飞桨
差评 建议想要在终端部署AI能力的开发者,考虑以下项目,这几个项目一直在维护和更新,API比较稳定,功能丰富,应用广泛,可避免遭遇被推到重来的 不 知 所 措。如果特别喜欢 paddle-lite,也建议先观望半年,看看代码和技术实现学习下,总之先别用 Tencent/ncnn https://github.com/XiaoMi/mace alibaba/MNN 因为开发新项目容易写KPI和PR,维护旧项目不好写KPI和PR吗? 心疼使用baidu终端推理框架的用户,又双叒叕要重写所有的底层代码啦! …
8.6M超轻量中英文OCR模型开源,训练部署一条龙 | Demo在线可玩
鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI要说生活里最常见、最便民的AI应用技术,OCR(光学字符识别)当属其中之一。 寻常到日常办理各种业务时的身份证识别,前沿到自动驾驶车辆的路牌识别,都少不了它的加持。 作为一名开发者,各种OCR相关的需求自然也少不了:卡证识别、票据识别、汽车场景、教育场景文字识别…… 那么,这个模型大小仅 8.6M,没有GPU也能跑得动,还提供自定义训练到多硬件部署的全套开发套件的开源通…
大厂开源真香,百度开源的超轻量级OCR工具库强大且实用
项目名称:PaddleOCR 项目作者:PaddlePaddle 开源许可协议:Apache-2.0 项目地址:https://gitee.com/paddlepaddle/PaddleOCR 项目简介PaddleOCR 旨在打造一套丰富、领先、且实用的 OCR 工具库,助力使用者训练出更好的模型,并应用落地。 PaddleOCR 是基于飞桨的 OCR 工具库,包含总模型仅8.6M的超轻量级中文 OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。 项目特性超轻量级中文OCR模…单模型支持中英文数字组合识别、竖排文本识别、长文本识别检测模型DB(4.1M)+识别模型CRNN(4.5M)使用通用中文OCR模型多种预测推理部署方案,包括服务部署和端侧部署多种文本检测训练算法,EAST、DB多种文本识别训练算法,Rosetta、CRNN、STAR-Net、RARE可运行于Linux、Windows、MacOS等多种系统
超越YOLOv5,1.3M超轻量,高效易用,目标检测领域这一个就够了!
允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI目标检测技术作为视觉技术届的顶梁柱,不仅单兵作战在人脸、车辆、商品、缺陷检测等场景有出色的表现,也是文本识别,图像检索、视频分析、目标跟踪等复合技术的核心模块,应用场景可谓比比皆是。 各界开发者对高精度、高效率的目标检测算法,以及便捷高效的开发、部署方式的追求可谓是极致的。但业界却缺少全面兼顾高性能算法、便捷开发、高效训练及完备部署的开源目标检测项目。…
精度45.9%,推理速度72.9FPS,百度飞桨推出工业级目标检测模型 PP-YOLO
允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI工业视觉、自动驾驶、安防、新零售等我们身边熟知的各行各业都需要目标检测技术,由于其很好的平衡了标注成本、检测精度和速度等,成为当前智能制造产业升级浪潮中被商业化应用最为广泛的AI技术之一。 而实际生产环境对检测算法的精度、速度、体积等要求往往十分苛刻。 例如工业质检,生产线上往往需要毫秒级别的图片检测速度,而为了确保使用厂商收益最大化,还需要尽量平衡硬件成…
假装泻药,利益不相关 背景本来不想做Paddle Lite框架评测的,只是组里的两位小姐姐尝试编译了3天(这期间还有Paddle Lite的小朋友友情协助,不要问是谁,圈圈虫人脉广)依然失败。我猜根据我在圈内摸鱼3年的经验,编译一个移动端的推理框架问题不难吧,总比当初移植Caffe到Android容易吧(果然打脸了)。 已经提前git clone完毕Paddle-Lite的repo,配置好ANDROID_NDK路径(ncnn、mnn、mace、Tengine均能识别) 开始踩坑2019-08-…
我是一个深度学习爱好者,对于这三个深度学习框架我都使用过,当我使用以后,我觉得他们之间差别并不大。深度学习框架只是你进行开发的一个工具,既然是工具也就没有很大的使用差别。 三个工具的使用比较: https://github.com/WangRongsheng/tf-pytorch-paddle 但是一般情况下说来,tensorflow普遍应用于工业的实际开发生产中,因为他有tf.js……一系列便于开发部署的集成包。如果你读过一些论文,你会发现pytorch更普遍用于学术研究工作。而对于百度的paddle,…
Enhanced CTC Loss
在OCR识别中, CRNN是一种在工业界广泛使用的文字识别算法。 在训练阶段,其采用CTCLoss来计算网络损失; 在推理阶段,其采用CTCDecode来获得解码结果。虽然CRNN算法在实际业务中被证明能够获得很好的识别效果, 然而用户对识别准确率的要求却是无止境的,如何进一步提升文字识别的准确率呢? 本文以CTCLoss为切人点,分别从难例挖掘、 多任务学习、 Metric Learning 3个不同的角度探索了CTCLoss的改进融合方案,提出了EnhancedC…
四天搞懂生成对抗网络(四)——CycleGAN的绝妙设计:双向循环生成的结构
“神仙姐姐”CycleGAN在“风格迁移四部曲系列”的 《风格迁移的“精神始祖”Conditional GAN》 文章中,已经跟大伙一起在MNIST手写数据集上手撸了CGAN,让GAN学会了“认标签,写数字”。然后,我们将CGAN“拟合条件概率分布”的思想发扬光大,在文章《用CGAN做图像转换的鼻祖pix2pix》 中,让GAN学会了“看图学画风”,并用学会的图片风格渲染新图片。到这里GAN是不是已经有了点艺术家的气质了~ 但是,前面介绍的两个GAN只能算是…
四天搞懂生成对抗网络(一)——通俗理解经典GAN
序言做图像分类、检测任务时,为了提高模型精度,在数据处理方面,我尝试了很多数据增强tricks(包括了简单的裁切、变形、明暗、颜色调整,也包括了MixUp图像融合以及SMOTE这样的解决类别样本平衡的插值方法),取得了不错的精度提升。在查找资料时,我发现在人脸识别、行人重识别等任务中,还可以通过GAN(生成对抗网络)来生成具有多样高级语义特征的样本来充实训练集数据,以帮助提升模型精度。随着对GAN的了解逐步深入,…
算法SOTA、功能全面、性能最佳,PaddleDetection 2.0重磅升级!
目标检测技术作为视觉技术届的顶梁柱,不仅单兵作战在人脸、车辆、商品、缺陷检测等场景有出色的表现,也是文本识别,图像检索、视频分析、目标跟踪等复合技术的核心模块,应用场景可谓比比皆是。 各界开发者对高精度、高效率的目标检测算法,以及便捷高效的开发、部署方式的追求可谓是极致的。但业界却缺少全面兼顾高性能算法、便捷开发、高效训练及完备部署的开源目标检测项目。百度飞桨端到端目标检测开发套件PaddleDetection…
性能开源里数一数二,必然会越来越好!即使屡败屡战,也请不要放弃! 非官方docker环境下,Linux交叉编译-android-armv8,以及benchmark踩坑完成,这一路真尼玛心累,需要脚本见后文。 整体感觉开源有些 急功近利了,【一键安装】、【一键benchmark】、【缺 · Demo】做的不是不好是很差,委婉地说还需加油鸭!需要优化安装流程,做到【一键安装】:CMake里会自动下载第三方库的源码再编译比较慢(可以考虑wget预编译好的第三方…
模型精度不降反升!飞桨是这样改进PACT量化算法的!
随着人工智能应用在手机、IoT上的普及,受能耗和设备体积的限制,端侧硬件的计算性能和存储能力相对较弱,这给人工智能模型带来了新的挑战——需要模型更小更快更强。量化,就是其中的一个重要手段。因此,近年来量化成为学术界与工业界热门的研究方向。但与此同时,模型量化也引发了巨大的挑战。其中比较大的有两个:一是由于表示精度下降引起信息损失带来准确率的下降;二是量化带来的不连续性使神经网络的训练不稳定。学术和…
12岁女孩零编程经验开发系统千人用,80岁初代程序员300多天打卡学AI
金磊 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 纯小白,对AI感兴趣,想学习AI或是尝试做些有趣的小应用,有可能吗? 文科生一枚,自学了Python,但是对AI一无所知,能学深度学习吗? 没有代码基础,又想借助AI为现在的工作解决问题、做出改变,能实现吗?对于AI新手, 如何入门AI,一直是个令人头秃的问题。而对于那些有一定技术基础的人,想要用AI在实际工作生活中实现点什么,似乎也并不容易。 不过,也不是没有办法。 [图片] …
Jetson Nano上部署PaddleDection 原生预测方法经验分享
Jetson Nano上部署飞桨PaddleDection 原生预测方法经验分享为了写好这篇经验分享,以下的所有步骤,我又“心情愉悦”地操作了一遍。步骤操作很简单,但是很耗费时间,所以同学们要有耐心。 一、环境准备(1)安装Jetson Nano官方系统Jetson Nano Developer Kit SD Card Image 版本JP 4.4.1,官方镜像已经预装了OpenCV、CUDA、CUDNN、TensorRT等依赖环境。(推荐迅雷下载,速度很快)。 [图片] (2)准备SD卡(至少32G,最好大于这个存储…
上海张江×百度飞桨打了个样,AI赋能这事儿可算有“参考答案”了
鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI一家并没有AI算法工程师的初创企业,竟然只用20小时就开发出了一套AI质检模型,还凭此拿下了世界500强食品工厂的订单? 这么一件听上去有点“离谱”的事儿,还就真真切切发生在了上海。 事情的起点,始于世界500强冰淇淋厂商工厂里一个看似平平无奇的 质检环节。彼时,这家公司面临的问题是: 冰淇淋生产包括制作蛋卷皮、灌料、喷涂巧克力涂层、包装等环节,整个流程可能涉及几十种质量…
百度万亿级图检索引擎发布!四大预训练模型开源,还“发糖”15亿元
金磊 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI又一年520,又一年情…… Stop!不是这种打开方式。 瞧~同样是为了 “过节”,却吸引了五湖四海的开发者聚集在此。 [图片] 这就是已经“约定俗成”的深度学习开发者盛会—— WAVE SUMMIT 2021。而 百度飞桨,作为国产最大深度学习平台,同样也在520这样的日子,给开发者们带来了不少“糖”吃:发布全新飞桨开源框架2.1版本发布全新大规模图检索引擎开源文心ERNIE四大预训练模型全新发…
飞桨深度学习开源框架2.0抢先看:成熟完备的动态图开发模式
允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI百度飞桨于近期宣布,深度学习开源框架2.0抢先版本正式发布,进入2.0时代。其中一项重大升级,就是推出更加成熟完备的命令式编程模式,即通常说的动态图模式。同时在该版本中将 默认的开发模式定为动态图模式,满足用户直接使用该模式完成计算机视觉、自然语言处理、语音、推荐等全场景的AI算法开发。可见飞桨团队对采用动态图模式开发的成熟度,以及未来主力推广应用有着强大的自…
PaddleOCR如何更换模型
PaddleOCR是一款开源的 python OCR工具(从图片中识别成文字),源码地址: https://github.com/PaddlePaddle/PaddleOCR 通过pip命令即可安装:( 快速开始 )pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple pip install "paddleocr>=2.0.1" # 推荐使用2.0.1+版本通过简单几行代码,便可识出来图片中的文字:( 快速开始 )from paddleocr import PaddleOCR, draw_ocr # Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换 …