百度大脑EasyDL送技能,零代码基础小白也能玩转AI! ​

发布时间:2019-08-26 阅读量:642 来源: 智东西 发布人: Jane

智东西8月23日消息,百度大脑AI开放平台分享了多项近期发布和升级的新功能,并详细介绍了百度EasyDL的最新进展和典型案例,包括深度学习框架、OCR文字识别和语音自训练平台等。

 

此外,工作人员还在现场向大家演示了如何快速训练一个AI模型,并集成在硬件中进行离线计算。同时,百度还邀请了中国专利信息中心、茅台博物馆、农信互联三家企业代表,来分享如何利用百度EasyDL协助业务的AI应用和落地化进程。

 

2016年底开放以来,百度大脑一直通过研发技术降低AI应用落地的门槛,截止目前,该平台已经积累了218项技术能力,实现24小时快速集成AI工具,覆盖超过130万的开发者。

 

百度大脑1.jpg

 

一、EasyDL:零算法基础训练生成AI模型


百度大脑经调查发现,在各行业的业务场景中,约有86%的行业需要定制开发相关的AI模型以提高业务效率,例如科研机构的生物识别、物流的自动分拣包裹和智慧零售等。

 

然而,企业们在面对AI业务转型时,也面临着人才不足、数据标注成本高、模型部署繁琐和迭代优化周期长等痛点。

 

基于此,百度大脑推出了一个名为EasyDL的定制化模型训练和服务平台。简单来说,用户通过该平台,哪怕没有任何算法和代码基础,都可自行定制一个高精度的AI模型。

 

百度大脑2.jpg

 

用户定制模型时,根据可视化页面的提示创建模型,上传图片、文本、视频或音频等数据集并标注,标注完成后再对模型进行训练和校检,最后即可生成发布。

 

值得一提的是,在数据集标注方面,用户仅需手动处理其中30%的数据,剩下可通过EasyDL的智能标注功能一键标注,减轻了70%的密集劳动力成本。若是第三方合作伙伴,平台还提供数据采集和标注服务。

 

此外,AI模型的发布支持三种格式,分别为公有云RestAPI、离线SDK和软硬一体方案,实现AI模型跨平台应用。

 

目前,EasyDL推出了行业版和通用版两种版本。据百度AI技术生态部高级产品经理李景秋介绍,EasyDL自2017年底推出以来,已有超过1.7万个企业客户,创建了超过36000个AI模型,应用覆盖安防监控、零售商品识别以及镜检细胞分类等领域。

 

百度大脑3.jpg

 

李景秋表示,EasyDL计划将上线图像分割模型,支持非矩形和不规则形状等标注,可应用于工业瑕疵检测与道路检测。另外,EasyDL的图像分类、物体检测模型也即将支持本地服务器部署。

 

二、6大功能升级,深度学习平台支持海思NPU


除了EasyDL的AI开发平台外,百度大脑还拥有其余4项应用架构,包括部署与集成、场景化方案、AI开放能力和深度学习平台。

 

百度AI技术生态部高级产品经理娄双双介绍,百度大脑在8月已经开放并升级了一系列新功能和服务。

 

在深度学习平台方面,百度大脑全新发布了一个名为Paddle Lite的深度学习框架。该框架加强了多平台多硬件的支持能力,新增各类硬件Kernel 70种。

 

娄双双表示,Paddle Lite还增加了对FPGA(ZU3\ZU5\ZU9)和华为海思NPU的深度支持,成为了首个支持华为NPU在线编译的框架。

 

OCR文字识别方面,百度大脑升级了名片识别、二维码/条形码识别和手写识别的性能,进一步提升其识别率。官方表示,OCR手写识别的准确率已提升至95%以上,识别效果和速度双指标保持在行业第一。

 

百度大脑4.jpg

 

与此同时,百度大脑还对人体分析中的人流量统计(动态版)算法进行了优化,将准确率提升至92%以上。此外,图像处理方面还增加了图像的拉伸恢复和风格转换功能,它除了能自动识别比例失调的图像并将其恢复成正常比例外,还能够将原图像转换成卡通或素描等风格。

 

百度大脑5.jpg

 

除此之外,百度大脑的内容审核平台也进行了一系列功能升级,其中最核心的两项分别为支持审核模型定制和分钟级策略更新。

 

一方面,官方打通了EasyDL的应用渠道,内容审核平台能够定制审核模型,以用于识别特殊场景识别和过滤特殊物品、行为。另一方面,官方违禁库实现了分钟级别更新的功能,能够及时过滤最新的风险事件。

 

最后在语音自训练平台方面,官方扩展了API调用方式,使其能调用搜索模型和输入法模型,让该平台进一步适用于更多领域。

 

娄双双表示,自语音自训练平台上线以来,已拥有了医疗、金融、物流等多个行业的客户,模型的上线应用也覆盖至业务数据采集录入、智能语音助手等多个场景,其专业领域的词汇识别率已提升5%至25%。

 

三、三类应用领域介绍,提高业务效率


对企业来说,如何高效低成本利用AI来提升业务效率是一项十分重要的任务。

 

在现场,中国专利信息中心、茅台博物馆和农信互联的代表为大家分享如何通过百度大脑来实现业务智能化。

 

在知识产权保护领域,中国专利信息中心软件设计师崔亚坤介绍,他们利用EasyDL训练了一个专利保护的AI模型,该模型不仅能分类图片,还能对图片中的物体进行检测。

 

此外,他们还将百度大脑的文字识别、图像搜索、NLP语义处理等功能进行整合,以进一步提升其自动化审核流程的工作效率。

 

EasyDL还可应用于文化领域,帮助人们更好地挖掘、了解相关历史文化。

 

茅友公社APP负责人张瑞想表示,他们花了三周时间,通过EasyDL训练和迭代生成了一个定制化图像识别模型,该模型能够在几秒内迅速识别出每瓶茅台酒的生产年份和产地等信息,准确率高达99%。

 

前段时间,网上报道的AI宠物鼻纹识别和猪脸识别引起了许多人的兴趣。此次,农信互联高级工程师孙凌俊为大家分享了AI是如何帮助他们管理养猪场的。

 

他们通过EasyDL训练出了一个猪棚场景定制模型,并利用AI电子围栏和EasyDL的物体检测功能,可以对猪场进行远程管理,例如当摄像头检测到道路上出现猪而不是人时,便会及时警告工作人员前往现场处理。

 

此外,他们还训练出了一个猪病识别模型,帮助养殖人员判断猪是否有典型猪病,不仅在一定程度上降低了发病风险,还可改善养殖业目前的生产效率问题。

 

百度大脑6.jpg

 

结语:降低AI入门门槛,为企业提供转型新方向


随着AI技术的不断成熟和多样化发展,越来越多的企业对业务智能化的需求也与日俱增。但他们也面临着AI人才匮乏和数据集标注成本高等困境。

 

百度大脑推出的EasyDL定制化模型训练和服务平台,不仅降低了AI从应用到落地的门槛和成本,也为相关企业提供了智能化业务转型的新方向。

 

在未来,随着百度大脑技术的成熟,其OCR文字识别、深度学习、AI语音和视觉等技术也将会扩展至更多应用领域,帮助更多企业创造更大的商业价值。


相关资讯
华虹半导体2025年Q1业绩解析:逆势增长背后的挑战与破局之路

2025年第一季度,华虹半导体(港股代码:01347)实现销售收入5.409亿美元,同比增长17.6%,环比微增0.3%,符合市场预期。这一增长得益于消费电子、工业控制及汽车电子领域需求的复苏,以及公司产能利用率的持续满载(102.7%)。然而,盈利能力显著下滑,母公司拥有人应占溢利仅为380万美元,同比锐减88.05%,环比虽扭亏为盈,但仍处于低位。毛利率为9.2%,同比提升2.8个百分点,但环比下降2.2个百分点,反映出成本压力与市场竞争的加剧。

边缘计算新引擎:瑞芯微RV1126B四大核心技术深度解析

2025年5月8日,瑞芯微电子正式宣布新一代AI视觉芯片RV1126B通过量产测试并开启批量供货。作为瑞芯微在边缘计算领域的重要布局,RV1126B凭借3T算力、定制化AI-ISP架构及硬件级安全体系,重新定义了AI视觉芯片的性能边界,推动智能终端从“感知”向“认知”跃迁。

半导体IP巨头Arm:季度营收破12亿,AI生态布局能否撑起估值泡沫?

2025财年第四季度,Arm营收同比增长34%至12.4亿美元,首次突破单季10亿美元大关,超出分析师预期。调整后净利润达5.84亿美元,同比增长55%,主要得益于Armv9架构芯片在智能手机和数据中心的渗透率提升,以及计算子系统(CSS)的强劲需求。全年营收首次突破40亿美元,其中专利费收入21.68亿美元,授权收入18.39亿美元,均刷新历史纪录。

Arrow Lake的突破:混合架构与先进封装的协同进化

2024年10月,英特尔正式发布Arrow Lake架构的酷睿Ultra 200系列处理器,标志着其在桌面计算领域迈入模块化设计的新阶段。作为首款全面采用Chiplet(芯粒)技术的桌面处理器,Arrow Lake不仅通过多工艺融合实现了性能与能效的优化,更以创新的混合核心布局和缓存架构重新定义了处理器的设计范式。本文将深入解析Arrow Lake的技术突破、性能表现及其对行业的影响。

暗光性能提升29%:深度解析思特威新一代AI眼镜视觉方案

2025年5月8日,思特威(股票代码:688213)正式发布专为AI眼镜设计的1200万像素CMOS图像传感器SC1200IOT。该产品基于SmartClarity®-3技术平台,集成SFCPixel®专利技术,以小型化封装、低功耗设计及卓越暗光性能,推动AI眼镜在轻量化与影像能力上的双重突破。公司发言人表示:"AI眼镜的快速迭代正倒逼传感器技术升级,需在尺寸、功耗与画质间实现平衡,这正是SC1200IOT的核心价值所在。"