怎样低成本、高效率完成大批量人工智能(AI)算法模型的生产?在面向真实场景的AI模型应用中,这个朴素的问题正愈发成为“刚需”。毕竟术业有专攻,连广大专业的AI算法工程师都为了“炼丹”通宵达旦,半路入门的非专业人士要想做出一个好用的AI模型,耗时费力在所难免,还冒着跑不出满意性能的风险。那么能不能打造一个工具,将AI模型开发全流程变得像上手App般轻松易学?多位国际AI学术大牛正在组队推进这样的研究。他们共同发起了一个免费开放、无代码的产品级开源AI基础软件平台YMIR,想要借助开源的力量,让每一家企业都能轻松高效地开发出满足实际业务需求的高质量AI模型。YMIR今年5月才正式上线,短短半年已在社区大受欢迎,截至目前吸引了超过500家企业使用,涉及机器人、工业、芯片等行业。据开发者反馈,使用YMIR后算法生产效率普遍提升6倍,算法人员的需求量降为原来的1/10。现在,它进一步瞄准AI开发过程的常见痛点,升级至2.0版本,增设了公共算法库、一键模型部署等新功能,真正实现AI模型生产的全生命周期覆盖。开发者不仅可以在该平台上免费获取多类常见算法,而且只是动动鼠标,就能将算法一键部署到终端设备中,实现“开发即应用”。不管你是想要轻松上手AI开发,还是想要优化AI开发效率、提高AI模型质量,这都是个值得一试的生产力工具。
▲YMIR主页
01 免费开放算法,高精度模型随用随取
要实现AI模型的规模化生产,需要有更好用的工具,来精简整个开发流程中的重复步骤,为开发者持续“减负”。许多云大厂及AI公司都在为此拼技术、拼经验,将开发门槛一降再降。问题是,AI应用场景太广泛了,从厨房监控虫鼠到工厂质检零件,很难能用一套兼而有效的解决方案去满足各类应用需求。而企业推出的AI开发平台,大多聚焦于部分业务相关的高频场景,难免不能顾及一些偏低频、小众的应用需求。面对这些难题,开源也许是更有效的解法。在计算机发展史中,开源的价值不言而喻,众多开发者的智慧与经验凝结在一起,共同打磨出更高质量、更完善的作品。同样,开源AI基础软件平台YMIR也是一项“众志成城”的工作——一群产品经验丰富的AI算法开发人员参与其中,将此前的经验以数据、流程等可视化的形式沉淀积累,通过流水线流程设计,大幅提升AI算法模型的生产效率。YMIR平台通过无代码开发方式,实现数据管理、数据挖掘、模型训练、模型验证等功能,以数据驱动算法模型训练和迭代,使得开发者能够一站式开发可应用部署在工业化生产中的算法,满足实际业务的需求。这样一来,高质量的AI模型开发,就不再是只有“专家”才能办到的事。一些中小型企业也得以节约更多专业人才的招聘留用成本,同时具备快速训练出满足业务需求的AI模型的能力。还有一个“减负”新招,是“公共算法库”板块。这是YMIR2.0的新增功能,开放了第三方算法。开发者如果不想从头训练,就可以在“公共算法库”直接选用已经被训练就绪的算法模型,调用部署到自己的业务中。
▲公共算法库
目前,“公共算法库”中的算法均可免 费 使 用,已预置有城市治理、防疫、明厨亮灶等行业的多种算法,包括“人车非”检测、口罩检测、厨师服穿着检测等常用的高精度算法,而且在持续上新。你也可以将自己训练好的算法模型公开上传,方便有同类需求的开发者调用,这样有助于减少重复开发造成的资源浪费问题。对于上传的算法,YMIR团队有一套专门的审核流程,来确保算法精度能通过标准化测试,满足基础的应用要求。
02 一键部署,打通AI开发“最后一公里”
除了帮开发者提高训练效率外,YMIR2.0还上线了另一个AI研发重要环节——“一键部署”,以解决从算法到应用的“最后一公里”问题。AI算法模型开发的最终目标,是将其部署到实际业务场景中,发挥应用价值。将部署环节标准化,不仅省力,也更省钱。以前工业界中,一个开发团队做硬件部署,普遍至少需要由几位工程师组成的小团队,每年仅是人才成本就动辄有上百万元。而YMIR2.0上线的模型部署功能,只要一键点击鼠标,就能将高精度算法模型以简单、高效的方式部署到智能摄像机等各类终端设备中。
▲算法一键部署到硬件设备上
这个部署功能的实现,对开发团队的能力提出了更高要求,既需实现高度模块化,使其能兼容所有算法,又得在部署速度上具备优势,从而支撑起更高精度、更大规模的模型部署。这样一来,企业不仅可以省去上百万元的成本,而且有效缩短算法进入市场的周期。完成算法部署后,开发者还能够通过平台观察获取算法在应用中的表现。
模型可部署到的硬件设备也是开放的。目前YMIR2.0支持包括瑞芯微在内的6款硬件平台。顺带提一句,YMIR已开启硬件设备(部署硬件)认证,并有多个厂家已通过,在“Github-硬件支持”模块或者京东上搜索“YMIR”就能查到相关信息。
之前YMIR1.0刚上线时,智东西曾上手体验过,只要具备开发AI算法的基础知识,基本上不需要付出什么学习成本,跟着可视化页面的指引,就能很轻松地跑通AI模型训练及管理流程。现在升级的YMIR2.0,可以较明显地感受到用户体验方面有进一步做优化,人机交互设计变得更加友好,模型生产迭代过程更直观,引导用户操作的体验也比之前更加流畅。
▲全流程项目迭代
对于AI开发来说,算法是灵魂,数据是生产力。训练测试模型的数据集如果有问题,算法再优质也会白搭进去不少力气。因此YMIR2.0还新增了对开发者非常有用的数据分析、模型诊断等功能,这对有密集AI开发需求的企业或个人提高效率会很有帮助。数据分析可以对数据集的大小、质量、标注框总数、标注框分辨率等进行管理和分析,还能分析模型生产后在测试集上的表现。
▲数据集分析
模型诊断则通过自动化分析模型和可视化呈现,有助于提高查错效率,更加立体地呈现模型在什么地方出了问题、在什么地方表现比较好,从而使开发者可以更有针对性地调整优化算法设计。
▲模型诊断
03 万里长城第一步,终极目标是AI生态繁荣
YMIR平台由一支国际化团队发起,包含多位国内外知名AI产学界大牛。比如云天励飞首席科学家王孝宇;美国硅谷NEC实验室媒体分析部主管,印裔科学家Manmohan Chandraker;前谷歌、亚马逊、Snap机器学习研究员,硅谷公司Heali联合创始人、首席AI官,法裔科学家William Brendel等等,都在YMIR发起团队阵营中。
▲云天励飞首席科学家王孝宇(图左),印裔科学家Manmohan Chandraker(图中),法裔科学家William Brendel(图右)
其相关论文去年被国际顶级机器学习会议NIPS 2021收录。
▲YMIR论文
云天励飞首席科学家王孝宇告诉智东西,起初YMIR开发团队预期会有更多的个人开发者上手试用该平台,但出乎意料的是,短短5个月间,YMIR平台已经在产业界砸出一些水花,被不少来自不同行业的企业尝试。“用户是用脚投票的。”王孝宇说,能提升开发效率、解决实际问题,开发者就愿意采用。与市面上一些基于云服务的AI开发平台不同,作为一个开源平台,YMIR具有低成本、开放式设计等优势,不仅全流程功能免费、允许开发者按需修改优化代码,而且能满足私有化部署对于隐私安全的需求,全开发流程可在本地进行,数据和算法模型完全掌握在开发者或企业自己手中。王孝宇希望企业或个人用户在使用YMIR2.0平台的过程中,也能够积极回馈社区,共同努力将这个项目做得更好。在他看来,现阶段AI商业化解决方案虽然很多,但每家各做各的,没有形成合力,其实并不利于AI长远的发展。人们对于如何使用标准化AI软件去推动产业升级缺乏经验,这是一个预期非常长的有待被教育的过程。“只有整个行业形成共识,认同AI是必须使用到的技术能力时,AI产业才能往更高的层次推进,标准化AI生产工具会变成未来不可分割的一部分。”王孝宇说。目前,YMIR在做的事,即是通过实现小闭环,让更多AI企业能够利用这些小闭环帮助客户打造大闭环,逐渐形成标准的通用化工具,最终推动整个AI大生态的繁荣。
04 结语:征文活动评选中最高赢5500元奖励和工作机会
开源AI项目并不少见,但一款全流程免费开放、能适应大多数垂直类行业差异化应用需求的开源AI开发平台,目前仍相对稀缺,YMIR平台也还在持续进化和扩容生态的路上。为了进一步鼓励和吸引开发者,YMIR开发团队计划举办“YMIR主题种草征文”活动,邀请各位开发者来讲述YMIR的使用心得。活动将最终被评出一等奖、二等奖、三等奖若干,分别可获得卡券5000元、卡券1000元、卡券500元,以及附加奖若干,可获得卡券500元。优秀作品作者将有机会获得YMIR团队的工作/实习机会。
(本文转自【智东西】)
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!