文/当下君
图片/来源网络
对于AI大规模落地这件事,目前国内的氛围喜忧参半。
近忧远虑的人,一般反而是真正的AI行业资深人士,或者是资深投资人,他们看到了场景限制、数据制约、人才短缺、成本高昂等方方面面的具体困难,他们的忧虑是有道理的。
的确,AI在落地中面临的问题非常之多,而且,应用场景分散太严重是AI应用落地的一大瓶颈。AI并不是万能的,在使用上经常受限于场景、数据、开发能力、企业拥抱新技术的态度等等问题。
一部分人认为,随着用户对AI应用的诉求变得越来越个性化,AI企业所提供的产品和解决方案也呈现定制化,AI企业必须贴地而行,尽可能多的参与到产业垂直场景和工程落地中才能生存。而另一部分人认为,较好的办法是,打造一个开放的AI平台,提供综合性的方案来解决AI落地面临的诸多挑战,而分散场景的定制化问题,平台应该交给生态伙伴解决,或通过提供更好的工具让客户自己实现。
后一条路听起来很美,但实践起来也很苦,百度就是后一条路上的代表企业,而其对于AI融入社会化大生产的实践和推动,堪称现实版的《探险日记》。
1
孤独的探路先行者
AI的落地,并不总是轰轰烈烈,也有雪落无声。
6月24日,世界银行执行董事会批准给中国提供贷款4.3亿美元,其中的1.5亿美元贷款将用于宁波的垃圾分类。
宁波开启了先进的垃圾管理、循环利用和预防措施,在国内属于领先位置。
简单说,宁波的垃圾处理,在分类后如何进一步处理,已经非常现代化,此次的世行资金,主要用于宁波全品类智能回收箱的落地,解决消费者如何分类投放,进而完善闭环。
机会往往留给有准备的人,宁波蔚澜就是这样一家企业。此前,它是一家生产物联网配电柜的企业,公司负责人范世杰非常关注市场动态,在2018年底,当他看到央视开始宣传垃圾分类时,立刻产生了一个念头——垃圾分类柜这种东西,本质上和物联网配电柜的差别不大。
新型的垃圾分类箱很快做了出来。居民对可回收垃圾的分类意识明确,但厨余垃圾分类就出现了困难。很常见的一个问题就是,居民在分类时不够精细,把其它垃圾混杂在厨余垃圾里,这就涉及到两个动作——需要对垃圾进一步分拣,还需要提醒居民下次注意类似问题。
为什么说厨余垃圾是一道门槛?主要是因为这种垃圾的形态、外观都很复杂,传统的视觉识别手段的精准度有限,成为产品的软肋。
让范世杰感到幸运的是,公司新招来了AI技术总监杜一品,大家都知道AI的人才奇缺,有完整的AI开发经验的人更少。
对于这种现象,百度集团副总裁吴甜称之为“AI先行者探路”阶段。
吴甜在解读百度飞桨深度学习平台与产业伙伴的广泛合作中所观察到的AI落地实践路径时,把这条路描绘为三个阶段,也就是AI先行者探路阶段、AI工作坊应用阶段和AI工业大生产阶段。
企业中的AI先行者,深谙业务场景中亟待解决的难题、有想法,想要突破传统的业务现状,希望借助AI的力量走出一条不一样的路。
杜一品正是如此,蔚澜并没有完整的AI团队,但是,他也有一些底气,因为掌握了新的工具——飞桨企业版EasyDL。
EasyDL是一个零门槛AI开发平台,开发一个AI模型的流程中,涉及的数据处理、特征提取、模型选择、参数调节、训练部署等环节,都实现了高度的自动化,经过简单学习即可运用。
杜一品用EasyDL轻松完成了厨余垃圾识别模型,另一个问题随之而生,垃圾箱端侧的识别需要比较高的AI算力,如果回传到云端计算,就需要企业添置大量的服务器、GPU卡等资源,这极大的增加了利润本身薄如刀锋的垃圾回收企业的成本。
就在这个时候,飞桨工程师给他支招,不需要购买庞大的AI计算设备,只需要一个百度的“EdgeBoard嵌入式AI计算卡”再搭配两个普通的摄像头就可以解决“成本高”的问题。最终,蔚澜也正是采用飞桨工程师的建议成功实现了AI的初次实践落地。杜一品说了一句很感概的话:“我们的设备成本只增加了大约2-3%,就让我们从自动化时代进入了智能化时代,原来AI也不那么贵。”
蔚澜的智能垃圾回收箱因为厨余垃圾智能识别这一项能力,在市场上赢得了竞争时间窗口。这就是AI的力量。
事实上,像杜一品这样的AI先行者还有很多。
王健(化名)是一家新能源电池企业的资深工程师,他最头疼的问题,就是电池的质检环节。
对电池进行质检,除了通电测试外,很重要的一个工作其实是非标准化的,得用肉眼去看,要仔细观察——金属焊接产生的颗粒是否掉在表面、有没有漏涂、焊接工艺是否一致等等。但是,传统以肉眼为核心的检验,存在准确率低、人才培养困难、生产环境中有害成份可能影响质检员健康等问题。
王健是一个乐于钻研新技术的人,他发现,飞桨的官方课程,是他在互联网上能找到的、现有的、最有效的能够帮助他快速进行应用研发的入门课程,于是他开始了自学,进而他开始思索,认为百度飞桨在视觉方面的强大能力,可以是解决肉眼质检效率低、标准化程度低的一个新办法。
王健是先行者,但同样是一个AI新手,他想办法联系到了百度飞桨,并获得了强大的支持。在合作的过程中,包括从模型选型到训练优化,再到部署以及与原有系统的集成,飞桨团队不仅提供了编程框架和模型库产品,还与王健在项目落地的各个环节展开了多次的交流和答疑,给予了全方位的技术建议和支持。
“我们希望,把产品线上的电池缺陷漏检率从小于百万分之一,优化到小于十亿分之一、单张产品图像缺陷检测平均时长小于2毫秒”,王健说:“但这不是一件容易的事,涉及的细节有300多个,包括黑斑、划痕、黑点、厚涂、凹点等等。”
对于这些问题,飞桨“平台式赋能”的优势就显现出来,因为他们拥有的不是一件或几件“武器”,而是一整个“武器库”,通过百度飞桨深度优化过的PP-YOLO和ResNet系列算法,王健团队提升了算法精度,加之飞桨 PaddleX 全流程开发工具的选用,大大地降低了应用深度学习技术进行产业落地的难度。
“最后,相较于传统的算法,应用了飞桨模型库的检测算法,过杀率降低了 66.7%,缺陷漏检率小于1DPPB,在多个产品线上进行迁移部署的效率也得到了全面提升”,王健满意的说,他也从这个项目中深深受益,成为了公司里AI技术改造的带头人。
杜一品和王健的经历,正是典型的“AI先行者探路”阶段向“AI工作坊应用”阶段转化的案例——总有那么一些人会愿意尝试新的技术,尽管这个过程或许很孤独。
所谓的孤独,不仅仅是没有人可以交流、讨论、共创;也可能是因为AI技术不被决策层理解,而仅仅靠技术人员是很难推动一类新技术落地的。
但一旦进行了验证,成功落地后,就会从个人实践,变成企业有内驱力,来建设团队学习和应用AI,从而进入吴甜称之为“AI工作坊应用”阶段。
先行者探路往往是孤独的,飞桨的陪伴让他们不再感觉是在独行。
2
AI探险之旅,需要不断进阶的能力
目前,绝大多数企业的AI实践,还都处于前两个阶段。
必须指出,百度并不是被动的等待企业在应用AI上自行进化,对三个阶段的总结也不是静态的总结,相反,百度飞桨正是发现不同的企业分布在三个不同阶段,所以通过这些丰富多样的需求,主动打磨飞桨的技术和产品,使它能更好的满足处在不同阶段的企业的实际业务需要,进而帮助企业成长到下一个阶段。
对于进入到AI工作坊应用阶段的企业,百度飞桨的做法就是帮助这些宝贵的“星星之火”在学中干、干中学,最后使他们成为企业内部AI之火燎原的“火种”。
但这个过程,并不容易。
如果你看过肯·福莱特的《世界三部曲》或者欧文斯通的《梵高传》,你一定对上个世纪初的煤矿工人生活的危险和悲惨印象深刻。
即使在新中国,1949年的煤炭每百万吨死亡率仍然高达22.54,而足足经历了60年后的2009年,这个数值才首次低于1,也就是每生产百万吨煤的死亡人数少于一人。尽管如此,当年煤矿死亡人数仍高达2700人。
“只要这个数字不归零,我们就还要继续努力,终有一日,我们会实现 ‘井下无人开采’的梦想”,华夏天信(北京)机器人公司总经理高强告诉笔者:“在矿用机器人领域,我们需要通过成熟可靠的AI解决方案来打造智慧煤矿,平衡安全与效率。”
华夏天信有一支精干的开发团队,但这支团队在面对“输煤胶带机器人智能巡检”的开发时,也遇到了技术的拦路虎。
如果一个人没有下过井,就很难想象里面是什么场景——在距地表几百米的深处,输煤胶带昼夜不停的将煤炭运送到地面,一般的输煤胶带动辄几公里,如果完全靠人力现场巡检或远程摄像头查看,那需要很多的巡检工人,这样不仅增加了井下人数,耗时耗力,而且难免误看漏看,存在安全隐患。
对于这个场景,最简单的方式是使用搭载通用检测算法的摄像头,可以进行简单的人员入侵检测、边界检测等,但这种方案无法满足井下光线较弱的复杂场景。有人建议使用比较通用的AI能力平台,选择适用的模型加以改造,但这需要很强的AI开发能力。也有人建议,直接使用一些第三方公司提供的API,但事实上,由于井下的网络传输环境异常恶劣,做不到满足实时性要求。
华夏天信找到了百度飞桨,这一次,他们在飞桨的“武器库”里找到一个端到端目标检测开发套件PaddleDetection,通过数据增强、算法选择等技术很好地解决了输煤胶带机器人实际遇到的场景难题,同时飞桨还打通了AI应用的最后一公里,提供了多端多平台推理部署工具链,帮助技术人员将AI应用高效落地。
此外,飞桨的工程师建议,因为采集端只有一路视频,所以,后端处理业务要既保证性能稳定性,又能兼顾将来业务扩展,叠加更多的智能分析功能。新的设备上线后,每日3公里巡检2次,单次仅仅能积累约200张图片素材,为了提高识别精度和更多数据的训练积累,飞桨工程师建议对于巡检点的视频进行截图回传,这样可以增加数据,再结合自动和人工标注加入训练集,提高识别效率。
“在飞桨的帮助下,我们全流程学习了一次AI的实施落地。我们发现,飞桨的一大优点就是开发部署的学习难度很低,即使我们的工程师经验并不丰富,但由于飞桨的开发套件成熟度高,实际上比我们预料的上线时间缩短70%以上,这大大的增加了我们以后进一步利用AI来改造设备的勇气。我们希望把那些单价上亿的自动采煤机,都通过百度的AI升级成智能机器人”,高强博士说:“以前我们说自己是一家机器人公司,但现在我们可以说自己是一家智能机器人公司,两字之差,跨越了一个时代!”
事实上,这种团队规模中等、有一定技术底蕴的团队,比之前文所说的“先行者模式”,更容易接受像开发套件这样的“重武器”,从而提升整体战斗力,从一个“工作坊”变成企业的AI发动机。
但并不是每个“工作坊”都有完备的团队,吴甜回忆过一个工业企业的AI落地情景,当初接洽时,初步了解到对方已经有一支12人的队伍,觉得大有希望——这是典型的“工作坊”式团队啊。
然而,经过实际接触才发现,这个12个人的AI团队,只有1名AI专业研发人员能够理解深度学习算法的大致原理,并且达到了能自己动手使用飞桨算法类套件进行深度学习算法训练的程度。
如何最快的让这些没有AI背景、甚至没有计算机背景的工程师能够在AI研发中形成合力?显然,从头学习是不现实的,而必须有工具。
被称为产业级深度学习平台的飞桨,之所以能够异军突起,在短短5年的时间内,在中国深度学习平台的市场综合份额上超过谷歌和Facebook,靠的就是和中国产业界的高度适配。
就拿刚才的问题来说,同一支团队、不同背景、不同经验甚至不同悟性,飞桨都准备了不同的工具。通过模型研发深度的阶梯式、多层次产品,来应对企业团队中人员背景多样的问题。
在一次论坛分享中,吴甜自信的说:“无论企业研发团队中的能力和经验如何,总能在飞桨平台上找到一种当前适用的产品形态,并可以不断学习精进,逐渐攀升使用更灵活更自主的产品。”
简单来说,飞桨平台就相当于一个巨大的模型工厂,能直接基于框架开发模型的AI工作者,是最高阶的,相当于米其林的三星级大厨。
仅仅有“工厂”还不够,还得有具体的“产品线”,这其中,又可以分为场景类开发套件和算法类开发套件,来适配不同的应用环境,能够运用开发套件的,也是AI应用人员中的行家里手。
当然,对于AI基础薄弱的人员,尤其是没有系统的学过编程的人员来说,最便捷的方式就是无代码的开发方式。同样以“模型工厂”里的大量模型为从基础,飞桨提供了前面介绍过的EasyDL。你可以理解为像使用美图秀秀这样简单,只要做一些拖拽、填写一些参数、上传一些数据,甚至不用写一行代码,就可以快速上手AI开发,吴甜曾称之为“让大家找找AI开发的感觉”。
为了包容不同类型的开发者,飞桨在便利性上做足功夫。
飞桨封装隐藏了编译自定义算子过程中不必要的框架底层概念,并且打通了训练和推理体系,这样就可以让更多非AI专业人员通过飞桨平台更灵活、更简单地在自己的领域应用深度学习技术。
言归正传,说到前面那支背景多样的团队,在百度飞桨和团队带头人的持续帮助下,能力有了全面的提升,使得团队的技术结构已经发生了变化——有人能使用飞桨可视化界面开发,有人能使用场景化套件,一些人甚至拥有了应用配置化开发的算法类套件深入进行深度学习算法的开发的能力,而这支团队的成长,就是处在AI工作坊阶段并不断进阶的一个AI团队的缩影。
但这,也不过是飞桨的探险之旅中的一个环节。
3
乘上星际飞船,探索AI宇宙
说起AI进入工业大生产,人们一定非常兴奋,脑中一定会出现非常壮丽的图景,但在实际落地中,这种工作的组织难度是非常高的。
以一个大型的互联网企业为例, 有涉及视觉、语音、推荐等数百个AI场景建模的需求,有应用开发、算法调优、平台开发等多种类型的AI研发工作,有MPI、机器学习和深度学习等数千并发任务,整个企业用了近十年向AI底座迁移,这才是真正的工业大生产。
而参与项目的技术人员、使用这些服务的企业员工,数量高达数千;在资源上,这些任务需要GPU、CPU、FGPA等异构计算的数万张卡,可谓是波澜壮阔。
“这种多人多任务高并发度协同,是最考验平台能力的,因为它不仅是一个工程问题,更是一个工程管理问题,它考验飞桨能否帮助AI在一个庞大体系落地的能力和效率,这是目前步入AI工业大生产的‘入门考试’。”在一次公开论坛中,吴甜这样形容。
而面对这样复杂的需求,飞桨开展了两方面的核心工作来支持,一类是面向资源算力层面,项目需要高效的算力管理与调度,以应对大规模AI应用时需要的算力基础设施提供、管理、调度等。
为此,飞桨构建了作业及工作流调度系统,从这个角度来看,再次显现了飞桨的“产业级”特性,那就是能够支持大量并行任务同时开展,对模型和服务进行了科学有序的管理,提升整体的研发效率。
这样的大型项目中,很多都是基于人工智能的通用模型打造,而一般来说,打造一个通用模型直到它成熟,需要许许多多次的尝试——很多通用模型在设计的时候其实都是一次对于资源的冒险,需要调动成千上万的GPU。
而飞桨在这样的大场景中解决的,就常常包含去尝试不同的超大模型,并通过卓越的泛化能力,再产生出更多个适用不同场景的更优化的小模型,我们可以把飞桨看做是“用AI生产出AI的体系”,它是AI的工作母机,是人类探索AI的星际飞船。
而正是因为飞桨不断的尝试这样的大场景、通用模型和泛化,所以,对于飞桨产品(模型)已经完善的场景,或者有一定研发能力的企业,企业中的AI团队在飞桨产品的辅助下就可以独立完成很多出色的应用项目,而且速度越来越快。
这其实就涉及到人们热衷于讨论的一个问题,对于越来越分散的场景,是不是需要无限的投入人力资源去定制服务,答案显然并非全部如此,飞桨的选择就是通过不断挑战大场景,不断的进行模型优化,使得模型的通用性越来越强,再配合以各种专用的套件,就能不断加速AI落地的速度。
例如,百度飞桨的合作伙伴里,就有专门生产AI产品及应用解决方案的企业,有一个企业,就基于Paddle Detection目标检测套件中的YOLOv2算法,打造了适用于炼钢厂的钢坯位置的检测方案。在这个项目中,由于PaddleDetection已经趋于成熟,企业团队成员能力较强,整体过程比较顺利,基本没遇到什么问题。而且,当下次、下下次遇到类似的钢坯检测问题时,部署的速度会十倍、百倍的提升,这就是一个能够用数据沉积智慧、经验和模型,从而不断自我完善的闭环,它们才是通向大工业时代真正的底层引擎。
如果说这篇文章仅仅是从AI落地的角度解读AI从先行者阶段向工业大生产时代的迈进,那它还是不够全面的,因为AI落地不仅仅取决于以上的技术、工程、管理方面的要素,它还需要更大体系的支持。
其中,人才的培养是非常重要的。虽然我们看到,很多工程师都可以边学边干,在实践中培养AI能力,但这不能掩盖我国AI人才严重缺乏的现实。而且,这种缺乏是全面的,从开创性的领军人物到最基层的用无代码开发工具的应用人才,都有巨大的缺口。
为此,飞桨非常重视复合型AI人才培养的工作,始终在输出业务、算法、工程三位一体的人才培养理念,强调跨越边界,学以致用。当前已经建立起成熟完善的产业级复合型AI人才培养体系,包括面向一线算法工程师的“AI快车道”,面向技术负责人的“AI私享会”和面向CTO、架构师层级的“AICA首席AI架构师培养计划”等等。
生态的建立也至关重要。飞桨是一个平台级的存在,平台有平台的优势,也有平台的劣势,特别是针对垂直场景和分散化的场景。
吴甜在多次对外沟通中反复强调,AI落地应用势必是要面对分散化的场景需求,如何在业务场景中发现问题、解决问题需要懂得业务逻辑的人学会结合AI技术,飞桨丰富的产品体系能够满足不同要求和特点的使用者,例如前面提到的零代码可视化界面客户端、场景类开发套件、算法类开发套件、模型库、深度学习框架。
此外,飞桨还提供了企业级的平台型产品BML,发布了首个易被集成的云原生机器学习核心系统PaddleFlow,可以为企业的AI平台开发者提供资源管理调度等核心能力,赋能更多细分场景和深度定制的AI平台,同时解决企业AI研发协作效率的问题。
但从更长远的角度看,飞桨应该有更多生态伙伴,就像我们前面提到的,为企业提供AI产品和方案的公司,基于飞桨进行丰富多样的AI生产创造,协同加速千行百业的智能化升级。