第四届数字中国建设峰会软件开源生态分论坛召开,开源协作激发创新动能

互联网科技圈 2021-04-30 12:59:15

“众研众用”的群智协同创新正在重塑软件产业的生态格局。4月25日,聚集产学研各界目光的第四届数字中国建设峰会在福州开幕。作为本届峰会的核心论坛之一,工信部、国家网信办联合主办的软件开源生态分论坛汇集部委领导、院士专家、开源机构、知名企业和开发者代表分享探讨我国开源生态建设成果和未来发展路径。

论坛现场,IEEE终身院士、湖南省政协原副主席蔡自兴教授做了题为《发挥人工智能核心作用,促进开源生态繁荣发展》的演讲,结合国家数字新型基础设施建设背景,从国家人工智能宏观发展战略出发,阐述了开源软件在人工智能行业的应用。开源中国CEO马越则分享了心目中的未来开源社区蓝图,既要实现内容聚合,也要具备精准推送能力,还要让志同道合的开源者实现更多互动。同时希望打造“拎包入住”的体验,让开发者把精力集中在产品上。

百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜在《开源开放促进科技创新与产业发展》主题演讲中强调,开源深刻影响着AI技术研发和产业应用,AI开源发展正经历三个变化,还分享了百度通过开源开放推动AI技术突破及产业智能化的实践路径。

(图:百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜)

吴甜指出,开源开放是技术创新和产业发展的重要模式。过去一段时间里,人工智能在经历快速实用化发展中被开源深刻影响着,随着产业智能化的深入,AI开源项目越来越多企业参与和主导,从纯AI技术架构发展到软硬件协同对接,从AI本身发展到与大数据、云计算更一体化。

据介绍,目前全球软件开源热度持续攀升,自2016年至2020年,世界最大的开源代码平台GitHub上注册企业数量逐年递增。开源代码广泛覆盖互联网、物联网、教育、网络安全、营销、金融、能源等各行各业。国内仅2020年一年开源项目数量便增长192%,是2013年至2018年开源项目的总和。在学术界,开源代码已经成为AI领域论文成果的重要组成部分。在产业界,通过IDC的调研可以看到,86.2%的企业或开发者在日常工作中都选择使用开源深度学习框架。

百度积极参与开源开放,基于多年产业实践经验打造的自主可控的深度学习开源开放平台飞桨,包含深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件,是人工智能技术研发的根基。飞桨的开源开放既加速了技术突破,也降低了产业AI开发与应用门槛。

例如,以飞桨为底座的知识增强语义理解技术文心ERNIE不断刷新自然语言理解任务效果,并在多语言、跨模态语义理解等方面不断突破。同时飞桨也在支撑“螺旋桨”生物计算平台,致力于支持AI+生物计算的前沿探索。

吴甜还在论坛现场介绍了飞桨最新的技术进展,分布式训练技术业内首创4D混合并行策略,通过数据并行、模型并行、流水线并行和分组参数切片四项策略组合,可训练千亿级稠密参数模型,且训练速度远高于3D混合并行策略。4D混合并行策略结合了多种并行策略的优点,将分布式训练技术与业务紧密结合,帮助开发者更好地应对大规模产业应用中对分布式训练的需求。

目前飞桨在GitHub上获得Star总数约7万,多个项目登顶GitHub Trending(当前热门趋势),成为最受全球开发者欢迎的项目,开发者和企业使用飞桨可以更快速、便捷地开发AI应用。目前飞桨已经凝聚了265万开发者,服务超过10万家企业,覆盖农业、工业、林业、民生、通信、电力、公益、城市管理等数十个行业,创造了超过34万个模型。

百度同样重视开源生态建设,不仅是APACHE软件基金会、LINUX Foundation和云原生计算基金会的金牌会员,还是开放原子基金的创始会员与理事单位,在国内外的开源组织中享有声誉。同时百度持续投入人才培养,截至2020年底已培养超过100万AI人才,未来5年还将培养500万AI人才。

飞桨等人工智能开源开放平台为产业创新和生态繁荣提供了源动力,让技术发展更快、应用普及更快。未来,百度也将继续拥抱开源,推动越来越多的行业加入产业智能化升级的浪潮中。

0 阅读:22