爱数:以开源应对领域认知的普惠价值与百花齐放

科技正能量 2022-09-29 18:31:08

彼得·蒂尔在《从0到1》中说,要把“进步”分为水平进步和垂直进步两种不同的方向。

水平进步较为常见,比如传统企业的商业模式是在现有基础上,复制之前的经验,通过竞争不断扩大自己的市场影响力,这是一个从1到N的过程;而垂直进步往往基于科技创新,例如互联网时代那些成功的企业能够做到从无到有,通常是利用科技创新带来的“颠覆性”,这也可以称之为从0到1。

从1到N,固然是维持社会文明前进的稳定基础,但对企业而言,从0到1应该是一种“先天下之忧而忧”的创新意识,一家企业要能够跳出“舒适区”,学会突破认知界限,不断通过从0到1的认知重塑,来开辟新赛道,才有希望成为市场的引领者。

爱数总裁贺鸿富

“从0到1”是一种开创性,是在重新定义新事物,是真正的原创。爱数总裁贺鸿富认为爱数有机会在数据产业成为一家从0到1的公司。这既是爱数总裁贺鸿富的个人坚持,也是爱数十六年来,在数据产业赛道中不断求索的动力。

#1

Data+AI的机遇是领域认知驱动

如今,资本的关注和技术的发展相结合,正在推动一个蓬勃发展的数据产业。这也许并不是一个全新的赛道,但在很多发展节点上,总是不乏从0到1的创新者,比如分布式存储对NAS存储的压力,云数据库对传统关系型数据库的取代等等。

爱数认为,正是不断的从“0到1”让整个数据产业总是处在快速发展的车道上,如今与数据产业相关的公司总市值已突破了2500亿美元,且已经诞生了6家市值超过100亿美元的超级独角兽。

的确,由数据价值驱动的数字经济正成为推动社会前进的主要模式,所有新兴的业态和场景化创新,无不是以数据价值的挖掘为基础。

对今天的企业来说,数据作为一种“无形资产”的重要性也变得比以往更加凸显。企业的数字化战略已经从“业务驱动”转向“数据驱动”。数字化转型的前提是数据化,所以数据成为了一种新的生产资料,也成为了智能化业务新的“起点”。

但拥有数据,并不等于获得了数据的价值。企业需要有效地掌握数据,并通过AI技术与数据结合,深入发掘数据对业务的驱动力、决策力和创新力。我们发现凡是依照这个逻辑所衍生的公司和业态,无一不是颠覆传统行业的新物种,比如那些创新速度更快的互联网公司和云计算公司。

因此,爱数认为,未来数据产业的关键词应该是:Data+AI,而驱动Data+AI从0到1的新机遇则是:领域认知驱动。

简单地说,领域认知智能是指利用人工智能的手段,基于业务模型,从各类数据中提取领域知识,并利用领域知识进行推理分析,解决领域内问题的技术体系。

如果从人工智能的发展历程来说,几乎过去20年都是感知智能的发展阶段,包括视觉、听觉、触觉等感知能力的提升,以智慧城市的场景为例,在城市中安装各种摄像头、卡口、物联传感设备等数据采集系统,可以海量地去收集城市运行的各类信息。

感知智能的发展,快速推动了AI作为一种通用能力的普世化,但感知智能作为通用的AI能力,还需要与具体的行业和场景相结合,才能发挥出业务智能化的价值,这就需要领域感知智能。如城市庞大的数据资产经过沉淀且“知识化”,与各项领域认知智能网络相结合,就形成了一个又一个的城市治理智慧应用。

#2

跨越认知智能与行业落地之间的鸿沟

对企业而言,要实现真正的“认知智能”,要经过3个步骤,先要做好全域数据的整合,再结合知识网络,最终走向认知智能。

为此,2020年爱数率先提出了“数据驱动型组织”的全新理念,完成从非结构化数据、结构化数据到机器数据三大数据源的多模态数据的整合,同时基于AnyDATA ONE一站式知识网络平台,将数据加工成知识,帮助企业通向认知智能。2022年,爱数又发布AnyDATA Framework 2,以领域知识网络、领域智商、集成的开发框架三大创新,赋予机器认知能力。

事实上,前瞻性的技术方向,未必都能换来市场的认可。IBM是第一个将“认知计算”作为企业未来愿景的公司,但除了沃森在医疗领域有不错的落地案例之外,在其他行业鲜有成功的样板。这说明,认知智能需要感知智能的成熟作为基础,超前的战略构想实际上有拔苗助长的嫌疑。

是感知智能技术的极大繁荣,让认知智能迎来了真正的发展契机,但这依然不够。我们要认识到领域认知智能与真正的行业落地之间,还有不小的距离。

首先,认知智能的技术能力与行业场景之间,还隔着一道鸿沟。往往有AI技术能力的企业缺乏场景,而传统企业拥有足够多的场景,但却缺乏AI技术能力的支撑和专业的团队。

其次,真正核心的AI能力和算法,仍然掌握在少数顶级AI公司的手里,AI的行业生态圈并不完整,尤其是认知智能与行业场景的结合也缺乏标准和成熟的方法论。

第三,人工智能要离开高高在上的殿堂,终究会步入民间,成为通用的普惠技术。智慧城市、智慧交通、智慧农业、智慧水利、智慧工厂…整个社会的智能化,需要普惠的能力。

第四,人工智能的专业人才还存在较大的缺口,这导致产业智能化的底层支撑力不够牢固,人工智能的产业生态成熟速度比预想的要更缓慢。

爱数研发副总裁陈骁指出,作为人工智能的子系统,很多行业领域都需要专业的领域知识驱动,但要发挥认知智能的价值,就需要将其限定在一种领域边界当中,来解决具体场景化的难题。

这种边界的划定,也有机会让领域认知智能,成为一种最佳实践,同时在普惠千行百业的这条路上,还缺一项重要的普世能力,那就是开源!

#3

开源是爱数站在行业视角的价值重构

马克·安德森说过,软件吞噬世界,而开源则在吞噬软件。早期开源软件是以成本驱动,长期博弈垄断的封闭系统,但现在开源已成趋势。如今很多大企业的IT部门,都在关键任务项目中,大量使用开源软件。

众所周知,开源的好处在于不用重复造轮子,从代码的层面就将共性的信息奉献到社区,由广泛的开发者在开源代码的基础上,加速软件本身的更新和迭代。开源不仅是一种商业模式,更是一种推动创新的加速器。

陈骁认为,通过领域认知的开源,可以整合全球智慧,进一步推动AI能够在普惠更多行业,更快的打开智慧世界的大门。

为此,爱数推出开源领域认知智能项目KWeaver,其中的K代表知识(Knowledge),Weaver代表编织者,意为将所有的知识编织在一起,从而实现领域认知智能。

据介绍,KWeaver项目是基于爱数认知智能框架AnyDATA Framework 2,以成熟的数据知识化方法论和系列认知智能应用组件赋能开发者,帮助企业降低认知智能应用开发的复杂度与人才门槛,更便捷地实现认知智能。同时,爱数也将推出认知中台方案,升级数据中台方案为知识中台方案,以更好的服务于客户,与客户共创,让AI深入应用场景,真正赋能客户的数据。

事实上,爱数早就在探索认知智能技术开源的可行性。在2019年底,AnyDATA ONE正式立项,爱数通过打造多模态的知识图谱平台,就已经为开源项目打下基础。经过近3年的优化迭代,AnyDATA Framework 2 演变成了一个基于领域知识网络的认知智能框架。2022年9月,脱胎于AnyDATA Framework 2的KWeaver 正式宣布开源,为了这条开源之路,爱数其实已走过了三年的准备期。

我们知道,任何开源项目都需要通过广大的开发者生态,而好的开源项目往往会针对不同属性和程度的开发者,提供差异化的能力的方案。

在这方面,KWeaver则为领域认知智能的数据科学家、应用开发者、领域专家提供了不同的能力。比如通过可视化的知识网络工作台、可视化的认知智能应用开发调试工具,为开发者们提供快速的开发能力。同时可以基于云原生的技术,提供横向扩展能力,并采用分布式的计算引擎来实现海量数据的接入和计算。

开源的本质并不是为了开源而开源,开源的目的是通过开放的机制,推动生态创新的效率。

可以预见,KWeaver的开源可以借助开放社区的研发资源演进产品,并把各行业和领域内解决问题的思路、方法、模型融入到爱数的领域认知框架。进一步将领域认知智能的能力,延伸到千行百业的各个场景。

KWeaver尽管是爱数的第一个开源项目,但它的背后是爱数市场地位提升之后,站在更高的行业视角所做的一次价值重构,也意味着爱数真正意义上以“隐形冠军”的目标在要求自己。

0 阅读:4

科技正能量

简介:相信文字有力量改变世界,坚持科技改变生活的正面角度。