要为14亿中国人打造数字分身,这家公司以算法取胜

优链时代 2022-12-10 14:17:12

蒋亚洪,杭州优链时代科技有限公司 创始人CEO,浙江大学计算机创新技术研究院 研究员

本文全文5965字,仔细阅读需要9分钟

在过去的半年多时间里,WEB3笔记采访了多个数字人公司。但优链时代却是最特别的一个,它不侧重于营销,只聚焦于做数字人技术。

优链时代致力于为中国14亿人打造跟真人样貌、神态高度切合的3D数字分身,如同去年英伟达CEO黄仁勋在公司发布会上展示的自己的数字人。

只是黄仁勋为打造自己的数字分身,运用了数十万美元的单反相机阵列,由34个美术师及15位工程师配合进行合成;而优链时代的产品:通过一秒的拍摄,被拍摄者最快5分钟获得自己的数字人,成本只要1百元。

这款产品就是3D云阵相机,为研制这款相机,蒋亚洪博士和他的团队用了五年时间,先后投入超过8000万元人民币。在历经四次迭代之后,成功解决算法上的数据缺失、计算时间过长等问题,进入商用阶段。

在总结这段经历的时候,蒋亚洪博士对WEB3笔记表示,创业的过程就是一个自我修行的过程,做技术尤其如此,解决问题的过程非常漫长,而且时间不可预估。这个过程会非常痛苦,甚至会让你死去活来,但没有这个(过程)怎么能去担当更大的挑战呢?

所以面对即将到来的商业推广,他的心态非常好:“所有的应用,都需要时间让用户去接受。我不知道具体那个时间点爆发,但我知道,只要方向是对的,市场爆发点总会来的。就如烧开水,水是一定会开的,能做的就是安下心来,只管加柴烧火。”

采访摘录

WEB3笔记:作为一名学者创业者,你怎么看待数字人产业的商业前景?

蒋亚洪:我们平常都是这么认为,2000年是PC互联网的元年,2010开始进入移动互联网,我们现在就进入元宇宙时代。

元宇宙是场景,是3D虚拟数字世界,可以沉浸式体验。比方说我们如果在元宇宙里开会,我们每个人都需要有自己的数字人,需要有硬件设备和软件系统,让我们真人和我们的数字人保持同步,包括眼神、表情、语音和肢体动作。所以,当我们在元宇宙里数字人坐在一起,大家看到的表情和神态,跟我们现实中本人是一模一样的。

我们目前的技术,还没有达到上面描述的理想状态。如果这个理想状态能够实现,那将给我们的工作和生活带来颠覆性的改变,包括我们的工作、会议、上课以及购物等。

WEB3笔记:您认为这样的理想场景什么时候能完全实现呢?

蒋亚洪:我估计两年左右能实现60%,五年左右基本上是90%。因为这涉及到很多方面的技术,包括硬件、人工智能(AI)、图形图像、数字人、元宇宙空间、区块链。它需要产业协同,需要很多公司的工作。

WEB3笔记:假如这个理想场景能够实现,我们的生活、工作会变成什么样?

蒋亚洪:我们在市中心的办公大楼远远不需要现在这么多。现在我们在家里上班,我看不到你,你可能还接了一份其他的工作。但是,假如咱们在元宇宙中工作,同事坐在一起,那我们可以一起聊天,可以在白板上讨论问题,就如在公司一样。所以,元宇宙时代,大部分人应该可以在家里上班。

又如,在元宇宙里和亲朋好友一起打麻将,每个人在不同的地方,都有自己一模一样的数字人,通过软硬件设备,真人和数字人实时同步,身临其境的体验,就像大家现在坐在一起打麻将一样。

大家知道,移动互联网对我们的生活改变巨大,但元宇宙对我们生活和工作的影响要比移动互联网的影响还要至少大100倍。在这种理想场景下,我认为未来一些没有创意的工作完全可以交给是数字人或者机器人,所以这对我们整个产业的任何方面都是颠覆性的。

所以我估计,(经过)2~3年左右,大部分人应该是都能感受得到(这种变化)。

WEB笔记:优链时代主要聚焦于基于真人3D数字分身的打造、研究与应用,那真人数字人跟虚拟数字人在很多应用场景和在技术实现方面有什么不同?它们在商业前景上有哪有区别,哪个更好一些?

蒋亚洪:我把元宇宙里边的人分成两种,基于真人的把它叫做数字人,基于非真人的叫做虚拟人。所以这样我们就分开来了。数字人是真人,虚拟人是指非真人。

给真人创建完美的3D数字分身,包括四个基础要素:1.人体模型——通过拍摄等手段,创建人体的3D数字模型;2.肢体动作——骨骼绑定支持人体模型以人的方式活动,通过动作捕捉,实现数字人在虚拟空间有意义的肢体动作;

3.面部表情——面部肌肉绑定支持面部表情变化,通过面部捕捉,实现数字人在虚拟空间有意义的面部表情呈现;

4.语音对话——同步音频、TTS等技术,实现数字人语音对话。

以上四个基础要素的完成度,决定了一个真人数字分身的完成度。

数字人和虚拟人都有不同的应用场景,比如工作中同事开会、社交中跟男女朋友约会,跟家人一起打麻将,我们肯定要用自己的数字人,不能用假的虚拟人,否则就没意义嘛。

所以,很多场景中,需要我们用真人的数字人。换句话说,要真正体验元宇宙的应用,我们每个人都需要有自己的数字人。

当然,虚拟人也肯定有它的应用场景,但至于说哪个的商业前景更大,还很难说。我只能说,真正要进入元宇宙,我们每个人都需要有自己的数字人。

WEB3笔记:我在短视频中看到了您的数字人,可以跳舞、打球,我想问的是,数字人和虚拟人在后面的内容创作上都需要用到AIGC技术,技术上会有不同吗?

蒋亚洪:本质上是一样的。唯一的区别还是在人的外形,就是我们的(数字人)是用云阵相机把我们真人的3D形象照下来的;虚拟人,它是电脑上面捏出来的。AIGC(AI Generated Content)是由AI生成的内容,其特点是自动化生产、高效。而我们的优链3D云阵相机对人体的不同角度进行拍摄,用时只需要一秒钟,通过AI算法最快5分钟能将拍摄的百张照片生成人体3D模型,大大的提高了建模的效率。其实也是AIGC技术应用的体现。

WEB3笔记:使用云阵相机制作数字人,优链3D云阵相机有哪些优势,成本会有大幅降低?

蒋亚洪:十年前,我们要造一个真人的数字人,只能手持扫描仪。

五年前,需要用单反相机阵列拍摄,再加后期渲染合成;但是单反相机的成本高,而且操作复杂。

优链3D云阵相机是用普通手机的摄像头替换了单反相机。虽然在硬件上差别不大,但在核心算法上相差很大。我们一直在不断优化自己的算法,前前后后,差不多用了5年的时间。让3D云阵相机能够快速采集人体模型和创建元宇宙数字分身,具有五个优势:

1. 精度高:140个摄像头,全方位无死角,最高可达5亿像素,人体点云数据量达到300多万个。

2. 成本低:创建一个数字分身,成本只要100元。

3. 建模快:最快5分钟可以完成创建3D人体数字模型。

4. 操作易:无需专业培训,全程智能化手机操作,极大提高了效率。

5. 拍摄短:人站立在3D云阵相机中间,一秒拍摄。

WEB3笔记,那请您给我们介绍一下云阵相机的技术和算法,他现在处于一种什么样的水平?

蒋亚洪:优链云阵相机的核心还是算法,通过这个算法,可以让一个人体的模型比较完整,质量高,并且是确实可用。

以前的算法是不能实现大规模商用的,生产的数字人有很大的瑕疵,包括“缺数据”(需要花人工去修,这需要很多精力,成本很高)、运算时间过长等问题,所以我们需要不断的进行优化。

截止目前,我们在硬件上面已经迭代了四次,到现在这个版本才开始正式投入商用。但它的迭代的核心还是算法。这个算法是摄像头从每个角度(三百六十度,从头到脚的每一个角度)给你身体拍摄的照片。然后用算法集合这些照片把你的人体模型给组建出来。现在我们云阵相机用五分钟就能把数字人的模型计算出来,并且这个模型直接可用。并且它的自动识别度比较高,包括衣服的颜色,都能计算出来。

为了让它的计算时间变得更快,把人的模型做的更好,把成本降得更低,这五年,我们花了了至少8000万人民币。

我经常开玩笑说,做技术很难,这个难,在于你不知道这个问题什么时候能解决。也许是一天,也许是下个月,但可能一年都没解决。

WEB3笔记:5年,8000万,您有哪些感悟?

蒋亚洪:我这么多年下来,最大的感悟就是自己的认知问题:这与钱和人才都没关系;自己是一切问题的根源,需要不断提高自己的认知。

提高自己的认知,首先要改造自己。这不是说去读几本书就可以了。我经常说是,我们是一把比较钝的刀,如果要变成一把锋利的刀,就必须把自己放在磨刀石上磨,磨刀的过程很痛苦,会让你死去活来,但没有这个过程,人怎么会变成一把锋利的刀呢?没有这个怎么能去担起更大的挑战呢?十年前,我看稻盛和夫的书没多大感觉,现在再看,感受太深了,有时看到眼泪都会掉出来。所以,我感觉创业就是对自己的修行。

同时,我非常感谢许多朋友的帮助,没有他们的帮助指点,就没有公司今天这个成就。

WEB3笔记:所以,现在3D云阵相机的技术算成熟了,是吗?

蒋亚洪:成熟了,今年上半年邀请了很多人到公司来体验,下半年又走出去参加展会。明年上半年很多落地的应用会起来。

明年的目标是在北上广深等一线、新一线城市普及我们的3D云阵相机,给大家拍摄数字人。我们的目标是,明年至少给全中国100万人拍摄数字人。

WEB3笔记:那你靠什么赚钱呢?就像这100万如何用上这个3D云阵相机?

蒋亚洪:明年,我们会在旅游景区、购物中心、步行街等地方铺设我们的云阵相机。现在许多行业都在做元宇宙空间,到时,它就需要有数字人就进入他们的元宇宙空间。明年上半年,苹果的VR、AR眼镜也会推出来,大家体验元宇宙的机会越来越多。

在这些地方给大家拍摄数字人。我们的赚钱方式主要体现在两方面:

第一,我们把(云阵相机的)硬件是卖或者租给运营商;

第二,拍摄数字人,我们收技术服务费。

有的时候,我会打个比方,我们相当于卖相机给照相馆,同时也顺便洗照片的云服务,虽然照相馆自己也能洗,但我们洗会更便宜质量更好。

WEB3笔记:但是,我有了自己的数字人之后,如何能像您在短视频中一样,去跟别人打篮球?去跟老太太跳广场舞呢?有没有后续的服务和支撑?

蒋亚洪:您提到的这些后续的支撑,其实是内容,我把它称之为元宇宙里面的第三块事情,第一是人,第二是空间,第三是内容。

我们是解决了人的问题,很多公司在做元宇宙空间,同样也有很多公司在做元宇宙内容。我们有很多做元宇宙内容的合作伙伴,刚才讲的各种各样的内容,无论是玩的还是工作的、教学的,这些内容都会出现。所以当你有了数字人,就会有足够多的东西让你去做,不要担心。

WEB3笔记:等于你们是女娲造人,剩下要启蒙的话,需要借助你们的合作伙伴。

蒋亚洪:对,这是一整个的产业链。

我们为什么要到明年上半年才开始逐渐落地,是因为元宇宙的其他基础建设还在不断发展壮大,当其他元宇宙内容服务和空间平台服务等基础建设越来越完善的时候,我们的数字人可以让内容变得更充实,赋能多个领域。我们公司专注于数字人,我们只做我们擅长的东西,尽量不分散精力去做别的事情。

WEB3笔记:嗯,明白。未来你们这块儿业务还是主要靠to B赚钱?

我们的模式是2B2C,赋能B端,服务C端。

WEB3笔记:公司下一步应该怎么去做?怎么迭代?未来云阵相机的成本会不会进一步降低?有没有新的产品以及相关的布局计划?

蒋亚洪:需要从技术和应用两方面回答你这个问题,

技术层面,虽然我们现在有已经有很好的数字人,可以应用到许多场景,但如果将理想型的数字人算作100分的话,那我们现在的数字人可能也就60分吧,因为要表情、神态、语音等加上去,成本还是比较高。所以我们会让数字人的质量进一步提高,包括让它的表情、神态、眼神,语音以及自己动作都更自然,且制作成本不超过1000块钱,去做到100分的水平。所以,我们需要继续优化算法商业应用方面,落地的应用需要不断扩展,你不去拓展应用,你做的东西再好,市场也起不来。所以,我们同所有的产业在合作,前段时间我们跟专门制作内容的万兴科技达成战略合作,在此之前,我们同中国移动、中国联通、中南卡通也达成了合作。未来我们会和许多头部企业合作,支持各行各业的不同场景。

关于成本方面,就像我们的电脑一样,现阶段技术升级的重点,不是为了降低数字人的制作成本,而是为了将我们的数字人打造的越来越好。如果最终目标是100分的话,我们要努力把它从现在的60分提升到80分,未来还要再继续提升到更高的分数,这样它的应用才会越来越广泛,给我们的生活带来越来越多的便利。

数字人应用的地方很多,比如智慧养老。实施积极应对人口老龄化国家战略,关爱银发人群,我们想让科技传递温度。智慧养老,帮老年人跨越数字鸿沟,让数字人去陪伴与守护老人。杭州现在大约有210万老人,而且大部分都居家,居家老人最大的问题就是孤独,没人聊天,陪伴(他们)最多的就是电视机。所以,就想用我们这个技术把老人们喜欢的孩子或子女做成数字人,去陪伴老人。让孩子们在电视上出现,并能跟老人们进行简单的对话。

WEB3笔记:这需要搭建一个生态,在生态的搭建上,你是怎么思考的?

蒋亚洪:我们是在搭建一个数字人平台,和其他做空间、内容的行业合作,。大家在各自平台建立接口,经过用户本人的授权,他的数字人可以跨越到不同的元宇宙里面。

就像上面提到的老龄社会的话题,用孩子们的数字人去实现对老人的陪伴,也不一定只能在电视上出现,在可以在手机上实现。

但对我们来讲,主要还是要将我们的数字人做的越来越好,从现在的60分,一直到理想状态的100分。

WEB3笔记:面对新技术、新算法的迭代,3D云阵相机的迭代频率会是多长时间呢?像旅游景点的合作伙伴怎么看待这种还在迭代中的产品,你给他们的承诺是什么?

蒋亚洪:3D云阵相机硬件的迭代周期差不多一年。

有些合作伙伴也对我说,“蒋博士,你这个产品一迭代,我的就过时了”,我说“不用担心,我们会租给你们,我们全包服务,维修、维护,全都不用担心,新一代产品上来,就给你们换用新的。所以我们明年会全国推广,除了卖,还有就是租,所以放下心来使劲去用,把这个场景落地”

我们的目标是:帮全中国14亿人都做出数字人来。

WEB3笔记:这目标挺好,我也相信每一个人都需要一个或是几个这样的数字人,来满足多种不同的场景。但要给14亿人做数字人,你准备怎么推广?

蒋亚洪:我先回答你前面问题,一个人确实不是只要一个两个数字人,年轻人可能每一年都要一个,甚至可以让现在的自己和十年前的自己的聊天对话。

在推广方面,现在已经有公司在跟我们合作给老年人做数字人。哪怕有一天他们去世了,也可以让他们的子女有和他们的“数字分身”聊天的可能。数字分身未来可以实现人类永生的梦想。

我认为,所有的应用,都需要时间让用户去接受。无论是滴滴、美团,还是抖音,都不是一蹴而就的。咱们推广产品也是一样,它是需要时间的,但我知道,水是一定会开的。现在我们还没有听到(水要开的)声音,我们能做的就是安下心来,只管加柴烧火,至于什么时候开,老天会安排的,不要受到周围人的干扰。

WEB3笔记:是的,技术发展的速度往往是快于市场预期的。

蒋亚洪:优链时代的“元宇宙数字人技术在亚运会的落地应用”成功入选杭州市科学技术局亚运会智能应用项目,计划在亚运会期间为杭州 10万市民创建数字分身,用数字分身参与亚运比赛,如和姚明打篮球、和中国女排打排球等,激发全民参与亚运会的热情。该项目还将为国外运动员创建数字分身,让数字分身游览杭州美景,如骑自行车飞跃西湖、和市民一起打太极等,他们会在社交媒体分享,实现全球传播,宣传杭州。

0 阅读:553

优链时代

简介:专注于真人3D数字化的研究及应用。