谁也没想到,由ChatGPT引发的生成式AI,宛如雨后春笋一般,肆意的疯狂生长,并且迅速成为科技行业炙手可热的风口,从简单的问答、到生成一张图片、一段代码,生成式AI的爆炸式增长,让它开始不断深入的介入我们的生活。
当然,作为目前我们手边集成度最高的智能终端,手机毫无疑问将成为生成式AI普世化的最终落点,很显然,芯片厂商已经开始着手解决算力问题,而如何应用好这些算力,将生成式AI从一个缥缈的专业名词,转变为真正能够提升使用效率、方便用户使用的功能,则要看各厂商的想象力以及执行力。
回想当年AI介入手机摄影,打开了手机影像的算法之路,时至今日“计算摄影”大行其道,甚至倒逼各种实体摄影品牌加入联名,成为各厂商的炫技必争之地。可以想象,如果生成式AI在智能终端领域发育成熟,必然能够为智能手机带来新一轮的革命。
毫不夸张的说,生成式AI是最有可能让智能手机真正成为“智能”手机的技术,谁能率先涉足这一蓝海,谁就有资格抢占更多的数据资源,就能更早的训练出成熟的模型和功能。
vivo,率先走出了这一步。
在最新发布的OriginOS 4上,vivo⾃研的通⽤⼤模型矩阵——蓝⼼⼤模型,正式落地。
对于OriginOS这样一套已经成熟完善的系统,加入生成式AI的阵营,毫无疑问就是重新再走一遍从0-1的过程,对于OriginOS 4和蓝⼼⼤模型来说,涅槃的路已经开始,而OriginOS 4上的各种体验究竟如何,让我们接下来一起慢慢探索。
蓝心小V,是生动又有趣的硅基生物
要了解OriginOS 4的核心,首先就要了解支撑起它全部智慧功能的基底——“蓝⼼⼤模型”。而要深入了解什么是“蓝⼼⼤模型”,那么我们首先就要搞明白,什么是AI,什么是“模型”,以及这两者之间有什么关系。
其实AI本质上是计算机科学的一个分支,而我们都知道,训练AI的本质其实就是不停的对其“投喂数据”,让其反复学习提炼出特点,最终形成程序代码意义上的“条件反射”。
但是数据池中的数据茫茫多,我们不可能将其全部投喂给AI进行学习,同时,训练AI的目的,往往是给予其一定的方向,在某些方面形成“专精”,继而帮助我们提升效率。所以如何圈定AI的学习范围,将其发展出训练者希望它拥有的“特长”,“训练模型”的意义便置于此。
简单来说就是,训练模型就像是专属于AI的训练跑道,确保AI在奔跑的过程中,不会出界,它方向决定了AI的专长。
而vivo的蓝⼼⼤模型,官方宣称将包含⼗亿、百亿、千亿三个参数量级,其中包含了共5款⾃研⼤模型,分别针对了5个不同的应用场景。
其中,10亿参数量级的模型将会是⾯向端侧场景打造的专业⽂本⼤模型;70亿参数量级的模型,是专门⾯向⼿机平台打造的⼤模型,在⾃然对话、知识问答、意图理解等场景下能⼒优秀,并且也即将成为⾸家开源的,手机平台大模型。
再高一些的700亿模型,是⾯向云端服务的主⼒模型,既有智能涌现,也能兼顾成本和性能。在意图识别、⽂案写作等场景下优势明显。更高的1300亿和1750亿模型,则是为了应对极限场景下的复杂任务而产生的模型。
从“蓝⼼⼤模型”整体的分布不难看出,针对手机平台的大模型,其⾃然对话、知识问答、意图理解等场景下的发力点,恰好就和生成式AI目前在工业生产中的热门应用点不谋而合。并且着重放大了生成式AI最关键的体验——“交流感”。
生物智慧性的体现源自“交流”,如今稍显鸡肋但是曾经让我们眼前一亮的语音助手,最开始就是凭借着能够和我们“交流”,让人眼前一亮,大为震惊。
而生成式AI最开始,也是凭借着“交流”出圈,并且是那种观感上更具有“人性”,而非按照提前设置好的语音指令,进行的“机械式”交流。
既然要营造交流感就必然需要树立一个交流对象,对于OriginOS 4来说,就是要让经过“蓝⼼⼤模型”训练AI,以一个具象化的形式存在于手机系统中。
于是“蓝心小V”应运而生,并由此为OriginOS 4带来了一系列全新的功能。
生成式AI的“人性”,源自其能够通过学习现有的数据并生成新的数据,从而实现类似人类创造力的功能。与传统的AI系统不同,生成式AI系统能够自己创造出新的内容,而不是只能根据输入的数据进行处理和分类。
所以自然“蓝心小V”也继承了这些特性,全新的超能语义搜索、超能问答、超能写作、超能创图以及超能智慧交互,颠覆了以往AI在手机操作系统中的功能和位置。
实用性上来说,超能语义搜索、超能问答和超能写作,这三个功能是我这几天试用下来,感觉非常能够提升工作以及实用效率的功能。
超能语义搜索的效果,简单来说就是进阶版的模糊搜索,不需要输入指定的关键字,只需要说出一些你对这个资料的简单描述,比如去年夏天拍的照片,或者刚刚保存的文档等,之后蓝心小V将基于你这些的简单描述,为你快速挑出对应的照片或文档。
超能问答除了能够提供和ChatGPT效果一样的各种问答对话外,能够实现非常人性化的文章提炼功能。当我们在阅读大篇幅的文字信息时,蓝心小V不仅可以基于网页/文档/链接的内容进行总结,还可以对文本内容进行问答。
甚至可以帮你总结论文,对于需要查阅大量相关文献的文字工作者来说,这个功能简直不要太好用,这才是真正的解放生产力。
超能写作顾名思义,就是能够根据你的要求生成不同风格的文字,但是高能的地方是,除了文字,它竟然还能够生成思维导图!输出一个你需要的项目,之后蓝心小V就能给你提供一个具备大致思路的思维导图,对于那些第一次上手项目,或者是灵感枯竭的策划们来说,这不就是自带的系统外挂?
除了上述的三项功能外,还有一项颇具趣味性的功能就是超能创图。它不仅能根据使用者的要求自动生成带有相关元素的图片,并且还能进行一系列的抠图,修图操作,和手动调整比,确实是非常方便了。
而超能智慧交互可以说是通过OriginOS 4渗透进了手机的各个细节以及操作中。例如能够提供大爆炸、应用内抠图等功能,别看这些功能看上去挺小,但是背后都是需要非常高的算力支持。
如此出色的蓝心小V,呼出它的方式也非常简单,侧边栏、悬浮图标以及原子组件都能够呼出它,与它交流既可以通过文字、语音,也可以通过直接拖拽语音、文档等。
前面说到了,作为一个开源项目,vivo此次也将蓝心小V单独提取了出来,以“蓝心千询”名字将它包装成了一个独立的公版APP,并上架各大应用商店,前面提到的自然对话、快速问答、文学创作、图片生成等功能,别的系统的手机届时都能享受得到。
总的来说,作为蓝心大模型在手机端的具象化缩影,蓝心小V目前能够提供的功能,已经远超之前大家一直以来对于,国产手机操作系统的认知,也确实将生成式AI的各个技术点转化为了非常实用且能够高频使用的功能,实现手机端的软着陆。
而目前生成式AI已经在多个领域得到了广泛应用,例如音乐生成、图像生成、文本生成等。这些应用使得人们可以快速地生成大量的创意内容,并为创意产业的发展带来新的机遇和挑战,如今蓝心小V已经做到了其中的文本、图像生成等,而随着模型的不断扩大,AI训练的不断成熟,想必不久之后的蓝心小V将更加强大,被赋能的终端,将成为真正意义上的生产力工具。
造虚拟显卡,分轻重缓急,重新定义系统流畅
体验完了OriginOS 4颇具里程碑意义的蓝心小V之后,接下来,我们将要回归一款系统最基本的体验——流畅。
其实安卓系统发展至今,卡顿的情况早已经不再像最初的那样频繁,外加现在旗舰们的内存内卷,动辄12G起步的RAM,似乎也不允许安卓再出现卡顿的情况。
那么在现如今根本不差硬件资源的情况下,厂商们又该如何重新诠释“流畅”呢?
其实答案很简单,保动画、保前台、保留活。或者更直接的来说,保证消费者系统体验的连贯性。
现如今,消费者心中理想化的“流畅”,具象到系统体验上其实换一个词更合适,那就是“精致”。阻尼的设置、动画的连贯,甚至是解锁过程中的粒子效果,想要让系统呈现出精致的流畅,就要对整个系统的动效,进行深入到以“帧”为单位的刻画。
为此,OriginOS 4提出了“虚拟显卡”的概念。在“虚拟显卡”的基础上,OriginOS 4针对安卓动效绘制流程进行重构,并运用了“动效远程化”与“动效并行机制”两套异步动画解决方案,等于说,在系统数据的处理上,为这些华丽的动效们开了绿灯,从根本上解决安卓因动效架构差异所导致的系统动效卡顿问题。
通过鲁sir的演示可以看到,整个OriginOS 4的动画衔接非常顺畅,无论是应用的打开与退出场景,还是打断动画,不仅能做到“从哪儿来回哪儿去”,并且与OriginOS 3相比:让应用响应速度提升36%,显示帧率稳定性最高提升70%。
如果说动效的流畅是系统表层的呈现,那么后台保活以及对于硬件资源的调度,则是一门深入系统的艺术。
我们都知道Android系统的底层是基于Linux内核,而在Linux内核中,有一套“公平调度”的算法,这一算法能够保证运行在Linux内核中的程序,都能平均使用算力资源。
举个例子,我们在使用手机时,一定是希望前台正在运行应用的优先级,要高于后台应用的。在“公平调度”的算法,不论你是啥应用,系统都会给你分配固定的资源。因此就会出现后台应用一旦多起来,影响前台正在运行应用的流畅度的情况。
很显然,在手机实际使用的场景中,一定会有主次排名,也一定是优先保证前台正在运行的APP能够获得足够的硬件资源支持,继而让用户感受到流畅的体验。
于是vivo率先在OriginOS 3创造性的提出了“不公平调度”的策略,在这种全新的资源管理调度算法下,我们在使用手机运行高负载应用时,就可以让系统尽可能多地分给前台应用更多资源,以缓解手机在运行高负载环境下的卡顿问题。
到了现如今的OriginOS 4身上,我们迎来了“不公平调度2.0”版。“不公平调度2.0”版在1.0版本的基础上,实现了线程级的不公平调度,并且将能够调度的资源扩招到了网络、内存以及IO资源中,实现了手机系统范围内的全链路资源调度。
同时,例如内存融合、异构计算这些在国产系统上已经非常成熟或者已经出现的功能,OriginOS 4也做到了人有我新。
内存融合方面,OriginOS 4进一步提升了内存分配以及回收的速度,这项提升的主要功能是进一步降低ROM的读写压力。我们都知道内存融合技术的本质,是将多余ROM容量划分出来予以支持RAM,但是ROM和RAM之间的数据读取速度是不同的,所以说一旦遇到规格差距较大的ROM和RAM组合,就会出现那种开了内存融合,手机反而更卡了的情况。OriginOS 4正式针对这一点进行了专项优化。
经过以上这些系统优化的小连招,在我们以vivo X90 Pro+,12+256G的测试终端上,OriginOS 4的系统体验测试跑出了218.47分的成绩,对比搭载OriginOS 3的同设备,得分有显著的提升。想必当稳定正式版放出之后,这个成绩还能被刷新。
好用,会更好用;安全,会更安全
OriginOS从诞生之初起,就是一个富有创造力的产物,它几乎颠覆了当时人们对于厂商本地化OS的固有印象,从审美到操作再到功能,堪称对当时安卓系统布局的重写。
而它难能可贵的是,在做到颠覆的同时,却始终用实用和安全这两道缰绳牢牢驾驭着它,让OriginOS本身不会因为过分的华丽而变得陌生,体验上变成空中楼阁。
说到好用和安全,想必没有人不会对横空出世的原子通知、原子随身听、原子套件以及原子私密系统等功能感到赞叹。
首先以原子通知、原子随身听等这些为代表的小功能、小组件,它代表了OriginOS本身将信息流高度集成化的特点,这会进一步降低使用者对信息分类的使用成本,进而提升使用整个系统时的使用效率。
在OriginOS 4中,vivo进一步将“集束化”信息流的理念拓展到了日常出行以及汽车驾驶中。
有车的朋友的想必最清楚,开车出门在外,停车、找车无疑是最令人头疼的地方,尤其是在热门商圈附近,明明商场近在眼前,但是无奈没有停车位,为了不吃发单只能在商场周围兜兜转转,或者将车停在距离更远的地方,明明是方便出行却反而更加累人。
而且不只是停车,返程找车的过程也相当离谱,在七拐八拐的地下停车场,出去再进来之后,大家应该都是“金鱼记忆”了,明明感觉就是停在那儿但就是找不到。
针对这两点,vivo联合百度地图、高德地图和捷停车,在OriginOS 4中实现了通过原子组件一键查询附近停车位的功能,同时通过“拍停车位置”按钮,还可以实现一键拍摄停车位置并储存至独立相册,同时自动记录停车场GPS信息方便找车。
如果车主停放的恰好是捷停车智慧停车场,则可以直接输入停车位编号实现一键找车,并且离场时缴纳停车费的操作,也可以直接在搭载了OriginOS 4的手机上完成,不用费劲巴拉的把手伸出车窗外去扫码。
另外,在保持整体UI设计元素不大改的情况下,OriginOS 4进一步对系统内部的元素进行了微调。首先就是统一了标题栏的样式,其次对设置菜单的顺序进行了整合微调,这些都让OriginOS 4的视觉风格更加整齐、简洁。
最后,安全方面,OriginOS经典的“千镜可信引擎”,在OriginOS 4上被进一步强化加固,不仅可以在金融支付场景下识别诈骗剧本,同时对应用还能施以动态监控,为隐私安全层层加码。
从硬件的附庸,到硬件的赋能
我们经常能够在生活中听到“赋能”这个词语,并且总是觉得它很玄、很宽泛。实际上从字面意义不难看出,所谓“赋能”就是为他人或合作对象赋予某种能力或能量。通俗讲,就是帮助他人或者合作者“增强能量”。
而在赋能与被赋能者之间,很显然从姿态上来说,前者要更加强势。对于OriginOS 4来说,“蓝心大模型”和“蓝心小V”赋能了OriginOS系统本身,让它单纯的从指令的执行者,变成了指令的创造者兼执行者。
继而,OriginOS 4通过自己属性的改变,赋能每一部搭载它的终端,让智能手机真正拥有智慧,也让人机交互实现真正意义上的“互相反馈”。
引入大模型和生成式AI,无疑是OriginOS 4巨大的革命点,与此同时,它目前为止所展示出的种种功能以及效果,是成熟、可用并且充满前景的。
当智能手机的硬件形态目前遭遇瓶颈,AI给予了它再向前迈出一步的机会,OriginOS 4目前来看已经牢牢抓住了这个机会,假以时日,会不会乘风而起呢?
vivo就是个笑话[笑着哭]美國一封api 即跪,连研发个芯卡都不敢