4月26日,科大讯飞旗下讯飞星火大模型推出了V3.5的更新版本,主要涉及到支持长文本、长图文、长语音等新功能。此外,星火图文识别大模型、多情感超拟人合成、一句话复刻等新功能也在此次更新中首发。这些功能主要面向企业级应用市场,可以更高效、更安全地帮助用户解决真实场景需求。
为何新推出的一些功能都突出了一个“长”字呢?它与之前的文本、图文和语音有何区别?
其实理解这个“长”字也并不难。大家都知道AI的发展给很多办公用户提供了便捷,可以快速生成我们需要的内容或者图文,但是遇到一篇超长的报告、论文等内容,如果大模型不支持长文本,那么人工去阅读恐怕不吃不喝一天也很难完成,这就是“长”所带来的痛点。
对于像律师、分析师、咨询师、市场营销员等职业用户,日常工作需要查阅整理大量的长文本,因此讯飞星火此次更新吸收了来自各种渠道的大量文本资料,针对各种行业的专业领域可以回答的更加准确。
如上图所示,笔者上传了一个容量为11MB的《有色金属加工厂电力设计规范》,文档总计130页,整个上传过程非常的快,基本不需要等待。同时针对规范里面内容,让讯飞星火总结里面主要内容和技术要求,随即等待十几秒钟就生成了回答的文本总结。
相信哪一位工作者遇到一个130页的文档都会倒吸一口凉气,仅仅是阅读完都已经非常困难,还需要在文字中寻找自己想要的答案,难度则会提升数倍。而反观讯飞星火仅仅需要上传专业的资料文档,就能很快找到你想要了解的内容,并加以分析总结,相信对于提升办公效率是绝 对天幻级别的。
除了专业行业长文本的摘要总结以外,全新的讯飞星火还可以解读长文本,比如笔者上传了一份房租租赁合同,看看讯飞星火能否找到我们需要的关键信息。
合同类的文件一直是不容忽视的,毕竟它具有一定的法律效力,所以每次签合同时候都会仔细阅读,生怕踩坑。不过使用讯飞星火就可以把对自己不利的条款筛查出来,这样汇总后就可以直观的看到那些条款不满意,尽快与对方协商,这样就极大的降低踩坑风险。
另外还有一些条款类的信息也是我们经常没有耐心看完的,就比如《中国太平洋财产保险股份有限公司机动车商业保险示范条款》,其实购买商业险就应该充分了解它的条款,但相信还没有多少人能够耐心看完密密麻麻的16页文字。
这时候讯飞星火就派上用场,比如车玻璃被打碎,车内物品赔付问题、水淹车等问题,它都可以轻松从长文本里面找出来,并给出最详尽的解答。
除了日常工作办公,全新的讯飞星火在长文本应用中还可以涉及到读书娱乐大类,比如我们常常下载的电子书,它也可以进行分析和回答。
余华先生的作品《活着》深受广大用户的喜爱,再上传完这部13万字的PDF文档后,我们进行了简单的测试,对于书中的一些细节包括福贵是否参加过解放战争、拉去当壮丁时遇到了谁等问题,它都可以很快的回答上来。
并且对于整部书的理解也很到位,它可以根据人物关系、时代背景,解读出当时人民的生活困境,帮助读者进行深层次的思考。
讯飞星火新增的长图文功能相比长文本功能可以说更加的强大,就比如我们拿到一款药的说明书,字迹又小又多,此时我们就可以将说明书进行扫描上传或者直接拍成清晰图像上传,来了解我们需要的内容。
上图是一款注射用的阿司匹林药品说明书,它能够清晰的说出注射后会有哪些不良反应,包括肠胃、肾脏、过敏等等,还会列出各种反应对应的一些症状,以便我们及时确认当下身体状况。同时,注射期间不能同时服用哪些药品也都能够清晰列出来,相比我们看说明书方便太多。
生活中大家还会购买一些家用电器和数码产品,同样也是懒得看说明书,讯飞星火同样可以帮助我们完成产品说明书的解读。上面是笔者上传的联想E14笔记本的电子说明书,询问了说明书里面最需要了解的部分,随即讯飞星火就从说明书中列出了它认为最重要的6个要素,比如电池、电源的安全风险,一些应用软件的下载,连接显示器方法等等,确实都很重要。
另外,对于一些故障询问讯飞星火也能轻松解决。笔者询问屏幕黑屏、键鼠无法使用怎么办?它会非常有逻辑性的通过排除法来判定故障原因,很有工程师的感觉。
我们还可以直接上传不超过100张的图片,讯飞星火可以快速理解图片的信息。上面是笔者上传的一些韩国旅行的攻略,总计21张手机照片,随即询问了要去韩国玩,有哪些特色是必须体验的。讯飞星火随即就总整个图片攻略中收集了六个大类,包括文化、美食、休闲等等。
如果想要去韩国旅游5天,讯飞星火也能够做出一个详细的攻略,并且还非常符合逻辑。大部分人都是落地首尔,所以第 一天行程就都在首尔。然后第二天和第三天开始向外面扩,比如北村八景、济州岛等等。然后是第四天购物和文娱体验,最后一天休闲返程,可以看出讯飞星火的总结和逻辑能力是非常强大的。
不仅如此,讯飞星火长图文也可以应用到教育、报纸、体验报告、app截图等场景,比如学生朋友可以拍摄日常老师的板书,回家统一进行上传,然后就可以归纳总结这一天的重点内容进行复习。
对于新闻工作者来说,日常听采访录音是家常便饭,有时候几个小时的录音需要来回听很多遍,造成很多重复的工作。而使用讯飞星火的长语音功能后,只需要把音频文件上传上去,就能够随时获取到你需要的关键内容。
上面是笔者上传的一段采访山东大学教授、硕士生导师、博士生导师张新刚的音频文件,时长大约在1个小时左右。题材主要围绕他所观察到的现代人、现代中国人的精神气质,是怎么个状态,又是在什么样的机制下生成的。
不难看出,讯飞星火的工作效率是非常高的,整个上传过程非常顺畅,并且当提出问题后可以迅速回答出问题,可见应该是在上传音频文件时就已经进行了音频转文本的工作。并且对于归纳总结也十分到位,对于给到年轻人的建议,它根据整个音频文件总结了7个要点,还是非常到位的。
在我们测试的整个过程中,所有上传的文档都会被记录在个人空间内,除了可以方便我们查找以外,也是在丰富个人的数据资源库,这样更能综合性的进行问答。
此次讯飞星火大模型V3.5的更新版本还推出了多情感超拟人合成和一句话声音复刻两大功能。其中一句话声音复刻是可以通过念一段对话把自己或者别人的声音录制进去,这样在和讯飞星火人工智能沟通的时候就像是与自己或者朋友在聊天,亲切感瞬间就提升了很多。
并且讯飞星火加入的多情感超拟人合成后,它就更像真实人的对话,我们能感受到它的高兴、抱歉或者撒娇,语气完全和平常AI截然不同,让沟通更加愉悦。
总结
在AI人工智能井喷式发展的前提下,长文本、长图片、长语音的推出无疑是增强了讯飞星火大模型V3.5的核心竞争力,并且也拓宽了其用户领域。对于一些经常要处理上万字甚至数十万字的文档企业用户来说,长文本无疑就是那颗救命的稻草,即便行业比较偏,它依然能够从上传的资料中寻找到你想要的答案,这就是对用户最大的核心价值。
从上面各个案例的测试中也能看出,更新后讯飞星火大模型V3.5在长文本、长图片、长语音的识别和理解能力上是非常强的,因为文本过长且内容过于分散,想要不漏掉关键信息就需要有好的技术算法支撑,无疑讯飞星火大模型V3.5是非常合格的。目前笔者上述聊到的各个功能均已上线,有需要的用户不妨亲自去试试,看看是否能够给你所在领域的工作带来便利吧。
现在办公几乎离不开星火,用好了,工作效率提升不止一倍
是真正的可以提高效率的,以现在的实力,对标gpt4不是不可能
我自己亲自体验了长文本、长语音和长图文功能,确实省时省力