近期有众多媒体报道传音控股(以下简称传音)已与阿里云达成合作,通义千问大模型已经搭载在传音旗下科技品牌TECNO推出的AI手机PHANTOM V Fold2中,以此打造深度本地化的实用型AI 。这一合作意味着双方将在智能手机的AI体验上开启新的篇章,为用户带来更多样化和智能化的服务。
此外,传音与阿里云在该款手机上基于联发科芯片进行了大量技术创新,双方在模型瘦身、工具链优化、推理优化、内存优化等多个维度展开合作。同时借助阿里巴巴淘系技术最新开源的MNN - LLM大模型推理引擎的高效GPU加速能力,成功地将大模型装进了手机。这一系列的技术创新为大模型在手机上的流畅运行提供了保障。不仅如此,在2024年3月全球最大的智能手机芯片厂商MediaTek联发科,已成功在天玑9300等旗舰芯片上部署通义千问大模型,为如今双方的合作奠定了一定的基础 。
传音致力于为新兴市场用户提供优质的以手机为核心的多品牌智能终端和移动互联网服务,在全球智能手机市场也有着可观的市场占有率。据IDC全球手机季度跟踪报告,2023年,传音的智能机在全球市场的占有率为8.1%,排名第五,并且在非洲、巴基斯坦、孟加拉国、菲律宾智能机出货量排名第一,印度智能机出货量排名第六 。
传音与阿里云合作的战略意义对于传音的意义
提升产品竞争力:在当前智能手机市场竞争激烈且朝着智能化和高端化发展的趋势下,搭载通义千问大模型能够使传音旗下的 AI手机在功能上更加独特和强大。例如在AI语音助手、智能图像处理等功能方面,借助通义千问的强大能力,可以提供更精准、高效的服务,吸引更多消费者,尤其是那些对AI功能需求较高的用户,有助于传音进一步提升在智能手机市场的份额,特别是在高端手机领域。传音一直致力于在AI技术上的布局,这次与阿里云的合作也是其技术战略布局中的重要一步。
适应市场发展需求:随着消费者对智能手机的要求越来越高,不再仅仅满足于基本的通讯和娱乐功能,AI功能成为了新的需求点。通过与阿里云合作,将大模型引入手机,能更好地满足用户对于智能交互、个性化体验等方面的需求。同时,这也有助于传音在新兴市场中保持领先地位,如非洲及南亚等市场对新兴技术的需求也在不断增长,传音借助该合作可以提前锁定这些市场中的智能AI手机市场份额,继续巩固自己在这些地区的市场优势。
对于阿里云的意义
拓展业务应用场景:阿里云的通义千问大模型具有广泛的应用场景,但在智能手机领域的深入应用是一个重要的拓展方向。与传音的合作,使得通义千问能够在传音旗下的手机品牌中得到应用,实现了大模型从云服务到移动终端的延伸,扩大了通义千问的应用范围。这有助于阿里云在移动端市场布局,构建更完整的AI生态系统,因为智能手机是移动互联网的重要入口之一,将大模型深入到手机中,能够触及更广泛的用户群体,为阿里云带来更多的用户流量和数据资源。
加强产业合作关系:通过与传音这样在智能手机领域具有一定市场规模和影响力的企业合作,阿里云可以加强与手机产业的关联度。手机产业涉及到芯片、硬件制造、软件、通信等多个领域,此次合作能够将阿里云与手机产业其他环节紧密联系起来,例如和联发科芯片等相关产业环节的衔接配合,共同推动AI技术在整个产业链中的应用和发展,也有助于阿里云在跨行业合作中积累更多经验,为未来开展更多类似合作奠定基础。
通义千问大模型搭载于传音 AI 手机的细节通义千问大模型成功搭载在传音旗下TECNO推出的AI手机PHANTOM V Fold2中,这一成果背后有着诸多的技术实现细节和用户使用模式的创新。
技术实现细节多维度技术创新:传音与阿里云在这款手机上基于联发科芯片进行了大量的技术创新工作。在模型瘦身方面,通过一定的算法和优化手段,减少模型的存储和计算资源占用,使得大模型能够在手机有限的存储空间和硬件资源上有效运行;在工具链优化上,改善编译、调试等工具链环境,提高模型在手机端的开发和部署效率;推理优化旨在提高模型推理的速度和准确性,让手机在面对用户请求时能够快速响应,这对于提供流畅的AI体验至关重要;内存优化则确保在运行大模型时,手机的内存管理合理,避免出现内存溢出等问题 。
借助开源推理引擎:双方借助阿里巴巴淘系技术最新开源的MNN - LLM大模型推理引擎的高效GPU加速能力,真正把大模型装进手机。MNN - LLM大模型推理引擎为大模型在手机端的运行提供了强大的运算加速支持,充分利用手机GPU的性能,让通义千问大模型在手机上的运行过程中,能够更快地处理数据,进行复杂的计算,从而实现各种智能化功能 。
用户使用模式特定AI按键便捷调用:传音这款AI手机机身设有特定的AI按键,用户可以通过这个按键一键调用端侧大模型。这为用户使用大模型提供了便捷的入口,无需复杂的操作流程。例如在日常使用场景中,无论是查询信息、寻求建议,还是进行文档及通话摘要等操作,用户只需按下这个按钮,就能快速启动通义千问大模型开始交互。
离线环境稳定运行:尽管是在离线环境下,这部手机依然能够流畅地进行多轮AI对话并实现文档及通话摘要功能。这一点体现了技术的先进性,传统的AI应用在离线环境下往往功能受限,但这款手机借助前期技术优化成果,能够让用户在不依赖网络连接的情况下,充分享受大模型带来的各种功能,极大地提高了用户体验的便捷性和稳定性,使AI功能不再受限于网络环境的限制。
传音控股AI手机的特点和优势基于AI技术的独特功能体现AI语音交互能力提升:由于搭载了通义千问大模型,传音AI手机拥有更强大的自然语言处理能力,继而提高AI语音助手的表现。例如,针对不同地区口音的识别更加精准,无论是传音深耕的非洲市场、南亚市场等地区具有独特口音的用户语音指令,都能有效的识别并给出精准的回应。这对于多语言、多口音的地区用户使用语音交互功能提供了极大的便利,有助于提高语音交互的效率和准确性。
智能图像与影像处理技术:结合通义千问大模型和传音自身已有的影像技术优势,在图像及视频的处理方面可能带来新的提升。比如对照片内容的智能识别、分类,视频的内容分析以及影像的AI创作等方面。这对于传音旗下手机的AI摄影、影像创作功能是一个强大的助力,能够满足用户对于影像创作日益增长的个性化需求,如利用AI进行照片的特效添加、自动生成视频等功能。
在新兴市场中的竞争优势本地化AI服务适配:传音在新兴市场有着深厚的市场根基,例如在非洲、巴基斯坦、孟加拉国等市场智能手机占有率较高。这款AI手机可以针对这些新兴市场的当地文化、生活习惯、用户需求,利用通义千问大模型建立本地化的AI服务。例如,在非洲一些地区,可以根据当地的文化元素、生活场景等提供独特的内容推荐、生活服务相关的AI建议等,做到更加贴合本土用户的需求。
性价比结合的产品策略:传音一直以来以提供高性价比的产品在新兴市场吸引消费者。现在加上AI的加持,在不显著提高价位的前提下,可以提升手机的性能和功能。这对于新兴市场中对价格敏感但又渴望享受智能化服务的广大消费者来说具有很大的吸引力,使传音能够在维持实惠价格的同时,不断提升产品在高端功能方面的竞争力。
阿里云在手机领域合作的过往案例与联发科合作推动手机端AI发展阿里云之前和联发科有重要的合作案例。2024年,联发科成功在其旗舰芯片天玑9300上部署了通义千问大模型,这一合作将大模型植入手机芯片中,实现了在离线情况下,手机用户仍然能够流畅进行多轮AI对话的效果,是手机端AI的一个重要里程碑 。这一合作意义重大,首先联发科作为全球智能手机芯片出货量最高的半导体公司之一,其芯片广泛应用于众多手机品牌。通义千问通过与联发科芯片的适配,能够借助联发科的市场份额和影响力广泛触及手机产业下游各厂商的手机终端产品,从而推动手机端AI技术的大规模应用。对阿里云而言,该合作不仅展示了通义千问大模型在硬件适配方面的能力,而且也为与其他手机厂商的合作树立了标杆,让更多手机厂商看到了通义千问在手机端应用的潜力。
在手机产业的云计算与其他合作云计算服务领域:阿里云为手机厂商提供基础的云计算服务,在存储、计算资源分配以及数据安全等层面助力手机企业的运营管理。许多手机厂商可利用阿里云的服务,将手机用户的数据进行安全的存储、备份,在应用分发、下载等环节也可以借助阿里云的云计算能力来确保高效性。
AI技术联合研发:除了和联发科的这种大模型部署合作外,阿里云可能还会在其他的AI技术、算法等层面与手机厂商开展联合研发。例如,针对手机用户行为分析、基于AI的手机安全防护等方面共同探索新的技术手段和解决方案,以提高手机整体的智能化水平和用户体验安全性。
通义千问大模型的技术特点和应用场景技术特点强大的语言理解能力:通义千问大模型能够准确地捕捉文本中的语义信息,这一特性是实现高效自然语言处理(NLP)的关键。无论是处理复杂语境中的语句,还是理解包含隐含意义的话语,它都表现出色。例如,当处理包含多义词、语义模糊的句子时,它能够依据上下文准确判断含义并给出回应。在智能问答系统中,这种语言理解能力能够确保提供更精准的答案。在机器翻译领域,它能够准确理解源语言的语义并转化为目标语言,从而提高翻译的准确性 。
出色的生成能力:基于海量的训练数据,通义千问能够生成流畅、自然的文本内容。这一特性使其可适用于多种内容创作场景,例如在自动写作故事、新闻报道创作、文案撰写等方面发挥作用。相比传统的基于固定模板或简单规则生成文本的方法,通义千问生成的内容更加丰富多样、逻辑结构更为合理。在学术论文撰写辅助方面,它可以帮助研究人员生成相关综述内容或者提供写作思路,提高论文撰写效率和质量 。
强大的推理能力:通义千问能够根据给定的前提进行逻辑推理,从而找到解决复杂问题的新途径。这种推理能力有助于在处理复杂逻辑问题时给出优化方案或合理的预测。例如,在金融领域对市场趋势的分析预测中,通义千问可依据历史数据、市场现状等前提条件进行合理推测;在解决数学复杂问题或者逻辑谜题时,它能够按照逻辑规则逐步推导得出答案 。
良好的扩展性和灵活性:通义千问大模型可以持续学习并优化自身性能,以适应不同的应用场景和需求。随着技术的发展以及新数据的输入,它能够不断完善自己的知识体系和算法模型。例如,当应用到新的行业或业务场景时,它可以通过少量的重新训练或者调整参数,快速满足特定场景的需求,在不同领域如医疗、法律、教育、文旅等都能够定制化地提供服务 。
应用场景智能客服领域:通义千问可以快速准确地回答用户的咨询问题,提供24小时无间断且高度个性化的服务体验。例如,电商平台的智能客服利用通义千问,可以处理用户对于商品信息的查询、订单状态的追踪以及售后问题的解答等。相比传统的关键词匹配式的智能客服,通义千问能够更好地理解用户的复杂问题并给出更有针对性的回复,有效地提高了用户满意度和降低了企业在客户服务方面的人力成本 。
教育行业应用:在教育领域,通义千问可以辅助教师进行教学。例如,能够针对学生的学习进度提供定制化的学习方案,针对不同学生的学习疑问提供详细的解答辅导。还可以作为课外知识补充的工具,对于学生在学习新知识过程中遇到的拓展性问题,它可以提供丰富的参考资料和解释内容,有助于提高学生的学习效果和自主学习能力,减轻教师的教学负担 。
金融行业助力:在金融领域,通义千问可以帮助金融专业人员提高工作效率。如投资顾问借助通义千问分析海量的金融市场数据,从而快速给出投资建议;银行客服人员可以利用它来快速解答用户关于账户管理、金融产品咨询等问题,同时它也有助于降低在数据处理、风险分析等方面人为错误的风险,确保金融业务更精准、高效地运行 。
医疗行业协作:在医疗领域,通义千问可以辅助医生进行疾病诊断。虽然它不能替代医生的诊断工作,但可以基于患者的症状描述以及医疗数据的分析,为医生提供疾病参考诊断、治疗方案建议等内容。同时也能够帮助医疗工作人员进行医学知识的学习、科研论文的前期查询等工作,在提高医疗服务效率和质量方面发挥积极作用。
内容创作贡献:通义千问在内容创作方面存在显著优势。无论是新闻类稿件的写作,科技论文的创作,还是文学作品的构思等方面,它都能够生成高质量的内容。对于新闻稿件的创作,它能够依据事件的基本信息快速撰写新闻稿;在科技论文创作方面,能对研究进展进行阐述、参考文献引用等提供思路和范例;在文学创作方面,可以为故事创作提供情节构思、人物形象描述等方面的创意支持。对于创作者来说,它是一款有力的内容创作辅助工具,能够激发创作灵感,提高创作效率 。