编辑|孙浩南
今日导读
微软发布27亿参数基座模型Phi-2
阿里、港大推出新模型LivePhoto,可将静态图片转为动态视频
工信部:推动人工智能、人形机器人等前沿技术研发和应用推广
谷歌英伟达AMD投资创企Essential AI
Meta雷朋智能眼镜推出多模态AI功能
Telefónica联手Meta,将改善老年人使用VR的体验
微软发布27亿参数基座模型Phi-2
12月13日消息,今天凌晨,微软发布27亿参数的语言模型Phi-2,据称可与规模大25倍的大模型相媲美,该模型目前已加入Azure AI Studio。Phi-2基于Transformer训练,目标是预测下一个单词,它在1.4T个词组上进行了训练,这些词组来自NLP和编码的合成数据集或网络数据集,训练在96个英伟达A100 GPU上耗时14天。Phi-2是一个基座(Base)模型,没有通过人类反馈强化学习(RLHF)进行调整,也没有经过指导性微调。在多个基准测评上,只有2.7B的Phi-2性能超越了Mistral和Llama 2的7B或13B模型,以及谷歌3.2B规模的Gemini Nano 2。
阿里、港大推出新模型LivePhoto,可将静态图片转为动态视频
12 月 13 日消息,阿里巴巴、香港大学、蚂蚁集团的研究人员提出了一种全新图片生成动态视频模型——LivePhoto。用户通过 LivePhoto,可将一张静态图片快速生成高精准的动态视频。与传统方法不同的是,LivePhoto 在开源文生图模型 Stable Diffusion 基础之上,增加了运动强度和文本加权两大创新模块,可精准掌控动态视频生成过程中的运动强度、文本描述。据悉,LivePhoto 的效果与主流模型 Gen-2、Pikalabs 等相当。
工信部:推动人工智能、人形机器人等前沿技术研发和应用推广
12 月 13 日消息,在中国国际经济交流中心举行的 2023-2024 中国经济年会上,工业和信息化部总经济师高东升表示,以科技创新引领现代化产业体系建设,大力推进新型工业化。下一步还将持续推动产业结构优化升级,前瞻布局一批未来产业,推动人工智能,人形机器人等前沿技术研发和应用推广,加快构筑未来发展新优势。
谷歌英伟达AMD投资创企Essential AI
12月13日消息,据彭博社报道,由谷歌注意力机制论文其中两位作者创立的AI公司Essential AI,昨日宣布已筹集5650万美元(约合人民币4.05亿元)新融资,由March Capital领投,AMD、谷歌、英伟达、Thrive Capital等参投。
Meta雷朋智能眼镜推出多模态AI功能
12月13日消息,据外媒The Verge报道,Meta今日起在其雷朋智能眼镜中推出多模态AI功能,可以识别物体和翻译语言。用户戴上雷朋智能眼镜,说一声“Hey Meta”,就会召唤出一个虚拟助手,它能看到和听到周围发生的一切。Meta CEO马克·扎克伯格(Mark Zuckerberg)在社交平台Instagram上演示了这一更新,要求眼镜推荐与他手中的衬衫相匹配的裤子。作为回应,虚拟助手描述了这件衬衫,并提供了一些可能与之相配的裤子的建议。他还让眼镜的AI助手翻译文本并展示一些图像说明。该功能目前处于早期测试阶段,在美国小范围测试。
Telefónica联手Meta,将改善老年人使用VR的体验
近日,有媒体称Telefónica将与Meta联手合作,通过Telefónica基金会“RECONECTADOS”的“la tecnología no tiene edad”项目开发适合老年人的混合现实的内容,再通过Meta Quest 3设备提供易于访问途径。据称,将会融入语音交互等辅助功能,以改善视力不佳或运动困难人士的体验。此外,还涵盖数字技能,从参观虚拟艺术品、休闲活动、数字社交互动到认知发展体验,这些都可以在Movistar Immersive Experience应用程序中获得。这一举措进一步加强了Telefónica和Meta去年宣布的合作伙伴关系,双方承诺扩大并持续探索连接XR的技术。