编辑|孙浩南
YouTube 推出可模仿著名歌手的 AI 工具,可用文字或哼唱创作歌曲
据报道,YouTube 正在测试新的生成式 AI 功能,让用户可以通过输入文本或哼唱一段旋律来创作音乐。其中一个功能叫做 Dream Track,已经向平台上的一些创作者提供,它可以根据著名艺人的风格自动生成 30 秒的音乐片段。YouTube 还展示了一些可以通过哼唱生成音乐的新工具。YouTube 表示,目前正在与“一小部分精选的美国创作者”测试 Dream Track 功能,可以以九位艺人的风格制作音乐;他们分别是 Alec Benjamin、Charlie Puth、Charli XCX、Demi Lovato、John Legend、Papoose、Sia、T-Pain 和 Troye Sivan。该软件可以生成歌词、伴奏和以艺人风格的 AI 合成声音。
Meta推出基于人工智能的视频编辑工具
11月17日消息,当地时间11月16日,Meta推出了两项基于人工智能的视频编辑新功能,可用于在Instagram或Facebook上发布视频。第一个功能名为“Emu Video”,可以根据纯文本、纯图像或组合的文本和图像输入来生成视频。另一款名为“Emu Edit”,用户可以通过文本指令进行自由形式的编辑。
联发科与Meta将合作开发AR智能眼镜芯片
据报道,在日前举办的联发科2023年芯片峰会上,联发科高管Vince Hu正式宣布与Meta建立新的合作伙伴关系,双方将携手研发用于AR眼镜的芯片产品。两家公司之间的新合作伙伴关系意味着联发科将打造专门用于Meta AR眼镜的定制芯片。据悉, Meta与雷朋合作的前代Ray-Ban Meta智能眼镜搭载的是骁龙 AR1 Gen 1 SoC,下一代智能眼镜则很可能换上专用的AR芯片,并内置取景器显示屏,用于融合虚拟世界和物理世界,允许用户扫描二维码、阅读消息等。会上没有透露这款“将搭载联发科芯片的AR眼镜”的任何细节,只是直接表示Meta将在未来某个时候推出此款产品。
传谷歌Gemini推迟至明年第一季度发布
11月17日消息,据外媒The Information今日报道,两位知情人士透露,谷歌将推迟发布Gemini大模型,预计明年第一季度发布。今年9月,谷歌代表曾告诉一些云客户和业务合作伙伴,他们将在11月之前推出基于Gemini的对话式AI。Gemini团队面临的一个关键挑战是如何确保该模型与OpenAI最先进的GPT-4一样好或更好。知情人士称,目前尚不清楚谷歌是否达到了这一标准。
Unity 面向开发者推出 AI 工具 Unity Muse 和 Unity Sentis
据报道,在荷兰阿姆斯特丹的 Unite 2023 活动上,游戏引擎开发商 Unity 展示了人工智能工具 Muse 和 Sentis 的进化版本,前者是一个以 AI 驱动为辅助的扩展平台,为开发人员在创作过程中带来了便利,使他们能够轻松地将想法转化为现实;后者是一款无缝集成自定义 AI 模型的工具,专为 Unity 引擎设计。目前 Muse 处于早期试用阶段,计划到 2024 年春季结束,价格为每月 30 美元。Sentis 则处于免费公测阶段,将于 2024 年随 Unity 6 引擎一起正式发布。
工业元宇宙协同发展组织秘书长:AI 算力算法等层面的竞争是一种国力竞争
11 月 17 日消息,工业和信息化部工业文化发展中心设计创新服务处负责人、工业元宇宙协同发展组织秘书长柯斌表示,如今,关于人工智能算力、算法、数据集等层面的竞争,事实上已经是世界领先国家之间的国力竞争。积极投身于 AI 在各行各业的原生应用创新机遇,也已经成为国内投资界和科技企业实践中形成的一种共识。
OpenAI 考虑将 ChatGPT 引入课堂
11 月 17 日消息,OpenAI 的一位高管透露,该公司目前正在探索如何将其广受欢迎的 ChatGPT 聊天机器人引入课堂。OpenAI 首席运营官 Brad Lightcap 在旧金山的一次会议上表示,公司或将于明年组建一个团队,探索这项技术在教育领域的应用。据悉,OpenAI 已经与可汗学院(Khan Academy)等教育团体建立了合作关系,以创建人工智能驱动的导师,并与施密特未来(Schmidt Futures)建立了合作关系,为服务欠缺社区的教育团体提供资助。