微软发布VALL-E2模型,语音克隆技术媲美人类配音

AI潮汐 2024-07-24 21:32:10

2024年7月25日 星期四

News

每天一分钟,AI资讯握手中

微软发布 VALL-E 2 模型,语音克隆技术媲美人类配音

微软近日推出了全新的零样本文本到语音(TTS)模型——VALL-E 2。该模型实现了与人类语音相媲美的效果,堪称 TTS 领域的重大突破。VALL-E 2 能够在没有任何先前样本的情况下,精确模拟目标语音,使其在生成语音克隆时几乎无法与真人区分。这一进展让 DeepFake 语音技术达到了新的高度,未来或将在多个领域广泛应用。

英伟达携手Meta推出AI代工业务,定制部署Llama 3.1超级模型

NVIDIA 宣布推出全新 AI 代工服务——NVIDIA AI Foundry 和 NVIDIA NIM 推理微服务。与Meta的Llama 3.1开源模型合作,为企业客户提供强大的生成式 AI 支持。Llama 3.1系列包括8B、70B和405B三个参数规模,训练使用超过16000个NVIDIA Tensor Core GPU。该模型在NVIDIA加速计算和软件平台上进行了优化,适用于数据中心、云环境以及本地工作站。

爱诗科技发布 PixVerse V2,全面升级AI视频生成能力

爱诗科技正式发布PixVerse V2视频生成产品,全球同步上线。新版本采用Diffusion+Transformer(DiT)基础架构,显著提升了视频生成的长度、一致性和趣味性。PixVerse V2支持一次生成多个视频片段,单片段最长8秒,多片段可达40秒。新玩法和技术创新让用户在AI视频生成方面有了更多的创意空间。

Meta发布最强开源模型Llama 3.1 405B,扎克伯格称开源引领新时代

Meta在官方博客中宣布,推出全新开源大语言模型Llama 3.1 405B。该模型在功能和性能上超越了许多闭源模型,标志着开源AI模型的新时代。Llama系列模型的总下载量已超过3亿次,展现出广泛的影响力。扎克伯格表示,开源模型将引领未来的AI发展方向。

Alphabet Q2财报超预期,皮查伊称AI将成为重要收入来源

谷歌母公司Alphabet公布了2024年第二季度财报,营收和利润均超出市场预期。受数字广告销售和云计算服务需求增加的推动,Alphabet的营收增长14%至847.4亿美元,净利润增长28.6%至236亿美元。尽管资本支出仍将保持高位,但首席执行官皮查伊坚信,AI技术将很快成为公司新的重要收入来源。

Adobe Illustrator和Photoshop推出新AI功能,加速创作流程

Adobe公司宣布为Illustrator和Photoshop引入一系列新的AI功能。Illustrator新增的“生成式形状填充”功能允许用户通过简单的文字提示生成精美的矢量图形,系统还能根据文档中的其他元素自动生成填充内容。Photoshop则进一步增强了AI驱动的编辑工具,旨在提升设计师的创作效率和控制力。

Meta AI推出Imagine Me功能,一图一句话实现用户梦想

Meta公司在发布Llama 3.1模型的同时,还推出了“Imagine Me”新功能。该功能允许用户上传一张照片并配上一句话,AI将根据用户的描述生成符合其期望的图像。Imagine Me不仅为用户提供了创意表达的新方式,还展示了AI在图像生成和理解方面的强大能力。

重庆两江新区与吉利汽车、旷视科技合作,共建AI智行平台

重庆两江新区、吉利汽车集团和旷视科技签署了战略合作协议,计划共同建设AI智行开放平台。三方将结合重庆的制造业基础、旷视科技的人工智能技术和吉利汽车的整车研发制造能力,构建“AI + 车 + 机器人”产业创新发展模式,推动智能出行领域的技术突破和应用落地。

OpenAI调整内部架构,AI安全高管Madry专注AI推理

OpenAI首席执行官山姆·阿尔特曼在社交平台X上宣布,公司进行了新一轮内部架构调整。负责AI安全的主管亚历山大·马德里被调岗,将专注于人工智能推理领域的新职位。这一调整旨在加强OpenAI在AI推理方面的研发和应用,提升公司在该领域的竞争力。

英特尔发布AI Playground开源软件,支持本地运行AI图像生成

英特尔推出了AI Playground开源软件,支持在配备8GB或以上显存的锐炫Arc显卡的系统上本地运行AI图像生成和聊天机器人。未来,该软件还将支持英特尔酷睿Ultra-H处理器,进一步扩大其适用范围。AI Playground的发布为开发者和用户提供了强大的本地AI运行环境,推动了AI应用的普及和发展。

0 阅读:9

AI潮汐

简介:每天一分钟AI资讯握手中一起踏上新工业革命浪潮之巅