OpenAIsora文本转视频模型发布，Sora简单介绍。

草台动画 2024-02-16 22:42:31

2024年2月15日，OpenAI 推出了文本转视频模型 Sora，使用 AI 将您的书面描述转换为长达一分钟的视频。OpenAI公司最知名的产品 Chatgpt，Chagpt 目前领先其他公司的同类产品，包括但不限于：Google的“Gemini”，百度的“文心一言”等。

此次OpenAI 推出文本转视频模型 Sora，为了巩固自己在人工智能的领先地位。

Sora是什么？

公共信息：

Sora是一个可以通过文本描述生成视频的人工智能模型，由美国人工智能研究机构OpenAI开发。

Sora这一名称源于日文“空”（そら sora），以示其无限的创造潜力。[1]其背后的技术是在OpenAI的文本到图像生成模型DALL-E基础上开发而成的。[2]模型的训练数据既包含公开可用的视频，也包括了专为训练目的而获授权的版权视频，但OpenAI没有公开训练数据的具体数量与确切来源。

Sora 效果

注意Sora这个词的，词源来自日文“空”。所以OpenAI 官方发布的应用案例，就是来自日本东京街头。

输入提示词（原提示词是英文）：

一位时尚的女性走在东京街头，周围是温暖闪亮的霓虹灯和活力四射的城市标识。她穿着一件黑色皮夹克，一条长长的红色连衣裙，搭配黑色靴子，并背着一个黑色手提包。她戴着墨镜，涂着红色口红。她步履自信，悠然自得地走着。街道潮湿而反光，呈现出丰富多彩的灯光的镜面效果。许多行人在街上走动。

这些提示词，Sora生成的视频如下。

视频长度为60秒，1分钟的时间。

整个视频是流动的，所有元素都在流动。

Sora 生成的影片，并不是简单的按部就班的“字面”意思。

Sora会运镜，她就像个导演，真正的生成影片。

一分钟的时长，有远景中景近景，特写大特写，Sora是在理解你的提示词。

Sora 影响

以往的文本生成视频，仅仅是多个视频片段拼凑，而且基本上在10秒钟。在Sora之前，文本生成视频连贯的视频，没有能够达到60秒的。

此次的演示Sora生成的视频，不但整体是连贯的风格统一，而且已经“机械化思考”如何制作一部优秀的短片。

Sora 使用

目前 Sora 邀请制，还没有大规模应用。

Sora 未来

Chatgpt 开启了人和AI对话的时代，人机交流。

现在人类获取信息的方式中，视频是最重要的渠道。Sora 如果能极其快速的输出有“特定自我观点”的视频，那么人工智能就能直接影响人类了。

0 阅读：22