谷歌发布视频生成模型Veo，正面迎战OpenAI Sora，抢占AI影视创作制高点-AI技术突破-AI动态观点-AI人工智能-极客阿唐

摘要：谷歌推出其迄今最强大的视频生成模型Veo，能够生成超过一分钟的高清视频，并在理解自然语言和视觉语义方面表现出色，直接与OpenAI的Sora展开竞争。...

在生成式AI的浪潮之巅，谷歌正式投下了一枚重磅炸弹，发布了其最先进的文生视频模型——Veo。此举被业界普遍视为对OpenAI此前发布的Sora模型的直接回应，标志着AI视频生成领域的竞争进入了白热化阶段。谷歌DeepMind首席执行官Demis Hassabis表示，Veo是谷歌在多模态AI研究上多年积累的结晶。

Veo的核心能力与技术突破

Veo的核心优势在于其能够生成高质量、长时程的视频内容。根据谷歌官方发布的技术细节和演示视频，Veo能够创建超过60秒的1080p分辨率视频，并且在画面连贯性、细节表现力和动态真实感方面达到了惊人的水平。更重要的是，Veo展示了对复杂自然语言提示词的深刻理解能力，能够精准捕捉和呈现“延时摄影”、“航拍”等专业影视术语所描述的视觉风格。

Veo具备的关键特性包括：

长视频生成： 能够稳定生成超过一分钟的视频，解决了此前模型在长视频中容易出现逻辑断裂和风格漂移的问题。
高保真度与连贯性： 生成的视频在人物、动物和物体的动作表现上更为真实、自然，且在整个片段中保持一致性。
深度语义理解： 模型能准确理解复杂的文本提示，并将其转化为具有特定电影风格和情感基调的视觉叙事。
多模态输入： 除了文本，Veo还支持图像和视频作为输入提示，用户可以基于一张图片或一段现有视频来指导后续内容的生成，提供了更高的创作灵活性。

行业影响与未来展望

Veo的发布，无疑将对影视制作、广告创意和短视频内容生态产生深远影响。它极大地降低了专业级视频创作的门槛，让创意人员可以快速将脑海中的想法可视化，进行故事板测试或直接生成部分成品镜头。谷歌计划将Veo逐步整合到YouTube Shorts等旗下产品中，并已向部分创作者开放了早期测试。随着Veo与Sora等模型的不断迭代，AI正以前所未有的速度重塑视觉内容的生产范式，一个由AI驱动的创意新纪元正加速到来。