近日,阿里巴巴ATH创新事业部研发的新一代多模态视频生成模型HappyHorse正式开启灰度测试。作为全球AI视频领域的有力竞争者,该模型在Arena.ai的文生视频、图生视频及视频编辑三大核心榜单中均展现出不俗的竞技实力。

影视级画质与深度语义理解

HappyHorse主打“影视级”视觉表现,支持1080P超高清输出。它能够精准驾驭多种视觉风格,无论是极具年代感的港式风情、宏大的古装氛围,还是新中式动漫效果,都能通过细腻的光影和自然的镜头运动予以还原。

image.png

在技术底层,该模型具备极强的语义解析能力,可处理长达800词的复杂指令,并支持同时输入9张参考图,从而确保人物形象、场景构件及道具细节的稳定性。据悉,生成一段15秒的高质量剧情视频,仅需2至5分钟。

实现音画同步的“一键成片”

除了视觉层面的突破,HappyHorse在多语言适配与音画互动上也表现出色。它兼容粤语、英语、法语等多语种创作,能使角色的口型、表情与肢体动作高度契合。更具亮点的是,模型可根据画面内容自动生成环境音效与背景音乐,真正实现音画同步的自动化创作流。

中文在线“次元神笔”完成接入,扩充AI工具箱

在模型开启测试的同时,国内数字内容领先企业中文在线也宣布,旗下全栈AI内容创作解决方案“次元神笔”已正式接入HappyHorse模型。

此前,“次元神笔”已集成了包括Seedance2.0在内的多款行业顶尖模型。通过引入HappyHorse,中文在线进一步构建了覆盖文本、图像、视频的全维度创作生态。此举旨在为创作者提供更多样化的工具选择,降低高质量内容产出的门槛,助力优质IP实现跨形态的快速转化。

随着全球AI技术的迭代,此类工具的普及或将重塑影视与短视频的创作逻辑。