2024-10-12 01:14
讲真,要不是在 X 上晃悠时突然被这几个视频 「砸中」,咱还真不知道 MiniMax ,中国估值最高的大模型公司之一 ,又闷声整了个大活儿。
这些海外「自来水」们秀出的「魔法」,正出自海螺 AI 10 月才上线的新功能「图生视频」。
五周前,MiniMax 发布了视频模型 abab-video-1,并在海螺 AI 网页版上线了视频创作入口(主要是文生视频),正式入局 AI 视频赛道。
旋即,海螺 AI 在过去一个月内迎来爆发式增长,月访问量超 8 倍, 增速领跑全球 AI 产品。
在 AI 产品榜·网站榜( web )上,海螺 AI 网页版 9 月访问量在两个增速榜排名第一,全球增速榜 TOP 1、国内增速榜 TOP 1,增速高达 867.41%。
海螺 AI「出征」不算早,上线仅过月余,就吸引了大批专业人士,包括电影导演、制片人、数字艺术家、游戏开发者、KOL 等,遍布全球 180 多个地区。
无论创作者想要创作超现实主义作品、探索幻想和科幻主题,还是深入研究动漫和抽象视觉效果,海螺 AI 都能提供广泛的选择,满足不同创作需求。
一系列恶搞英国「地狱厨神」Gordon Ramsey 的 AI 视频,火爆出圈,网友用的正是海螺 AI 。
这位以爆粗口闻名的厨师总是卷入各种奇怪场面,要么和一只夹住裆部的龙虾搏斗,要么穿着 Slayer(美国重金属乐队)的 T 恤敲打肉排,又或者坐在厨房中间的马桶上。
现实题材中,情绪表达一直是一个难题——无论是对 AI 、还是明星来说,但「自来水们」已册封海螺 AI 为「动画表情之王」。
新加坡电影导演 EHuanglu 用它生成了一位女性的面部特写( T2V ),从快乐到悲伤,最后捂脸哭泣,情绪变化演绎相当到位。
知名导演 Dave Clark 第一次利用海螺 AI 创作的星球大战片段( T2V ),一度在网络疯传。
试用了最新的图生视频( I2V )后,这位导演直言,「我一直在等待这种类型的恐龙运动。」
看看这个视频( T2V )。人物身体运动、情感表现以及整体画面质感,越来越接近纯粹的电影。
据说,海螺 AI 不用特效模板,只依靠模型综合能力实现最顶级的影视特效。
有导演曾在电影中使用 3D 软件进行这种灾难场面制作,但要达到类似效果非常困难。
一些网友、YouTube 主在比较海螺 AI 与最好的视频生成器 Runway、国内快手的可灵后发现,在生成运动方面,海螺 AI 明显属于下一个 Level,尤其是人体动作的流畅性和逼真性,比 Runway、Luma AI 等竞对都要好。
有博主甚至认为,在人物动作上,海螺 AI 的性能足以媲美甚至超越市面上其他领先的 AI 视频生成器。
你看,这个视频中( I2V )的女人转向一侧,从眼镜、头发、衣服到所有东西,均保持一致,海螺 AI 合乎逻辑地填补了缺失信息!
看第一帧,只能看见怪物的一只胳膊和手。但海螺 AI 居然可以自己「脑补」出新胳膊和手,还完美地融入了现有视频。
X 用户 Heather Cooper 曾发起线上投票,针对同样的提示,谁的表现最好?
除了生成动作方面的领先,几乎所有用户都承认海螺 AI 文本响应很好,能够较为准确地将提示词中的元素体现在视频中。
士兵转向摄像机,走向镜头,并用枪对准它,海螺 AI 抓住了每一个方位细节。
凭借对 90 年代人物着装风格、建筑样式的准确还原,以及特殊鱼眼镜头下滑板动作的精准把控,这个视频让海螺 AI 在 reddit 中迎来好评。
目前,海螺 AI 视频模型在 VBench(视频生成模型评测框架)的第三方独立测试结果中综合排名第一,在画面质量、连贯性、流畅性等多维度均处于领先地位。
最近,香港中文大学和腾讯研究人员通过「 VideoGen-Eval 」项目,对当前主流AI视频生成模型进行了全面评估,肯定了海螺 AI 在文本控制方面突出能力,尤其在人物表情、运镜、多镜头生成和主体动态方面表现优异。
除了老司机,对于此前未接触过 AI 的新人而言,海螺 AI 也非常友好。
一位名叫 Ksenia_Galushkina 的艺术家新手,花了两天半时间,用海螺 AI 生成 80 多条视频,制作完成了这条迷你艺术片。
俗话说得好,光说不练假把式。海螺 AI 视频模型的实力究竟如何,还得看一手评测。
海螺 AI 上新的图生视频功能,不仅能准确识别上传的图片,还能准确理解超过图片内容之外的复杂文本。
换句话说,创作者可以化身任性的导演,只需下个指令,海螺 AI 就会发挥充分的想象力予以实现。
不得不说,海螺 AI 的生成效果相当惊艳。佟掌柜眉一皱、嘴一撅,哭泣的表情非常逼真,邢捕头拥抱的动作也很自然流畅。
再比如被网友玩坏了的「分心男友」经典梗图。我们输入 Prompt:穿红衣服的女生转身,三个人拥抱在一起。
海螺 AI 完美遵循了文字指令,红衣女子转身,和身后的一对情侣拥抱,整套动作一气呵成,没有任何卡顿。
尤其是六只胳膊交叠在一起,很容易出现扭曲变形,但它生成的视频中,几乎没什么明显的 bug。
海螺 AI 很会「无中生有」,手里要么掏出个大哥大式儿的手机,扣在耳边假装打电话;要么摸出个赛博朋克风格的墨镜,骂骂咧咧地架在鼻梁上,光影、色调等细节处理得都挺到位。
不少人应该都见识过他吃手机的 AI 视频,这次我们来一次难度升级:老人拿着的手机变成鸡腿,并吃了起来。
为了体现地铁的高速运行,海螺 AI 对背景的渲染也很逼真,窗外的绿树快速后撤,环境不断变化,增强了沉浸感。
还有让猴哥的金箍棒秒变笛子,由此可见,海螺 AI 能够很好地解构指令框架和深层语义,并在视频生成中加以整合。
在电影《镜像世界》中,导演使用大量特殊镜头和后期制作技术,让小哥从镜子中穿越到另一个时空。
而现在要完成这一效果,只需要一张和一个目的地,海螺 AI 就能实现「跨屏」联动。
例如,将一位美女的照片和一幅风景图拼在一起,然后输入 prompt:女子走向绿地,站在草地上,望着美丽的湖面,镜头缓缓左移。
右边的美女完美融合到左边的草地场景中,并且主体从原场景进入目标场景后,光影、色调都会完美嵌入新场景的设定。
海螺 AI 按照文字描述,镜头随着女子的运动轨迹而移动,拼接处也逐渐消失。
网友们就开发出各种特效玩法,比如 CG 合成、碎片化、变身、爆炸、流体……
要知道,特效这玩意儿,那是嘎嘎费钱。就拿《阿凡达》来说,它的总制作成本为 2.37 亿美元,其中特效成本就占了 1.5 亿美元。
财大气粗的电影制作公司可以狠砸真金白银,但对于独立电影人来说,一分钱都难倒英雄汉。
如今海螺 AI 不用特效模板,只依靠模型综合能力就能轻松实现好莱坞级别的特效,真・人人都能当导演。
X 网友 Stylez Morales 就用了一张图和一句提示词,得到一段变身特效镜头。
一个变形金刚机器人突然变身成一辆超跑,在赛博朋克的街道上疾驰,这画面,真有一种电影级别的超现实视觉效果。
爆炸特效。《浴血黑帮》中的三兄弟大步流星往前走,身后的建筑在一片爆炸中摧毁。
它能用专业级调光与构图营造美学氛围,精细控制光影效果与景别变化,画面质感媲美大片。
画质高清,镜头缓慢推进,毛茸茸的小羊羔蹦跶着,耳朵也有节奏地上下扇动,效果丝毫不输迪士尼动画。
女模特摆着各种时尚 pose,表情自然且富有表现力,头发也会随着动作而飘动,大衣纽扣等细节也处理得很精细。
我们还上传了一张戴着墨镜、身穿西装、端着酒杯的男模特图片,然后输入 Prompt:男人开心地举起酒杯,然后从画面左侧走出来一位美女。
没有对比,就没有发言权,让海螺 AI 和 Runway 打个擂台,谁强谁弱也就一目了然。
海螺 AI 严格遵循提示词,坐在沙发上的 Ilya、Greg、Murati 站起来,向左走出画面,独留 Altman 站在原地凌乱;而 Runway 生成的画面则崩得离谱,照片中的四个人飞出沙发,完全没有遵循物理世界的运动规律,甚至还出现了脑袋 360 度旋转的诡异画面。
相比之下,Runway 的镜头较为简单,男子喝啤酒时,杯中的啤酒没有减少,左边女生的手部也出现了莫名其妙的动作。
Runway 则直接缺失了怪物主题,没有准确理解 prompt 的含义。
如果说,9 月的海螺 AI 已经令人印象深刻,那么,新增 「图生视频」的海螺 AI 又更上一层楼。它并不完美,但比大家试过的许多 AI 视频模型都要好。
神奇海螺的智慧和魔力是不容被质疑的,既然 Sora 迟迟不来,为什么不问问神奇海螺呢?
Copyright © 2002 尊龙凯时·(中国)人生就是搏! 版权所有 备案号:ICP备61544118号-4