AI企业 | 揭秘Vidu背后的中国力量:清华团队如何打造全球爆火的AI视频神器?
作者:微信文章10秒出片,4分钱成本,美国老奶奶用它把童话变动画,日本动漫师靠它掀起“一人工作室”革命
一家成立仅2年的中国公司,凭什么让好莱坞都紧张?
一、低调的颠覆者:生数科技是谁?
2013年3月,一家名为生数科技的公司在清华园悄然成立。这家由清华大学人工智能研究院、瑞莱智慧RealAI、蚂蚁集团和百度联合孵化的企业,初期甚至没有官网宣传,却在短短两年内震撼全球——其开发的视频大模型Vidu,成为首个在动漫生成领域登顶全球榜单的中国AI产品。
团队核心堪称“清华天团”:
首席科学家朱军清华人工智能研究院副院长,全球扩散模型研究先驱CTO鲍凡U-ViT架构论文第一作者,技术路线比Sora更早CEO唐家渝清华本硕学霸,主导商业落地
团队近90%成员为研发人员,来自清华、北大及阿里腾讯等大厂,学术基因与工程能力深度咬合,成为生数科技最隐秘的竞争力。
二、技术破壁:U-ViT架构的“中国原创”
当OpenAI的Sora在2024年初惊艳世界时,很少有人知道:中国团队早于Sora 3个月就提出了相同技术路径。
2022年9月,鲍凡团队发表U-ViT架构——全球首个将扩散模型(Diffusion)与Transformer融合的框架。这项被CVPR以“缺乏创新”拒稿的研究,却成为后来Sora核心DiT架构的“孪生兄弟”。
Vidu的三大杀手锏:
16秒超长一镜到底无需插帧拼接,直接端到端生成连贯动作(如玩具船在地毯航行16秒不崩坏)物理引擎级仿真精准模拟光影、灰尘、水流动态(如汽车扬尘符合空气动力学)多镜头语言大师自动切换远景/特写/追焦,堪比真人导演(如海边小屋→阳台→帆船的长镜头)
尤为惊艳的是对中国元素的深度理解:输入“熊猫湖边弹吉他”,生成画面既保留熊猫的毛发质感,又营造出东方意境的静谧感,这是国外模型难以企及的文化适配力。
三、改变创作规则:从好莱坞到东京的“效率核爆”
案例1:美国牧场里的银发导演
美国俄克拉荷马州的儿童作家Kimberly Fish,曾因AI生成的“八腿猫”崩溃。改用Vidu后,20分钟生成50个童话场景:魔法森林的光影、会说话的松鼠表情栩栩如生。她的绘本动画在TikTok爆火,收入飙升300%。
案例2:东京动漫界的“一人革命”
日本独立动画师柔树特效,仅凭Vidu就制作出全网播放300万的番剧《观察者悖论》。传统工作室需20人月的工程,他单枪匹马每周更新——上传角色草图后,用“角色一致性”功能让主角在不同场景无缝切换。
“以前改个茶杯要重做整个分镜,现在一句话搞定。”一位日本导演在东京AI大会上感叹。
行业地震级影响:
成本碾压1分钟高清视频成本仅5元,比Sora便宜80%效率跃迁广告公司5分钟生成1分钟成片,影视特效周期缩短50%开源生态代码权重全面开放,游戏公司用它批量生成NPC,省下百万美术成本
四、全球狂飙:2500万用户的“中国墙外香”
截至2025年6月,Vidu已覆盖200多个国家和地区:
日本市场爆发上线“动漫风格”模板后,本土创作者社群激增,与PocketAnime联合举办AI动漫大赛技术榜单屠榜Vidu Q1模型在VBench视频生成榜单位列全球第一,超越Runway等老牌玩家企业端渗透服务荣耀、飞鹤等国内企业,更拿下土耳其hubx、美国Genspark等国际客户
更值得玩味的是文化输出——在WaytoAGI东京大会上,日本用户追问:“为什么这种创新没诞生在我们国家?”
五、未来之战:中国AI的“多模态野望”
生数科技的野心远不止于视频:
模态融合正研发文本-图像-视频-3D联合生成,打造“全能创作大脑”影视级突破目标生成电影长镜头(当前上限32秒),已参与《流浪地球3》特效测试创作者经济构建“Vidu宇宙”社区,孵化个人IP(如柔树特效的动漫IP衍生品已商业化)
正如首席科学家朱军所言:“AI不是替代人类,而是让创作自由扩展到无限。”
结语:一场静悄悄的生产力革命
当60岁的牧场奶奶用Vidu把童话变成动画,当东京大学生用AI番剧收获百万粉丝,当好莱坞团队用它压缩特效制作周期——生数科技和Vidu的故事,本质是一场创作平权运动。
这家没有铺天盖地宣传的中国公司,用扎实的学术积累(3年30篇顶会论文)、极致的工程优化(训练速度提升40倍),以及对创作需求的深度共情(日本主流动漫师中超40%使用Vidu),证明了:
技术创新的终极意义,是让每个普通人都能成为世界的讲述者。
“我们正在进入一个时代:想象力是唯一的生产资料。”
——生数科技CEO唐家渝
体验Vidu:官网 www.vidu.studio 注册即用,支持中文提示词生成高清视频。
数据来源:生数科技官网、全球AI大会东京站报告、VBench技术评测(2025年6月)
页:
[1]