写点什么

曾经的“自动驾驶第一股”急速掉头,CEO 亲述图森未来生死时速这一年

  • 2024-12-23
    北京
  • 本文字数:4459 字

    阅读完需:约 15 分钟

曾经的“自动驾驶第一股”急速掉头,CEO亲述图森未来生死时速这一年

“我们已经做了很多工作,一年后再谈战略也不会变,不会再突然做别的事情。”图森未来 CEO 吕程坚定地说道。


自动驾驶赛道跑了近 10 年的图森未来,如今改名 CreateAI,大转弯迈进了动漫游戏领域。


“希望利用生成式 AI 技术重新定义数字化娱乐内容的制作,为全球用户提供高质量的动画和游戏内容。”这是图森重新给自己的定位。


总的来看,如今图森可以分成两个主要团队:一是研发部门,负责大模型研发、维护无人驾驶系统;另一个则是内容制作部门,以工作室形式自研不同的内容产品。而这两者对于图森有着不同的意义:技术是工具,内容是生意。


“商业模式是大模型的第四驾马车”


“图森现在有 270 名左右员工,其中技术研发 100 人左右,作为游戏公司的话肯定技术人太多了,其实我们还是一家技术公司。”吕程说道。


虽然图森更愿意称自己为技术公司,同时发布并开源了 70 亿参数的视频生成大模型 Ruyi,但是图森并不愿意成为一家大模型厂商。


吕程认为,在市场火、资本多的情况下,做通用模型可以维持一段时间。但现在有些公司花钱买量,还要支付用户使用成本,投入量是巨大的,市场上的公司不可能天天 PK 谁能给出最低价,其背后的商业模式很难走通。


另外的一个现实则是,如今 AIGC 技术还达不到 100% 生成高质量内容,更多是辅助作用,模型生成质量的上升还需要一定的时间,可能是三年、五年,所以不能一直砸钱。


“世界上没有一个纯大模型公司,我们要先找到商业模式,而 AI 是帮助你实现这个商业模式的工具。”吕程说道。


那么,怎么在短期内创造更好的商业模式、怎么利用好已有的技术?这是困扰图森高层良久的问题,直到今年 1 月份 OpenAI Sora 的出现给了图森未来新的灵感。


“大型语言模型虽然火,但跟图森的历史关系不大,但视频不同,图森与视觉还是有联系的。”吕程提到,那个时候常有人会问他们:图森的技术能不能做在 AIGC 方面有些用途?在双重启发下,图森瞄向了 AIGC 应用方向。


而走向游戏动漫领域,看似与图森的历史关系也不大,但创始人之一的陈默之前有过游戏动漫制作经验,对行业有了解、也有资源,比如图森的《金庸群侠传》IP 就是由其私人关系从金庸家族那里拿到授权的。相对选择一条新赛道从零开始,这或许是图森最好的选择。


就游戏而言,虽然疫情时期的爆发式增长不再,但吕程认为当前更多是回到了正常增长状态,高质量端游在国内依然很有前景,图森的新游戏方向也更多是 3A 高质量端游。而动漫已经逐渐成为游戏标配,即使不专门做动画、漫画,也会有 PV、立绘等,同时亚洲动漫文化已成为主流,全球动漫粉丝超过 8 亿。


但这两个行业普遍面临制作周期长、成本高的问题。像动画电影 / 番剧的制作成本约占总成本的 60%-70%,平均制作周期在 4-6 年不等,而著名 3A 游戏开发占总预算的 50%-70%,开发周期在 5-7 年间。


“我们做了这么多年技术,发现最终技术还是需要帮助解决大的问题或者创造更高价值的产品。”吕程说道。恰好,今年是生成式 AI 全面进军游戏领域的一年,众多游戏厂商希望借生成式 AI 在编程、NPC 动态交互、美术设计、内容创业等方面降本增效、创新游戏设计。


对于图森来说,更重要的是,游戏动漫行业的商业模式是一个已经被验证的商业模式。“我们通过制作内容产生的盈利以后可以投入到我们自己的研发,包括无人驾驶。很重要的一点是,不能靠市场来融资,得自己能养活自己。”吕程说道。


因此,图森未来在 3 月份在与董事会沟通后开始进行人员、测试等方面的投入,之后用了 5 个月时间验证了自己的技术可行性,董事会也正式批准了新业务板块。图森未来确定转型动漫游戏方向。


“不做最难的东西,就会被淘汰”


确定方向后,图森开始对整个动漫游戏产业链进行细分,分析怎么用技术解决当前行业面临的难题。


对大模型收费曾是当时图森考虑的变现方式之一,但最终被放弃了,图森决定做最难的内容部分。“AIGC 整个领域,如果不在开始做最难的东西,那肯定会被淘汰。你没法和大厂 PK,你的卡肯定不会比人多、钱也不比别人多,天天拼自己的大模型在每个层面都比别人好,这是很难的事情,除非是在一个行业很资深,拥有特殊数据,或者可以真正用这些工具来做不同的产品。”吕程分析道。


团队最终的决定是,图森要像 Unity、Epic 那样,从技术出发,然后慢慢做内容的制作和分发。


技术为底


虽然经历了一些动荡,但之前的基础设施、算法数据的核心人才还是留在了图森。此前的高级算法工程师王峰如今担任副总裁兼首席科学家,曾主持图森自动驾驶系统、传感器、高精地图、模拟器等多个核心模块设计研发的李海泉目前担任工程高级副总裁。


“大模型的三架马车:算法、算力和数据,其实我们都储备着。”吕程说道。


比如,算法方面,图森未来在 22 年无人驾驶行业有一个叫稀疏 BEV (Bird’s Eye View) 的算法 ,本质是一种用 Transformer 做的感式大模型算法。算力方面,图森未来通过自建数据中心和火山云等提供算力支持并不停迭代模型,目前已经在云计算上投入了数千万美元。而在数据上,图森未来的训练数据也来自公开数据库,但其优势在于对大量数据的自动化标注和整理技术,以此提高数据质量和模型效果。


现在市面上有很多视频生成模型,在吕程看来,大模型也是一种产品,不同行业里,模型的数据、优化点都不同,比如动漫里人的动作与真人比相对夸张。“一开始就清楚你的产品定义是很重要的一点。”


图森的研发团队用了 6 个月时间研发出了用于动漫游戏的图生视频大模型 Ruyi,采用最新 DiT 架构,支持 3D 场景重建,也支持在个人电脑上运行。


图森的大模型更加垂直到动漫游戏行业的从业者。考虑到专业人士需要对人设有很强控制的需求,文生视频模型可能每次生成的主体都不同,图生视频模型则可以先把人设定好,因此图森更加关注图生视频模型性能,帧间一致性、动作流畅性、色彩表现和构图等也是 Ruyi 研发的重点。


“我们的从文生视频模型表现可能不是最好的,没关系,这本身不是我们的关注点。”吕程表示。


按照图森研发规划,Ruyi 会继续迭代不同的版本,明年至少上线三款,分别是开源模型 Mini-7B-ACG、闭源模型 Standard-30B、闭源模型 Standard-30B-ACG,其中 Standard 版本支持生成 1080P 摄影级画面质感。到了 2026 年,图森将推出最强性能版本,支持 2K HDR 摄影级画面质感、支持多条件可控生成。



在以 Ruyi 视频大模型等基础技术之上,图森还针对不同的游戏板块自研了“ACG-GEN”系列工具,来制作动画游戏内容。像支持人物角色生成和人物主体一致性的 AVG GEN、支持动画视频生成和音效生成的 Anime GEN 、支持游戏单位生成和游戏平衡性测试的 SLG GEN 等都将于明年推出。


未来,待这些底层技术和工具更加成熟后,图森不拒绝以付费形式推向市场。不过,图森不会将自己变成一家技术供应商,理由也很简单:“SaaS 这块国内基本上没什么市场。”


_Mini-7B 开源地址:_https://huggingface.co/IamCreateAI/Ruyi-Mini-7B


内容为王


针对内容产品,图森内部梳理了由著名 IP、社区生态、影游联动、生成式 AI 和人才组成的商业闭环。


能拿到大 IP,陈默功不可没。陈默个人出于对武侠和动漫、游戏的兴趣和热爱,2020 年创立了水墨侠道公司,其作品《笑傲江湖》动画电影计划于 2025 年上映。期间,陈默与金庸家族建立了联系。图森确认转型后,陈默凭借此前积累的信任,加上金庸家族对游戏里人设、质量标准的认可,获得了《金庸群侠传》的独家授权 IP。据悉,图森将在该项目上进行千万到亿级别的投入,游戏的首支 PV 计划将于明年年中发布,测试版于 2026 年发布,正式版则在 2027 年发布。



《金庸群侠传》游戏部分画面,非最终版


对于早已官宣的《三体》IP,2D 动画电影将基于《三体 II:黑暗森林》改编,并与日本著名机械设计师河森正治、日本著名电影制作工作室白组株式会社联合制作。游戏方面则是会推出一款开放世界 FPS 游戏,计划于 2027 下半年同步全球发行,以最大化营销协同效应并增强社区互动。


如今,陈默作为首席制作人的身份,参与到图森未来内容产品的生产中,同时郝佳男担任首席运营官。根据图森的设想,无论金庸的武侠赛道还是刘慈欣的科幻题材,其本身都有一定的规模,游戏如果做得足够好玩、足够漂亮,就能吸引很多新的用户。


按照规划,在明年二季度,图森将发布一款 AVG 游戏和一款 SLG 游戏,这两款游戏肩负图森在当年实现收支平衡的任务。后年,图森上线一款 MOBA 游戏、河洛 2 和 Kings 系列番剧与同系列游戏,同时 3A 端游《金庸群侠传》测试版开启,彼时图森将迎来核心玩家的一次大考。而真正的考验图森游戏制作能力的或许是三年后其寄予厚望的《金庸群侠传》正式版和《三体》系列影游上线,无论如何玩家将会用脚投票。


“我觉得起码发布以后,如果‘最期待的武侠游戏’或‘最期待的 3A 游戏’里没有我们的话,我会感觉很丢人、很失望。”吕程抱有很大期待,这也是他给自己的动力。


图森表示,公司目前拥有充足的现金储备支撑现有项目和内容上线发行,按照其设想,2027 年度收入超过 8 亿美金。这意味着,从今年开始,图森有近两年的时间是纯投入,留给 2026 年首发游戏失败的空间极低,团队压力也可见一斑。



图森内容产品发布时间表


转型后,国际化依然是图森要走的路。游戏和动漫行业本身就是国际化的,这意味着图森不仅要和国内游戏厂商竞争,还要和欧洲、美国等全球游戏厂商竞争。图森目前国内的制作团队主要集中在北京和广州两地,另外还在日本和美国分别设立了团队。


在这方面,吕程表现出了很大的信心,“去年谁也不觉得中国能做 3A 游戏,然后今年出来了《黑神话:悟空》,相信亚洲包括中国占整个全球高质量游戏的制作和发行比例会越来越多。”吕程说道,“武侠肯定是以中国为主,而国际市场的潜力很大。”


吕程进一步分析道,“对我们这种半游戏公司或者后入场的公司来说,现在这个时间,虽然称不上洗牌,但确实是一个拐点,即现在制作大型高质量游戏成本越来越高,同时游戏内容可能有点不太符合玩家口味。这也是为什么连马斯克都成立了 AI 游戏工作室,说要 make games great again”。


吕程也表示,相比自动驾驶,内容不是特别敏感的行业,反而能够促进全球交流。图森在国际化上的经验对于发行和内容设计都是有帮助的,此外其在资本市场、政治环境上都有经验可以借鉴。


结束语


“没有能让你突然一件事情做得比别人都好的魔法。”吕程说道,“什么事情都不是百分百成功,只是当你每个环节都做得比别人好,并且在这个市场足够大的前提下,我们就有信心说我们有机会成功。”


他也鼓励至今还在公司的员工们,“这是一个行业很大、商业模式明确,技术上也能看见进展的选择。相比无人驾驶好的一点是,它的反馈周期更加统一和明确,会让大家会有往前走的动力。”


而对于图森之前的高层动荡,吕程认为,PR 声音比真正对公司的威胁要大一些。“这两年,公司管理层很稳定,董事会也很稳定,只是现在有人在外面有不同的利益在闹,但这些事情都会有法律法规解决。”


作为游戏动漫界“新人”,未来三年对图森来说是非常关键,它不仅需要证明自己在游戏动漫行业的制作能力,还要成功实现营收,保证公司的顺利发展。但留给图森证明的机会其实不会那么多。


图森能否如愿走到最后,我们拭目以待。


2024-12-23 15:421

评论

发布
暂无评论

Checkout.com支付解决方案,助力跨境电商领跑购物季

科技热闻

RocketMQ Flink Catalog 设计与实践

阿里云大数据AI技术

sql 大数据 flink 分布式计算 企业号十月PK榜

前端高频手写面试题

helloworld1024fd

JavaScript

React核心工作原理

xiaofeng

React

百度搜索业务交付无人值守实践与探索

百度Geek说

Pytho 企业号十月 PK 榜 智能测试

软件测试面试真题 | MYSQL中删除语句有哪些?

测试人

sql 软件测试 面试题 测试开发

React源码解读之React Fiber

flyzz177

React

软件测试 | 测试开发 | 如何确保API的稳定性与正确性?你只需要这一招

测吧(北京)科技有限公司

测试

【1024】程序员节丨致敬所有技术布道师

MobTech袤博科技

1024程序员节 MobTech袤博科技

请求投放个性化广告时,如何征得用户同意?

HarmonyOS SDK

广告

开源软件供应链攻击激增430%,供应链安全不容小觑丨行业报告解读

SEAL安全

开源 DevOps 行业报告 软件供应链安全

日报周报是“毒瘤”还是“良药”?

优秀

周报 日报

java开发培训机构要怎么谨慎选择

小谷哥

React源码解读之任务调度

flyzz177

React

JUC中的AQS底层详细超详解

华为云开发者联盟

Java 开发 华为云 企业号十月 PK 榜

阿里云移动测试-远程真机篇

移动研发平台EMAS

性能测试 app测试 移动测试 远程真机

实现Promise的原型方法--前端面试能力提升

helloworld1024fd

JavaScript

Vue3知识点之数据侦测

yyds2026

Vue

2022 XDR网络安全运营新理念峰会完整嘉宾阵容公布!

未来智安XDR SEC

网络安全

Vue3必会技巧-自定义Hooks

yyds2026

Vue

学会这10种定时任务,我有点飘了

小小怪下士

Java 程序员

长安链源码分析之交易过程分析(8)

高可用和负载均衡的三大区别详细讲解-行云管家

行云管家

高可用 高可用集群 ha

React生命周期深度完全解读

夏天的味道123

React

几个常见的js手写题,你能写出来几道

helloworld1024fd

JavaScript

React的5种高级模式

夏天的味道123

React

React性能优化的8种方式

xiaofeng

React

Webpack中的plugin插件机制

Geek_02d948

webpack

对象存储只能按文件名搜索,你out了吧

华为云开发者联盟

云计算 存储 华为云 企业号十月 PK 榜

Springboot 一行代码实现文件上传 20个平台!少写代码到极致

程序员小富

Java springboot 文件上传

深度解析9种ScheduledThreadPoolExecutor的构造方法

华为云开发者联盟

高并发 开发 华为云 源代码 企业号十月 PK 榜

曾经的“自动驾驶第一股”急速掉头,CEO亲述图森未来生死时速这一年_AI&大模型_褚杏娟_InfoQ精选文章