写点什么

曾经的“自动驾驶第一股”急速掉头,CEO 亲述图森未来生死时速这一年

  • 2024-12-23
    北京
  • 本文字数:4459 字

    阅读完需:约 15 分钟

曾经的“自动驾驶第一股”急速掉头,CEO亲述图森未来生死时速这一年

“我们已经做了很多工作,一年后再谈战略也不会变,不会再突然做别的事情。”图森未来 CEO 吕程坚定地说道。


自动驾驶赛道跑了近 10 年的图森未来,如今改名 CreateAI,大转弯迈进了动漫游戏领域。


“希望利用生成式 AI 技术重新定义数字化娱乐内容的制作,为全球用户提供高质量的动画和游戏内容。”这是图森重新给自己的定位。


总的来看,如今图森可以分成两个主要团队:一是研发部门,负责大模型研发、维护无人驾驶系统;另一个则是内容制作部门,以工作室形式自研不同的内容产品。而这两者对于图森有着不同的意义:技术是工具,内容是生意。


“商业模式是大模型的第四驾马车”


“图森现在有 270 名左右员工,其中技术研发 100 人左右,作为游戏公司的话肯定技术人太多了,其实我们还是一家技术公司。”吕程说道。


虽然图森更愿意称自己为技术公司,同时发布并开源了 70 亿参数的视频生成大模型 Ruyi,但是图森并不愿意成为一家大模型厂商。


吕程认为,在市场火、资本多的情况下,做通用模型可以维持一段时间。但现在有些公司花钱买量,还要支付用户使用成本,投入量是巨大的,市场上的公司不可能天天 PK 谁能给出最低价,其背后的商业模式很难走通。


另外的一个现实则是,如今 AIGC 技术还达不到 100% 生成高质量内容,更多是辅助作用,模型生成质量的上升还需要一定的时间,可能是三年、五年,所以不能一直砸钱。


“世界上没有一个纯大模型公司,我们要先找到商业模式,而 AI 是帮助你实现这个商业模式的工具。”吕程说道。


那么,怎么在短期内创造更好的商业模式、怎么利用好已有的技术?这是困扰图森高层良久的问题,直到今年 1 月份 OpenAI Sora 的出现给了图森未来新的灵感。


“大型语言模型虽然火,但跟图森的历史关系不大,但视频不同,图森与视觉还是有联系的。”吕程提到,那个时候常有人会问他们:图森的技术能不能做在 AIGC 方面有些用途?在双重启发下,图森瞄向了 AIGC 应用方向。


而走向游戏动漫领域,看似与图森的历史关系也不大,但创始人之一的陈默之前有过游戏动漫制作经验,对行业有了解、也有资源,比如图森的《金庸群侠传》IP 就是由其私人关系从金庸家族那里拿到授权的。相对选择一条新赛道从零开始,这或许是图森最好的选择。


就游戏而言,虽然疫情时期的爆发式增长不再,但吕程认为当前更多是回到了正常增长状态,高质量端游在国内依然很有前景,图森的新游戏方向也更多是 3A 高质量端游。而动漫已经逐渐成为游戏标配,即使不专门做动画、漫画,也会有 PV、立绘等,同时亚洲动漫文化已成为主流,全球动漫粉丝超过 8 亿。


但这两个行业普遍面临制作周期长、成本高的问题。像动画电影 / 番剧的制作成本约占总成本的 60%-70%,平均制作周期在 4-6 年不等,而著名 3A 游戏开发占总预算的 50%-70%,开发周期在 5-7 年间。


“我们做了这么多年技术,发现最终技术还是需要帮助解决大的问题或者创造更高价值的产品。”吕程说道。恰好,今年是生成式 AI 全面进军游戏领域的一年,众多游戏厂商希望借生成式 AI 在编程、NPC 动态交互、美术设计、内容创业等方面降本增效、创新游戏设计。


对于图森来说,更重要的是,游戏动漫行业的商业模式是一个已经被验证的商业模式。“我们通过制作内容产生的盈利以后可以投入到我们自己的研发,包括无人驾驶。很重要的一点是,不能靠市场来融资,得自己能养活自己。”吕程说道。


因此,图森未来在 3 月份在与董事会沟通后开始进行人员、测试等方面的投入,之后用了 5 个月时间验证了自己的技术可行性,董事会也正式批准了新业务板块。图森未来确定转型动漫游戏方向。


“不做最难的东西,就会被淘汰”


确定方向后,图森开始对整个动漫游戏产业链进行细分,分析怎么用技术解决当前行业面临的难题。


对大模型收费曾是当时图森考虑的变现方式之一,但最终被放弃了,图森决定做最难的内容部分。“AIGC 整个领域,如果不在开始做最难的东西,那肯定会被淘汰。你没法和大厂 PK,你的卡肯定不会比人多、钱也不比别人多,天天拼自己的大模型在每个层面都比别人好,这是很难的事情,除非是在一个行业很资深,拥有特殊数据,或者可以真正用这些工具来做不同的产品。”吕程分析道。


团队最终的决定是,图森要像 Unity、Epic 那样,从技术出发,然后慢慢做内容的制作和分发。


技术为底


虽然经历了一些动荡,但之前的基础设施、算法数据的核心人才还是留在了图森。此前的高级算法工程师王峰如今担任副总裁兼首席科学家,曾主持图森自动驾驶系统、传感器、高精地图、模拟器等多个核心模块设计研发的李海泉目前担任工程高级副总裁。


“大模型的三架马车:算法、算力和数据,其实我们都储备着。”吕程说道。


比如,算法方面,图森未来在 22 年无人驾驶行业有一个叫稀疏 BEV (Bird’s Eye View) 的算法 ,本质是一种用 Transformer 做的感式大模型算法。算力方面,图森未来通过自建数据中心和火山云等提供算力支持并不停迭代模型,目前已经在云计算上投入了数千万美元。而在数据上,图森未来的训练数据也来自公开数据库,但其优势在于对大量数据的自动化标注和整理技术,以此提高数据质量和模型效果。


现在市面上有很多视频生成模型,在吕程看来,大模型也是一种产品,不同行业里,模型的数据、优化点都不同,比如动漫里人的动作与真人比相对夸张。“一开始就清楚你的产品定义是很重要的一点。”


图森的研发团队用了 6 个月时间研发出了用于动漫游戏的图生视频大模型 Ruyi,采用最新 DiT 架构,支持 3D 场景重建,也支持在个人电脑上运行。


图森的大模型更加垂直到动漫游戏行业的从业者。考虑到专业人士需要对人设有很强控制的需求,文生视频模型可能每次生成的主体都不同,图生视频模型则可以先把人设定好,因此图森更加关注图生视频模型性能,帧间一致性、动作流畅性、色彩表现和构图等也是 Ruyi 研发的重点。


“我们的从文生视频模型表现可能不是最好的,没关系,这本身不是我们的关注点。”吕程表示。


按照图森研发规划,Ruyi 会继续迭代不同的版本,明年至少上线三款,分别是开源模型 Mini-7B-ACG、闭源模型 Standard-30B、闭源模型 Standard-30B-ACG,其中 Standard 版本支持生成 1080P 摄影级画面质感。到了 2026 年,图森将推出最强性能版本,支持 2K HDR 摄影级画面质感、支持多条件可控生成。



在以 Ruyi 视频大模型等基础技术之上,图森还针对不同的游戏板块自研了“ACG-GEN”系列工具,来制作动画游戏内容。像支持人物角色生成和人物主体一致性的 AVG GEN、支持动画视频生成和音效生成的 Anime GEN 、支持游戏单位生成和游戏平衡性测试的 SLG GEN 等都将于明年推出。


未来,待这些底层技术和工具更加成熟后,图森不拒绝以付费形式推向市场。不过,图森不会将自己变成一家技术供应商,理由也很简单:“SaaS 这块国内基本上没什么市场。”


_Mini-7B 开源地址:_https://huggingface.co/IamCreateAI/Ruyi-Mini-7B


内容为王


针对内容产品,图森内部梳理了由著名 IP、社区生态、影游联动、生成式 AI 和人才组成的商业闭环。


能拿到大 IP,陈默功不可没。陈默个人出于对武侠和动漫、游戏的兴趣和热爱,2020 年创立了水墨侠道公司,其作品《笑傲江湖》动画电影计划于 2025 年上映。期间,陈默与金庸家族建立了联系。图森确认转型后,陈默凭借此前积累的信任,加上金庸家族对游戏里人设、质量标准的认可,获得了《金庸群侠传》的独家授权 IP。据悉,图森将在该项目上进行千万到亿级别的投入,游戏的首支 PV 计划将于明年年中发布,测试版于 2026 年发布,正式版则在 2027 年发布。



《金庸群侠传》游戏部分画面,非最终版


对于早已官宣的《三体》IP,2D 动画电影将基于《三体 II:黑暗森林》改编,并与日本著名机械设计师河森正治、日本著名电影制作工作室白组株式会社联合制作。游戏方面则是会推出一款开放世界 FPS 游戏,计划于 2027 下半年同步全球发行,以最大化营销协同效应并增强社区互动。


如今,陈默作为首席制作人的身份,参与到图森未来内容产品的生产中,同时郝佳男担任首席运营官。根据图森的设想,无论金庸的武侠赛道还是刘慈欣的科幻题材,其本身都有一定的规模,游戏如果做得足够好玩、足够漂亮,就能吸引很多新的用户。


按照规划,在明年二季度,图森将发布一款 AVG 游戏和一款 SLG 游戏,这两款游戏肩负图森在当年实现收支平衡的任务。后年,图森上线一款 MOBA 游戏、河洛 2 和 Kings 系列番剧与同系列游戏,同时 3A 端游《金庸群侠传》测试版开启,彼时图森将迎来核心玩家的一次大考。而真正的考验图森游戏制作能力的或许是三年后其寄予厚望的《金庸群侠传》正式版和《三体》系列影游上线,无论如何玩家将会用脚投票。


“我觉得起码发布以后,如果‘最期待的武侠游戏’或‘最期待的 3A 游戏’里没有我们的话,我会感觉很丢人、很失望。”吕程抱有很大期待,这也是他给自己的动力。


图森表示,公司目前拥有充足的现金储备支撑现有项目和内容上线发行,按照其设想,2027 年度收入超过 8 亿美金。这意味着,从今年开始,图森有近两年的时间是纯投入,留给 2026 年首发游戏失败的空间极低,团队压力也可见一斑。



图森内容产品发布时间表


转型后,国际化依然是图森要走的路。游戏和动漫行业本身就是国际化的,这意味着图森不仅要和国内游戏厂商竞争,还要和欧洲、美国等全球游戏厂商竞争。图森目前国内的制作团队主要集中在北京和广州两地,另外还在日本和美国分别设立了团队。


在这方面,吕程表现出了很大的信心,“去年谁也不觉得中国能做 3A 游戏,然后今年出来了《黑神话:悟空》,相信亚洲包括中国占整个全球高质量游戏的制作和发行比例会越来越多。”吕程说道,“武侠肯定是以中国为主,而国际市场的潜力很大。”


吕程进一步分析道,“对我们这种半游戏公司或者后入场的公司来说,现在这个时间,虽然称不上洗牌,但确实是一个拐点,即现在制作大型高质量游戏成本越来越高,同时游戏内容可能有点不太符合玩家口味。这也是为什么连马斯克都成立了 AI 游戏工作室,说要 make games great again”。


吕程也表示,相比自动驾驶,内容不是特别敏感的行业,反而能够促进全球交流。图森在国际化上的经验对于发行和内容设计都是有帮助的,此外其在资本市场、政治环境上都有经验可以借鉴。


结束语


“没有能让你突然一件事情做得比别人都好的魔法。”吕程说道,“什么事情都不是百分百成功,只是当你每个环节都做得比别人好,并且在这个市场足够大的前提下,我们就有信心说我们有机会成功。”


他也鼓励至今还在公司的员工们,“这是一个行业很大、商业模式明确,技术上也能看见进展的选择。相比无人驾驶好的一点是,它的反馈周期更加统一和明确,会让大家会有往前走的动力。”


而对于图森之前的高层动荡,吕程认为,PR 声音比真正对公司的威胁要大一些。“这两年,公司管理层很稳定,董事会也很稳定,只是现在有人在外面有不同的利益在闹,但这些事情都会有法律法规解决。”


作为游戏动漫界“新人”,未来三年对图森来说是非常关键,它不仅需要证明自己在游戏动漫行业的制作能力,还要成功实现营收,保证公司的顺利发展。但留给图森证明的机会其实不会那么多。


图森能否如愿走到最后,我们拭目以待。


2024-12-23 15:426169

评论

发布
暂无评论

从无到有,一步一步教你搭建微服务电商项目,包含笔记+视频+源码

小二,上酒上酒

微服务

数据库故障处理优质文章汇总(含Oracle、MySQL、MogDB等)

墨天轮

MySQL 数据库 oracle 故障定位 国产数据库

Linux下基础命令(二)

DS小龙哥

10月月更

融云实践:主流叙事之外,科技如何助力民生改善

融云 RongCloud

数据 服务 科技

阿里高工携18位架构师耗时两个月整合1000页的Java岗面试八股文

程序知音

Java 架构 java面试 后端技术 Java面试八股文

如何使用华为云IoT平台实现远程控制无人机,资深物联网从业者手把书一步一步教你!

wljslmz

物联网 IoT 无人机 华为云 10月月更

别按部就班的背面试题了!吃透这份Java面试核心知识手册,大环境不好Offer也能拿到手软!

Java全栈架构师

程序员 面试 程序人生 架构师 Java后端

Github三天点击破亿,四天助力金九银十,精通SpringCloud微服务架构,成就大厂梦

小二,上酒上酒

Java spring 编程 Spring Cloud

有人想用开源工具DBT取代 SQL,你同意吗?

雨果

sql

专利解析|混合缓存技术在元年多维库中的应用

元年技术洞察

数据分析 多维数据库

Linux系统下基础命令介绍

DS小龙哥

10月月更

Linux下文件目录权限操作

DS小龙哥

10月月更

Python进阶(十二)浅谈python中的方法

No Silver Bullet

Python 方法 10月月更

十大 CI/CD 安全风险(二)

SEAL安全

DevOps CI/CD DevSecOps CI/CD管道 软件供应链安全

数字化转型案例解读:德意志银行数字化转型背后的故事

雨果

数字化转型

IT人士必须警惕这9个信号:说明你的IT架构很糟糕

雨果

数据管理工具 数据服务平台

5年大厂开发经验,加上这份Java高性能架构笔记,终于拿到了架构师薪资

小二,上酒上酒

Java 大厂 大厂面试 Java面试题

MatrixOne混沌测试之道

MatrixOrigin

数据库 分布式 混沌测试

5分钟,带你创建一个智能电梯检测器模型

华为云开发者联盟

物联网 华为云 iotda 智慧电梯 企业号十月 PK 榜

挑战海量数据:基于Apache DolphinScheduler对千亿级数据应用实践

白鲸开源

大数据任务调度 任务调度 dophinscheduler 大数据调度

阿里内部JVM G1GC纯手写学习笔记,你确定看得完?

小二,上酒上酒

编程 JVM 马士兵

阿里p8免费公开五份Java架构师学习手册,助力金九银十

小二,上酒上酒

Java 架构 阿里

八月裸辞,九月疫情在家闭关狂刷面试题,十月成功上岸京东物流

小二,上酒上酒

Java 阿里

Linux下automake工具使用(自动构建Makefile文件)

DS小龙哥

10月月更

Linux下Shell脚本基础语法

DS小龙哥

10月月更

阿里内部手写的Spring Security,真的香啊

小二,上酒上酒

spring spring security

再不看就来不及了,腾讯Spring Boot高阶笔记,限时开源48小时

小二,上酒上酒

Java 面试 大厂

阿里内部独家Java架构面试题,面试再不过来找我

小二,上酒上酒

MySQL spring JVM 多线程 MQ

你从未见过如此详细的 TCP 八股文!

C++后台开发

TCP 网络编程 网络协议 八股文 C++开发

Bug改不完,迭代总延期,咋办?

华为云开发者联盟

开发流程 bug 迭代 瀑布开发 企业号十月 PK 榜

Gartner:被CIO们忽略的7个颠覆性趋势

雨果

CIO

曾经的“自动驾驶第一股”急速掉头,CEO亲述图森未来生死时速这一年_AI&大模型_褚杏娟_InfoQ精选文章