根据天眼查信息,视频生成工具 HeyGen 背后的公司诗云科技(深圳)有限公司 12 月 11 日因决议解散申请注销登记。
HeyGen 由徐卓(Joshua Xu) 于 2020 年 11 月创立,他曾在 Snap 担任软件工程师六年。
据福布斯报道,徐卓和首席产品官梁望(Wayne Liang) 都是上海同济大学的校友,后来去了卡内基梅隆大学攻读了硕士学位。毕业后,徐卓加入了 Snap,而梁望则成为了初创公司 Smule 和 TikTok 母公司 ByteDance 的产品设计师。2020 年,徐卓回国探亲时因 Covid-19 滞留,随后在深圳创立了 HeyGen,同时将其总部设在了洛杉矶。
借着 GPT 的东风,HeyGen 在去年 9 月推出 AI 视频创作应用程序后,仅用 7 个月的时间实现了 100 万美元的 ARR(年度经常性收入),然后又于 10 月份达到 1000 万美元,如今,这一数字已经跃升至 1800 万美元。
HeyGen 提供一系列订阅选项,每月 49 美元到 150 美元不等,并提供一定数量的积分,每个积分可用于一分钟的视频。用户也可以选择更高端的选项,来创建更长、更高分辨率的视频。平均费用约为每分钟 3 美元,还有 1,000 美元的专业选项,但需要使用专业工作室和绿屏。
该公司也在成立后迅速吸引了 AI 领域投资者的兴趣:在成立三个月后就成功从两大投资者红杉中国和真格基金那里获得了 200 万至 300 万美元的种子轮融资。
11 月 29 日,HeyGen 宣布获得由 Sarah Guo 领投的 Conviction Partners 的 560 万美元新一轮风险投资。这轮投资使得这家洛杉矶公司的估值达到了 7500 万美元;作为交易的一部分,Guo 将接替 HongShan(原 Sequoia China)在 HeyGen 董事会的席位,这是 HeyGen 为了与其中国起源保持距离而采取的措施之一。
一夜爆红背后,还存隐忧
今年 10 月底,美国知名歌手 Taylor Swift 说普通话的视频片段在网络热传。
在视频中,Taylor Swift 用中文说道:“我最近去过很多地方,比如意大利、法国和日本”,口型和说话内容步调一致,达到了以假乱真的效果。
除了分享她最近去法国和意大利等地的经历外,她还讨论了一些没有完成的歌曲,她表示希望她的歌迷能够聆听这些未发行的曲目。
随后,该事件的汇编剪辑也已发布到 TikTok,迅速引起了大量关注。
这种利用 HeyGen 生成的 deepfake 类视频,其真实程度让大众非常震惊,有网友在热传的视频下评论说,“无论该视频使用什么技术,都会导致翻译和配音演员失业。”并且并不是所有人都对这种技术充满热情,另一位网友认为,“这实际上很可怕。”
有趣的是,中国社交媒体平台微博上的人们也有同样的情绪。“最可怕的是,如果有人用他的技术制造假新闻,因为人工智能能够操纵声音和嘴巴的动作,人们很容易相信它,”一位网友评论道。
今年 5 月,福州曾发生一起案例,涉及使用人工智能换脸技术,短短 10 分钟内骗取了 430 万人民币。因此,我们需要更深入地了解如何最有效地防范恶意滥用和欺骗性技术的问题。
尽管 HeyGen 在一定程度上会过滤露骨或暴力内容,但毋庸置疑,粉丝仍可能将其应用于欺骗性场景。由于与中国当前法规不符,HeyGen 目前在中国已被禁止。而徐卓则表示,他的初衷一直是将公司迁回洛杉矶。
是否存在技术壁垒?
据公开资料显示,HeyGen 现有 25 名员工,其产品采用了 Diffusion 技术。这种技术也是 Midjourney 或 OpenAI 的 DALL·E 的核心。徐卓透露,公司已经开发出了自己的视频 AI 模型,并且还整合了来自 OpenAI 和 Anthropic 的大模型用于文本处理,以及 Eleven Labs 提供的音频技术。
至于创业动机,徐卓曾在一次公开访谈中提到,其前东家 Snapchat 曾于 2018 年发布了第一个版本的生成性的模型,可以将用户变成娃娃脸或迪士尼风格,这证明了人工智能的能力,“人工智能可以创造出以前世界上不存在的东西。”
2021 年初,OpenAI 发布了 DALL·E 模型,该模型可以使用 AI 创建图像,将 GPT 会话结合起来,创造视频或生成视频。这种玩法与他自称为“黑客风格工程师”的身份相契合,“我真的很喜欢构建新东西、破解新东西,然后被别人使用。人工智能在我看来特别神奇,因为……大多数人,他们不理解,或者他们不需要理解这是人工智能,但它实际上是一种可以炫耀的神奇技术。”
HeyGen 延续了这种想法,不仅可以将素材创建为图像或视频,还可以创建从相机记录的内容,“这样我们就不必再次进行相机拍摄。”
市面上类似于 HeyGen 的 AI 视频初创公司数量不少,像 Runway 和 Pika 这样的公司就允许用户通过输入文本提示来创作和编辑视频,而 HeyGen 相对不同之处在于,它专注于帮助企业开展营销、培训和操作视频等工作。
虽然目前公司运行情况看起来不错,但徐卓还是希望他们的新产品能够让 YouTubers 和 TikTokers 感兴趣。
但实际上,YouTube 已经推出了一套生成式 AI 工具。这些工具包括但不限于:
“Dream Screen”:创建人工智能生成的视频和照片,输入提示即可生成背景资源。
“AI Insights”:使用生成式 AI 来提出视频创意和草稿大纲。这些内容建议将针对每个 YouTube 频道并根据观众参与度进行个性化。据 YouTube 称,测试版中 70% 的创作者发现这些功能对内容规划很有帮助。
“使用 Aloud 自动配音”:针对不同地区本地化内容,YouTube 会推出一个名为“Aloud”的工具,让全世界的观众都能访问他们的内容。
虽然字节跳动的 AI 项目处于保密状态,但我们不难想象,以字节的研发能力和资源储备,在 TikTok 上实现类似功能不是难事儿。
参考资料:
https://medium.com/@justmcLaughlin/youtubes-new-ai-features-a-game-changer-for-creators-2bf087705b6a
评论