HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

美图奇想大模型进阶至 V5,一口气发布 6 款新品喊话友商:快来抄作业

  • 2024-06-13
    北京
  • 本文字数:4077 字

    阅读完需:约 13 分钟

美图奇想大模型进阶至V5,一口气发布6款新品喊话友商:快来抄作业

6 月 12 日,在第三届美图影像节上,美图公司宣布美图奇想大模型(MiracleVision)已升级到 V5,将通过“AI 工作流”进一步助力电商、广告、游戏、影视、动漫五大行业。



相较于传统工作流,美图公司创始人、董事长兼首席执行官吴欣鸿解释了“AI 工作流”的 5 大优势:


首先,传统工作流以客户端算力为主,云端为辅。而在未来,很多能力将会部署在云上,并与客户端进行算力融合。


第二,从完成工作需要一个团队各司其职,在 AI 工作流的助力下,到一个人就是一支团队。AI 能自动化解决很多重复性的劳动,还能让非专业人士,借助 AI 解决专业领域的问题。


第三,AI 能够提供近乎无限的创意灵感库,让你不需要再绞尽脑汁想创意,而是轻松地选创意。


第四,工作流从相对固化到支持任意规划,AI 会像搭积木一样,根据需要调用不同的能力,快速组成工作流,从而完成特定的任务。


最后,在传统工作流中,往往只能靠个体经验做事,但在 AI 工作流中,模型能够基于数据自动迭代,速度远超人工。


而以奇想大模型 V5 模型能力为基石,美图还在会上一口气发布了 6 款围绕「影像与设计」AI 工作流的产品,包括三款产品的重磅升级,以及三款神秘新产品。


美图公司集团高级副总裁陈剑毅总结说:“美图最擅长的事就是化繁为简。因为 PhotoShop 门槛高,所以有了美图秀秀;因为影楼修图效率低,所以有了美图云修;因为制作口播视频有很多卡点,所以有了开拍;因为想让人人都能做设计,所以有了美图设计室。这都是我们对用户需求和垂直场景的深刻理解。”


对于新发布的产品,陈剑毅显然十分满意,他半开玩笑地说:“今天又是友商们抄作业的一天。”

历时 1 年迭代,V5 已涵盖图像、视频、音频、文本大模型


作为美图 AI 产品生态的基石,美图奇想大模型(MiracleVision)发布于 2023 年 6 月第二届美图影像节,为美图全系产品提供 AI 模型能力。


吴欣鸿介绍,经过将近一年迭代,美图奇想大模型已升级到 V5 版本,采用美图自研 DiT 技术架构(Sora 同款的 Transformer 扩散模型架构),涵盖图像大模型、视频大模型、音频大模型和文本大模型,拥有更强的模型架构与更大的参数量,结合更精准的语义理解,实现了更长的视频时长,动态连续性和画面稳定性也大幅提升。



例如,美图秀秀中的 AI 助手 RoboNeo,用户只需要通过简单的语言指令,就可以完成一系列复杂的图像编辑,包括 AI 改图、AI 消除等等。“未来,影像与设计的工作流会变得更简单,用户打打字、说说话就可以轻松完成各种任务。”吴欣鸿表示。


此外,美图奇想大模型(MiracleVision)的升级也进一步完善了美图的 AI 产品生态:应用层有 AI 图像、AI 视频、AI 设计、AI 营销四大模块的多款产品,生态层由中国领先的视觉创意平台站酷和美图 AI 助手 RoboNeo 提供服务,模型层由美图奇想大模型(MiracleVision)为全系产品提供 AI 模型能力。

美图云修 V2,解决调色难、用时多等问题


为了让修图师摆脱重复工作,在第一届美图影像节上,美图在 AI 图像模块中发布了新“家族成员”——美图云修。它相当于影楼版美图秀秀,可以批量导图,让 AI 批量精修。


据陈剑毅介绍,美图云修经过 2 年的发展,年修图张数已经超过 5 亿张。经过对婚纱、写真、儿童这三个市场占有率最高的商业摄影品类的市场调研,发现使用美图云修之后,门店选片平均增收达到了 40%。


在大会上,美图发布了美图云修 V2 版本,主要解决调色难且费时的问题。通过通过智能曝光、AI 滤镜、色彩迁移三步可以进行 AI 批量调色,帮助修图师大幅增效。


除了以上新能力之外,美图云修还开放了 API,服务于各种场景,实现即传、即修、即用。比如商业摄影场景中的照片直播、旅拍;电商场景中的模特精修、服饰美化等诸多场景。

开拍 V2,重构传统口播视频工作流


去年影像节,美图发布了“开拍”,基于 AI 脚本、AI 提词器、AI 文字快剪等功能,可以帮助用户用 AI 制作口播视频。


陈剑毅透露,“开拍”上线一年以来,截止上个月月活跃用户数已接近 70 万,累计内容创作数超 4000 万。与此同时,“开拍”的订阅收入也在高速增长,成为一款月毛利突破百万的 AI 应用。


在这个过程中,引发了美图的三点新思考:第一,在未来,人人都将是口播创作者;第二,口播视频将成为新的创收途径;第三点,AI 将提升口播内容质量。


“在这个趋势之下,我们也发现,即使有了 AI,口播自媒体的起号依然困难重重。”陈剑毅表示。据此,“开拍”V2 版本基于 AI 重构了从前期策划、中期拍摄到后期制作的传统口播视频工作流。


在前期策划环节,AI 脚本支持个人脚本风格的定制,导入三条参考视频,就可以生成同款风格的脚本模板,持续复用;


在拍摄环节,可以借助 AI 辅助真人拍摄,也可以用 AI 数字人生成口播视频;在后期制作环节,通过文字快剪,10 秒就能搞定视频粗剪。然后通过全新的 AI 一键包装功能,可以智能匹配音效、实现花字等各种后期特效。


“过去要花费 1-3 天才能完成的无数任务,用‘开拍’的 AI 工作流,不到半小时就可以搞定。”

美图设计室 V3,从个人提效到组织提效


美图设计室自发布以来,目前已拥有接近 1800 万月活跃用户,每月产生的电商物料超过了 4000 万。成为美图历年来毛利增长最快的产品。


本次大会发布了美图设计室 V3 版本,总结下来主要有 3 大亮点:


第一,AI 批量设计。将商品照片批量导入后,可以自动完成抠图和商品图、海报的生成,并自动适配各平台的物料尺寸,上百张大促活动图 3 秒就能生成;


第二,AI 商品视频。不需要专业设备,手机拍一张商品照片,或者绕着商品拍个 360 度的视频,就可以让 AI 生成商品视频;


第三,支持团队协作。传统工作流中需要由设计师承担所有设计工作,需求方只能等待排期,而基于美图设计室,设计师可以先将公司的 Logo、品牌色、字体、模板等设计资源,一口气上传到共享资源库,后续由需求方直接用这些资源搞定各种设计小任务,比如调整个图片尺寸、改改文字内容等等。

站酷设计服务,搞定找人难、流程复杂、售后难三个痛点


虽然 AI 大大降低了设计门槛,但是在具体业务场景中,仍然有很多场景需要专业设计师支持,提供定制化服务。比如包装设计、企业画册等等。


对此,用户往往会考虑从网上找设计师来帮忙,但传统的设计服务平台存在 3 大痛点:


首先,找人难,面对网站上面眼花缭乱的设计师,很难判断哪个合适;


其次,合作流程复杂,沟通成本高,想合作只能和设计师一个个聊需求,问档期、问价格,千里未必能挑一;


最后,售后难,对交付的作品不满意,但很难申请退款。


为了解决这一系列问题,美图在今年上半年将站酷设计服务收入麾下,而在今天的大会上,美图站酷设计服务正式上线,服务包括 14 大类,涵盖平面、插画、UI、网页,也包括影视、动漫、摄影,甚至空间设计、服装设计等。

奇觅,面向游戏广告解决制作和投放双高的问题


早在 2018 年,美图就投资了一家专注于游戏营销的公司——睿晟天和,并于 2023 年全资收购。在睿晟服务众多游戏客户的过程中,美图发现游戏广告仍存在两大痛点:


第一是制作成本高,游戏公司在设计广告时,既要制作大量的投放物料,又要适应各种平台规格,还要频繁更新和优化,非常消耗时间和设计资源;


第二是投放成本高,游戏营销竞争激烈,不少游戏的获客成本高达一两百块,此外在运营、分析等工作上也投入了大量人力。


“所以,我们将美图的影像技术与睿晟丰富的游戏营销经验相结合,推出了游戏广告 AI 制作与投放平台——奇觅,希望实现游戏广告的高效制作与精准投放,让优秀的游戏被更多玩家看到。”吴欣鸿表示。


据他介绍,奇觅的 AI 灵感库、AI 广告制作和 AI 广告投放,为行业提供了一套完整的游戏营销工作流。


其中,奇觅的 AI 灵感库提供了热点雷达,实时捕捉全网游戏热点,找到游戏玩家关注度最高的话题,可以帮助广告策划人员激发创意;AI 广告解析功能,可以对热门广告的脚本、画面、配音、配乐进行全方位拆解,快速洞察广告火爆的原因;另外,无论是休闲游戏,还是多人竞技、角色扮演等游戏,奇觅的 AI 灵感库都能针对性提供大量爆款脚本,让游戏更出圈。


而在确定脚本后的广告制作环节,根据录屏素材,AI 还能够智能匹配脚本,通过智能剪辑、添加转场、字幕,以及配音配乐,批量制作不同风格的优质游戏广告视频。之前非常冗长的游戏视频广告制作,直接被 AI 压缩至几分钟,让游戏营销如同叠满了 BUFF。


除了视频广告,奇觅还可以批量制作平面广告。基于海量平面广告模版,用户只要上传素材,AI 就能智能匹配模版进行批量制作。


而在正式投放前,AI 投前分析在五分钟内就能完成数十条广告的预审核和投放潜力评估,快速过滤掉高风险和投放潜力低的广告。据此,批量创建投放计划,还可以针对不同的人群搭建差异化的广告策略,仅需十分钟就可以完成三千条不同广告计划的设置。


据了解,奇觅已覆盖巨量引擎、华为、OPPO、vivo 等主流的广告平台,只需 1 分钟就可以直达游戏投放渠道。

坚持自研视频大模型,MOKI 让视频创作前所未有的简单高效


今年 2 月,OpenAI 发布文生视频模型 Sora,并引发文生视频领域的激烈竞赛。


在 Sora 发布后,美图第一时间升级了视频大模型技术架构。从 U-net 架构升级到了更强的 DiT 架构。影像节现场公布的信息显示,升级后的美图视频大模型拥有 6 大亮点:更强的模型架构和更大的参数量,结合更精准的语义理解,实现了更长的视频时长,动态连续性和画面稳定性也大幅提升。


“作为一家以美为核心的公司,我们对效果有着极高的要求。只有自研视频大模型,才能以高标准不断提升效果。同时,只有将模型与产品深度融合,做到模型即产品,才能给用户最好的体验。”吴欣鸿表示。原本需要实拍的视频,通过 AI 就可以生成,这个趋势正越来越近。


美图还通过 AI 短片创作工具 MOKI 解决了视频大模型“故事成片难”、“可控性较差”的问题。与常规文生视频产品不同,MOKI 深度理解视频创作者需求,实现内容和成本的双重可控,目前可以进行多种视频场景的 AI 短片创作。


吴欣鸿表示,MOKI 让视频创作前所未有的简单高效,无论你是个人还是专业团队,只要你有想法,都能轻松地将它变成短片作品。


可以看到,从诞生至今已经步入第 16 个年头的美图,已经不再只是一个纯 C 端产品。从打造爆款应用,到进入垂直行业攻坚客户痛点,美图正在慢慢探索出新的增长路径。“所谓‘流水不争先,争的是滔滔不绝’,面向垂直行业和场景,我们选择了 AI 工作流这条路,就意味着我们要在接下来的时间不断完善这个工作流。”吴欣鸿说道。

2024-06-13 00:186609

评论

发布
暂无评论
发现更多内容

融云「 IM 进阶实战高手课」系列直播上线

融云 RongCloud

IM 连接协议

我用这一招让团队的开发效率提升了 100%!

Liam

程序员 前端 后端 开发 API

大数据培训班如何选

小谷哥

数字孪生园区场景中的坐标知识

ThingJS数字孪生引擎

数字孪生

一文搞懂│php 中的 DI 依赖注入

设计模式 依赖注入 8月月更 高级编程

制胜精细化运营时代 华为应用市场打出内容、场景、商业运营组合拳

Geek_2d6073

开源一夏 | Python Web开发(八):后端开发中的增查改删处理

是Dream呀

开源

安全至上:落地DevSecOps最佳实践你不得不知道的工具

龙智—DevSecOps解决方案

DevOps DevSecOps

学好web前端培训课程方法推荐

小谷哥

电烙铁的基础知识

单宝华

电子技术 8月月更

「全球数字经济大会」登陆 N 世界,融云提供通信云服务支持

融云 RongCloud

isc N世界

Redis进阶之路:深度解析Redis单线程架构,图文并茂不能再清晰了

王小凡

Java redis 程序员 开发

开源一夏|数据结构课设:基于字符串模式匹配算法的病毒感染检测问题

是Dream呀

开源

百问百答第49期:极客有约——国内可观测领域SaaS产品的发展前景

博睿数据

可观测性 智能运维 博睿数据 极客有约 中信证券

开源一夏 | 不会吧,十分钟就能上手Prometheus与Grafana监控SpringBoot项目

知识浅谈

开源 8月月更 SpringBoot实战

A tour of gRPC:06 - gRPC client straming 客户端流

BUG侦探

gRPC RPC

参加前端培训后程序员能找到工作吗?

小谷哥

搭建属于自己的知识库(Wikijs)

开源 wiki 知识库 8月月更

浅聊组合函数

掘金安东尼

前端 函数编程 8月月更

用 Lunchbox 在 vue3 中创建一个旋转的 3D 地球竟是如此简单

前端修罗场

3D 地球 ThreeJS

创新云集技术咖,工赋汇聚实战派:2022工赋开发者峰会

工赋开发者社区

工业 峰会

大数据培训机构大概要花费多少钱

小谷哥

CWE4.8:2022年危害最大的25种软件安全问题

华为云开发者联盟

安全 后端 开发

研发了 5 年的时序数据库,到底要解决什么问题?

TDengine

数据库 tdengine

不改一行源码,实现 sentinel-dashboard 所有配置支持 apollo 持久化

铁匠

微服务 sentinel 流量控制 sentinel dashboard

什么是SVN(Subversion)?

龙智—DevSecOps解决方案

svn 版本控制 版本管理 版本控制软件

2022年值得尝试的7个MQTT客户端工具

EMQ映云科技

物联网 IoT mqtt 客户端 8月月更

大数据培训如何部署一个健壮的Airflow

小谷哥

Python 教程之输入输出(2)—— 输入和输出

海拥(haiyong.site)

Python 8月月更

全面认识二极管,一篇文章就够了

矜辰所致

ESD二极管 8月月更 二极管 电子设计基础 TVS二极管

开源一夏 | 数据结构课设:图书信息管理--顺序存储和链式存储

是Dream呀

开源

美图奇想大模型进阶至V5,一口气发布6款新品喊话友商:快来抄作业_AI&大模型_高玉娴_InfoQ精选文章