限时!亚马逊云科技云从业者认证考试五折,未过免费补考!更有好礼相送! 了解详情
写点什么

美图奇想大模型进阶至 V5,一口气发布 6 款新品喊话友商:快来抄作业

  • 2024-06-13
    北京
  • 本文字数:4077 字

    阅读完需:约 13 分钟

美图奇想大模型进阶至V5,一口气发布6款新品喊话友商:快来抄作业

6 月 12 日,在第三届美图影像节上,美图公司宣布美图奇想大模型(MiracleVision)已升级到 V5,将通过“AI 工作流”进一步助力电商、广告、游戏、影视、动漫五大行业。



相较于传统工作流,美图公司创始人、董事长兼首席执行官吴欣鸿解释了“AI 工作流”的 5 大优势:


首先,传统工作流以客户端算力为主,云端为辅。而在未来,很多能力将会部署在云上,并与客户端进行算力融合。


第二,从完成工作需要一个团队各司其职,在 AI 工作流的助力下,到一个人就是一支团队。AI 能自动化解决很多重复性的劳动,还能让非专业人士,借助 AI 解决专业领域的问题。


第三,AI 能够提供近乎无限的创意灵感库,让你不需要再绞尽脑汁想创意,而是轻松地选创意。


第四,工作流从相对固化到支持任意规划,AI 会像搭积木一样,根据需要调用不同的能力,快速组成工作流,从而完成特定的任务。


最后,在传统工作流中,往往只能靠个体经验做事,但在 AI 工作流中,模型能够基于数据自动迭代,速度远超人工。


而以奇想大模型 V5 模型能力为基石,美图还在会上一口气发布了 6 款围绕「影像与设计」AI 工作流的产品,包括三款产品的重磅升级,以及三款神秘新产品。


美图公司集团高级副总裁陈剑毅总结说:“美图最擅长的事就是化繁为简。因为 PhotoShop 门槛高,所以有了美图秀秀;因为影楼修图效率低,所以有了美图云修;因为制作口播视频有很多卡点,所以有了开拍;因为想让人人都能做设计,所以有了美图设计室。这都是我们对用户需求和垂直场景的深刻理解。”


对于新发布的产品,陈剑毅显然十分满意,他半开玩笑地说:“今天又是友商们抄作业的一天。”

历时 1 年迭代,V5 已涵盖图像、视频、音频、文本大模型


作为美图 AI 产品生态的基石,美图奇想大模型(MiracleVision)发布于 2023 年 6 月第二届美图影像节,为美图全系产品提供 AI 模型能力。


吴欣鸿介绍,经过将近一年迭代,美图奇想大模型已升级到 V5 版本,采用美图自研 DiT 技术架构(Sora 同款的 Transformer 扩散模型架构),涵盖图像大模型、视频大模型、音频大模型和文本大模型,拥有更强的模型架构与更大的参数量,结合更精准的语义理解,实现了更长的视频时长,动态连续性和画面稳定性也大幅提升。



例如,美图秀秀中的 AI 助手 RoboNeo,用户只需要通过简单的语言指令,就可以完成一系列复杂的图像编辑,包括 AI 改图、AI 消除等等。“未来,影像与设计的工作流会变得更简单,用户打打字、说说话就可以轻松完成各种任务。”吴欣鸿表示。


此外,美图奇想大模型(MiracleVision)的升级也进一步完善了美图的 AI 产品生态:应用层有 AI 图像、AI 视频、AI 设计、AI 营销四大模块的多款产品,生态层由中国领先的视觉创意平台站酷和美图 AI 助手 RoboNeo 提供服务,模型层由美图奇想大模型(MiracleVision)为全系产品提供 AI 模型能力。

美图云修 V2,解决调色难、用时多等问题


为了让修图师摆脱重复工作,在第一届美图影像节上,美图在 AI 图像模块中发布了新“家族成员”——美图云修。它相当于影楼版美图秀秀,可以批量导图,让 AI 批量精修。


据陈剑毅介绍,美图云修经过 2 年的发展,年修图张数已经超过 5 亿张。经过对婚纱、写真、儿童这三个市场占有率最高的商业摄影品类的市场调研,发现使用美图云修之后,门店选片平均增收达到了 40%。


在大会上,美图发布了美图云修 V2 版本,主要解决调色难且费时的问题。通过通过智能曝光、AI 滤镜、色彩迁移三步可以进行 AI 批量调色,帮助修图师大幅增效。


除了以上新能力之外,美图云修还开放了 API,服务于各种场景,实现即传、即修、即用。比如商业摄影场景中的照片直播、旅拍;电商场景中的模特精修、服饰美化等诸多场景。

开拍 V2,重构传统口播视频工作流


去年影像节,美图发布了“开拍”,基于 AI 脚本、AI 提词器、AI 文字快剪等功能,可以帮助用户用 AI 制作口播视频。


陈剑毅透露,“开拍”上线一年以来,截止上个月月活跃用户数已接近 70 万,累计内容创作数超 4000 万。与此同时,“开拍”的订阅收入也在高速增长,成为一款月毛利突破百万的 AI 应用。


在这个过程中,引发了美图的三点新思考:第一,在未来,人人都将是口播创作者;第二,口播视频将成为新的创收途径;第三点,AI 将提升口播内容质量。


“在这个趋势之下,我们也发现,即使有了 AI,口播自媒体的起号依然困难重重。”陈剑毅表示。据此,“开拍”V2 版本基于 AI 重构了从前期策划、中期拍摄到后期制作的传统口播视频工作流。


在前期策划环节,AI 脚本支持个人脚本风格的定制,导入三条参考视频,就可以生成同款风格的脚本模板,持续复用;


在拍摄环节,可以借助 AI 辅助真人拍摄,也可以用 AI 数字人生成口播视频;在后期制作环节,通过文字快剪,10 秒就能搞定视频粗剪。然后通过全新的 AI 一键包装功能,可以智能匹配音效、实现花字等各种后期特效。


“过去要花费 1-3 天才能完成的无数任务,用‘开拍’的 AI 工作流,不到半小时就可以搞定。”

美图设计室 V3,从个人提效到组织提效


美图设计室自发布以来,目前已拥有接近 1800 万月活跃用户,每月产生的电商物料超过了 4000 万。成为美图历年来毛利增长最快的产品。


本次大会发布了美图设计室 V3 版本,总结下来主要有 3 大亮点:


第一,AI 批量设计。将商品照片批量导入后,可以自动完成抠图和商品图、海报的生成,并自动适配各平台的物料尺寸,上百张大促活动图 3 秒就能生成;


第二,AI 商品视频。不需要专业设备,手机拍一张商品照片,或者绕着商品拍个 360 度的视频,就可以让 AI 生成商品视频;


第三,支持团队协作。传统工作流中需要由设计师承担所有设计工作,需求方只能等待排期,而基于美图设计室,设计师可以先将公司的 Logo、品牌色、字体、模板等设计资源,一口气上传到共享资源库,后续由需求方直接用这些资源搞定各种设计小任务,比如调整个图片尺寸、改改文字内容等等。

站酷设计服务,搞定找人难、流程复杂、售后难三个痛点


虽然 AI 大大降低了设计门槛,但是在具体业务场景中,仍然有很多场景需要专业设计师支持,提供定制化服务。比如包装设计、企业画册等等。


对此,用户往往会考虑从网上找设计师来帮忙,但传统的设计服务平台存在 3 大痛点:


首先,找人难,面对网站上面眼花缭乱的设计师,很难判断哪个合适;


其次,合作流程复杂,沟通成本高,想合作只能和设计师一个个聊需求,问档期、问价格,千里未必能挑一;


最后,售后难,对交付的作品不满意,但很难申请退款。


为了解决这一系列问题,美图在今年上半年将站酷设计服务收入麾下,而在今天的大会上,美图站酷设计服务正式上线,服务包括 14 大类,涵盖平面、插画、UI、网页,也包括影视、动漫、摄影,甚至空间设计、服装设计等。

奇觅,面向游戏广告解决制作和投放双高的问题


早在 2018 年,美图就投资了一家专注于游戏营销的公司——睿晟天和,并于 2023 年全资收购。在睿晟服务众多游戏客户的过程中,美图发现游戏广告仍存在两大痛点:


第一是制作成本高,游戏公司在设计广告时,既要制作大量的投放物料,又要适应各种平台规格,还要频繁更新和优化,非常消耗时间和设计资源;


第二是投放成本高,游戏营销竞争激烈,不少游戏的获客成本高达一两百块,此外在运营、分析等工作上也投入了大量人力。


“所以,我们将美图的影像技术与睿晟丰富的游戏营销经验相结合,推出了游戏广告 AI 制作与投放平台——奇觅,希望实现游戏广告的高效制作与精准投放,让优秀的游戏被更多玩家看到。”吴欣鸿表示。


据他介绍,奇觅的 AI 灵感库、AI 广告制作和 AI 广告投放,为行业提供了一套完整的游戏营销工作流。


其中,奇觅的 AI 灵感库提供了热点雷达,实时捕捉全网游戏热点,找到游戏玩家关注度最高的话题,可以帮助广告策划人员激发创意;AI 广告解析功能,可以对热门广告的脚本、画面、配音、配乐进行全方位拆解,快速洞察广告火爆的原因;另外,无论是休闲游戏,还是多人竞技、角色扮演等游戏,奇觅的 AI 灵感库都能针对性提供大量爆款脚本,让游戏更出圈。


而在确定脚本后的广告制作环节,根据录屏素材,AI 还能够智能匹配脚本,通过智能剪辑、添加转场、字幕,以及配音配乐,批量制作不同风格的优质游戏广告视频。之前非常冗长的游戏视频广告制作,直接被 AI 压缩至几分钟,让游戏营销如同叠满了 BUFF。


除了视频广告,奇觅还可以批量制作平面广告。基于海量平面广告模版,用户只要上传素材,AI 就能智能匹配模版进行批量制作。


而在正式投放前,AI 投前分析在五分钟内就能完成数十条广告的预审核和投放潜力评估,快速过滤掉高风险和投放潜力低的广告。据此,批量创建投放计划,还可以针对不同的人群搭建差异化的广告策略,仅需十分钟就可以完成三千条不同广告计划的设置。


据了解,奇觅已覆盖巨量引擎、华为、OPPO、vivo 等主流的广告平台,只需 1 分钟就可以直达游戏投放渠道。

坚持自研视频大模型,MOKI 让视频创作前所未有的简单高效


今年 2 月,OpenAI 发布文生视频模型 Sora,并引发文生视频领域的激烈竞赛。


在 Sora 发布后,美图第一时间升级了视频大模型技术架构。从 U-net 架构升级到了更强的 DiT 架构。影像节现场公布的信息显示,升级后的美图视频大模型拥有 6 大亮点:更强的模型架构和更大的参数量,结合更精准的语义理解,实现了更长的视频时长,动态连续性和画面稳定性也大幅提升。


“作为一家以美为核心的公司,我们对效果有着极高的要求。只有自研视频大模型,才能以高标准不断提升效果。同时,只有将模型与产品深度融合,做到模型即产品,才能给用户最好的体验。”吴欣鸿表示。原本需要实拍的视频,通过 AI 就可以生成,这个趋势正越来越近。


美图还通过 AI 短片创作工具 MOKI 解决了视频大模型“故事成片难”、“可控性较差”的问题。与常规文生视频产品不同,MOKI 深度理解视频创作者需求,实现内容和成本的双重可控,目前可以进行多种视频场景的 AI 短片创作。


吴欣鸿表示,MOKI 让视频创作前所未有的简单高效,无论你是个人还是专业团队,只要你有想法,都能轻松地将它变成短片作品。


可以看到,从诞生至今已经步入第 16 个年头的美图,已经不再只是一个纯 C 端产品。从打造爆款应用,到进入垂直行业攻坚客户痛点,美图正在慢慢探索出新的增长路径。“所谓‘流水不争先,争的是滔滔不绝’,面向垂直行业和场景,我们选择了 AI 工作流这条路,就意味着我们要在接下来的时间不断完善这个工作流。”吴欣鸿说道。

2024-06-13 00:186498

评论

发布
暂无评论
发现更多内容

Vue 2 即将停止更新

南城FE

JavaScript Vue 前端开发

图说技术:我的技术文章配图实践经验

Java 工程师蔡姬

技术人 21 天技术人写作行动营

OpenHarmony创新赛圆满收官:引领开源趋势,开启创新技术新纪元

新消费日报

Cilium CNI深度指南

俞凡

Kubernetes 云原生 网络 通信

图像处理AI软件推荐:Topaz Photo AI 激活直装版

胖墩儿不胖y

Mac软件 图像处理工具

开放原子云社区正式成立

开放原子开源基金会

Java 开源 程序员 开发者 算法

【PHP】thinkPHP6中的MVC思想的小案例

Geek_Angel

php mvc thinkphp6

一文详解 BRC20 衍生品协议 Bitcat,铭文市场长期发展的助推器

鳄鱼视界

数据库:mysqldump用法详解

百度搜索:蓝易云

MySQL Linux 运维 mysqldump 云服务器

INFINI Labs 产品更新 | Easysearch 新增快照搜索功能,Console 支持 OpenSearch 存储

极限实验室

console easysearch

诚邀报名 | 技术创新,照见未来——共建OpenHarmony,共赴开源世界

开放原子开源基金会

Java 开源 程序员 开发者 算法

有OpenHarmony技术问题,上Laval社区

Geek_2d6073

软件开发

Geek_8da502

小红书商品详情API:电商助力

Noah

多家高校设立“鸿蒙班”;ChatGPT 成为 Nature 年度十大人物丨 RTE 开发者日报 Vol.107

声网

系统综合清理优化推荐 MacCleaner 3 Pro 激活中文版

mac大玩家j

系统优化 Mac软件 系统优化工具

生成式AI给我们带来的影响

月下独酌

大模型

APIitem_get:你的淘宝商品详情搜索神器

技术冰糖葫芦

API 接口

如何使用 NFTScan NFT API 在 Viction 网络上开发 Web3 应用

NFT Research

NFT NFT\ NFTScan

MacCleaner 3 Pro中文激活:Mac电脑强大的清理优化软件

胖墩儿不胖y

优化软件 Mac软件推荐 系统优化工具

GaussDB整体性能慢分析教程。

百度搜索:蓝易云

云计算 Linux 运维 GaussDB 云服务器

体育直播程序源代码降低搭建门槛,低成本建体育赛事平台成为行业常态

软件开发-梦幻运营部

为开发者服务,让梦想成为可能|孙文龙理事长发表专题演讲

开放原子开源基金会

Java 开源 程序员 开发者 算法

拼多多ID取商品详情API:电商行业的秘密武器与实时数据获取的智慧之路

Noah

开源大侠请留步!您有一份开源集市攻略!

开放原子开源基金会

Java 开源 程序员 开发者 算法

3D渲染买显卡还是用云渲染?3D渲染卡慢

3DCAT实时渲染

云渲染 实时云渲染

单口千兆以太网物理层芯片

芯动大师

一文详解 BRC20 衍生品协议 Bitcat,铭文市场长期发展的助推

威廉META

美图奇想大模型进阶至V5,一口气发布6款新品喊话友商:快来抄作业_AI&大模型_高玉娴_InfoQ精选文章