写点什么

美图奇想大模型进阶至 V5,一口气发布 6 款新品喊话友商:快来抄作业

  • 2024-06-13
    北京
  • 本文字数:4077 字

    阅读完需:约 13 分钟

美图奇想大模型进阶至V5,一口气发布6款新品喊话友商:快来抄作业

6 月 12 日,在第三届美图影像节上,美图公司宣布美图奇想大模型(MiracleVision)已升级到 V5,将通过“AI 工作流”进一步助力电商、广告、游戏、影视、动漫五大行业。



相较于传统工作流,美图公司创始人、董事长兼首席执行官吴欣鸿解释了“AI 工作流”的 5 大优势:


首先,传统工作流以客户端算力为主,云端为辅。而在未来,很多能力将会部署在云上,并与客户端进行算力融合。


第二,从完成工作需要一个团队各司其职,在 AI 工作流的助力下,到一个人就是一支团队。AI 能自动化解决很多重复性的劳动,还能让非专业人士,借助 AI 解决专业领域的问题。


第三,AI 能够提供近乎无限的创意灵感库,让你不需要再绞尽脑汁想创意,而是轻松地选创意。


第四,工作流从相对固化到支持任意规划,AI 会像搭积木一样,根据需要调用不同的能力,快速组成工作流,从而完成特定的任务。


最后,在传统工作流中,往往只能靠个体经验做事,但在 AI 工作流中,模型能够基于数据自动迭代,速度远超人工。


而以奇想大模型 V5 模型能力为基石,美图还在会上一口气发布了 6 款围绕「影像与设计」AI 工作流的产品,包括三款产品的重磅升级,以及三款神秘新产品。


美图公司集团高级副总裁陈剑毅总结说:“美图最擅长的事就是化繁为简。因为 PhotoShop 门槛高,所以有了美图秀秀;因为影楼修图效率低,所以有了美图云修;因为制作口播视频有很多卡点,所以有了开拍;因为想让人人都能做设计,所以有了美图设计室。这都是我们对用户需求和垂直场景的深刻理解。”


对于新发布的产品,陈剑毅显然十分满意,他半开玩笑地说:“今天又是友商们抄作业的一天。”

历时 1 年迭代,V5 已涵盖图像、视频、音频、文本大模型


作为美图 AI 产品生态的基石,美图奇想大模型(MiracleVision)发布于 2023 年 6 月第二届美图影像节,为美图全系产品提供 AI 模型能力。


吴欣鸿介绍,经过将近一年迭代,美图奇想大模型已升级到 V5 版本,采用美图自研 DiT 技术架构(Sora 同款的 Transformer 扩散模型架构),涵盖图像大模型、视频大模型、音频大模型和文本大模型,拥有更强的模型架构与更大的参数量,结合更精准的语义理解,实现了更长的视频时长,动态连续性和画面稳定性也大幅提升。



例如,美图秀秀中的 AI 助手 RoboNeo,用户只需要通过简单的语言指令,就可以完成一系列复杂的图像编辑,包括 AI 改图、AI 消除等等。“未来,影像与设计的工作流会变得更简单,用户打打字、说说话就可以轻松完成各种任务。”吴欣鸿表示。


此外,美图奇想大模型(MiracleVision)的升级也进一步完善了美图的 AI 产品生态:应用层有 AI 图像、AI 视频、AI 设计、AI 营销四大模块的多款产品,生态层由中国领先的视觉创意平台站酷和美图 AI 助手 RoboNeo 提供服务,模型层由美图奇想大模型(MiracleVision)为全系产品提供 AI 模型能力。

美图云修 V2,解决调色难、用时多等问题


为了让修图师摆脱重复工作,在第一届美图影像节上,美图在 AI 图像模块中发布了新“家族成员”——美图云修。它相当于影楼版美图秀秀,可以批量导图,让 AI 批量精修。


据陈剑毅介绍,美图云修经过 2 年的发展,年修图张数已经超过 5 亿张。经过对婚纱、写真、儿童这三个市场占有率最高的商业摄影品类的市场调研,发现使用美图云修之后,门店选片平均增收达到了 40%。


在大会上,美图发布了美图云修 V2 版本,主要解决调色难且费时的问题。通过通过智能曝光、AI 滤镜、色彩迁移三步可以进行 AI 批量调色,帮助修图师大幅增效。


除了以上新能力之外,美图云修还开放了 API,服务于各种场景,实现即传、即修、即用。比如商业摄影场景中的照片直播、旅拍;电商场景中的模特精修、服饰美化等诸多场景。

开拍 V2,重构传统口播视频工作流


去年影像节,美图发布了“开拍”,基于 AI 脚本、AI 提词器、AI 文字快剪等功能,可以帮助用户用 AI 制作口播视频。


陈剑毅透露,“开拍”上线一年以来,截止上个月月活跃用户数已接近 70 万,累计内容创作数超 4000 万。与此同时,“开拍”的订阅收入也在高速增长,成为一款月毛利突破百万的 AI 应用。


在这个过程中,引发了美图的三点新思考:第一,在未来,人人都将是口播创作者;第二,口播视频将成为新的创收途径;第三点,AI 将提升口播内容质量。


“在这个趋势之下,我们也发现,即使有了 AI,口播自媒体的起号依然困难重重。”陈剑毅表示。据此,“开拍”V2 版本基于 AI 重构了从前期策划、中期拍摄到后期制作的传统口播视频工作流。


在前期策划环节,AI 脚本支持个人脚本风格的定制,导入三条参考视频,就可以生成同款风格的脚本模板,持续复用;


在拍摄环节,可以借助 AI 辅助真人拍摄,也可以用 AI 数字人生成口播视频;在后期制作环节,通过文字快剪,10 秒就能搞定视频粗剪。然后通过全新的 AI 一键包装功能,可以智能匹配音效、实现花字等各种后期特效。


“过去要花费 1-3 天才能完成的无数任务,用‘开拍’的 AI 工作流,不到半小时就可以搞定。”

美图设计室 V3,从个人提效到组织提效


美图设计室自发布以来,目前已拥有接近 1800 万月活跃用户,每月产生的电商物料超过了 4000 万。成为美图历年来毛利增长最快的产品。


本次大会发布了美图设计室 V3 版本,总结下来主要有 3 大亮点:


第一,AI 批量设计。将商品照片批量导入后,可以自动完成抠图和商品图、海报的生成,并自动适配各平台的物料尺寸,上百张大促活动图 3 秒就能生成;


第二,AI 商品视频。不需要专业设备,手机拍一张商品照片,或者绕着商品拍个 360 度的视频,就可以让 AI 生成商品视频;


第三,支持团队协作。传统工作流中需要由设计师承担所有设计工作,需求方只能等待排期,而基于美图设计室,设计师可以先将公司的 Logo、品牌色、字体、模板等设计资源,一口气上传到共享资源库,后续由需求方直接用这些资源搞定各种设计小任务,比如调整个图片尺寸、改改文字内容等等。

站酷设计服务,搞定找人难、流程复杂、售后难三个痛点


虽然 AI 大大降低了设计门槛,但是在具体业务场景中,仍然有很多场景需要专业设计师支持,提供定制化服务。比如包装设计、企业画册等等。


对此,用户往往会考虑从网上找设计师来帮忙,但传统的设计服务平台存在 3 大痛点:


首先,找人难,面对网站上面眼花缭乱的设计师,很难判断哪个合适;


其次,合作流程复杂,沟通成本高,想合作只能和设计师一个个聊需求,问档期、问价格,千里未必能挑一;


最后,售后难,对交付的作品不满意,但很难申请退款。


为了解决这一系列问题,美图在今年上半年将站酷设计服务收入麾下,而在今天的大会上,美图站酷设计服务正式上线,服务包括 14 大类,涵盖平面、插画、UI、网页,也包括影视、动漫、摄影,甚至空间设计、服装设计等。

奇觅,面向游戏广告解决制作和投放双高的问题


早在 2018 年,美图就投资了一家专注于游戏营销的公司——睿晟天和,并于 2023 年全资收购。在睿晟服务众多游戏客户的过程中,美图发现游戏广告仍存在两大痛点:


第一是制作成本高,游戏公司在设计广告时,既要制作大量的投放物料,又要适应各种平台规格,还要频繁更新和优化,非常消耗时间和设计资源;


第二是投放成本高,游戏营销竞争激烈,不少游戏的获客成本高达一两百块,此外在运营、分析等工作上也投入了大量人力。


“所以,我们将美图的影像技术与睿晟丰富的游戏营销经验相结合,推出了游戏广告 AI 制作与投放平台——奇觅,希望实现游戏广告的高效制作与精准投放,让优秀的游戏被更多玩家看到。”吴欣鸿表示。


据他介绍,奇觅的 AI 灵感库、AI 广告制作和 AI 广告投放,为行业提供了一套完整的游戏营销工作流。


其中,奇觅的 AI 灵感库提供了热点雷达,实时捕捉全网游戏热点,找到游戏玩家关注度最高的话题,可以帮助广告策划人员激发创意;AI 广告解析功能,可以对热门广告的脚本、画面、配音、配乐进行全方位拆解,快速洞察广告火爆的原因;另外,无论是休闲游戏,还是多人竞技、角色扮演等游戏,奇觅的 AI 灵感库都能针对性提供大量爆款脚本,让游戏更出圈。


而在确定脚本后的广告制作环节,根据录屏素材,AI 还能够智能匹配脚本,通过智能剪辑、添加转场、字幕,以及配音配乐,批量制作不同风格的优质游戏广告视频。之前非常冗长的游戏视频广告制作,直接被 AI 压缩至几分钟,让游戏营销如同叠满了 BUFF。


除了视频广告,奇觅还可以批量制作平面广告。基于海量平面广告模版,用户只要上传素材,AI 就能智能匹配模版进行批量制作。


而在正式投放前,AI 投前分析在五分钟内就能完成数十条广告的预审核和投放潜力评估,快速过滤掉高风险和投放潜力低的广告。据此,批量创建投放计划,还可以针对不同的人群搭建差异化的广告策略,仅需十分钟就可以完成三千条不同广告计划的设置。


据了解,奇觅已覆盖巨量引擎、华为、OPPO、vivo 等主流的广告平台,只需 1 分钟就可以直达游戏投放渠道。

坚持自研视频大模型,MOKI 让视频创作前所未有的简单高效


今年 2 月,OpenAI 发布文生视频模型 Sora,并引发文生视频领域的激烈竞赛。


在 Sora 发布后,美图第一时间升级了视频大模型技术架构。从 U-net 架构升级到了更强的 DiT 架构。影像节现场公布的信息显示,升级后的美图视频大模型拥有 6 大亮点:更强的模型架构和更大的参数量,结合更精准的语义理解,实现了更长的视频时长,动态连续性和画面稳定性也大幅提升。


“作为一家以美为核心的公司,我们对效果有着极高的要求。只有自研视频大模型,才能以高标准不断提升效果。同时,只有将模型与产品深度融合,做到模型即产品,才能给用户最好的体验。”吴欣鸿表示。原本需要实拍的视频,通过 AI 就可以生成,这个趋势正越来越近。


美图还通过 AI 短片创作工具 MOKI 解决了视频大模型“故事成片难”、“可控性较差”的问题。与常规文生视频产品不同,MOKI 深度理解视频创作者需求,实现内容和成本的双重可控,目前可以进行多种视频场景的 AI 短片创作。


吴欣鸿表示,MOKI 让视频创作前所未有的简单高效,无论你是个人还是专业团队,只要你有想法,都能轻松地将它变成短片作品。


可以看到,从诞生至今已经步入第 16 个年头的美图,已经不再只是一个纯 C 端产品。从打造爆款应用,到进入垂直行业攻坚客户痛点,美图正在慢慢探索出新的增长路径。“所谓‘流水不争先,争的是滔滔不绝’,面向垂直行业和场景,我们选择了 AI 工作流这条路,就意味着我们要在接下来的时间不断完善这个工作流。”吴欣鸿说道。

2024-06-13 00:186656

评论

发布
暂无评论
发现更多内容

云仿真平台有哪些特点

3DCAT实时渲染

云仿真

Kylin、Druid、ClickHouse该如何选择?

五分钟学大数据

4月月更

EMQ 云边协同解决方案在智慧工厂建设中的应用

EMQ映云科技

物联网 IoT 智慧工厂 边云协同 emq

iOS开发面试-如何打破30岁的中年危机

iOSer

ios iOS面试

这两个实用的导航网站,推荐给你!

小炮

导航网站

如何构建产品帮助中心

小炮

帮助中心

从社会学角度解读机器学习

Taylor

机器学习 深度学习 学习方法 损失函数 梯度下降

24小时无人自助洗车设备多少钱

共享电单车厂家

自助洗车机价格 24小时无人自助洗车 自助洗车设备多少钱

国产GPU芯片概述

Finovy Cloud

人工智能 GPU服务器 GPU算力

FastDFS 海量小文件存储解决之道

vivo互联网技术

fastdfs 数据存储 分布式,

渗透测试面试问题,内含大量渗透技巧

喀拉峻

网络安全 安全 渗透测试

化繁为简!阿里新产亿级流量系统设计核心原理高级笔记(终极版)

Java全栈架构师

Java 程序员 架构 面试 架构师

巧用PostgreSQL高可用中间件,99999业务服务持续性不再是DBA的天花板

博文视点Broadview

渗透测试信息收集之子域名收集总结

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

猛肝《Java权威面试指南(阿里版)》,“金三银四”offer必有你的一份!

Java架构追梦

Java 程序员 java面试 后端开发

Pipy MQTT 代理之(四)安全性

Flomesh

mqtt Proxy Pipy

低成本、快速造测试数据,这个造数工具我后悔推荐晚了!

Liam

测试 Postman 自动化测试 测试工具 测试自动化

数字经济多项技术突围 元宇宙被赋予更多想象

CECBC

物联网+车载小程序进入发展快车道

Geek-peri

小程序 车联网 物联网

智能家居新浪潮 物联网潜力无限

Geek-peri

小程序 物联网 智能家居

小程序生态成为私域基建必选项

Geek-peri

电子版产品手册如何制作?简单的方法来了

小炮

产品宣传手册

绝艺学会打麻将,腾讯AI Lab提出全新策略优化算法ACH

科技热闻

自助洗车怎么加盟?加盟流程介绍

共享电单车厂家

自助洗车加盟 自助洗车怎么加盟 自助洗车加盟流程

龙蜥开发者说:从零开始的创造,是动力也是挑战 | 第5期

OpenAnolis小助手

操作系统 开发者故事 龙蜥开发者说 桌面DDE

阿里云视频云互动虚拟技术,打造虚拟直播最佳沉浸式体验

阿里云CloudImagine

直播

如何在众筹中充分利用区块链技术?

CECBC

这个导航网站,是设计师福音!

小炮

导航网站

驱动现代金融发展的“元宇宙路径”

CECBC

啃完阿里工程师的Java面试八股文,斩获腾讯等6家大厂offer!

Java架构追梦

Java 后端开发 Java八股文

云原生环境下的日志采集、存储、分析实践

火山引擎开发者社区

云原生 日志

美图奇想大模型进阶至V5,一口气发布6款新品喊话友商:快来抄作业_AI&大模型_高玉娴_InfoQ精选文章