AICon上海|与字节、阿里、腾讯等企业共同探索Agent 时代的落地应用 了解详情
写点什么

阿里国际发布首个大规模商用翻译大模型,效果据称超 Google、DeepL 等

  • 2024-10-17
    北京
  • 本文字数:793 字

    阅读完需:约 3 分钟

大小:394.50K时长:02:14
阿里国际发布首个大规模商用翻译大模型,效果据称超Google、DeepL等

在 AI 调用量最高的场景之一——机器翻译,阿里国际的 AI 团队有了新进展。


10 月 16 日,阿里国际副总裁、AI 负责人张凯夫在接受彭博社专访时表示,阿里国际最新研发的 Marco 翻译大模型,支持中、英、日、韩、西、法等 15 种全球主流语种。目前已在阿里国际 AI 官网 Aidge 上发布,面向全球用户开放使用。


据称,基于目前广泛使用的开源评测数据集 Flores,Marco 翻译大模型在 BLEU 自动评测指标上,超过市面上的其他翻译产品,如 Google 翻译、DeepL、GPT-4 等。



图:根据公开榜单数据的测评结果


Marco 的主要优势就是由大语言模型驱动,能够基于语境进行精准翻译,而不是根据字面意思,造成哭笑不得的歧义。“你的宝贝正在路上”,不会再被翻译成“Your baby is on the way”。以“尊嘟喜欢”这一网络用语为例,一些 AI 翻译产品会将这句话翻译为“Zundu likes it”,而在 Marco 大模型中,这句话非常地道地翻译为“I really like it”。


如何实现这一效果呢?据介绍,Marco 翻译大模型通过面向多语言的数据筛选技术,如多语种混合语料甄别、多维度数据质量评估,获得高质量、大规模的多语言数据,再结合多语言的混合专家、参数扩张方法,从而保证主导语言(如中、英)性能不下降的情况下,提升其他语种的质量。同时,通过模型量化和加速、多模型规约等优化策略,大幅降低大模型的服务成本,甚至与传统小模型相比,成本也具有优势。


目前,Marco 翻译大模型已实现大规模商用。得益于阿里国际在跨境电商领域多年的积累,Marco 在跨境电商领域的表现尤为亮眼。对于个人用户来说,Marco 能够根据上下文提供高质量的翻译和良好的可读性,甚至支持不同的翻译风格,满足多样化的翻译需求。


根据媒体公开报道,阿里国际在去年成立了 AI 团队,过去一年在 40 多个场景里测试了 AI 能力,帮助 50 万中小商家、对 1 亿款商品进行优化。商家的 AI 需求也不断增长,近半年的数据显示,平均每两个月,商家对于 AI 的调用量就翻 1 倍,AI 的调用量已经突破日均 1 亿次。

2024-10-17 08:4910925

评论

发布
暂无评论
发现更多内容

985的分数,却毅然选择了普本。

Jackpop

直击 | 认识和了解bboss

大河

stream Binlog ETL bboss mysql cdc

具备捕获 Web2 用户能力的 PoseiSwap,治理通证$POSE再度涨超 360%

鳄鱼视界

具备捕获 Web2 用户能力的 PoseiSwap,治理通证$POSE再度涨超 360%

西柚子

拼多多最新面经出炉:项目+八股+算法+场景全都问了个遍

程序员小毕

程序员 算法 高并发 项目 java面试

从互联网到国企、从一线城市到三线省会

WizInfo

使用 Kind 体验 Kasten K10 备份还原 K8S 集群 (二)

吴威

Kubernetes 容器 k8s veeam 备份 & 恢复

具备捕获 Web2 用户能力的 PoseiSwap,治理通证$POSE再度涨超 360%

股市老人

具备捕获 Web2 用户能力的 PoseiSwap,治理通证$POSE再度涨超 360%

BlockChain先知

【 INFINI Workshop 上海站】7 月 27 日一起动手实验玩转 Easysearch

极限实验室

上海 Workshop 极限科技

2023-07-08:RabbitMQ如何做到消息不丢失?

福大大架构师每日一题

福大大架构师每日一题

某米重新定义了985。。。

Jackpop

考上211,录取到天坑专业。。。

Jackpop

上个大学,竟然被割韭菜了?

Jackpop

【Redis故障排查】「连接失败问题排查和解决」带你深入分析一下Redis阻塞原因以及问题排查方案指南

码界西柚

redis 分布式架构 解决方案 技术分析 性能优化分析

一些容易被忽略的测试场景

QE_LAB

移动端测试 测试场景

情感语音识别:倾听声音背后的情感

数据堂

情感语音识别

车内语音识别数据:驱动智能出行的新动力

数据堂

车载语音识别

语音识别唤醒词:开启智能化的语音交互时代

数据堂

唤醒词

你可能不知道现在的Java面试有多卷!

程序员小毕

程序员 高并发 架构师 java面试 八股文

基于自定义数据源的LangChain的聊天

派大星

#LangChain

C++中Stack(栈)的使用方法与基本操作

芯动大师

阿里国际发布首个大规模商用翻译大模型,效果据称超Google、DeepL等_AI&大模型_赵钰莹_InfoQ精选文章