QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

阿里国际发布首个大规模商用翻译大模型,效果据称超 Google、DeepL 等

  • 2024-10-17
    北京
  • 本文字数:793 字

    阅读完需:约 3 分钟

大小:394.50K时长:02:14
阿里国际发布首个大规模商用翻译大模型,效果据称超Google、DeepL等

在 AI 调用量最高的场景之一——机器翻译,阿里国际的 AI 团队有了新进展。


10 月 16 日,阿里国际副总裁、AI 负责人张凯夫在接受彭博社专访时表示,阿里国际最新研发的 Marco 翻译大模型,支持中、英、日、韩、西、法等 15 种全球主流语种。目前已在阿里国际 AI 官网 Aidge 上发布,面向全球用户开放使用。


据称,基于目前广泛使用的开源评测数据集 Flores,Marco 翻译大模型在 BLEU 自动评测指标上,超过市面上的其他翻译产品,如 Google 翻译、DeepL、GPT-4 等。



图:根据公开榜单数据的测评结果


Marco 的主要优势就是由大语言模型驱动,能够基于语境进行精准翻译,而不是根据字面意思,造成哭笑不得的歧义。“你的宝贝正在路上”,不会再被翻译成“Your baby is on the way”。以“尊嘟喜欢”这一网络用语为例,一些 AI 翻译产品会将这句话翻译为“Zundu likes it”,而在 Marco 大模型中,这句话非常地道地翻译为“I really like it”。


如何实现这一效果呢?据介绍,Marco 翻译大模型通过面向多语言的数据筛选技术,如多语种混合语料甄别、多维度数据质量评估,获得高质量、大规模的多语言数据,再结合多语言的混合专家、参数扩张方法,从而保证主导语言(如中、英)性能不下降的情况下,提升其他语种的质量。同时,通过模型量化和加速、多模型规约等优化策略,大幅降低大模型的服务成本,甚至与传统小模型相比,成本也具有优势。


目前,Marco 翻译大模型已实现大规模商用。得益于阿里国际在跨境电商领域多年的积累,Marco 在跨境电商领域的表现尤为亮眼。对于个人用户来说,Marco 能够根据上下文提供高质量的翻译和良好的可读性,甚至支持不同的翻译风格,满足多样化的翻译需求。


根据媒体公开报道,阿里国际在去年成立了 AI 团队,过去一年在 40 多个场景里测试了 AI 能力,帮助 50 万中小商家、对 1 亿款商品进行优化。商家的 AI 需求也不断增长,近半年的数据显示,平均每两个月,商家对于 AI 的调用量就翻 1 倍,AI 的调用量已经突破日均 1 亿次。

2024-10-17 08:4910714

评论

发布
暂无评论
发现更多内容

[BitSail] Connector开发详解系列四:Sink、Writer

字节跳动数据平台

大数据 数据中台 数据治理 数据安全 企业号9月PK榜

【YonBuilder 课堂】“入职申请单” 的创建流程

YonBuilder低代码开发平台

直播平台源码弹性云托管技术:稳定直播与降低成本的利器

山东布谷科技

软件开发 源码搭建 直播平台源码 弹性云托管

OpenHarmony应用ArkUI 状态管理开发范例

OpenHarmony开发者

OpenHarmony

可观测性用观测云,观测云护航「杭州亚运会」

观测云

人工智能 数据可视化

稳定性建设框架 | 京东物流技术团队

京东科技开发者

超时管理 稳定性治理 企业号 8 月 PK 榜 稳定性建设

一文看懂研发效能提升 | 京东云技术团队

京东科技开发者

研发效能

方案选择、落地与改进,企业如何突破阻力,打造全新ITSM体系?Atlassian白金合作伙伴——龙智专家解读

龙智—DevSecOps解决方案

ITSM devops国际峰会

王文京:构建企业服务大生态,共同服务企业数智化

用友BIP

企业服务

C/C++编译命令捕获机制及实现

maijun

编译命令捕获

芯片开发之难如何破解?龙智诚邀您前往D&R IP-SoC China 2023 Day

龙智—DevSecOps解决方案

芯片 芯片开发

千万不要忽略PCB设计中线宽线距的重要性

华秋电子

PCB

租赁LED显示屏需要注意什么问题

Dylan

活动 项目 LED显示屏

R语言之数值型描述分析

timerring

R 语言

用ChatGPT做一个Chrome扩展 | 京东云技术团队

京东科技开发者

chrome ChatGPT Chrome Extension

海量用户IM聊天室的架构设计与实践

JackJiang

网络编程 即时通讯 IM

字节跳动云原生成本优化实践开源项目 Katalyst |社区编程挑战启动!

字节跳动开源

开源 编码 社区 社区活动

活动预告 | 龙智、紫龙游戏与JFrog专家将出席龙智DevSecOps研讨会,探讨企业大规模开发创新

龙智—DevSecOps解决方案

Atlassian 大规模开发 JFrog

用友Fast by BIP&阿里云联合产品发布!助力企业快速实现数智化

用友BIP

Fast by BIP

大数据计算引擎 EasyMR 如何简单高效管理 Yarn 资源队列

袋鼠云数栈

YARN

开发指导—利用CSS动画实现HarmonyOS动效(一)

HarmonyOS开发者

HarmonyOS

软通咨询:引领制造业数字化转型新路径

软通咨询

数字化转型 制造业数字化

安全可信|权威认证!天翼云边缘安全加速平台AccessOne护航企业行稳致远!

天翼云开发者社区

云计算 软件安全

用了这么久SpringBoot却还不知道的一个小技巧

java易二三

Java 程序员 计算机

什么是渗透测试?

小魏写代码

阿里国际发布首个大规模商用翻译大模型,效果据称超Google、DeepL等_AI&大模型_赵钰莹_InfoQ精选文章