2025 AI基础设施风向标,不看必后悔!#AI基础设施峰会 了解详情
写点什么

阿里国际发布首个大规模商用翻译大模型,效果据称超 Google、DeepL 等

  • 2024-10-17
    北京
  • 本文字数:793 字

    阅读完需:约 3 分钟

大小:394.50K时长:02:14
阿里国际发布首个大规模商用翻译大模型,效果据称超Google、DeepL等

在 AI 调用量最高的场景之一——机器翻译,阿里国际的 AI 团队有了新进展。


10 月 16 日,阿里国际副总裁、AI 负责人张凯夫在接受彭博社专访时表示,阿里国际最新研发的 Marco 翻译大模型,支持中、英、日、韩、西、法等 15 种全球主流语种。目前已在阿里国际 AI 官网 Aidge 上发布,面向全球用户开放使用。


据称,基于目前广泛使用的开源评测数据集 Flores,Marco 翻译大模型在 BLEU 自动评测指标上,超过市面上的其他翻译产品,如 Google 翻译、DeepL、GPT-4 等。



图:根据公开榜单数据的测评结果


Marco 的主要优势就是由大语言模型驱动,能够基于语境进行精准翻译,而不是根据字面意思,造成哭笑不得的歧义。“你的宝贝正在路上”,不会再被翻译成“Your baby is on the way”。以“尊嘟喜欢”这一网络用语为例,一些 AI 翻译产品会将这句话翻译为“Zundu likes it”,而在 Marco 大模型中,这句话非常地道地翻译为“I really like it”。


如何实现这一效果呢?据介绍,Marco 翻译大模型通过面向多语言的数据筛选技术,如多语种混合语料甄别、多维度数据质量评估,获得高质量、大规模的多语言数据,再结合多语言的混合专家、参数扩张方法,从而保证主导语言(如中、英)性能不下降的情况下,提升其他语种的质量。同时,通过模型量化和加速、多模型规约等优化策略,大幅降低大模型的服务成本,甚至与传统小模型相比,成本也具有优势。


目前,Marco 翻译大模型已实现大规模商用。得益于阿里国际在跨境电商领域多年的积累,Marco 在跨境电商领域的表现尤为亮眼。对于个人用户来说,Marco 能够根据上下文提供高质量的翻译和良好的可读性,甚至支持不同的翻译风格,满足多样化的翻译需求。


根据媒体公开报道,阿里国际在去年成立了 AI 团队,过去一年在 40 多个场景里测试了 AI 能力,帮助 50 万中小商家、对 1 亿款商品进行优化。商家的 AI 需求也不断增长,近半年的数据显示,平均每两个月,商家对于 AI 的调用量就翻 1 倍,AI 的调用量已经突破日均 1 亿次。

2024-10-17 08:4910904

评论

发布
暂无评论
发现更多内容

采访华为服务器OS首席架构师熊伟:开源背后的故事(采访提纲)

xcbeyond

采访提纲 6月日更

作为新时代的Java工程师,你需要具备什么能力?

卢卡多多

Java 能力提升 6月日更 六月

模块7作业

Geek_2e7dd7

架构训练营

网络抓包实战06——灵异事件的始作俑者:Reset数据包

青春不可负,生活不可欺

Linux之mv命令

入门小站

Linux

用VSCode刷LeetCode

IT蜗壳-Tango

6月日更

一文带你了解什么是HTTP协议

网络安全学海

网络安全 安全 信息安全 HTTP 渗透测试

你会选做通才还是专才?

石云升

职场经验 6月日更

协同过滤推荐算法(十六)

Databri_AI

推荐算法

分布式锁相关探索

常清静

redis 分布式锁 zookeeper分布式锁 redisson 分布式锁

全球首个开源图像识别系统上线了!人脸、商品、车辆识别一网打尽!

百度大脑

人脸识别 图像识别

“云智技术论坛”即将召开,百度智能云带来端边云全面智能化平台

百度大脑

人工智能 物联网 云智一体

知乎上线1小时,5w浏览量被下架的JVM全解笔记,内容太强大

Java架构师迁哥

Jenkins 如何与 Kubernetes 集群的 Tekton Pipeline 交互?

张晓辉

Kubernetes 云原生 jenkins Tekton CI/CD

微信小程序开发(一)

空城机

微信小程序 大前端 6月日更

详解 SQL 中的单表查询

悟空聊架构

sql 6月日更 单表查询 T-SQL

百度与张江集团达成战略合作,AI助推上海城市数字化转型

百度大脑

人工智能

网络攻防学习笔记 Day53

穿过生命散发芬芳

网络攻防 6月日更

【21-16】PowerShell循环

耳东@Erdong

PowerShell 6月日更

Java8 的时间库(2):Date 与 LocalDate 或 LocalDateTime 互相转换

看山

Java 6月日更

Kubernetes手记(20)- HeapSter监控

雪雷

k8s 6月日更

只把华为“桑田岛时间”看做一档对话节目?格局小了!

脑极体

Java线程状态与状态间的切换

wzh

Java 线程 JVM 操作系统 并发

在线URLEncode编码,URLDecode解码工具

入门小站

工具

zookeeper原生api操作

赵镇

zookeeper

react源码解析19.手写迷你版react

全栈潇晨

react.js

Pandas高级教程之:处理缺失数据

程序那些事

Python 数据分析 pandas 程序那些事

[译] R8 优化:方法的 Outlining 优化

Antway

6月日更

Java内存模型

wzh

Java JVM happens-before 并发 Java内存模型

“布”道AI的正确打开方式

脑极体

定点数与浮点数表示

若尘

浮点数 计算机组成原理 6月日更

阿里国际发布首个大规模商用翻译大模型,效果据称超Google、DeepL等_AI&大模型_赵钰莹_InfoQ精选文章