发布了 1 篇内容
共 736字, 被阅读 14次
获得了 1 次赞同
获得了 1次喜欢, 获得了 0 次收藏
参与了 1 次互动
互动包含发布评论、点赞评论、参与投票等

蚂蚁技术研究院发布推理大模型强化学习框架,邀请开发者共同助力 AGI 生态
2 月 25 日,蚂蚁技术研究院正式开源强化学习框架 AReaL(Ant Reasoning RL)。AReaL 源自开源项目 ReaLHF,旨在训练每个人都可以复现和贡献的大型推理模型 (LRM)。AReaL 是蚂蚁技术研究院为开发一个完全开放和包容的 AGI 世界迈出的一步。