写点什么

网易有道自研 RAG 引擎 QAnything 正式开源,可增强大语言模型准确度及专业能力

  • 2024-01-17
    北京
  • 本文字数:750 字

    阅读完需:约 2 分钟

大小:371.61K时长:02:06
网易有道自研RAG引擎QAnything正式开源,可增强大语言模型准确度及专业能力

1 月 16 日,网易有道宣布自研的知识库问答引擎 QAnything 正式开源,除了可以调用云端大模型服务,还支持纯本地部署,所有用户可免费在开源社区 Github 内进行下载,一键部署即可使用。该系统目前支持 word、ppt、excel、pdf、图片等多种文档格式,直接导入进去即可实现像"ChatGPT"一样问答。

 

据悉,QAnything 的主要原理是基于检索增强的生成(Retrieval Augmented Generation,简称 RAG),能够利用检索外部内容的方式增强大语言模型的准确度、专业能力和个性化等各方面的性能。

 

QAnything 作为有道自研的 RAG 引擎,结合了用户私有数据和大模型的优势——用户的任何内容,以任意的形式存在,比如各种格式的文档,音频,数据库等,都可以在 QAnything 的支持下,变成可以针对其内容进行问答的使用方式,通过这个技术框架用户可以很方便地搭建自己的智能知识助手。


QAnything 系统架构图

 

值得一提的是,本次开源的 QAnything 是一套完整的 RAG 系统,包括专门优化的自研的 embedding 和 rerank 模型,微调后的 LLM,优化后的推理代码,向量数据库,以及一个立即上手可用的前端。所有的算法模型(包括 7B 大模型+embedding/rerank+OCR)占用显存不超过 16G。

 

如今,QAnything 已在有道的多个产品中应用,包括有道翻译文档问答、有道速读及有道内部业务的客服系统等。以子曰教育大模型最新发布的创新应用成果“有道速读”为例,有道速读内置了文档问答、文章摘要、要点解读、引文口碑和领域综述五大功能,能够帮用户更快更准地获得信息和对文档的理解。而该功能背后的驱动就是 QAnything,在大模型技术的加持下,用户能够实现快速理解文档、定位要点,实现 1 分钟读完万字长文。

 

“目前,QAnything 项目还在不断迭代,欢迎大家参与开发,并给予我们更多反馈。我们希望能帮助有需要的开发者们,和更多伙伴一起推动大模型的落地。”网易有道首席科学家段亦涛介绍道。

2024-01-17 17:449863

评论 3 条评论

发布
用户头像
试用了一下,太垃圾了,完全不能用。给个Excel,一共200行数据,问它有几行数据,告诉我24,然后连问了5-6个问题,一个比一个简单,没有任何一个问题答对。
2024-02-02 18:04 · 福建
回复
用户头像
qanything开源代码怎么访问
2024-01-20 10:12 · 浙江
回复
2024-01-24 09:59 · 北京
回复
没有更多了
发现更多内容

文盘Rust -- 本地库引发的依赖冲突

TiDB 社区干货传送门

开发语言

Wallys|QCN9074/QCN6024/ 5G 802.11ax|Does QCN9074-5G module support W56?

Cindy-wallys

QCN9074 QCN6024

【2.10-2.17】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动 优质创作周报

基于 Flink 的小米数据集成实践

Apache Flink

大数据 flink 实时计算

模块6 拆分电商系统为微服务

KING

这才是打开Java面试的正确方式,金三银四互联网大厂Java面试八股来袭

架构师之道

编程 程序员 java面试

高并发下保证接口幂等的8个锦囊

采菊东篱下

Java 编程

TiDB在转转公司的发展历程

TiDB 社区干货传送门

实践案例 版本升级 集群管理 管理与运维

LeetCode题解:938. 二叉搜索树的范围和,DFS,详细注释

Lee Chen

算法 LeetCode

HIFIVE音加加×筷子科技,内容创作如何再加“筷”一点

HIFIVE音加加

音乐 版权 视频创作 AI剪辑

设计模式第七讲-外观模式、适配器模式、模板方法模式详解

C++后台开发

设计模式 后端开发 Linux服务器开发 适配器模式 C++开发

普通单双面板的生产工艺流程:图形转移

华秋电子

借助 APISIX Ingress,实现与注册中心的无缝集成

API7.ai 技术团队

服务注册与发现 服务发现 APISIX Ingress Controller

云数据库TiDB使用过程注意项及改进建议

TiDB 社区干货传送门

6.x 实践

iOS tableView添加group分组

刿刀

ios UITableView

拜占庭将军问题和 Raft 共识算法讲解

京东科技开发者

算法 分布式系统 拜占庭将军问题 raft共识算法 日志同步

自定义HarmonyOS启动页组件

白晓明

HarmonyOS 自定义组件 OpenHarmony

OceanBase 4.0解读:兼顾高效与透明,我们对DDL的设计与思考

OceanBase 数据库

数据库 oceanbase

@所有人,OceanBase DevCon • 2023来啦!

OceanBase 数据库

数据库 oceanbase

腾讯云助力东宁智慧农业发展,共探乡村振兴产业数字化创新

科技热闻

高复用性自动化脚本设计实践

京东科技开发者

自动化 测试 框架 脚本重构 高复用

【立哥】【每日一个小知识】写遗嘱把部分财产赠给第三者,遗嘱有效力吗?

Lee Chen

知识

火山引擎DataTester:A/B测试,让企业摆脱广告投放“乱烧钱”

字节跳动数据平台

大数据 AB testing实战 企业号 2 月 PK 榜

故障案例:MySQL唯一索引有重复值,官方却说This is not a bug

GreatSQL

Serverless Streaming:毫秒级流式大文件处理探秘

华为云开发者联盟

云计算 大数据 华为云 企业号 2 月 PK 榜 华为云开发者联盟

# drainer binlog 清理机制 源码详解

TiDB 社区干货传送门

集群管理 管理与运维

SVFormer:走进半监督动作识别的视觉 Transformer

Zilliz

计算机视觉 Transformer

2022年最新数据库调查报告:当前企业使用率第一的中国数据库是什么?

墨天轮

数据库 TiDB oceanbase 国产数据库 达梦数据

GGX发布全新路线图,揭示具备 Layer0 特性且可编程的跨链基建生态

股市老人

信通院发布“2023可信AI案例 知识计算应用优秀案例”, 百度知识中台三大案例入选

Geek_2d6073

Slurm集群调度策略详解(2)-回填调度

慕冰

Slurm 回填调度

网易有道自研RAG引擎QAnything正式开源,可增强大语言模型准确度及专业能力_AI&大模型_凌敏_InfoQ精选文章