写点什么

网易有道自研 RAG 引擎 QAnything 正式开源,可增强大语言模型准确度及专业能力

  • 2024-01-17
    北京
  • 本文字数:750 字

    阅读完需:约 2 分钟

大小:371.61K时长:02:06
网易有道自研RAG引擎QAnything正式开源,可增强大语言模型准确度及专业能力

1 月 16 日,网易有道宣布自研的知识库问答引擎 QAnything 正式开源,除了可以调用云端大模型服务,还支持纯本地部署,所有用户可免费在开源社区 Github 内进行下载,一键部署即可使用。该系统目前支持 word、ppt、excel、pdf、图片等多种文档格式,直接导入进去即可实现像"ChatGPT"一样问答。

 

据悉,QAnything 的主要原理是基于检索增强的生成(Retrieval Augmented Generation,简称 RAG),能够利用检索外部内容的方式增强大语言模型的准确度、专业能力和个性化等各方面的性能。

 

QAnything 作为有道自研的 RAG 引擎,结合了用户私有数据和大模型的优势——用户的任何内容,以任意的形式存在,比如各种格式的文档,音频,数据库等,都可以在 QAnything 的支持下,变成可以针对其内容进行问答的使用方式,通过这个技术框架用户可以很方便地搭建自己的智能知识助手。


QAnything 系统架构图

 

值得一提的是,本次开源的 QAnything 是一套完整的 RAG 系统,包括专门优化的自研的 embedding 和 rerank 模型,微调后的 LLM,优化后的推理代码,向量数据库,以及一个立即上手可用的前端。所有的算法模型(包括 7B 大模型+embedding/rerank+OCR)占用显存不超过 16G。

 

如今,QAnything 已在有道的多个产品中应用,包括有道翻译文档问答、有道速读及有道内部业务的客服系统等。以子曰教育大模型最新发布的创新应用成果“有道速读”为例,有道速读内置了文档问答、文章摘要、要点解读、引文口碑和领域综述五大功能,能够帮用户更快更准地获得信息和对文档的理解。而该功能背后的驱动就是 QAnything,在大模型技术的加持下,用户能够实现快速理解文档、定位要点,实现 1 分钟读完万字长文。

 

“目前,QAnything 项目还在不断迭代,欢迎大家参与开发,并给予我们更多反馈。我们希望能帮助有需要的开发者们,和更多伙伴一起推动大模型的落地。”网易有道首席科学家段亦涛介绍道。

2024-01-17 17:449735

评论 3 条评论

发布
用户头像
试用了一下,太垃圾了,完全不能用。给个Excel,一共200行数据,问它有几行数据,告诉我24,然后连问了5-6个问题,一个比一个简单,没有任何一个问题答对。
2024-02-02 18:04 · 福建
回复
用户头像
qanything开源代码怎么访问
2024-01-20 10:12 · 浙江
回复
2024-01-24 09:59 · 北京
回复
没有更多了

代码随想录训练营 Day06 - 哈希表(上)

jjn0703

手把手带你搭建企业低成本万能架构

EquatorCoco

架构 软件架构 低成本

第九届“互联网+”大赛产业赛道百度命题正式公布!57道命题,等你揭榜!

飞桨PaddlePaddle

人工智能 百度

SQL 优化(四):如何使用 join

hungxy

语音房源码搭建技术分享之降噪功能详解

山东布谷科技

软件开发 源码搭建 语音房源码 语音房

国内首批!腾讯云EdgeOne通过信通院边缘计算最新评估

Geek_2d6073

ReentrantLock源码解析 | 京东云技术团队

京东科技开发者

线程 企业号 7 月 PK 榜 并发问题

揭秘元宇宙背后的最炫科技风

华为云PaaS服务小智

云计算 华为云 元宇宙

如何用Java校验SQL语句的合法性?有这5种解决方案

高端章鱼哥

Java sql

浪潮信息直播高能预告!令人感兴趣的高性能架构、CXL技术、数据库等硬件相关技术分享来了 | 第 83-85 期

OpenAnolis小助手

开源 高性能架构 龙蜥大讲堂 RDMA 浪潮信息

如何自动化测试你的接口?—— Rest Assured

不在线第一只蜗牛

自动化 自动化测试 API

Spring容器获取Bean的9种方式 | 京东云技术团队

京东科技开发者

spring Spring Boot bean 企业号 7 月 PK 榜

Net DB Web多级缓存的实现

不在线第一只蜗牛

HTTP net web api

技术分享| 融合通讯的架构介绍

anyRTC开发者

音视频 MCU mesh SFU 融合通讯

HarmonyOS极客松“上分秘籍”! 高手们顶峰相见!

HarmonyOS开发者

HarmonyOS

EMAS热修复Sophix适配App加固的技术方案

移动研发平台EMAS

阿里云EMAS 移动热修复 app热修复 app加固

2023 MWC上海:移动云勇担新基建国家队 引领算网新趋势

Geek_2d6073

一篇文章带你上手性能测试框架K6

QE_LAB

自动化测试框架 测试自动化 #性能测试

谁是家居智能化时代“头号玩家”? 小度全屋智能将登陆中国建博会

新消费日报

软件DevOps云化发展的趋势 【课程限时免费】

华为云PaaS服务小智

云计算 DevOps 云原生 华为云 华为开发者大会2023

大模型加速学科升级,飞桨赋能北邮“X+大模型”特色小学期

飞桨PaddlePaddle

人工智能 百度 paddle 百度飞桨

对线面试官-Redis(五 为什么这么快为什么能抗住高并发)

派大星

Java 面试题

合作、参与、让开源更易用 | 亚马逊的开源文化

亚马逊云科技 (Amazon Web Services)

云计算

用ChatGPT搞定K8s!

互联网工科生

k8s kubernetes 运维 ChatGPT

inBuilder今日分享丨系统集成系列之异构接入

inBuilder低代码平台

集成

分布式事务的几种实现方式 | 京东云技术团队

京东科技开发者

事务 分布式, 企业号 7 月 PK 榜

时序数据库 TDengine 与 DBeaver 达成合作,生态系统再壮大

爱倒腾的程序员

涛思数据 tdengine 时序数据库

火山引擎 DataLeap 构建Data Catalog系统的实践(一):背景与调研思路

字节跳动数据平台

扫光动效在移动端应用实践

百度Geek说

动效 移动端 企业号 7 月 PK 榜

网易有道自研RAG引擎QAnything正式开源,可增强大语言模型准确度及专业能力_AI&大模型_凌敏_InfoQ精选文章