AICon上海「Agent与多模态解决方案专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

网易有道自研 RAG 引擎 QAnything 正式开源,可增强大语言模型准确度及专业能力

  • 2024-01-17
    北京
  • 本文字数:750 字

    阅读完需:约 2 分钟

大小:371.61K时长:02:06
网易有道自研RAG引擎QAnything正式开源,可增强大语言模型准确度及专业能力

1 月 16 日,网易有道宣布自研的知识库问答引擎 QAnything 正式开源,除了可以调用云端大模型服务,还支持纯本地部署,所有用户可免费在开源社区 Github 内进行下载,一键部署即可使用。该系统目前支持 word、ppt、excel、pdf、图片等多种文档格式,直接导入进去即可实现像"ChatGPT"一样问答。

 

据悉,QAnything 的主要原理是基于检索增强的生成(Retrieval Augmented Generation,简称 RAG),能够利用检索外部内容的方式增强大语言模型的准确度、专业能力和个性化等各方面的性能。

 

QAnything 作为有道自研的 RAG 引擎,结合了用户私有数据和大模型的优势——用户的任何内容,以任意的形式存在,比如各种格式的文档,音频,数据库等,都可以在 QAnything 的支持下,变成可以针对其内容进行问答的使用方式,通过这个技术框架用户可以很方便地搭建自己的智能知识助手。


QAnything 系统架构图

 

值得一提的是,本次开源的 QAnything 是一套完整的 RAG 系统,包括专门优化的自研的 embedding 和 rerank 模型,微调后的 LLM,优化后的推理代码,向量数据库,以及一个立即上手可用的前端。所有的算法模型(包括 7B 大模型+embedding/rerank+OCR)占用显存不超过 16G。

 

如今,QAnything 已在有道的多个产品中应用,包括有道翻译文档问答、有道速读及有道内部业务的客服系统等。以子曰教育大模型最新发布的创新应用成果“有道速读”为例,有道速读内置了文档问答、文章摘要、要点解读、引文口碑和领域综述五大功能,能够帮用户更快更准地获得信息和对文档的理解。而该功能背后的驱动就是 QAnything,在大模型技术的加持下,用户能够实现快速理解文档、定位要点,实现 1 分钟读完万字长文。

 

“目前,QAnything 项目还在不断迭代,欢迎大家参与开发,并给予我们更多反馈。我们希望能帮助有需要的开发者们,和更多伙伴一起推动大模型的落地。”网易有道首席科学家段亦涛介绍道。

2024-01-17 17:4410401

评论 3 条评论

发布
用户头像
试用了一下,太垃圾了,完全不能用。给个Excel,一共200行数据,问它有几行数据,告诉我24,然后连问了5-6个问题,一个比一个简单,没有任何一个问题答对。
2024-02-02 18:04 · 福建
回复
用户头像
qanything开源代码怎么访问
2024-01-20 10:12 · 浙江
回复
2024-01-24 09:59 · 北京
回复
没有更多了
发现更多内容

面对当下火爆的AIGC,我们可以做些什么? | 社区征文

AXYZdong

三周年征文

iOS MachineLearning 系列(3)—— 静态图像分析之区域识别

珲少

深度学习基础入门篇[七]:常用归一化算法、层次归一化算法、归一化和标准化区别于联系、应用案例场景分析。

汀丶人工智能

人工智能 机器学习 深度学习 归一化算法

我的Gopher成长之路

闫同学

三周年连更

Reactive响应式编程系列:解密Lettuce如何实现响应式

大步流星

Reactive lettuce 响应式编程系列 Lettuce如何实现响应式 Redis响应式

Android WebView使用与JS交互

松柏不怕雪

webview js java; Android; JS Bridge

2022-04-22:给你两个正整数数组 nums 和 target ,两个数组长度相等。 在一次操作中,你可以选择两个 不同 的下标 i 和 j , 其中 0 <= i, j < nums.leng

福大大架构师每日一题

Go 算法 rust

深度学习基础入门篇[六(1)]:模型调优:注意力机制[多头注意力、自注意力],正则化【L1、L2,Dropout,Drop Connect】等

汀丶人工智能

人工智能 机器学习 深度学习 正则化 注意力机制

如何在lua中设置计时器

linux大本营

lua 协程 Coroutine 计时器

在OpenHarmony 开发者大会2023,听见百业同鸣

脑极体

鸿蒙

测试CLIP zero-shot learning | 深度学习

AIWeker

深度学习 多模态 CLIP 三周年连更

音视频八股文(3)--ffmpeg常见命令(2)

福大大架构师每日一题

音视频 ffmpeg

ubuntu安装x11 forword,并做好配置

linux大本营

Linux ubuntu

挑战 30 天学完 Python:Day12 模块Module

MegaQi

挑战30天学完Python 三周年连更

什么是前端开发领域的 Cumulative Layout Shift 问题

汪子熙

前端开发 angular web开发 web开发基础 三周年连更

设计一个大规模搜索引擎,大概有1000台服务器

linux大本营

搜索引擎 负载均衡 存储 分布式,

一文带你看通透,MySQL事务ACID四大特性实现原理

架构精进之路

MySQL 数据库 后端 事务 三周年连更

时间管理:不要让时间偷走你的饼干

蔡农曰

程序员 生活 时间管理

企业微信接入系列-上传临时素材

六月的雨在InfoQ

企业微信 三周年连更 企业微信接入 上传临时素材

Spring 的 IoC(控制反转)

HoneyMoose

让GPT学会使用工具,拓展技能

蔡超

GPT ChatGPT LLM GPT-4 #LangChain

dpdk l2fwd需要配置哪些参数

linux大本营

DPDK

我的开源项目与开源经历分享

秦少卫

GitHub 开源 前端 Fabric.js 图片编辑器

职场进阶必须拥有的4种能力,你掌握了吗?

Jack

linux脚本执行可变参数任务

linux大本营

Linux 脚本

dbtemplate 是什么

weigeonlyyou

mybatis ORM 嵌入式应用 API Gateway 嵌入式设备

Django笔记十四之统计总数、最新纪录和空值判断等功能

Hunter熊

Python django like contains startwith

为什么要理解OpenAI和GPT-4?LexFridman谈对话Sam Altman开场白

B Impact

Mysql主从复制

乌龟哥哥

三周年连更

linux脚本定义一个二维数组

linux大本营

Linux 脚本 二维数组

Java 把 Map 的值(Value)转换为 Array, List 或 Set

HoneyMoose

网易有道自研RAG引擎QAnything正式开源,可增强大语言模型准确度及专业能力_AI&大模型_凌敏_InfoQ精选文章