速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

网易有道自研 RAG 引擎 QAnything 升级:发布纯 python 版本,首次支持在 Mac 运行

  • 2024-04-12
    北京
  • 本文字数:1030 字

    阅读完需:约 3 分钟

大小:516.10K时长:02:56
网易有道自研RAG引擎QAnything升级:发布纯python版本,首次支持在Mac运行

4 月 8 日,有道知识库问答引擎 QAnything 更新至 1.3.0 版本,该版本带来了两大主要功能升级:发布纯 python 的轻量级的版本,该版本支持在 Mac 上运行,也可以在纯 CPU 机器上运行;同时支持 BM25 + embedding 混合检索,可以实现更精准的语义检索和关键字搜索。本次更新后,QAnything 能为开发者探索大模型落地提供更强大的技术支撑和更流畅的用户体验。

 

QAnything 系统架构图


QAnything 是网易有道自研的 RAG(Retrieval Augmented Generation) 引擎。该引擎允许用户上传 PDF、图片、Word、Excel、PowerPoint 等多种格式的文档,并实现类似于 ChatGPT 的互动问答功能,其中每个答案都能精确追溯到相应的文档段落来源。该引擎支持纯本地部署,上传文档数量无上限,问答准确率很高。


GitHub 地址:

https://github.com/netease-youdao/QAnything


自今年 1 月开源以来,QAnything 迅速吸引了开发者社区的广泛关注,并多次登上了 GitHub trending 榜单。截至目前,在 GitHub 上 QAnything 已经积累 7000+个星标,这反映出了用户对其价值的高度评价。


QAnything登上GitHub trending榜单


此外,QAnything 下载次数已达数万次。其中,语义嵌入排序模型 BCEmbedding 更是每月可达超 60 万次下载。


值得一提的是,QAnything 采用了自研的 BCEmbedding 模型(RAG 系统关键模块)。有道发现,在客服问答以及一些 toB 客户的场景中,OpenAI 的 Ada2 BCEmbedding 检索准确率只有 60%,而其自研的 BCEmbedding 检索准确率可以达到 95%。该模型具有中英双语跨语种能力和多领域覆盖两大特色。


据悉,QAnything 收集了包括教育、医疗、法律、金融、百科、科研论文、客服、通用 QA 等场景的语料,使得模型可以覆盖和支持尽可能多的应用场景,为商业化落地提供了便捷。


目前,QAnything 已在有道多场景中落地。如“有道领世”在 QAnything 的帮助下,凭借海量的升学资料数据,打造出一个“私人 AI 规划师”,能为每个家长和学生提供个性化的服务,展示更加全面、专业、及时的升学规划。面对高考政策、升学路径、学习生活以及职业规划等各类问题,该系统的解答准确率超过 95%。未来随着数据补充和更新,准确率会一直上涨。


与此同时,子曰教育大模型最新应用成果“有道速读”,其核心功能文档问答、文章摘要、要点解读、引文口碑和领域综述,背后驱动也是 QAnything。在其加持下,用户快速理解文档、定位要点等诉求得以快速实现,短短一分钟,万字长文就能拆解得明明白白。除赋能自身业务外,开源后的 QAnything 不断拓宽“朋友圈”。目前已累计为近百家企业赋能,以期让 AI 应用真正进入医疗、物流、办公等多元化场景,为企业、组织和个人带来生产效率的大幅提升。

2024-04-12 11:197191

评论

发布
暂无评论
发现更多内容

QEMU X86架构机器类型之pc-i440fx-piix

Linux内核拾遗

芯片 虚拟化 qemu

解决Python使用GPU

快乐非自愿限量之名

Python 开发语言

软件测试学习笔记丨Vue使用axios

测试人

Vue 软件测试 自动化测试 测试开发

从票务到游戏:Celestia 首届黑客松亮点项目盘点

TechubNews

人工智能ChatGPT的多种应用:如何更好地提问

霍格沃兹测试开发学社

Golang 1.23: 新的 unique 包

huizhou92

Game-Fi 新贵 MetaArena 项目全解析:重塑区块链游戏生态

股市老人

领域数据视图化和无代码设计原理

XIAOJUSURVEY

前端 低代码 搭建 schema 问卷模型

公链开发需要多少钱?

区块链开发团队DappNetWork

Go 1.23: 新包 Iter

huizhou92

Go

蓝易云 - Ubuntu22.04交叉编译gcc9.5 for arm

百度搜索:蓝易云

ubuntu 内存 服务器 云服务器 GCC

低代码开发:智能财务系统开发应用

不在线第一只蜗牛

低代码

中小企业转型有招,华为云618营销季步步“智”胜

YG科技

IPv6改造技术:隧道技术的原理和优缺点

国科云

2024 年 5 月区块链游戏研报:市值增长、玩家参与变迁、迷你游戏兴起

Footprint Analytics

链游

智谱AI CodeGeeX代码大模型获信通院最高等级,成为国内首批通过可信AI评估的企业

技术研究院

快速删除Win10、Win11恼人的英文键盘

程序员与厨子

windows 键盘 输入法

PS亮度蒙版工具 Lumenzia for Mac 支持ps2024 v11.7.7最新版安装

Rose

如何用Vue3构建一个交互式3D图

秃头小帅oi

从0到100:找搭子小程序开发笔记(一)

CC同学

蓝易云 - 关于openfeign的http和rpc详解

百度搜索:蓝易云

Web HTTP Hystrix Ribbon openfeign

火山引擎视频云发布赛事直播方案,延时缩短至1s

新消费日报

区块链钱包浏览器开发功能,价格和时间周期

区块链开发团队DappNetWork

时序数据库 IoTDB 构筑长安汽车海量车况数据管理新引擎,助力智能网联汽车发展

Apache IoTDB

借助 NGINX 实现 QUIC+HTTP/3 对 OpenSSL 的支持

NGINX开源社区

nginx API openssl HTTP/3 QUIC TLS

低代码开发应用:国企数字化转型的思考与探索

快乐非自愿限量之名

低代码 数字化

如何用二维码进行来访登记?这个模板帮你轻松实现!

草料二维码

草料二维码 访客登记 来访登记 访客来访二维码 来访二维码

蓝易云 - Redisson集成SpringBoot详解

百度搜索:蓝易云

Java redis spring Spring Boot redisson

利用 AI 机器学习,轻松实现化合物配比最优化解决方案

Altair RapidMiner

人工智能 机器学习 数据分析 大模型

Game-Fi 新贵 MetaArena 项目全解析:重塑区块链游戏生态

股市老人

网易有道自研RAG引擎QAnything升级:发布纯python版本,首次支持在Mac运行_AI&大模型_凌敏_InfoQ精选文章