产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

发布自研大模型 夸克 App 将迎来全面升级

  • 2023-11-15
    北京
  • 本文字数:1556 字

    阅读完需:约 5 分钟

发布自研大模型  夸克App将迎来全面升级

国产大模型阵营再添新锐选手。11 月 14 日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克 App 将借助自研大模型全面升级,加速迈向年轻人工作、学习、生活的 AI 助手。


近期,在 CMMLU 权威大模型性能评测中,夸克大模型成绩位列榜首。最新评测显示,夸克大模型整体能力已经超过 GPT-3.5,在写作、考试等部分场景中优于 GPT-4。


国产自研大模型中的“学霸”


夸克大模型是基于 Transformer 架构、自主研发的多模态大模型,每天会对亿级的图文数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供 AIGC、智能检索的专业服务。



性能方面,凭借语义理解、逻辑推理、内容生成等技术优势,夸克大模型在 CMMLU 权威榜单的最新评测结果中,取得排名第一的优异成绩。在国内专业考试测试中,夸克大模型高考成绩接近满分,并以 486 分的高水平通过临床执业医师资格考试,是名副其实的“学霸”。


同时,夸克大模型具备了对不良、虚假信息识别、回答和指引的出色能力。知识能力方面,夸克大模型拥有广泛的知识覆盖、上下文理解、创造性表达、信息搜集和整合、多语言支持等,同时具备外接专业知识增强、检索增强能力,进一步提升跨领域、时效性的知识和语言理解能力。此外,夸克大模型还具有撰写各类文本的强大文学创作能力,以及准确、合理、连贯的对话回复能力。


整体能力超过 GPT-3.5,部分场景优于 GPT-4,夸克大模型能力“爆表”源于数据、行业、知识正确性、平台等四方面优势。首先,夸克大模型拥有最全面的中文数据库,能更好地理解、评估、提炼中文知识体系;第二,夸克自建及拥有各类题库、知识点、医疗知识图谱、书籍及出版物等资料,沉淀了非常丰富的数据及用户场景;第三,在通用知识、写作增强等方面,夸克建立了从内容、搜索再到推理的一套可辨别知识真伪的技术体系。第四,夸克组建了数百人的研发团队,在搜索、教育、医疗等垂直领域中进行大模型的预训练与精调。


据介绍,坚持自研大模型的研发路线是服务于夸克的业务战略,也是持续推动夸克 App 在产品体验创新和迈向新一代搜索的技术底座。


夸克将借助自研大模型全面升级


今年以来,人工智能技术已经逐步融入到夸克 App 的产品迭代中。夸克扫描王能够在复杂场景下模仿人类思维,更精准地识别、分析和提取文字、公式及图片,实现更完美的扫描效果。夸克网盘上线的 AI 自然语言搜索功能,仅通过模糊词、形容词等关键信息,就能快速找到照片、文档等云端资料,进一步提升搜索效率。


作为最受年轻人青睐的智能产品,夸克 App 为数千万 95 后职场人和大学生提供了跨场景的智能效率工具。根据 QuestMobile 发布的《2023 年轻人群智能效率应用研究》报告显示,夸克 App 在泛学生人群和新生代职场人群的用户占比最高,年轻用户使用时长位列行业第一。



据悉,夸克大模型将会优先落地在通识问答、专业搜索等信息服务领域,满足年轻人学习知识和提升自我的需求。未来,夸克大模型应用于搜索、智能工具和资产管理助手等场景,一系列 AI 原生应用将为年轻人工作、学习、生活提供更全面的服务。


今年 9 月,阿里集团宣布了用户为先、AI 驱动的两大战略重心,将加大对“技术驱动的互联网平台业务”、“AI 驱动的科技业务”等业务的战略性投入。近日举办的 2023 世界互联网大会上,阿里巴巴集团 CEO 吴泳铭预判,在可见的未来,会有更智能的下一代产品进入人们的生活,AI 助理会无处不在,成为每个人工作、生活、学习中的助手。


“AI 时代已经来临,大模型应用的全新体验临界点近在咫尺。”阿里巴巴智能信息事业群总裁吴嘉表示,基于大模型的 AIGC 技术将会给搜索产品带来全新变化,加速迈向下一代搜索。夸克借助自研大模型将全面升级,全新的夸克很快会和大家见面。

 

2023-11-15 16:391705
用户头像
赵钰莹 InfoQ 主编

发布了 882 篇内容, 共 642.1 次阅读, 收获喜欢 2679 次。

关注

评论

发布
暂无评论
发现更多内容

DIMP:Learning Discriminative Model Prediction for Tracking 学习判别模型预测的跟踪

Geek_7ubdnf

神经网络

如何利用浮动容器制作悬浮下拉菜单?

Towify

知道这10个让你的API接口突然超时的原因吗?

风铃架构日知录

Java IT java程序员 超时 API接口

Java二级高速缓存架构设计

元年技术洞察

缓存 数字化转型 二级缓存 Spring Cache Java’

问题盘点|使用 Prometheus 监控 Kafka,我们该关注哪些指标

阿里巴巴中间件

kafka 阿里云 云原生 Prometheus

MarkDown简明语法手册

Geek_7ubdnf

markdown

MarkDown高阶语法手册

Geek_7ubdnf

markdown

阿里云AIoT 经典基础知识 快问快答——基础知识

阿里云AIoT

Serverless 物联网 API 消息中间件 弹性计算

事件总线 + 函数计算构建云上最佳事件驱动架构应用

Serverless Devs

Java高手速成 | 实现人物拼图游戏

TiAmo

Java 拼图

IoTLink 轻量级的物联网综合业务支撑平台

山东云则信息科技

Java 物联网 spring-boot

如何用 7 分钟玩转函数计算?

Serverless Devs

2023年了 对Go做一个全网最全的总结

卡二条

Go Go Concurrency Patterns Go web

如何提高Java代码的质量!

风铃架构日知录

Java 程序员 后端 IT 代码规则

阿里妈妈 Dolphin 智能计算引擎基于 Flink+Hologres 实践

阿里云大数据AI技术

人工智能 大数据 flink 计算引擎 企业号 1 月 PK 榜

「认知」打工人的自我修养

职场 认知

使用MinIO构建分布式文件系统来一次分布式文件系统实战!

风铃架构日知录

Java 程序员 分布式 分布式系统 IT

当我们在谈论DataOps时,我们到底在谈论什么

阿里云大数据AI技术

大数据 运维 数据管理 企业号 1 月 PK 榜

Curve 文件存储在 Elasticsearch 冷热数据存储中的应用实践

网易数帆

elasticsearch 云原生 分布式存储 curve 企业号 1 月 PK 榜

DW-Siam:Deeper and Wider Siamese Networks for Real-Time Visual Tracking 更宽更深的孪生网络

Geek_7ubdnf

神经网络

GA-RPN:Region Proposal by Guided Anchoring 引导锚点的建议区域网络

Geek_7ubdnf

神经网络

IoTLink v1.2.1 最新公告

山东云则信息科技

Java 物联网 springboot

如何使用 Towify 在小程序里实现一个广告轮播图?

Towify

为什么我们的微服务中需要网关?

江南一点雨

nginx SpringcloudGateway

阿里云数据湖3.0解决方案两度登上InfoQ 2022年度榜单

云布道师

阿里云

到底什么样的 REST 才是最佳 REST?

小小怪下士

Java 程序员 Rest API

CheckStyle使用

soap said

idea插件 格式化代码

TapTap算法平台的 Serverless 探索之路

Serverless Devs

混沌演练实践(一)

京东科技开发者

测试 混沌工程 系统 混沌测试 企业号 1 月 PK 榜

百度工程师带你玩转正则

百度Geek说

正则表达式 开发工具 正则 企业号 1 月 PK 榜

GAN:生成对抗网络 Generative Adversarial Networks

Geek_7ubdnf

神经网络

发布自研大模型  夸克App将迎来全面升级_云计算_赵钰莹_InfoQ精选文章