写点什么

从虚拟学生“华智冰”到冬奥手语播报,人工智能大模型究竟还有多少可能性?

  • 2021-09-30
  • 本文字数:2258 字

    阅读完需:约 7 分钟

从虚拟学生“华智冰”到冬奥手语播报,人工智能大模型究竟还有多少可能性?

9 月 28 日,清华大学首位 AI 虚拟学生“华智冰”首次正脸亮相,并为大家带来一首歌曲,亮相视频中,“华智冰”是一名眉目清秀的女孩,表情动作也十分真实,视频一经发出,立马引起网友热议。那么“华智冰”到底是谁?


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    三个多月前的“2021北京智源大会”上,“华智冰”第一次出现在大众视野中,她基于超大规模智能模型“悟道2.0”诞生,具有丰富知识、与人类有良好交互能力,会创作音乐、诗词和绘画作品。这次“她”凭借一首弹唱成功圈了一波粉丝,也成为颇受喜欢的“网红”。

     

    “华智冰”的走红同时让“她”背后的世界最大的超大规模智能模型“悟道 2.0”再次受到大家关注。自“悟道 2.0”发布之日起,关于它怎么用起来就成为业界关心的热点话题。

     

    在本月 24 日,在智源研究院承办的 2021 中关村论坛“人工智能与多学科协同创新”平行论坛上,智源研究院学术副院长、清华大学教授唐杰公布了“悟道 2.0”应用的最新进展,并带来了两个最新应用案例。大模型时代的到来对于人工智能究竟有何意义?在会上,智源研究院院长黄铁军也给出了我们答案。


    “悟道”大模型落地实践

     

    本次创新成果展示主要围绕“悟道”开放平台及技术创新,包括:“悟道”大模型开放平台、大模型高效推理工具包 BMInf、全新升级的 AI 文图绘画大师 CogView 和实现大模型群聊的对话模型 EVA。

     

    • AI 工业化开发模式的“悟道”大模型开放平台,使得企业可以规模化、产业化地进行 AI 应用开发,降低了大模型开发门槛。

     

    • 大模型高效推理工具包 BMInf,实现了“一卡顶四卡”,支持在低配置的 NVIDIA GTX 1060 单卡机上运行百亿大模型,同时具备能力全面、应用便捷的优势。

     

    • AI 文图绘画大师 CogView 本次又取得重大升级,4 倍提速,4 倍清晰,实现图像生成品质与速度的双重突破。


     

    • 对话模型 EVA 实行开源上线,除特别善解人外,还具有大模型群聊功能,展望“人与物”交流的现在时代迈进到“物与物”交流的人机共融未来时态。

     

    同时针对大家关心的应用落地方面,唐杰教授为我们展示了两个 “悟道”大模型赋能产业的最新技术应用案例,分别为:“悟道”大模型与OPPO小布助手开启“生成式回答系统”以及基于智源“悟道”大模型的冬奥手语播报数字人。

     

    现阶段,从长尾问题来看,OPPO 小布助手以及整个 AI 语音回复行业普遍存在以下难点:

     

    • 单个问题命中率低、体量大且无法穷尽

    • 自建语料库周期长,人工数据标注成本高

     

    而这些问题也导致海量问题无法通过 AI 语音助手找到答案。针对这一行业痛点, 智源“悟道”大模型与 OPPO 小布助手合作,研发“生成式回答系统”,功能上线后将解决行业共通性的长尾问题,单条回答的建设成本降低 99%。



    对于此次与 OPPO 小布助手的合作,智源研究院黄院长也在会后采访中表示,“对于像 OPPO 这样的大企业,直接对接大模型并没有问题,但对于中小型企业,目前来讲可能还有难度,我们目标是希望有一天能让他们也可以简单、方便地用上大模型,用 AI 技术解决各行业应用场景中的具体问题。毕竟我们相信它有满足各类企业需求的潜力,只不过把潜力变成现实的中间还需要更多生态建设,悟道大模型正在朝着这个方向努力。”

     

    此外,本次论坛上我们还认识了一位“新朋友”——基于智源“悟道”大模型的冬奥手语播报数字人。“悟道”手语播报数字人将在北京冬奥会期间正式投入应用,它将提供全流程智能化的数字人手语生成服务,方便听障人士也能收看赛事专题报道,提升他们的社会参与度和幸福感。



    除了论坛上展示的两个应用案例,在黄院长看来,大模型的“通用智能”能力在医疗、金融、新闻传播等行业中同样具有非常大的应用前景。例如,在医疗健康领域,大模型在医疗数据格式化、病历自动解读与分析、自动问诊系统等都可以发挥巨大效用;在新闻传播领域,基于模型可实现智能新闻线索收集、机器写作、辅助编辑、虚拟主播等应用。

     

    因此通过以上对“悟道”应用生态的观察,我们不难发现,对于人工智能的发展来说,从“大炼模型”迈向“炼大模型”已经是大势所趋。那么大模型时代究竟有何意义?对于广大技术人员来说,又该以何种姿态面对其中的机遇与挑战呢?

    大模型时代的到来,意味着什么?


    驻足于让人工智能普惠各行各业的愿景上,黄院长曾说过:“之前全球形成了‘千村万户大炼模型’的热闹场面,但这种‘自家炼钢自己用’的作坊方式成本较高,显然不符合现代产业发展规律。而大模型泛化能力强,可以做到‘举一反三’,同一模型利用少量数据进行微调或不进行微调就能完成多个场景的任务,中小企业不需要招聘很多 AI 算法专业人员即可以进行应用开发,可以显著降低中小企业的研发门槛,促进 AI 技术的落地。”

     

    而今在思考“悟道 2.0”该如何用起来以及落地的实践过程中,黄院长以及科研团队对于大模型又有了更深刻的体会,“大模型就是把社会的各种数据资源、最强的算法以及算力整合在一起,变成公共基础平台”, 这也对大模型下一步的努力方向进行构想,即通用化、普及化、标准化。因此黄院长也在会上发出呼吁产希望学研能共同努力发展大模型,使其能更好地服务于各种应用。



    同时,面对大模型的诸多挑战技术人员更需不断创新进步。例如针对模态信息的理解和建模的统一问题,需要加入多模态的数据,比如文本、图片、视频等类型的输入,多模态的数据可以使得模型具备更多样的能力,以更好地应对各类下游任务,提高模型的“智商”。

     

    从多才多艺的中国首个 AI 虚拟学生“华智冰”到助力冬奥数字人,可以说,属于人工智能大模型的时代已经正式开启。对此,由黄院长领携的科研团队也向全社会广发英雄帖:欢迎各位有志之士加入到智源大模型的生态中来,为大模型研发的技术路线及应用构建等提供具体指导,为探索新一代人工智能发展提供助力。

    2021-09-30 14:092651

    评论

    发布
    暂无评论
    发现更多内容

    亚马逊商品API接口:运用及收益的深度探讨

    科普小能手

    API 接口 API 测试 亚马逊API 亚马逊商品详情API 亚马逊API接口

    TiDB 新朋友 DBdoctor

    TiDB 社区干货传送门

    监控 管理与运维 故障排查/诊断

    Visio Viewer for Mac(Visio文件查看工具)

    Mac相关知识分享

    2024高质量Java面试题集锦:高级Java工程师面试八股汇总

    采菊东篱下

    java面试

    淘宝API接入全攻略:从零开始的实战指南

    代码忍者

    pinduoduo API

    Termius Beta for Mac强大的 SSH 工具

    Mac相关知识分享

    CST软件如何添加和管理自定义的材料

    思茂信息

    教程 仿真软件 CST软件

    Axure RP 10 及Axure RP 10破解教程 附安装包 Mac/win

    Rose

    升级就是最好的调优:TiDB 用户收益与实践总结报告

    TiDB 社区干货传送门

    版本升级 7.x 实践 8.x 实践 TiDB Vector

    sublime text for Mac(代码编辑器)

    Mac相关知识分享

    实时创作和视觉编程软件 TouchDesigner Pro

    Rose

    测试人生 | 90后斩获多家名企offer的小哥哥,做对了什么?

    测吧(北京)科技有限公司

    测试

    2024牛客网更新的1000多道java后端面试题,花点耐心看完offer拿到手软

    架构师之道

    java面试

    SingleThreadScheduledExecutor线程池设计/场景案例/性能调优/场景适配(架构篇)

    肖哥弹架构

    Java 并发编程 高并发

    【GreatSQL优化器-01】const_table

    GreatSQL

    Axure RP 8 破解版下载-附axure rp 8 注册码,可永久汉化激活

    Rose

    TiDB 字符集原理和最佳实践

    TiDB 社区干货传送门

    管理与运维

    “多快好省”:TiDB 在现代金融系统中的应用与实践

    TiDB 社区干货传送门

    实践案例

    VMware Fusion Pro 12 Mac(vm虚拟机)

    Mac相关知识分享

    Neo4j×Milvus:手把手教你搭建GraphRAG Agent

    Zilliz

    neo4j 图数据库 Milvus 向量数据库 GraphRAG Agent

    Smooze Pro for Mac v2.1.11激活版 鼠标增强工具专业版

    Rose

    数据驱动增长四阶段:从TLG到ALG的全面解析|StartDT Talk

    奇点云

    用TPCCRuner测试TiDB v7.5.4

    TiDB 社区干货传送门

    性能测评 数据库连接

    ScheduledThreadPool线程池设计/场景案例/性能调优/场景适配(架构篇)

    肖哥弹架构

    Java 并发编程 高并发

    MindNode for mac(思维导图软件)中文版

    Mac相关知识分享

    一键蓝牙设备连接切换 ToothFairy for Mac v2.8.4中文版 兼容M/intel

    Rose

    【论文速读】| RePD:通过基于检索的提示分解过程防御越狱攻击

    云起无垠

    从 PyQt5 窗口闪退问题看 Python 垃圾回收与消息机制

    LLLibra146

    Python 垃圾回收 PyQt5 消息机制

    Taro 鸿蒙技术内幕系列(二):如何让 W3C 标准的 CSS跑在鸿蒙上

    京东零售技术

    taro 鸿蒙 前端

    汽车线束行业MES系统主要功能

    万界星空科技

    mes 万界星空科技 汽车线束行业 汽车线束mes

    【教程】第三章:任务数据管理 —— 运筹帷幄,轻松上手

    NocoBase

    开源 低代码 教程 无代码

    从虚拟学生“华智冰”到冬奥手语播报,人工智能大模型究竟还有多少可能性?_AI&大模型_闫园园_InfoQ精选文章