写点什么

智谱清言 App 全新升级视频通话功能,并推出新一代基座大模型

  • 2024-09-02
    北京
  • 本文字数:1480 字

    阅读完需:约 5 分钟

大小:764.27K时长:04:20
智谱清言 App 全新升级视频通话功能,并推出新一代基座大模型

近日,智谱宣布清言 App 推出“视频通话”功能,同时官宣了新一代基座大模型 GLM-4-Plus,此外还将 CogVideoX-5B 开源、GLM-4-Flash 免费。

全新的“视频通话”功能来了


清言 App 迎来“视频通话”功能,这是清言 App 继 7 月上线生成视频功能清影 Ying 后又一重大更新,也是国内首个面向 C 端开放的视频通话。


清言视频通话跨越了文本模态、音频模态和视频模态,并具备实时推理的能力。用户拨打清言的视频通话窗口,即可与它进行流畅通话,即便频繁打断它也能迅速反应。清言可以理解摄像头拍摄到的内容,可以听懂指令并准确执行。这样的体验就如同和真人视频通话一样。


下面是在游戏陪伴、作业辅导、作业辅导和一些生活场景下,清言视频通话功能的表现:


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    据悉,清言 App 视频通话功能将于 8 月 30 日上线,首批面向清言部分用户开放,同时开放外部申请。


    清影视频通话内测开通链接:https://zhipu-ai.feishu.cn/share/base/form/shrcnqpIx9q5ILEFeT2cPNhyuSf

    GLM-4-Plus 发布并上线开放平台


    GLM-4-Plus 是智谱全自研 GLM 大模型的最新版本,在语言理解、指令遵循、长文本处理等方面性能得到全面提升。


    GLM-4-Plus 使用了大量模型辅助构造高质量合成数据以提升模型性能,利用 PPO 有效有效提升模型推理(数学、代码算法题等)表现,更好反映人类偏好。


    • 语言文本能力方面,GLM-4-Plus 和 GPT4o 及 405B 参数量的 Llama3.1 相当。



    LCB: LiveCodeBench


    NCB: NaturalCodeBench


    *represents reproduced results


    • 长文本能力则通过更精准的长短文本数据混合策略,取得了更强的长文本的推理效果,比肩国际先进水平。



    • GLM-4V-Plus 还可以理解网页内容,并将其转换为 html 代码,在图像和视频理解能力方面位居前列。



    • GLM-4V-Plus 能够理解并分析复杂的视频内容,同时具备时间感知能力。


    下面是针对该视频相关问题,GLM-4V-Plus 做出的回答。


    用户:这个穿绿色衣服的球员在整个视频都做了什么?

    GLM-4V-Plus:在整个视频中,穿绿色衣服的球员在场上运球,然后跳起将球投入篮筐。

    用户:这个视频的精彩时刻是什么?发生在第几秒?

    GLM-4V-Plus:这个视频的精彩时刻发生在第 4 秒,当时穿绿色衣服的球员跳起并将球投入篮筐。



    GLM-4-Plus 现已在智谱大模型开放平台部署,企业和开发者即日起可以通过智谱开放平台 bigmodel.cn 上的 API 调用智谱最新的基座大模型。


    _GLM-4-Plus API 文档更新在:_https://bigmodel.cn/dev/api#glm-4


    _GLM-4V-Plus API 文档更新在:_https://bigmodel.cn/dev/api#glm-4v


    _MaaS 模型介绍页(包含最新模型的概要介绍):_https://bigmodel.cn/dev/howuse/model


    文生图模型升级


    文生图模型迎来最新版本 CogView-3-Plus,其效果接近目前最佳的 MJ-V6 及 FLUX 等模型,并支持图片编辑功能。





    _CogView-3-Plus 更新在::_https://bigmodel.cn/dev/api#cogview


    模型再开源


    另外,继 CogVideoX 2B 版本开源后,5B 版本也于近日正式开源,性能更强,推理显存需求最低仅为 11.4GB。同时,CogVideoX-2B 的开源协议调整为更加开放的 Apache 2.0 协议,任何企业与个人均可自由使用。


    随着 CogVideoX-5B 的开源,智谱不仅在开源模型数量上领先,累计下载量也突破 2000 万次,智谱以实际行动为国际开源社区做出自己应有贡献。


    随着技术进步、效率提升和成本优化,智谱宣布大模型开放平台 bigmodel.cn 最具性价比的大模型,GLM-4-Flash 现已完全免费,用户可以通过调用 GLM-4-Flash 快速、免费地构建专属模型和应用。这也是智谱开放平台首个完全免费的大模型 API。


    智谱表示,最新推出的基座大模型,和此前发布的 CogVideoX 等模型一道,完善了智谱自主原创的全栈大模型谱系,推动智谱实现面向世界先进水平的全面对标。


    2024-09-02 14:544676

    评论

    发布
    暂无评论

    【架构师训练营】模块六作业

    樰巳-堕~Horry

    架构实战营 「架构实战营」

    Microchip发布具有强大编程和调试功能的新型在线仿真器(ICE)

    Geek_2d6073

    ReactNative进阶(四十):应用 ListView 实现分组列表

    No Silver Bullet

    ListView React Native 1月月更

    快递,菜鸟驿站,直播购物:老年人的电商之墙

    脑极体

    一文聊透Netty核心引擎Reactor的运转架构

    bin的技术小屋

    网络编程 nio 中间件 jdk8 netty

    基于OpenMLDB v0.4.0快速搭建全流程线上AI应用

    第四范式开发者社区

    人工智能 机器学习 OpenMLDB 特征平台

    【笔记】学《郭东白的架构课》:访谈|对话于冰(下)

    术子米德

    架构师成长笔记

    模块六作业

    黄秀明

    「架构实战营」

    云智慧智能研究院:2022年智能运维发展八大趋势

    云智慧AIOps社区

    趋势 AIOPS 智能运维 云智慧 运维发展

    openLooKeng助力中移在线获“ICT优秀案例”

    openLooKeng

    (1-24/24)awesome「结构」

    mtfelix

    300天创作 2022Y300P

    Hoo虎符研究院 | 币圈后浪 BreederDAO区块链游戏的NFT工厂

    区块链前沿News

    虎符 Hoo 虎符交易所

    AI+遥感:释放每个像元价值

    百度大脑

    人工智能 AI

    模块六

    撿破爛ぃ

    架构训练营

    openLooKeng基于选择率的动态过滤优化

    openLooKeng

    大数据

    【笔记】学《郭东白的架构课》:访谈|对话于冰(中)

    术子米德

    架构师成长笔记

    建一座国际连锁「商场」:openEuler 的雄心与蓝图 | 开源访谈《源创者说》首播

    科技热闻

    开源机器学习数据库OpenMLDB v0.4.0产品介绍

    第四范式开发者社区

    人工智能 机器学习 大数据 OpenMLDB

    虎虎生威新春大吉,2月更文挑战来袭!

    InfoQ写作社区官方

    2月月更 热门活动

    虎年就要玩虎符 春节就要瓜分虎符虎年大礼包

    区块链前沿News

    Hoo虎符 Hoo 虎年 春节活动

    双龙贺岁,龙蜥 LoongArch GA 版正式发布

    OpenAnolis小助手

    Linux 开源 新年

    左手2021, 右手2022 | 社区征文

    soolaugust

    技术 云原生 新春征文

    Microchip宣布标准非混合型宇航级电源转换器系列 已新增28伏输入耐辐射选项

    Geek_2d6073

    openLooKeng | Oracle update和delete支持简介及实现

    openLooKeng

    Spark合并Iceberg小文件内存溢出问题定位和解决方案

    漫长的白日梦

    spark iceberg 小文件

    【笔记】学《郭东白的架构课》:访谈|对话于冰(上)

    术子米德

    架构师成长笔记

    实时渲染大赛太卷了!来看大佬提前交卷的优秀参赛作品

    3DCAT实时渲染

    3D 实时渲染

    openLooKeng算子接口和执行流程

    openLooKeng

    如何系统分析项目的干系人?

    石云升

    项目管理 1月月更

    建木持续集成平台v2.2.1发布

    Jianmu

    DevOps 持续集成 CI/CD

    并发不是并行

    en

    智谱清言 App 全新升级视频通话功能,并推出新一代基座大模型_AI&大模型_褚杏娟_InfoQ精选文章