写点什么

智谱清言 App 全新升级视频通话功能,并推出新一代基座大模型

  • 2024-09-02
    北京
  • 本文字数:1480 字

    阅读完需:约 5 分钟

大小:764.27K时长:04:20
智谱清言 App 全新升级视频通话功能,并推出新一代基座大模型

近日,智谱宣布清言 App 推出“视频通话”功能,同时官宣了新一代基座大模型 GLM-4-Plus,此外还将 CogVideoX-5B 开源、GLM-4-Flash 免费。

全新的“视频通话”功能来了


清言 App 迎来“视频通话”功能,这是清言 App 继 7 月上线生成视频功能清影 Ying 后又一重大更新,也是国内首个面向 C 端开放的视频通话。


清言视频通话跨越了文本模态、音频模态和视频模态,并具备实时推理的能力。用户拨打清言的视频通话窗口,即可与它进行流畅通话,即便频繁打断它也能迅速反应。清言可以理解摄像头拍摄到的内容,可以听懂指令并准确执行。这样的体验就如同和真人视频通话一样。


下面是在游戏陪伴、作业辅导、作业辅导和一些生活场景下,清言视频通话功能的表现:


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    据悉,清言 App 视频通话功能将于 8 月 30 日上线,首批面向清言部分用户开放,同时开放外部申请。


    清影视频通话内测开通链接:https://zhipu-ai.feishu.cn/share/base/form/shrcnqpIx9q5ILEFeT2cPNhyuSf

    GLM-4-Plus 发布并上线开放平台


    GLM-4-Plus 是智谱全自研 GLM 大模型的最新版本,在语言理解、指令遵循、长文本处理等方面性能得到全面提升。


    GLM-4-Plus 使用了大量模型辅助构造高质量合成数据以提升模型性能,利用 PPO 有效有效提升模型推理(数学、代码算法题等)表现,更好反映人类偏好。


    • 语言文本能力方面,GLM-4-Plus 和 GPT4o 及 405B 参数量的 Llama3.1 相当。



    LCB: LiveCodeBench


    NCB: NaturalCodeBench


    *represents reproduced results


    • 长文本能力则通过更精准的长短文本数据混合策略,取得了更强的长文本的推理效果,比肩国际先进水平。



    • GLM-4V-Plus 还可以理解网页内容,并将其转换为 html 代码,在图像和视频理解能力方面位居前列。



    • GLM-4V-Plus 能够理解并分析复杂的视频内容,同时具备时间感知能力。


    下面是针对该视频相关问题,GLM-4V-Plus 做出的回答。


    用户:这个穿绿色衣服的球员在整个视频都做了什么?

    GLM-4V-Plus:在整个视频中,穿绿色衣服的球员在场上运球,然后跳起将球投入篮筐。

    用户:这个视频的精彩时刻是什么?发生在第几秒?

    GLM-4V-Plus:这个视频的精彩时刻发生在第 4 秒,当时穿绿色衣服的球员跳起并将球投入篮筐。



    GLM-4-Plus 现已在智谱大模型开放平台部署,企业和开发者即日起可以通过智谱开放平台 bigmodel.cn 上的 API 调用智谱最新的基座大模型。


    _GLM-4-Plus API 文档更新在:_https://bigmodel.cn/dev/api#glm-4


    _GLM-4V-Plus API 文档更新在:_https://bigmodel.cn/dev/api#glm-4v


    _MaaS 模型介绍页(包含最新模型的概要介绍):_https://bigmodel.cn/dev/howuse/model


    文生图模型升级


    文生图模型迎来最新版本 CogView-3-Plus,其效果接近目前最佳的 MJ-V6 及 FLUX 等模型,并支持图片编辑功能。





    _CogView-3-Plus 更新在::_https://bigmodel.cn/dev/api#cogview


    模型再开源


    另外,继 CogVideoX 2B 版本开源后,5B 版本也于近日正式开源,性能更强,推理显存需求最低仅为 11.4GB。同时,CogVideoX-2B 的开源协议调整为更加开放的 Apache 2.0 协议,任何企业与个人均可自由使用。


    随着 CogVideoX-5B 的开源,智谱不仅在开源模型数量上领先,累计下载量也突破 2000 万次,智谱以实际行动为国际开源社区做出自己应有贡献。


    随着技术进步、效率提升和成本优化,智谱宣布大模型开放平台 bigmodel.cn 最具性价比的大模型,GLM-4-Flash 现已完全免费,用户可以通过调用 GLM-4-Flash 快速、免费地构建专属模型和应用。这也是智谱开放平台首个完全免费的大模型 API。


    智谱表示,最新推出的基座大模型,和此前发布的 CogVideoX 等模型一道,完善了智谱自主原创的全栈大模型谱系,推动智谱实现面向世界先进水平的全面对标。


    2024-09-02 14:545472

    评论

    发布
    暂无评论
    发现更多内容

    区块链技术的价值传递

    CECBC

    区块链

    编程常见必备知识

    梦醒了

    编程 链表 函数

    Java 训练营第一周习题:02 加载字节码文件

    现实中游走

    Java

    LeetCode题解:322. 零钱兑换,动态规划,JavaScript,详细注释

    Lee Chen

    算法 大前端 LeetCode

    Your small business questions, answered

    小韩

    计算机内部的总线是什么

    FishyFine

    计算机结构

    树莓派语音控制的一次小尝试

    水战龟

    树莓派

    开源微服务运行时 Dapr 发布 1.0 版本

    阿里巴巴云原生

    开源 容器 微服务 开发者 云原生

    云算力系统开发|云算力APP软件开发

    系统开发

    【转】阿秀:C++经典49问49答

    杨明越

    产品训练营第五周作业

    朱航

    2021 iOS底层提升计划

    iOS底层

    菜单展示的递归与非递归形式实现 (go语言版)

    松小鼠

    数据结构和算法

    关于零售业数字化势在必行的一些杰出观点

    小刘在学习

    新零售

    作业5

    赝品

    「极客时间」课程购买用例

    西西里奇

    内娱完蛋了?不如让5G“出道”来抢救一下

    脑极体

    第二次书摘的微信视频号直播复盘

    小匚

    用户体验

    小结Spring中bean的作用域与生命周期

    李楠

    spring 生命周期 bean 作用域

    2021华为软件精英挑战赛正式开启,冠军奖金20万!

    2021华为软件精英挑战赛

    华为 软件 比赛 软件挑战赛

    【编程小白福利】办公自动化--从VBA到Python

    IT蜗壳-Tango

    七日更 28天写作 2月春节不断更 办公自动化 IT蜗壳

    OAtuth2.0 知多少

    圣杰

    oauth2.0 dotnet

    助力文化荟萃,区块链或可打造“新”春晚?

    CECBC

    区块链 春晚

    量化炒币机器人软件系统开发|量化炒币机器人app开发

    系统开发

    区块链技术带来金融服务的信任变革

    CECBC

    金融

    智能云网:从时代所需,到运营商所向

    脑极体

    最值得期待的Python进阶宝典《Effective Python》第2版中文版来咯!

    华章IT

    Python 代码整洁 Python编程 EffectivePython Python进阶

    量化机器人APP开发|量化机器人软件系统开发

    系统开发

    Linux Jenkins 自动打包vue部署到远程window服务器

    三爻

    Vue jenkins Win

    c语言函数与指针基础

    赫鲁小夫

    Python编程入门手记

    吕湛全

    智谱清言 App 全新升级视频通话功能,并推出新一代基座大模型_AI&大模型_褚杏娟_InfoQ精选文章