写点什么

仅三步,开启 DeepSeek 语音畅聊模式!

  • 2025-03-10
    北京
  • 本文字数:1212 字

    阅读完需:约 4 分钟

大小:610.39K时长:03:28
仅三步,开启DeepSeek语音畅聊模式!

火山方舟已上线 DeepSeek,扣子也同步推出了满血版 DeepSeek 全家桶,并独家支持 DeepSeek Function Calling 能力。在此基础上,火山引擎 RTC 实现了 DeepSeek 实时语音对话功能,让用户从只能「打字」跨越到「语音聊天」,不限设备或网络如何,都能轻松实现。


火山引擎 RTC「实时对话 AI」技术,让 AI 交流顺畅自如:


极速响应:端到端响应延时可低至 1 秒,告别 "空气突然安静" 的等待尴尬。


弱网畅聊:电梯、高铁车厢等弱网环境下,AI 对答如流、不卡顿。


智能打断:再也不用等 AI 念完小作文才能说话!毫秒级人声检测和打断响应,随时插话切换话题。


屏蔽干扰:AI 降噪自动屏蔽生活环境中的噪声和人声干扰,精准识别对话人声。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    上火山引擎或扣子搭建,几分钟就实现与 DeepSeek 语音聊天。


    仅需两步,快速体验与 DeepSeek 实时对话


    👉 第一步:准备工作,开通产品


    前往火山引擎实时音视频控制台,在首页新手指引中选择「实时对话式 AI Demo」。按照指引,开通配置火山引擎语音识别(ASR)、语音合成(TTS)以及火山方舟上的大模型(LLM)等服务。


    *火山引擎实时音视频控制台:https://console.volcengine.com/auth/login?redirectURI=%2Frtc%2Fguide%3F



    在实时音视频控制台选择 Demo



    按引导配置 ASR、TTS 以及 LLM


    👉 第二步:加入房间,邀请智能体进入


    用户进入 RTC 房间后,选择调用智能体,按业务需求选择适合的语音识别、语音合成以及大模型(如 DeepSeek-V3),进行组合配置,即可与智能体进行实时音视频通话。



    用户加入 RTC 房间


    配置智能体


    语音生成大模型支持丰富的音色选择,体验语音识别、语音生成大模型要先进行企业认证。


    AI 语音交互


    视觉理解能力


    如果想体验「语音交互」叠加「视觉理解能力」,可选择豆包的多模态大模型-Doubao-vision。


    在业务场景落地到应用还想更进一步?


    方案支持智能打断功能,用户可以选择打断模式和打断敏感度调节等,同时,智能体支持配置 Function Calling 和长期记忆等功能。


    点击即可快速体验


    使用扣子,轻松搭建语音智能体


    👉 第一步:前提准备


    开通扣子,即可支持语音和实时通话 API。


    👉 第二步:扣子平台创建智能体


    创建智能体(如语音 AI Agent),选择所需的模型,比如 DeepSeek-V3,用户可一键选择,并编写优化人设与回复逻辑。调试好所有内容后,发布自己专属智能体,选择发布平台需同步选择 API。


    创建智能体


    选择所需的模型


    编写人设与回复逻辑


    发布自己专属智能体


    👉 第三步:填写配置,体验实时 SDK


    在扣子 API 中选择 Real-time Chat SDK,选择此前创建好的智能体(如语音 AI Agent),可选择不同音色与降噪设置,确认后即可体验。


    填写配置


    开启麦克风后和扣子智能体开始语音通话,页面中会实时展示对话的消息记录、触发的事件列表,用户也可以直接手动输入一条消息发送给智能体。



    详细接入,可查看扣子智能语音文档:https://www.coze.cn/open/docs/guides/realtime_overview


    实时对话式 AI 方案支持灵活部署于软件与硬件终端,诚邀行业伙伴携手探索,解锁更多「AI+音视频互动」场景。

    2025-03-10 18:454100

    评论

    发布
    暂无评论

    第五期(2022-2023)传统行业云原生技术落地调研报告——金融篇

    York

    容器 DevOps 微服务 云原生 金融

    dpdk中,如何建立portid/queue的配置和逻辑核心的关系

    linux大本营

    队列 DPDK DPDK开发

    一文带你了解实战常用JavaScript API

    程序员海军

    JavaScript 三周年连更

    2022-04-26:给定一个数组componets,长度为A, componets[i] = j,代表i类型的任务需要耗时j 给定一个二维数组orders,长度为M, orders[i][0]代表i

    福大大架构师每日一题

    golang 算法

    打工人逃不开「单人单岗」

    Java 架构 程序人生 职场

    linux dbus客户端和服务器示例代码

    linux大本营

    c++ Linux dbus

    一键生成通用的微服务(gRPC)项目代码,让你的开发效率翻倍提升

    vison

    Go 微服务 gRPC 代码自动生成

    来字节跳动实习,有机会发Nature子刊

    字节跳动技术范儿

    重载++运算符分别实现i++和++i

    linux大本营

    运算符 数据结构与算法

    系统稳定性建设之我见(64/100)

    hackstoic

    质量管理 系统稳定性

    京韵、京城、京味:从一台服务器看数字北京

    脑极体

    算力

    Go sync.Once:简约而不简单的并发利器

    陈明勇

    Go golang 高并发 三周年连更 sync.Once

    扎最深的寨,打最持久的仗——一知智能AI商业化攻略访谈录

    B Impact

    UDP报头是通过结构体位段实现的吗

    linux大本营

    网络协议 udp UDP协议

    nvim 配置c++环境

    linux大本营

    vim C++

    openbmc 中如何使用D-bus

    linux大本营

    dbus openBMC

    6G 通信技术和 5G 通信技术的区别

    汪子熙

    通讯协议 通讯 三周年连更

    概述产品设计通用七原则

    阿泽🧸

    产品设计 三周年连更

    一个有趣的图片加载效果

    南城FE

    CSS 前端 动画 图片

    共话数字化新技术、新趋势 华为云开发者日东莞站成功举办

    Geek_2d6073

    基于Flutter实现Windows平台离线大模型对话应用实战

    轻口味

    flutter AI windows 跨平台 三周年连更

    数据存储与访问——文件存储读写

    芯动大师

    application 三周年连更 SharedPreference

    Golang new 和 make 函数

    宇宙之一粟

    Go make new 三周年连更

    什么是Java 异常?如何处理异常?

    Java架构历程

    Java 三周年连更

    Django笔记十七之group by 分组用法总结

    Hunter熊

    Python django count 分组查询 sum

    写一个完整的SHOW TABLE STATUS 语句返回的所有表的状态信息对应的结构体

    linux大本营

    数据库 存储 结构体 C++

    解析下rte_pktmbuf_pool_create参数含义

    linux大本营

    DPDK DPDK开发

    如何建设IT运维流程与体系

    穿过生命散发芬芳

    运维体系 三周年连更

    dpdk l2fwd如何初始化每个逻辑核的port/queue的

    linux大本营

    队列 DPDK DPDK开发

    linux dbus代码举例

    linux大本营

    Linux C++

    minikube 初体验环境搭建

    IT蜗壳-Tango

    三周年连更

    仅三步,开启DeepSeek语音畅聊模式!_字节跳动_火山引擎视频云_InfoQ精选文章