写点什么

腾讯汤道生:行业大模型已经过了“尝鲜期”

  • 2023-09-10
    北京
  • 本文字数:1576 字

    阅读完需:约 5 分钟

腾讯汤道生:行业大模型已经过了“尝鲜期”

9 月 7 日,在 2023 腾讯全球数字生态大会上,腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生发表主题演讲,重点分享了 AI 大模型等技术产品对于产业发展的深远影响,以及腾讯云行业大模型的最新思考。

 

“大语言模型的发展第一次让我们看到了 AI 在产业中大规模落地的可能。六个月前,很多企业惊叹于通用大模型的生成能力,迫不及待地尝试与业务结合。但很快发现,通用大模型在实际应用中,面临专业度、准确度、数据安全、成本等很多挑战。”汤道生说

 

汤道生提到,行业大模型已经过了“尝鲜期”,目前正深入各类业务场景,推动企业全链条智能化。“六个月前,客户来谈大模型,能想到的应用场景基本只是文字客服。但今天,应用场景已经快速扩展到各个领域,比如在金融行业,大模型已经应用在开户、业务处理、风控等多个场景。”为此,腾讯尝试用大模型打造全栈产品能力,用于业务不同环节,助力企业全链条提质增效。

 

与此同时,汤道生提到表示,在大模型产业化的落地过程中,客户关注的不仅是模型的大小、功能,而是更为关注如何选用并定制适合自身业务发展的模型产品。基于这些实际需求,腾讯云不断升级大模型精选商店,包括自研的通用大模型“混元”、20 多种主流开源模型和更多行业大模型。企业可以根据自身需求选择合适的模型产品,并进行训练和精调,以满足个性化需求。

 

企业专属模型的生成,涉及到数字资产资源管理、数据标注、训练、评估、测试和部署等很多环节。同时,根据业务发展,企业模型需要不断地调优、迭代,数据处理的整个过程,也要不断地重复。汤道生认为,模型的热潮导致各项成本攀升,拥抱大模型不能只是一时冲动,还要理性考虑落地成本,训练、推理的效率。

 

针对此,腾讯云也提供了从数据处理、多机多卡训练到硬件优化的一站式解决方案,以帮助企业高效、低成本地创建和使用大模型。同时,腾讯云 TI 平台还进行了全新升级,有效提升了大模型的训练速度和推理效率。

 

“AI 大模型等产品的发展及落地将对千行百业产生‘质’的影响,我们也将持续开放产品能力、不断探索技术应用,助力产业实现更高质量的发展。”汤道生表示。

 

据悉,为解决企业 AI 能力应用难题,腾讯云推出了 AIGC 全栈解决方案,依托于腾讯云在大模型、机器学习等方面的 AI 能力,通过升级一站式 MaaS 服务,打造 AIGC 全链路内容安全解决方案,提供从标注、训练/微调、评估、测试到部署的全流程开发业务,确保 AIGC 服务更“可信、可靠、可用”。

 

在算力方面,腾讯云的新一代高性能计算集群 HCC,从“计算、存储、网络”三大技术层面出发,为大模型训练提供高性能、高带宽、低延迟的智算能力支撑。通过搭载最新代次计算卡,利用星海自研服务器的 6U 超高密度设计和并行计算理念,确保高性能计算;依托高性能存储 CFS Turbo 和对象存储 COS,实现高吞吐存储;通过自研 3.2T RDMA 星脉网络,保障高性能无损网络;并构建了集群可观测体系,实现对 GPU 和网络进行实时监控和故障自动恢复,保证高稳定性。

 

此外,腾讯云还通过 GPU & CPU 混布、GPU 离在线混布、本地盘与分布式缓存混布的混合部署方式,系统性地提升了资源利用率。腾讯云新一代高性能计算集群 HCC,打造了 AIGC 落地各行各业的算力基础,让 AIGC 服务更可靠。

 

在合规性方面,腾讯云能够对数据集进行预处理,为企业提供自动化审核服务、定制识别服务等审核解决方案,再通过 AIGC 大模型进行训练和微调,构建起完善的内容审核平台,实现智能化拦截敏感内容,保障了端到端的合规,有效解决了 AIGC 落地的内容合规层面问题,让 AIGC 服务更可信。

 

在训练与推理效率方面,腾讯云通过数据集下载加速、训练及模型数据读取加速、Checkpoint 写加速、分布式训练加速、推理加速的全链路加速能力,系统性地解决了训练与推理效率问题,以效率提升带动成本下降,例如数据集下载层面,腾讯云的半托管 MSP 工具和对象存储 COS 提供了跨地域复制能力,能够轻松实现低成本将海外数据集传输至国内。

 

2023-09-10 10:583260

评论

发布
暂无评论
发现更多内容

深入了解JAVA线程篇

邱学喆

线程 线程池 线程间通信 线程回调

ECMAScript 2021 (ES12)通过,正式写入 ECMAScript 标准

清秋

ecmascript 新闻资讯 ES2021 ES12 标准

阿里云中间件首席架构师李小平:企业为什么需要云原生?

阿里巴巴云原生

.NET Core HttpClient源码探究

yi念之间

.net core HttpClient

数据仓库常见建模方法与大数据领域建模实例综述

云祁

数据仓库 数据建模 维度建模

react源码解析20.总结&第一章的面试题解答

全栈潇晨

React

WasmEdge (曾用名 SSVM) 成为 CNCF 沙箱项目

WasmEdge

云计算 云原生 webassembly cncf

自动驾驶产业进入“两条腿”时代:车路协同的中国式飞跃

脑极体

大白话彻底搞懂 HBase Rowkey 设计和实现方式

云祁

大数据 HBase

Visual Studio 2010下ASPX页面的TreeView控件循环遍历

吴脑的键客

C#

基于朴素ML思想的协同过滤算法(十七)

Databri_AI

推荐算法

Linux之cp命令

入门小站

Linux

与8090创业者、投资人共话“初心”!2021中国新青年创业投资峰会举办

创业邦

Java学到什么程度才能叫精通?

Java架构师迁哥

5分钟速读之Rust权威指南(二十九)循环引用

wzx

rust

Kubernetes手记(21)- 新一代监控架构

雪雷

k8s 6月日更

这是一场按下播放键就停不下来的冒险

白洞计划

这是一场按下播放键就停不下来的冒险

脑极体

与其摸鱼,不如来看:高性能消息中间件NSQ解析的整体介绍

蜜雪冰城主题曲血洗B站:企业自媒体运营如何接地气

石头IT视角

七牛云 霍锴:SDK 是一款技术服务的门面,如何方便用户高效接入是前提|Meetup 讲师专访

七牛云

音视频 sdk Meetup

在线URL转sitemap工具

入门小站

Linux

我看JAVA 之 JVM

awen

Java JVM

ES6 中的 Symbol 是什么?

编程三昧

JavaScript 大前端 ES6 数据类型 symbol

JavaScript 学习(八)

空城机

JavaScript 大前端 6月日更

真的了解 HDFS 的 SecondaryNameNode 是干什么的?

云祁

Github上星标85k的,图解操作系统、网络、计算机 PDF,竟是阿里的?

Java架构师迁哥

看完阿里开源笔记,我终于敢说精通“网络协议”了

Java架构师迁哥

你遇到过哪些质量很高的 Java 面试题?

Java架构师迁哥

我用来阻止你摸鱼看直播、知乎和微博的Chrome插件

OBKoro1

chrome 效率工具 大前端 工作效率 chrome扩展

一步一步实现 Vue 3 Reactivity

Geek_z9ygea

JavaScript Vue 响应式 Vue 3

腾讯汤道生:行业大模型已经过了“尝鲜期”_AI&大模型_褚杏娟_InfoQ精选文章