
“开盒”风波后百度公开“开盒”事件调查过程:任何职级都触碰不到用户数据;Qwen3 即将发布?蔚来汽车全年净亏损为 224.02 亿元;美团 CEO 王兴首谈 AI:美团策略是进攻而非防守;年薪达 945 万!80 后女副总裁首次上榜;字节吴永辉亲自带实习生,取消季度 OKR;苹果 AI 负责人被炒,AI 团队重组;阿里被曝拟全面实现“AI 化”:正开发杀手级 AI 应用,阿里云启动“T 项目”,员工绩效与 AI 挂钩;又走一位合伙人!高管们接连“出走”百川智能;马斯克旗下 xAI 收购视频生成公司;小米发布史上最强年报!将投近百亿到 AI 中;o1/o3 后训练掌门人出走创业,OpenAI 鼎力支持押注 AI 材料……
行业热点
“开盒”风波后百度公开“开盒”事件调查过程:任何职级都触碰不到用户数据
3 月 20 日,针对日前卷入“开盒”风波后外界产生的信息安全疑虑,百度在媒体沟通会上进行了释疑:此次“开盒”数据的源头是海外社工库,并非来自百度。百度经过反复排查,排除了公司副总裁谢广军泄露嫌疑。在沟通会上,百度相关负责人明确表示,百度从未与任何黑灰产组织有过任何形式的合作,也从未收到过此类合作需求。
百度安全负责人陈洋穿了一件印有“很安全”的工服,详细还原了“开盒”事件的调查经过,并复现了海外互联网开盒泄露的路径。在现场,陈洋还展示了经三方公证的“(2025)京精诚内经证字第 1642 号”公证书。他再次表示,百度任何职级的员工及高管均无权限触碰用户数据。
百度安全负责人陈洋表示,昨天接到一些举报信之后,内部也成立调查组进行了严格的调查。从结果上看,确实不是谢广军干的,也不是从百度泄露的。从数据安全设计上来讲,从一开始,就是对数据做了匿名化假名化的,而且做了种种的权限分离,任何人都是没有这个权限的。“我们的调查结果看,也是确认谢广军完全没有相关数据库的任何权限,从操作行为日志看,也没有做这样的事情的尝试而数据的泄露源是什么?我们去调查还原了这么一个小女孩的过程,结果还是比较令人吃惊的。我们在海外的 Telegram 电报群里面,找到了很多的这种社工库,通过社工库去查询微博上的一些人的信息,确实可以查到,而且好多信息都是免费的。此外我们还随机试了几个身边的人,确实也都可以查,而且成本很低,几块钱就可以。很多是免费。这整个过程我们也已经去做了公证了安全是永无止境的,我们永远要有一颗敬畏之心。我们希望能尽自己的所有努力,让每一位公民,都能够安心在网上去生活,在网上去安心地享受数字世界。”
但此次事件依然引发了部分用户对百度的信任危机,一些用户甚至表示要卸载百度产品。对此,陈洋表示百度将本着更加透明、开放的态度,进一步加强与用户的沟通。他详细介绍了百度安全体系的多层防护机制,此外,百度还对业务数据进行二次加密,确保即使在极端情况下,数据也无法被轻易破解。
Qwen3 即将发布?
有网友分析 huggingface/transformers 库 PR#36878,总结即将推出的 Qwen3 大模型系列信息。
架构创新:除常规 Dense 版外,还引入了基于 MoE 的版本,自研“Qwen3MoE”。
模型规模:现已知的三种模型版本分别为 0.6B-Base、8B-beta 和 15B-A2B-Base,分别对应 0.6B、8B 和 15B 的参数量。其中,15B-A2B-Base 版本为 MoE 版,激活参数大小为 2B。
分词:模型在标记器部分延续了 Qwen2 的设计,保证了分词兼容性与稳定性。
Qwen3 还加入了 QK-norm,取消 attention-bias,MoE 版本 3 相较于 2 取消 qkv-bias。
上述为目前网友分析,具体技术参数和应用场景的详细信息,需要关注官方渠道的后续发布。
蔚来汽车全年净亏损为 224.02 亿元
3 月 21 日,蔚来发布 2024 年第四季度及全年财报。数据显示,去年第四季度蔚来实现营收 197.03 亿元,同比增长 15.2%;净亏损为 71.11 亿元,同比扩大 32.5%;截至四季度末,蔚来的现金储备稳定在约 420 亿元。2024 年全年,蔚来总营收为 657.32 亿元,同比增长 18.2%,创下历史新高;全年净亏损为 224.02 亿元,较上一年度增长 8.1%。
李斌透露,从今年第一季度开始,推进研发、供应链、销售服务方面的全面降本,公司大规模推行基本经营单元机制,提升全员经营意识,提高投资回报率。从第二季度开始,报表上就可以看到成本端和费用端的改进;第三季度公司将会持续深化成本费用的控制;有信心实现在第四季度盈利的目标。
对于组织变革,蔚来管理层称,公司动员团队尽快废除惯性,提升全员经营意识,以交付为经营目标。针对毛利率,蔚来管理层提到,公司的目标是,在 2025 年年底蔚来品牌毛利率达到 20%,乐道达到 15%。
李斌透露,近期市场竞争、负面舆情对乐道品牌销量有 30%-40%的影响。乐道销量未达预期的原因之一是品牌知名度远低于竞品,存量订单消化完后,新增订单会有压力。此外,销售人员销售经验不足、前期电池供应不足等问题都影响了乐道的销量。
在降本的同时,蔚来依旧制定了多方面的扩张计划。蔚来方面称,将在 2025 年建设“产品大年”“技术大年”“换电站建设大年”“国际化大年”。
美团 CEO 王兴首谈 AI:美团策略是进攻而非防守
3 月 22 日消息,美团日前发布 2024 年第四季度及全年财报。在财报后的电话会议中,美团首次对外披露其 AI 战略。美团 CEO 王兴表示,美团对于 AI 是“进攻而不是防守”, 正在研究和开发基础模型以及应用,对外部技术合作持开放态度。王兴认为,从长远来看,AI 可能会对社会的互动方式产生根本性的影响,但对于履约型服务行业,人工智能的影响目前仍较小。
王兴还汇报中首次披露,美团自主研发的生成式大语言模型“龙猫”(LongCat)已全面应用于内部提效场景,包括人工智能编程、智能会议和文档助手,并且它在图形设计和短视频生成方面也非常有用。据介绍,截至目前,龙猫已取得了相当不错的评估结果,可与中国的顶级模型相媲美。龙猫的人工智能核心使用量也已从去年年初的 10%增长到了目前的 68%。
年薪达 945 万!80 后女副总裁首次上榜
近期,福布斯发布 2025 杰出商界女性 100 榜单,其中,美的集团副总裁、首席财务官兼财务总监钟铮今年首次登上榜单。近期,福布斯发布 2025 杰出商界女性 100 榜单,其中,美的集团副总裁、首席财务官兼财务总监钟铮今年首次登上榜单。
资料显示,该榜单以国内上市公司女性管理者、跨国企业巨头在华的女性掌舵人,以及独角兽企业中的女性创始人为研究对象,通过对候选人所领导业务经营业绩、资本市场表现、市场规模、行业影响力及创新力等数据进行分析,从上千位候选人中遴选出最终的 100 人。第十一届福布斯中国商界女性的平均年龄为 51 岁,37%为白手起家的创业者(含早期加入创始团队)、57%为职业经理人、6%为女性二代接班人。
公开资料显示,钟铮为 80 后,硕士学历。钟铮于 2002 年加入家电巨头美的集团(000333.SZ),先后担任美的家用空调事业部广州工厂、国内营销公司和海外营销公司财务经理、美的集团金融中心和部品事业部财经总监、美的集团审计总监等职务,2022 年 2 月开始任集团首席财务官(CFO),并于 2023 年 2 月当选第十四届全国人大代表。美的集团 2023 年财报显示,钟铮 2023 年从公司获得的税前报酬总额为 945 万元。
字节吴永辉亲自带实习生,取消季度 OKR
字节跳动豆包大模型部门(Seed)召开全员会。全员会上明确了 Seed 部门最重要的目标是探索智能上限,鼓励有能力、有想法的同学,探索更长周期的、具有不确定性和大胆的 AI 研究课题。
吴永辉强调了长期研究的重要性,对 Seed Edge 的投入将进一步加大,会为 Seed Edge 提供充足的算力,并将持续在内外部招募最具潜力和好奇心的研究人才。同时,对 Edge 项目取消季度 OKR 和半年考核,保障长期稳定的研究环境。
进一步加强组织文化,打造开放、包容、自信的团队研究氛围,则是 Seed 今年工作的另外一个重心。吴永辉提到他加入字节的原因,是想做第一流的研究,也想打造一个第一流的 AI 研究团队。
他表示,希望 Seed 成为一个能培养人才的组织:“我们希望把世界上最好的人才吸引到 Seed 来。但更重要的是我们要把内部人才用好,把我们的潜力股识别出来,给他们足够的机会,培养成顶级的人才。”据悉,在 Top Seed 实习生的导师里新加了吴永辉。
近日,一个名为字节、清华 AIR 联合实验室 SIA Lab 出品的算法 DAPO,论文通讯作者和开源项目负责人是 01 年 Qiying Yu,本科毕业于哈工大,直博进入清华 AIR,目前博士三年级在读。去年年中,他以研究实习生的身份加入字节首次推出的“Top Seed 人才计划”。
苹果 AI 负责人被炒,AI 团队重组
彭博社得到内部人士消息称,苹果 CEO 库克对 AI 团队的主管 John 失去信心,库克打算让 Vision Pro 的负责人 Mike Rockwell 调任负责管理 AI 团队。
此次人事调动的原因是,由于 Siri 智能助手的相关 AI 功能拖延了数个月,让库克不再信任 AI 团队主管 John 执行产品开发的能力。此前,Siri 助手的相关 AI 功能本来计划在 iOS18 的某个版本中上线,但苹果上周宣布相关功能可能会延迟到 iOS19 再推出。
库克选择 Rockwell 来接手,是在押注其成熟的经验,他已经在 Vision Pro 上展示了新产品和管理数千人的工程的组织能力,库克希望能让苹果的人工智能 AI 业务重回正轨。
3 月 21 日消息,据报道,苹果公司当地时间 19 日因“未能兑现 Apple Intelligence 承诺”而遭大量用户发起集体诉讼。原告指控该公司在推广 iOS 18 和 iPhone 16 系列时,对延期发布的 Siri 智能功能进行虚假宣传,涉嫌违反《反不正当竞争法》并误导消费者。
阿里被曝拟全面实现“AI 化”:正开发杀手级 AI 应用,阿里云启动“T 项目”,员工绩效与 AI 挂钩
据报道,阿里巴巴 CEO 吴泳铭主张在阿里现有业务中全面实现“AI 化”。阿里所有部门已被告知,他们 2025 年的绩效将通过如何利用 AI 促进增长来评估。淘宝和天猫在内的核心电子商务部门被鼓励采用更多的 AI 技术。各团队正在与通义千问的工程师密切合作,共同开发能够提高效率和用户体验的功能。
知情人士称,该公司还在开发一系列 AI 原生应用,其中一些可能会在今年推出。“在公司内部,我们相信,基于成熟 AI 技术的下一个杀手级应用,一个甚至比抖音更受欢迎的应用,可能很快就会出现,”该人士表示。阿里巴巴今年以来围绕 AI 基础设施、基础模型平台及 AI 原生应用大手笔投入,并陆续有相关成果产出。
据悉,阿里“All in”人工智能除了表决心,更是通过行动来贯彻落实。据财联社近日报道,阿里云已启动了“T 项目”,主要指面向下一代 AI 技术,做 AI 引擎、LLM、多模态等未知领域探索,知情人士表示:项目是为了加速 AI 的研发。T 项目采用员工“借调”的方式,即从阿里云内部抽调精锐力量,组成专项团队。据大厂日爆报道,阿里云原 DB4AI 负责人 my(P9)已经转入“T 项目”。此外,多位 P8 职责发生变更。
又走一位合伙人!高管们接连“出走”百川智能
近日,据报道,金融 ToB 业务的负责人——百川智能商业合伙人、金融事业群总裁邓江,虽未官宣离职,但也已经离开,下一步或将加入一家大模型创业公司。此前百川智能被曝联合创始人焦可已经离职,联合创始人、模型研发负责人陈炜鹏即将离职。加上去年 12 月,联合创始人、商业化负责人洪涛也选择了离开。细数下来,在最近三个月以来,已出现三位联创及合伙级高管离职,另一位“等待离职中”。
对于这些消息,百川智能方面选择保持沉默。不过,有知情人士透露,“陈炜鹏此次离职系本人主动提出,如果百川通过离职请求,很快就会离开。”该人士进一步透露称,“陈炜鹏其实在百川负责基础大模型,管理着公司一大半的研发人员,是百川绝对的核心技术领导人。但是,由于 2024 年,百川内部爆发过激烈的人才、资源争抢,处于旋涡重心的陈炜鹏也深受其累,“主动提出离职”。除了焦可和陈炜鹏外,知情人士还透露,本月初百川智能金融行业 ToB 业务 B 端组调整的力度极大,目前整个组均已裁撤,之前负责该业务的百川智能商业合伙人、金融事业群总裁邓江,目前也已经离职。
马斯克旗下 xAI 收购视频生成公司
据报道,马斯克旗下人工智能公司 xAI 已收购了 Hotshot,后者是一家专注于开发 AI 视频生成工具的创业公司,其技术类似于 OpenAI 的视频生成大模型 Sora。
Hotshot 总部位于旧金山,由萨斯蒂和约翰·穆兰在几年前创立。这家创业公司最初专注于开发基于 AI 的图片创作和编辑工具,但最终转向了开发文本生成视频的 AI 模型。
xAI 收购 Hotshot 可能意味着该公司计划开发自己的视频生成模型,以与 Sora、谷歌的 Veo 2 等产品竞争。马斯克此前曾暗示,xAI 正在开发视频生成模型,以增强其 Grok 聊天机器人平台。他曾在今年 1 月的一次直播中表示,预计“Grok 视频”模型将在“几个月内”发布。
小米发布史上最强年报!将投近百亿到 AI 中
3 月 18 日消息,小米集团发布 2024 年度全年财报,小米 CEO 雷军称是“史上最强年报”。财报显示,小米 2024 年全年营收 3659 亿元,创历史新高,同比增长 35.0%,经调整净利润为 272 亿元,创历史新高,同比增长 41.3%。值得一提的是,2024 年第四季度,小米总收入首次单季度突破 1000 亿元,达到 1090 亿元,再创历史新高。
此外,小米集团总裁卢伟冰在 2024 业绩会上称,小米将投入总研发经费的 1/4,大约 70 至 80 亿元到 AI 中。卢伟冰表示,长期来看,AI、OS 和芯片三项被列为小米核心技术。短期来看,小米要做好 AI 基建,开发语言大模型、多模态大模型等 AI 技术,搭建 AI 大模型落地的应用场景,比如超级小爱、智能座舱、智能驾驶等,小米内部也会利用 AI 技术进行内部提效。
o1/o3 后训练掌门人出走创业,OpenAI 鼎力支持押注 AI 材料!
OpenAI 后训练团队负责人威廉·费德斯正式离职,将自创业投身于 AI 材料领域。没想到,这一创业项目竟获老东家注资支持。OpenAI 表示:“OpenAI 将会对 Fedus 新公司进行投资并建立合作伙伴关系”。值得一提的是,去年 10 月,继上一位后训练团队负责人离职后,费德斯被提拔为新的继任者。不过半年的时间,OpenAI 后训练团队,又走了一位 leader。作为后训练部门负责人,费德斯主要进行 ChatGPT、API 和 AI 智能体底层模型的研究与开发工作。
此前,他就职于谷歌大脑,专注于通过专家混合系统(Mixtures of Experts)技术来优化神经网络效率。2022 年,他正式入职 OpenAI,初期作为核心开发人员加入强化学习(RL)团队,是 ChatGPT 的共同创造者之一,主要负责数据处理和模型评估工作。期间,他主导了多个重要模型(包括 4o、o1-mini、o1-preview 等)的后训练研发工作。
华为新品发布会:一口气甩四款车,发布首款阔折叠手机 PuraX,7499 元起售
3 月 20 日下午,在华为 Pura 先锋盛典和鸿蒙智行新品发布会上,华为常务董事、终端 BG 董事长、智能汽车解决方案 BU 董事长余承东一口气公布了四款车,新款问界 M9 和问界 M5 Ultra 正式开卖,享界 S9 增程版开启预售,同时也预告了问界 M8 将会在 4 月份上市。余承东也提到智界品牌,虽然没有新车发布,但是明确了刘亦菲将会成为智界的品牌大使,也算是对前一段时间的热搜进行了回应。
同时,从硬件上来看,华为已经为 L3 做好了准备。今年第三季度将会正式推送 ADS 4 版本,届时将会真正实现 L3。为了保证新车的交付节奏,赛力斯汽车总裁何利扬现场说到,赛力斯投入了 5 亿元以上进行产线的改造,实现了自动化和智能化的全面升级,交付周期将会大幅缩短。
此外,余承东正式公布了此前预热的新形态手机,命名为华为 PuraX,定位阔折叠。华为 PuraX 也是首款全面搭载 HarmonyOS5 的手机。华为 PuraX 采用 16:10 阔型屏,展开后屏幕为 6.3 英寸,分辨率为 2120×1320;外屏尺寸为 3.5 英寸,分辨率为 980×980。华为 PuraX 首发搭载 AI 眼动翻页功能,可以对眼球运动轨迹进行追踪,当用户看到页末时,会根据用户眼球运动自动翻页。
售价方面,华为 PuraX 的 12GB+256GB 版本 7499 元,12GB+512GB 版本 7999 元;另外,还有华为 PuraX 典藏版,16GB+512GB 售价 8999 元,16GB+1TB 售价 9999 元。
大模型一周大事
重磅发布
混元 T1 正式版上线腾讯云:创新混合 mamba 架构,擅长超长文推理
3 月 21 日,腾讯宣布推出自研深度思考模型混元 T1 正式版,并同步在腾讯云官网上线,输入价格为 1 元/每百万 tokens,输出价格为 4 元/每百万 tokens。
该模型以 Turbo S 为基座打造,打造出的一款秒回、吐字快、擅长超长文处理的强推理模型。在体现推理模型基础能力的常见 benchmark 上,如大语言模型评估增强数据集 MMLU-PRO 中,混元 T1 取得 87.2 分,仅次于 o1。在 CEval、AIME、Zebra Logic 等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元 T1 的成绩也达到业界领先推理模型的水平。此外,T1 还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。

混元 T1 正式版沿用了混元 Turbo S 的创新架构,采用 Hybrid-Mamba-Transformer 融合模式。这是工业界首次将混合 Mamba 架构无损应用于超大型推理模型。这一架构有效降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 的内存占用,从而显著降低了训练和推理成本,让混元 T1 实现首字秒出,吐字速度达到最快 80 tokens/s。
基于出色的长文捕捉能力,混元 T1 能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,混合 Mamba 架构针对长序列处理进行了专项优化,通过高效的计算方式,在确保长文本信息捕捉能力的同时大幅降低资源消耗,在相近的激活参数量下,实现了解码速度提升 2 倍。
字节版 Manus,多模态 AI Agent 开源
Agent TARS 是一个开源的多模态人工智能代理,它通过视觉解析网页并无缝集成到命令行和文件系统中,利用浏览器操作。字节跳动开源的多模态 AI Agent,最大的特点是能够通过视觉方式理解网页内容,并与命令行和文件系统无缝集成。主要功能包括:
任务规划与执行,通过代理框架实现任务的自动化规划与执行,支持搜索、浏览、探索链接等操作。
多工具集成,无缝集成浏览器、命令行、文件编辑等多种工具,支持复杂工作流的处理。
实时输出展示,提供直观的流式用户界面,展示浏览器、文档等多模态输出结果。
人机交互,支持“人在回路”模式,用户可以在任务执行过程中实时干预和调整方向。
任务分享,支持将任务线程打包为 HTML 文件或上传至远程服务器,方便与他人分享。
奥特曼反思:DeepSeek 走红启示,GPT-5 将免费开放使用
OpenAI 首席执行官奥特曼在对话中提到 DeepSeek 的快速崛起,认为其成功不仅源于技术实力,还与推广策略有关。他反思了 OpenAI 隐藏某些功能(如思维链)的做法,为竞争对手提供了机会,并宣布 GPT-5 将免费向公众开放,以调整市场策略。奥特曼强调,DeepSeek 的成功对行业有重要启示,技术推广和应用同样关键。未来,更多创新团队将推动人工智能行业的进步。
3 月 20 日,OpenAI 近日在其开发者 API 中推出了更强大的推理人工智能模型——o1-pro。据 OpenAI 称,o1-pro 相比之前的 o1 模型,使用了更多的计算资源,以提供“持续更好的响应”。目前,该模型仅向特定开发者开放,特别是那些在 OpenAI API 服务上消费至少 5 美元的用户。然而,o1-pro 的定价相当高昂:对输入模型的每百万词元(约 75 万字)收取 150 美元,对模型生成的每百万词元收取 600 美元。这相当于 OpenAI 的 GPT-4.5 价格的两倍,普通 o1 价格的 10 倍。
OpenAI 认为,o1-pro 性能的提升将说服开发者支付这笔不菲的费用。然而,早期用户发现,该模型在处理数独谜题时表现吃力,并在简单的视错觉笑话上出现错误。此外,OpenAI 去年年底进行的某些内部基准测试显示,o1-pro 在编码和数学问题上的表现仅略高于标准版 o1,但在回答这些问题时确实更加可靠。
英伟达 GTC 开幕,黄仁勋介绍多项 AI 进展
在 GTC 2025 的开幕主题演讲中,英伟达创始人黄仁勋在 150 分钟内,接连给从 AI Agent 到数据中心的 AI 芯片、再到具身智能的多个行业生态,再次指明了未来。
英伟达此次推出了一个新的“AI 工厂”引擎的操作系统,Dynamo。黄仁勋把这个推理服务库比作新时代的 VMware,能够自动编排如何让 AI 在推理时代跑的更好——每秒能产生更多 token。按照英伟达的说法,使用 Dynamo 优化推理,能让 Blackwell 上的 DeepSeek-R1 的吞吐量提升 30 倍。Dynamo 也完全开源。
在硬件领域,老黄宣布了其 Blackwell AI 工厂平台的下一个演进版本————Blackwell Ultra,旨在进一步提升 AI 推理能力。Blackwell Ultra 具体包含 GB300 NVL72 和 HGX B300 NVL16 系统,其 AI 性能比其前代产品高出 1.5 倍。
英伟达还公布了其 2026 年和 2027 年数据中心路线图的更新,其中就包括即将推出的下一代 AI 芯片 Rubin(以天文学家 Vera Rubin 命名)与 Rubin Ultra 的计划配置。
而在去年发布了 GR00T 模型之后,今年英伟达发布了 GR00T N1 模型。英伟达宣布这是全球首个开放的、完全可定制的通用人形机器人推理与技能基础模型。Groot N1 基于合成数据生成与仿真学习的技术基础,采用了“快思考与慢思考”的双系统架构。其中,“慢思考”系统让机器人能够感知环境、理解指令,并规划正确的行动,而“快思考”系统则将规划转换为精准、连续的机器人动作。
Stability AI 发布新模型,2D 照片轻松转 3D 视频
3 月 19 日,Stability AI 推出了其最新的人工智能模型——Stable Virtual Camera,该模型能够将 2D 图像转换为“沉浸式”视频,并呈出逼真的深度和视角。Stable Virtual Camera 可以从一张或多张图像(最多可处理 32 张)中生成场景的“新视角”,用户还可以指定相机角度。该模型可以生成沿着“动态”相机路径或预设路径移动的视频,包括“螺旋”、“缩放”、“移动”和“平移”等多种效果。
目前版本的 Stable Virtual Camera 为研究预览版,可以生成方形(1:1)、竖屏 (9:16) 和横屏 (16:9) 三种宽高比的视频,最长可达 1000 帧。然而,Stability AI 警告说,该模型在某些情况下可能会产生较低质量的结果,尤其是在处理包含人类、动物或“动态纹理”(如水面) 的图像时。目前,Stable Virtual Camera 在 Hugging Face 平台上以非商业许可的形式供研究使用,用户可以下载体验。
谷歌云重磅推出高清语音模型 Chirp 3,支持 248 种声音
据报道,谷歌云在位于伦敦的 DeepMind 总部举行了一场会,正式推出其高清语模型 Chirp3。该模型通过 Vertex AI 统一机器学习平台向开发者开放,提供了丰富的开发工具,助力程序的创新。Chirp3 支持 248 种不同的声音,并可用 31 种语言进行语音合成。开发者可以利用这一模型创建多种应用,如智能语音助手、有声读物和视频配音等。谷歌表示,Chirp3 的语音功能能够捕捉人类语调的细微差别,使得对话更加生动和引人入胜。
除了使用现成的语音,用户还可以通过谷歌云的文本转语音 API 创建自定义语音。然而,谷歌为了确保负责任的使用,限制了这一语音克隆功能的访问权限,以防止潜在的滥用行为,并确保符合伦理 AI 的实践。此外,谷歌还借此机会宣布了一项计划,旨在通过综合培训项目来提升英国的 AI 技能,帮助专业人士有效掌握 AI 技术。谷歌将向英国初创企业提供云基础设施和 AI 工具的使用积分,支持它们快速开发和扩展创新解决方案,以刺激创业活动。
企业应用
3 月 20 日,埃隆・马斯克旗下的人工智能公司 xAI 为其 API 添加图像生成功能。该 API 仅支持“grok-2-image-1212”模型,该模型可根据输入的描述生成最多 10 张图像,每秒最多处理 5 次请求,输出格式为 JPG,每张图像收费 0.07 美元(现汇率约合 0.51 元人民币)。
3 月 19 日,豆包 AI 编程功能迎来三项升级,包括 HTML 预览、Python 运行、生成完整项目。目前豆包支持 HTML 代码实时预览和交互,可以更加直观地制作各类小游戏和网页。豆包目前支持 Python 代码直接运行,报错可一键修复。
3 月 18 日,腾讯元宝电脑版发布升级,新增了截图提问功能,也支持拖拽文件和图片到输入框,便捷交给元宝解析。同时,元宝电脑版还能调节字体大小,并上线深色模式。用户还可以随时中断思考和回答、把提问回退到输入栏重新编辑问题。
3 月 17 日,小米技术官方微博发文称,小米大模型团队在音频推理领域取得突破性进展,受 Deepseek-R1 启发,团队率先将强化学习算法应用于多模态音频理解任务,仅用一周时间便以 64.5%的 SOTA 准确率登顶国际权威的 MMAU 音频理解评测榜首。现同步开源。
3 月 17 日,谷歌计划自明年起与联发科合作,研发下一代人工智能芯片 Tensor。谷歌之所以选择联发科,部分原因在于联发科与台积电关系紧密,同时相比另一家合作伙伴博通,联发科的芯片采购成本更低。
3 月 17 日,智己汽车、饿了么、斑马智行三方官宣合作,同步预告将联合发布 AI 智行领域的最新探索成果。据悉,基于阿里巴巴 AI 大模型的技术积累与生态布局,三方共同开发出行业首个“AI 生态座舱”,将融合链接自然语言交互及 AI 服务生态。
评论