
曝 Kimi 投流 9 亿,日活不足千万;黄仁勋首度回应 DeepSeek 冲击;接入 DeepSeek 后回答植入“58 到家”广告?腾讯官方回应;AI 硅胶娃娃爆火,接入 ChatGPT、Llama 等大模型;铁饭碗悬了!广东深圳首批“AI 公务员”正式上岗:比人牛;上汽乘用车史上最大规模人事大换血,涉及 63 位中高层;特朗普要对美国 AI 和芯片机构下手,裁员 500 人;马斯克阴影下 NASA 正经历至暗时刻,已裁员近 1800 人;曝 TikTok 将重组安全信任部门,在全球裁员;吴永辉加盟引字节架构调整;阿里 AI To C 业务近期开启大规模人员招聘……
行业热点
奥特曼婚后首晒娃,纳德拉祝贺
当地时间 2 月 23 日,奥特曼在 x 上激动晒娃:

欢迎来到这个世界,小家伙!
他提前降临,接下来需要在新生儿重症监护室待一段时间。虽然如此,他的状况很好,能在这个小小的世界里照顾他,感觉真的很温馨。
我从未感受过如此深沉的爱。
奥特曼和丈夫 Oliver Mulherin 结婚一年,这是他们的第一个孩子。去年底,奥特曼在一次采访中提到,2025 年 AGI 降临,将要一个自己的孩子。
微软 CEO 萨提亚·纳德拉(Satya Nadella)在帖子下表示,“衷心祝贺!为人父母是人生中最深刻、最有意义的经历之一。祝你和你的家人一切顺利。”
曝 Kimi 投流 9 亿,日活不足千万
QuestMobile 最新数据显示,DeepSeek App 以“零营销”姿态创造增长神话:上线至 2 月 9 日,累计下载量突破 1.1 亿次,周活跃用户最高触及 9700 万。这一成绩正在重塑行业竞争规则。
反观传统玩家的"重营销"策略遭遇寒冬。Kimi 过去一年投入近 9 亿元营销费用,每月营销预算高达 2 亿元,在小红书等平台大手笔投放,一度让 B 站"沦陷"。然而即便投入如此巨资,其日活规模仍未破千万,与 DeepSeek 短短数十天靠自然流量达到 3500 万日活形成鲜明对比。
更令人瞩目的是,其他玩家的营销投入同样惊人:豆包的投放规模据称是 Kimi 的数倍,Minimax 的 Talkie 在海外投入数千万美金,星野在国内市场也投入上亿元。然而,DeepSeek 的横空出世给这一轮"烧钱竞赛"浇了一盆冷水。
23 日凌晨,月之暗面发布最新论文《Muon is Scalable for LLM Training》,并开源 MoE 模型 Moonlight,模型激活参数仅需 3B。论文显示,月之暗面通过深度改造 Muon 优化器并将其运用于实际训练,证明了 Muon 在更大规模训练中的有效性,是 AdamW 训练效率的 2 倍且模型性能想相当。
黄仁勋首度回应 DeepSeek 冲击
在近日举办的 Beyond Artificial 大会上,英伟达 CEO 黄仁勋就近期备受关注的中国企业 DeepSeek 及 AI 行业发展发表了重要观点。他特别指出,市场普遍对 AI 应用架构存在一个误解,真正的 AI 应用应该包含三个同等重要的阶段:预训练、后训练(推理能力学习)以及实际推理过程。
预训练阶段使用多模态数据学习基础知识;后训练阶段通过强化学习、人工反馈等方式培养模型的推理能力;而推理过程则需要模型进行复杂的思考和分析,包括并行试验和分步推理。
他强调,预训练虽然重要,但后训练对智能发展而言才是最关键的部分,因为这是将学到的知识应用于解决实际问题的过程。同时,推理过程本身也需要大量计算资源,因为 AI 在回答问题时需要进行多重推理和不断修正。
谈及 DeepSeek,黄仁勋认为其创新不会阻碍 AI 发展,反而会加速 AI 的应用扩展。“这对英伟达来说是一件好事,但从本质上说,所有的核心点都在于应用层的加速。”
至于企业 AI 应用策略,黄仁勋提出了“多元并存”的观点。他建议企业可以同时采用公有云 AI 服务和自研 AI 系统。对于通用服务,可以优先使用公有云上的现成解决方案;而在企业特定专业领域,则可以基于开源模型和工具开发专有 AI 系统。
接入 DeepSeek 后回答植入“58 到家”广告?腾讯官方回应
2 月 18 日,科普博主“三个老爸实验室”爆料称,腾讯元宝 AI 在接入 DeepSeek 系统后,回答中疑似出现商业广告植入,引发网友热议。
从曝光的对话截图来看,当用户向元宝 AI 咨询“空调移机”避坑建议时,系统推荐了“58 到家”和“快回收”等第三方服务平台。这一情况让不少用户质疑腾讯在 AI 服务中植入商业广告,相关话题迅速登上热搜。

众多用户表示,在使用 AI 助手时,希望得到的是纯粹的信息和建议,而不是夹杂着商业推广内容,这一事件极大影响了他们的使用体验。面对舆论质疑,腾讯公关总监张军迅速通过微博做出回应。他表示“理论上不应该(出现广告),已经让技术去查了”。张军推测,异常回答可能源于系统开启联网搜索时,引用了“58 到家”公众号发布的避坑指南内容。同时,他建议用户可通过连续追问方式验证回答性质,“如果真是广告,追问几次就会露馅”。
值得关注的是,微信搜索功能也同步出现服务入口变更。部分用户发现对话框顶部搜索页面出现“下载元宝 (体验 DeepSeek R1)”的提示。微信官方称,为应对用户激增的体验需求,已紧急协调部署调用元宝系统支持,目前 DeepSeek-R1 满血版及混元深度思考模型 T1 仍处于灰度测试阶段。
AI 硅胶娃娃爆火,接入 ChatGPT、Llama 等大模型
近期,广东中山成人玩偶制造商 WMDoll 因推出搭载 AI 功能的硅胶娃娃引发市场热议。据报道,这款产品通过接入 ChatGPT、Llama 等开源 AI 模型,实现了智能对话和情感互动功能,新一代 AI 硅胶娃娃具备理解、分析和回应能力,可以通过持续对话建立用户画像,并保持长期记忆功能。比如今天告诉娃娃生病了,后续你表达要带她出去玩的时候,娃娃可能会提醒你好好休息养病。
WMDoll 负责人 Max 介绍,开发这类产品的前期投入至少需要 100 万元,目前,该公司已与国内情感 AI 仿生机器人提供商无芯科技合作,计划开发具备面部表情和生理数据联动功能的新产品。
新一代 AI 硅胶娃娃引爆舆论的关键一点在于其收费模式。据悉,MetaBox 娃娃的售价在 1500-2000 美元之间(约合 10880-14507 元人民币)。想要体验 AI 交互功能,需要先支付 100 美元的订阅费。后续再根据需求充值续费,如果暂停订阅,产品就只是个不会说话的普通娃娃。
铁饭碗悬了!广东深圳首批“AI 公务员”正式上岗:比人牛
2 月 17 日消息,据“幸福福田”官微显示,首批 70 名“AI 公务员”正式上岗,其错误率控制 5%以内。官方公告显示,广东深圳福田区推出基于 DeepSeek 开发的 AI 数智员工,上线福田区政务大模型 2.0 版,除了有 DeepSeek 通用能力外,还结合各部门各单位实际业务流程,量身定制个性化智能体,首批满足 240 个业务场景使用。目前,福田区已上线 11 大类 70 名“数智员工”,覆盖政务服务全链条。通过 240 个政务场景终端的精准解析,覆盖公文处理、民生服务、应急管理、招商引资等多元场景。个性化定制生成时间从 5 天压缩至分钟级。这些“AI 公务员”公文格式修正准确率超 95%,审核时间缩短 90%,错误率控制在 5%以内。“AI 任务督办助手”跨部门任务分派效率提升 80%,按时完成率提升 25%。
此事迅速在社交媒体引起热议,“AI 公务员”这一说法也在讨论中被频频提及。18 日上午,记者采访了深圳市福田区政务服务和数据管理局党组成员、副局长高增,他表示,“AI 数智员工”是 AI 助手,它能辅助开展公共管理和服务,提高工作效率,不能单独决策,不能算是“AI 公务员”。
上汽乘用车史上最大规模人事大换血,涉及 63 位中高层
2 月 18 日,上汽乘用车发布了《关于大乘用车干部任免的通知》,63 位中高层职位迎来“地震级”调整!这场由集团总裁贾建旭亲自签发的变革,这次大规模的人事调整涉及销售、市场、品牌、网络发展等多个关键部门的高层管理人员,涉及荣威、名爵、飞凡等核心品牌,更将研发总院、零束科技等关键部门纳入重组范围,堪称上汽自主板块史上最大规模的人事调整。此次人事调整于 2 月 12 日生效。
2024 年,上汽乘用车(三大品牌荣威、飞凡和名爵)零售量仅 81.4 万辆,同比下滑超 30%,而比亚迪、吉利、奇瑞等自主品牌已突破 200 万辆大关。面对上汽乘用车板块的“失速”,贾建旭将改革矛头直指“大乘用车板块”,进行了一系列顶层调整,亲自担任上汽大乘用车执管会主席,主导大乘用车的变革。此外,上汽大乘用车管理层开启了全员内部竞聘,而此次大规模人事调整就是竞聘后的结果。
特朗普要对美国 AI 和芯片机构下手,裁员 500 人
2 月 20 日,据外媒报道,作为美国总统特朗普对联邦政府进行大规模人员削减计划的一部分,美国商务部下属美国国家标准与技术研究院(NIST)正准备解雇多达 500 名左右的试用期员工。知情人士透露,周三,部分 NIST 试用期员工已收到即将被解雇的口头通知。一些知情人士表示,NIST 尚未就此次裁员影响的范围作出最终决定。在拜登政府时期,NIST 负责协助实施美国政府的一些关键计划,包括为半导体制造提供资金,并为人工智能的使用和开发制定标准。此次裁员发生在美国新任商务部长 Howard Lutnick 正式上任之后。在上个月的确认听证会上,Lutnick 表示,他计划审查拜登政府的芯片项目以及该部门的人工智能计划。
马斯克阴影下 NASA 正经历至暗时刻,已裁员近 1800 人
2 月 19 日消息,美国国家航空航天局(NASA)总部和遍布全美的 10 个区域中心,共有近 18000 名公务员,但这家全球顶尖的航天机构可能将面临进一步的重大裁员。据消息人士透露,大约 750 名 NASA 员工接受了“人生岔路口”方案,将签署延迟生效的离职协议,在今年晚些时候离开该机构。听起来这个数字很多,但通常每年大约都有 1000 人离开 NASA,因此实际上很多人可能只是提前获得离职补偿,离开那些他们原本就计划要辞去的岗位。
将接受“延迟辞职”的员工和被辞退的试用期员工加起来,特朗普政府目前已裁减了 NASA 约 10%的员工。然而,裁员可能并不会就此结束。两位消息人士表示,NASA 各区域中心的负责人已经接到指令,要为应对未来几个月内的“重大人员裁减”做好准备。裁员规模尚未确定,甚至可能不会发生,因为白宫必须要与美国国会就 NASA 及其他机构的预算进行谈判。
曝 TikTok 将重组安全信任部门,在全球裁员
2 月 20 日消息,据外媒报道,三位知情人士周四表示,作为重组的一部分,TikTok 正在裁减其负责内容审核的信任与安全部门的全球员工。两位消息人士称,该应用程序的运营主管兼该部门负责人 Adam Presser 于周四向员工发送了一份备忘录,通知他们这一举动。亚洲、欧洲、中东和非洲的团队从同一天开始裁员。TikTok 表示,其在全球拥有 40000 名信任和安全专业人员,外媒无法立即确定裁员的程度。
吴永辉加盟引字节架构调整
2 月 17 日消息,据知情人士消息称,在谷歌工作长达 17 年的“Google Fellow”吴永辉博士已离开谷歌,加入字节跳动。2023 年,因为深度学习领域的持续研究贡献,吴永辉博士被谷歌晋升为“Google Fellow”和谷歌 DeepMind 的研究副总裁。知情人士称,吴离开谷歌,是希望做一些新的,偏探索的工作。这次加盟字节,也将专注在偏长期、偏基础的科研工作。
有市场消息称,在原谷歌 DeepMind 副总裁吴永辉加入字节担任大模型团队 Seed 基础研究负责人后,字节大模型团队进行架构调整,多名原来向朱文佳汇报的算法和技术负责人转向吴永辉汇报。对此,接近字节人士称,吴永辉主要负责 AI 基础研究探索工作,偏基础研究,朱文佳主要负责模型应用相关的工作,偏模型应用,两个人都在 seed 部门,都向字节 CEO 梁汝波汇报。
另外,针对媒体报道的《字节 AI 团队大变阵》,2 月 22 日,抖音集团副总裁李亮发文回应称,这个稿子应该是找了错误的信源,里面提到的“技术副总裁杨震原将退休”、“冯佳时将离职创业”“张一鸣拜访了豌豆荚创始人王俊煜,以及上海模速空间里的创业公司”,都是不实信息。

阿里 AI To C 业务近期开启大规模人员招聘,开放招聘岗位达到数百个
2 月 19 日,据媒体报道,阿里 AI To C 业务近期开启大规模人员招聘,开放招聘岗位达到数百个,其中 AI 技术、产品研发岗位占比达到 90%,所招聘人员将重点投入到文本、多模态大模型、AI Agent 等前沿技术与应用的相关工作中。上周,马云曾现身夸克办公区,外界普遍猜测夸克在阿里 AI 战略布局中将占有重要地位。据统计数据显示,夸克 2024 年度的累计下载量超 3.7 亿。
OpenAI 前首席技术官成立新公司,联创 Sutskever 初创公司拟融资 10 亿美元
当地时间 2 月 18 日,OpenAI 前首席技术官 Mira Murati 宣布成立名为“思维机器实验室”(Thinking Machines Lab)的新公司。穆拉蒂表示,这是一家由科学家、工程师和建造者创办的公司,将专注于:帮助人们调整人工智能系统,以满足他们的特定需求;为构建能力更强的人工智能系统打下坚实的基础;培养开放科学文化,帮助整个领域了解和改进这些系统。公司的目标是通过坚实的基础、开放的科学和实际的应用,让人工智能变得更有用、更易懂,从而推动人工智能的发展。
此外,知情人士透露, OpenAI 联合创始人 Ilya Sutskever 正在为其初创公司筹集超过 10 亿美元,估值超过 300 亿美元——这将使这家新兴企业跻身全球最有价值的私营科技公司之列。
韩国禁止新用户下载 DeepSeek,因担忧“个人信息保护”问题
据报道,韩国政府 2 月 17 日表示,出于对中国人工智能应用程序 DeepSeek 的担忧,已暂停这款应用程序的下载。韩国个人信息保护委员会表示,该服务已于 2 月 15 日下午 6 点暂停,并将在根据韩国个人信息保护法规进行“改进和修补”后恢复。
此前,韩国多个政府部门和机构内部阻止了对 DeepSeek 服务的访问。另据韩国《朝鲜日报》网站报道,韩国个人信息保护委员会认为,若想符合个人信息保护法规的要求,DeepSeek 需要相当长的时间进行修改,因此决定暂停其在韩国应用市场的下载。此次措施实行后,老用户仍可正常使用,但新用户下载将受到限制。
大模型一周大事
重磅发布
微软首发量子芯片 Majorana 1
近期,微软发布了量子计算的新突破 — Majorana 1 芯片。根据微软发布的论文所述,这是世界上首个由拓扑内核驱动的量子处理单元(QPU),可在单个芯片上扩展至百万量子比特,为量子计算指明了一条路径。
在过去 17 年的时间里,微软一直都在寻找一个可靠的新材料和体系结构去实现量子计算。如今,微软宣布利用了一种新型的拓扑超导材料(结合了砷化铟(半导体)和铝(超导体))首次实现对马约拉纳粒子的精准操控,可以创造出更稳定、抗干扰的量子比特(qubits)。
目前,微软宣布已经将 8 个拓扑量子比特放在一个仅有手掌大小的芯片上,而这个芯片架构的目标是要拥有 100 万个拓扑量子比特,这也是目前唯一明确具备可扩展性的架构。
微软技术研究员 Chetan Nayak 认为,“我们重新发明了量子时代的晶体管,这是通向实用量子计算的清晰路径。”同时 Chetan Nayak 还表示,从最初,团队就想制造一台对商用有影响力的量子计算机,并且不仅仅是在思想上引领,并且他强调,若想实现就必须实现规模化。此外,微软表示,预计会在未来几年内,能够造出解决工业规模问题的量子计算机。
Figure AI 发布能“双机协作”的端侧大模型
2 月 20 日消息,在 2 月初终结与 OpenAI 的 AI 模型合作后,美国机器人创业公司 Figure AI 如期在周四公开了背后的原因:公司已经有更厉害的通用具身智能模型 Helix。Figure AI 表示,Helix 是首款能对整个人形机器人上半身(包括头部、躯干、手腕和手指)进行高频率、连续控制的视觉-语言-动作(VLA)模型。通过直接将视觉语言模型中捕获的丰富语义知识,直接转化为机器人动作,克服了人形机器人领域的多个长期挑战——至少不需要为机器人的每一个动作进行大量训练了。

Figure 介绍称,Helix 是首款可以在人形机器人上协同运行的 AI 模型,使得两台机器人可以协作解决一个共享的、长期的操作任务。作为这项科技突破的结果,搭载 Helix 的机器人现在可以根据自然语言指令,识别并拾取几乎所有的小型家居物品,包括机器人从未见过的成千上万物品。在公司给出的案例中,机器人在接受“拿起那个仙人掌”、“拿起沙漠里的东西”时,都能选择最接近玩具的手,成功从一堆物品中拎出仙人掌玩具。
月之暗面宣布推出新模型 Kimi Latest
2 月 18 日,月之暗面宣布推出一款新模型 Kimi Latest,它将对标 Kimi 智能助手当前使用的模型,随智能助手产品更新而同步升级(模型名称始终不变),用户现已可在 Kimi 开放平台体验。据介绍,Kimi Latest 总是使用 Kimi 智能助手产品使用最新的 Kimi 大模型,可能包含尚未稳定的特性;上下文长度为 128k,会自动根据上下文长度选择 8k/32k/128k 模型作为计费模型;支持自动上下文缓存。目前 Kimi Latest 仅支持调用 Kimi 普通版模型,Kimi k1.5 长思考模型暂不支持 API 调用。
DeepSeek 推出 NSA,用于超快速的长上下文训练和推理
2 月 18 日,DeepSeek 推出 NSA。DeepSeek 称,NSA 是一种与硬件一致且本机可训练的稀疏注意力机制,用于超快速的长上下文训练和推理。通过针对现代硬件的优化设计,NSA 加快了推理速度,同时降低了预训练成本,而不会影响性能。在一般基准测试、长上下文任务和基于指令的推理上,它的表现与完全注意力模型相当甚至更好。
美研究机构发布生物学领域最大 AI 模型 Evo 2
美国弧形研究所 19 日在官网发布公报说,来自该研究所、美国芯片制造商英伟达公司和美国斯坦福大学等机构的研究人员共同开发的人工智能(AI)生物学模型 Evo 2 当天正式发布。公报说,在前一代模型 Evo 1 的基础上,Evo 2 发展成为目前生物学领域规模最大的 AI 模型。该模型基于超过 12.8 万个基因组数据的 9.3 万亿个核苷酸进行训练。
卷不过就换条路!法国人工智能公司发布专精阿拉伯语的 AI 大模型
据报道,面对 DeepSeek、阿里巴巴、OpenAI、谷歌等全球 AI 巨头近来“卷到飞起”的尖端大模型竞争,被视为欧洲 AI“全村希望”的科创企业 Mistral 选择了一条少有人走的路。当地时间周一,总部位于巴黎的 Mistral 发布名为 Mistral Saba 的定制大模型,主要卖点是经过专门训练的阿拉伯语交互能力。
官方介绍称,Saba 是一个 240 亿参数的轻量级模型,能够在本地单卡环境下部署,输出响应速度可以达到 150 个 tokens/秒。这个模型使用特别挑选的中东和南亚数据集,所以与参数量多出几倍的通用大模型相比,Mistral Saba 在回应阿拉伯语问题方面,能做到更高的准确率和关联性。
xAI 发布 Grok 3,马斯克称其为“地球上最聪明的人工智能”
2 月 18 日,马斯克与 xAI 团队,在直播中正式发布了 Grok 最新版本 Grok3。此前,马斯克将 Grok-3 描述为“地球上最聪明的 AI”。他在 X 平台上表示:“自己整个周末都在和团队打磨产品。”然而据媒体报道,有人测试了最新的 Beta 版 Grok3,并提出了那个经典的用来刁难大模型的问题:“9.11 与 9.9 哪个大?”遗憾的是,在不加任何定语以及标注的情况下,号称目前最聪明的 Grok3,仍然无法正确回答这个问题。
不过对此马斯克并不以为然,其公开回应称,当前的 Grok 3 仅是测试版,这个阶段错误越多越好,而完整版将在未来几个月推出,并邀请用户反馈使用问题。也有舆论认为,尽管在官方 PPT 中,Grok3 在大模型竞技场 Chatbot Arena 中看似“遥遥领先”,但实际上其与 DeepSeek R1 和 GPT4.0 的差距仅为 1% 到 2%。
此外,2 月 20 日,马斯克旗下人工智能公司 xAI 的 Grok 应用升至美国区 App Store 免费 APP 榜首,超越 OpenAI 的 ChatGPT APP。同时,马斯克还宣布 Grok3 将免费提供 ( 直到服务器崩溃为止 ) ,马斯克表示,“短时间内,Grok 3 对所有人免费开放!”在发布会上,马斯克宣称 Grok 3 在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于 SpaceX 的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
企业应用
2 月 21 日,李开复创立的 AI 独角兽零一万物,近日内部发生多处变动:计划拆分数字人业务,由零一万物数字人业务研发负责人杨昌鹏带队。零一万物 AI 视频混剪项目负责人蓝雨川离职创业,新项目 SparkView 方向为 AI 视频编辑工具。
2 月 20 日,腾讯已完成系列 AI 产品线调整。继腾讯元宝从 TEG(技术工程事业群)转入 CSIG(腾讯云与产业事业群)之后。QQ 浏览器、搜狗输入法、ima 等更多产品和应用也已经汇入 CSIG,成为腾讯面向大模型时代打出的全新产品组合。
2 月 20 日,百度搜索全量上线 DeepSeek 满血版。用户可在百度 App 输入任意搜索词,完成一轮搜索后,在搜索结果页点击“AI+”进入 AI 搜索,再点击下方去试试“满血版”即可与 DeepSeek 对话。
2 月 19 日,Meta 宣布,将举办首届专注于生成式 AI 的开发者大会。这场大会被命名为 LlamaCon,以 Meta 旗下的 Llama 生成式 AI 模型系列命名,定于 4 月 29 日 举行。Meta 表示,届时将分享其 开源 AI 方面的最新进展,以帮助开发者打造创新的应用和产品。
2 月 17 日,腾讯 AI 助手“腾讯元宝”迎来更新,混元+DeepSeek 两大模型均支持深度思考功能,用户下载并打开腾讯元宝即可免费使用。
评论