10 月 31 日,阿里云正式发布千亿级参数大模型通义千问 2.0。官方数据显示,在 10 个权威测评中,通义千问 2.0 综合性能超过 GPT-3.5,正在加速追赶 GPT-4。此外,阿里云还发布了智能编码助手通义灵码等行业应用大模型。
针对阿里云的大模型策略,阿里云 CTO 周靖人在接受记者采访时表示,“我们的目标并不是做 toC 的产品,而是希望更多地把模型的能力开放出来,让更多开发者、合作伙伴使用。”
据周靖人介绍,阿里云的定位是“服务好各种各样在 AI 时代的创业者、开发者和企业客户等。通过多层技术能力,包括 AI 基础设施、模型等能力,最好地支持开发者和客户,帮助他们解决在创业、落地、创新等方面的问题。”
具体来讲,模型创业公司希望使用到最先进的 AI 基础设施;企业客户希望将开源模型与自己产品做二次结合,这类产品包括通义千问等开源模型、帮助企业做模型定制的阿里云百炼等;还有关注业务系统的开发者,通过简单的 API 集成到自己业务体系中。
周靖人表示,这次 AI 技术变革的实质是一次技术体系的全面升级。对云计算来说,主要包括以下纬度:第一,系统优化,即如何利用模型能力优化复杂庞大的分布式系统,让它真正变成一个“自动驾驶的云”;第二,用模型帮助提升开发效率,即让用云这件事本身变得更加智能;第三,以模型为中心打造最好的 AI 基础设施,提供低成本、一站式的模型训练、微调、推理等服务。
“而云厂商既要懂 AI,又要懂云计算,才能在这次竞争里取得一个重要的战略性优势。”周靖人表示。具体来说,云厂商要做的事情就是让用户以更低的成本使用模型来提供服务。
“今天基础设施的目标,特别是模型推理方面,不单是提升延迟等各个方面的性能,同时还要能够降低使用成本。在这方面,我们还有大量的工作需要做。”周靖人表示,阿里云不是简单开发界面的开放,而是 API 级别、模型级别的开放。用户可以借这些产品发挥更大的想象空间,做更多业务的创新。
周靖人呼吁,大家要给这个领域一些时间。“毕竟从国内来讲,整个产业的变化是从今年开始的,甚至到了 3、4 月份,大家才陆陆续续发模型。在这方面,我们的确比海外要晚,海外拥有至少一年的先发优势,甚至更长的时间。”
不过,周靖人表示,国内也在快速地追赶中。短短半年时间内,国内模型生态已经慢慢发展起来了。模型的生态发展起来,一定代表了算力发展得起来。
评论