被《福布斯》杂志誉为“最终的思考机器”的雷·库兹韦尔在《奇点临近》一书中提到了两个关键时间节点:第一,2029 年通用人工智能会出现;第二,到 2049 年人类就会进入“奇点时刻”,意识层面的永生将会出现。
这部预测人工智能和科技未来的“奇书”中提供的崭新视角影响着很多技术从业者,其中就包括奇富科技(原 360 数科)CEO 吴海生。在日前举办的 2024 年度人工智能大模型金融领域示范场景及创新应用案例成果特展主题日活动上,他表示,在亲身经历了从互联网到移动互联网再到产业互联网的多次变革之后,他的切身感受是“我们一不小心可能就会错过整个时代”。
“随着‘奇点时刻’到来,对于个人来说,创造力会变得更加重要。而作为企业而言,可以做的事情变得更多。”
出于这样的思考和初衷,奇富科技过去几年在 AI 领域进行了不少探索和实践。尤其是在 2022 年大模型技术席卷而来之后,奇富科技与度小满、马上消费金融等一众金融科技公司都先后布局,发布了多项大模型成果。
“金融行业天生适合先进的人工智能落地,我们几乎所有的生产要素全是数字化的,因此天然适合大模型的训练和生成。这是我们今天能够面向开发、运营,面向我们几千万的用户去做更多实践和尝试的重要原因。虽然这些尝试目前还不完全成熟,但我认为我们已经走在一条正确的路上,而且这条路会让我们越走越有信心。”吴海生强调。
值得一提的是,经过一年多来的应用探索,除了客服、营销等外围场景,奇富科技已经开始把大模型技术应用于信贷这样的金融核心业务中去。
Agent 带来大模型在信贷场景的应用破局
具体而言,通过大模型对用户的信贷记录、收入情况、消费习惯等信息进行综合分析,能够为用户提供更加精准的信贷额度和利率。除此之外,针对小微企业,还可以基于大模型对其关系图谱、产品图谱、产业图谱进行分析,不仅提高了信贷业务的效率,降低了风险,同时也面向个人和小微企业提供了更好的服务。
据介绍,在奇富科技有数百万人获得了人生第一笔贷款。
奇富科技首席算法科学家费浩峻在接受 InfoQ 等媒体采访时表示, 大模型在信贷场景的应用破局主要来自于 Agent 模式的突破。“Agent 其实是多人工协作、多 Agent 一起协作,最后得出一个满意的答案。”
举例来说,一个语音智能体虽然能跟用户交互,但是当用户需要做一些调整的时候,很多时候是没法解决实际问题的,这时候,如果多智能体协同,它就可以跟另一个智能体去做交互,比如风险智能体会大体评估判断出几个结果:第一,材料信息充分可以直接提供贷款;第二,可能还需要提供什么材料作为补充;第三,可能提供任何材料都无法满足借贷需求。“这是一个很大的逻辑框架,有可能直接返回,也有可能会再调过来营销智能体。”
“我们现在线上整个加起来应该有 700 多个模型在运转。后来,我们就去做拆解,最后发现整个大模型、整个信贷的核心能力,其实主要就是两个方面,一是表征,二是预测。”
费浩峻进一步解释,表征具体指的是用户的行为表征,通过把用户的在物理世界和虚拟世界的各种行为信息,用降维的方式传输给决策模型,也就是转化为模型能够识别和理解的特征。而预测则是指基于这些特征进行风险评估和决策。
“目前大模型在决策需求跟风险决策方面的应用还有一定难度,但在对于表征却有着天然优势。比如,通过学习小模型对于数据轮转的能力,把它迁移到大模型里,就可以影响我们的业务。”
以小微企业服务中的研报解读为例,过去研报中的各种信息变化(如利润提升、原材料价格上涨、质量下降、需求增加/减少、成本升高等),经过 QiFuGPT 扩充后回变成 200 多个产品事件,比如产能下降可能也意味着需求下降,投资升高可能意味着用户贷款意愿增加。“这些数据通过指令优化、强化学习持续反馈给大模型,就可以帮助业务实现更多的指标泛化和精细化。”
费浩峻向 InfoQ 记者强调,虽然过去传统的 AI 技术也已经在这个过程中可以发挥很大作用,但是大模型的信息提取效率有着非常显著的提升。“当然,我们也一直在倡导,不是高参数模型就一定适用,因为成本很高,所以我们现在基本上就在 10B 左右的模型上使用,整体来看它是比较经济的。”
半年尝试上百个金融智能体,26 个达到商用级别
多智能体协同的背后,是奇富科技今年 3 月份上线的具备金融科技特质的智能体平台 AI STUDIO。
奇富科技技术副总裁宋荣鑫在会上介绍,这一平台的核心优势来自于两项技术:企业级 RAG 和 AI Flow。“通过 RAG 技术我们逐步构建了奇富科技的企业级知识库,在此基础上再利用 AI Flow 的技术,把 RAG 的知识串联起来,负责调用企业级知识库和大模型,形成解决问题的智能体。现在我们每一个工程师一旦有了创新思路就可以马上做一个智能体,比如说觉得写稿子太麻烦了,我们可以一天之内做一个智能体帮他写稿子,最快一天就能生成。”
不仅如此,通过有效的分发,奇富科技还显著增加了推理服务器的效率,预计每年可以解决创新成本大概 600 万元。并且,基于 360 的安全基因,智能体平台构建的所有能力都能够在安全环境中进行。“在这些技术保障下,我们只花半年时间就完成了 100 多个金融智能体的尝试,其中 26 个达到了商用级别。”
从具体的场景上来看,26 个智能体覆盖了金融企业的全生命周期,比如贷前、贷中、贷后,甚至睡眠客户的管理。从工作内容上涵盖了客户识别、产品服务、金融产品研发和经营分析等核心环节。
其中,AI 研发一直是大模型公认的最佳应用场景。奇富科技从去年开始就在探索智能研发,具体落地产品是 Jarvis 平台。在这个过程中,奇富科技也发现,仅靠通用的大模型能力产生的研发效能提升“还不够震撼”,直到引入 RAG 技术构建金融专家大模型之后,Jarvis 生成代码的效率实现了飞跃。
宋荣鑫指出,具体而言,奇富科技研发人员在 Jarvis 的时间从 1 天缩短到了 2 小时,30%的代码都由 AI 自动生成,每天执行的案例已经突破了 1 万个。
除了研发人员之外,坐席是金融行业另一个最为庞大的群体。而面向坐席人员,奇富科技也在今年 9 月上线了奇富 Copilot 产品。数据显示,自上线以来至今,其内部使用人数有了 6 倍的提升,目前奇富科技内部 500 多座席正在使用奇富 Copilot,使用频次超过 1 倍增长。
“为了更准确地了解奇富 Copilot 对一线坐席的帮助到底有多大,我们采取的是非主线产品逻辑的上线模式,用插件形式嵌入在每一个坐席系统中,每个城市上线后只进行一次宣讲,坐席可以根据自己的情况选择试用或者保持使用。”费浩峻表示,“据过去 4 个多月的数据统计,我们开放的坐席有 80%会持续使用,它对整个业务的提效达到了将近 200%。”
模型好不等于业务导向好
大模型构建和应用是一个投入高、周期长的大工程,而金融由于其行业特殊性又注定着整个探索实践过程充满更多的挑战。对此,费浩峻告诉 InfoQ,奇富科技的优势在于,既有数据、又有技术、还有应用场景。“我们也不会做基座,但是我们有能力在基座上做 L1 层的模型,这个是业内很难得能力的。”
拿奇富 Copilot 来说,之所以能够面向坐席人员实现 200%的提效,费浩峻认为,第一离不开奇富 GPT 大模型的扎实基础,第二离不开奇富科技在场景的持续理解和深耕。从权重来看,前者的重要性占比是 40%,后者是 60%。
事实上,早在去年 4 月,奇富科技就已经推出了业内首个金融大模型,并在 12 月进行了一次 Copilot 尝试。“刚开始的业务效果还是不错的,但是随着技术迭代变多以后,效果出现了不稳定。”费浩峻回忆道,“后来我们开始闭门反思,并深入一线,跟一线业务主管不断地沟通,最终发现,并不是模型好业务导向就好。比如说我们原来的想法是帮坐席提供更多、更全的信息,但是其实每一个坐席对于实时的信息理解能力是不一样的,有些需要提供两个字,有些座席要提供几句话。”
为了解决这一问题,产研团队用了超过 1000 多个小时跟一线业务反复磨合沟通最终打造出了当下版本的奇富 Copilot。
与此同时,在奇富 GPT 大模型建设过程中,奇富科技也充分考虑了对业务的赋能。从以下三个方面来看:
第一,数据方面,奇富科技经过多年来在 AI 领域的探索,对于数据清洗也做了大量的工作,目前,其训练数据质量 badcase 率已经降到了 5%以下。费浩峻补充表示,这个水平无论是在金融行业还是其它行业中都是相当高的;
第二,训练方面,业界通常在训练过程中会重点关注训练收敛曲度,而奇富科技关注的是未来在业务数据上的表现;
第三,微调方面,奇富科技自研的两阶段微调指令框架会在微调的过程中,充分的把通用的金融数据跟业务的场景数据所结合。
经过不断地迭代,目前奇富 GPT 大模型在各种业务的评测基本上都有 10%到 20%的效果提升,“总的来说,我们认为更懂金融业务的金融大模型+更懂金融业务的金融场景的打磨,才打造出了这样的金融大模型。”费浩峻表示。
目前,业界对于金融大模型主要抱有三种心态——观望、实验、投入生产。显然,奇富科技已经进入了投产阶段。
“我觉得在现如今这个充满不确定性的时代,有三件事情是确定的:第一,大模型时代一定会到来;第二,大模型赋能金融科技这条路一定行得通;第三,我们将坚定投入大模型技术的这些确定性。这是我们对未来的信心,也是我们对客户和合作伙伴的承诺。”宋荣鑫强调。
评论