HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

探索大模型智能:众安保险基于 AIGC 的应用实践

  • 2023-07-12
    北京
  • 本文字数:4199 字

    阅读完需:约 14 分钟

探索大模型智能:众安保险基于AIGC 的应用实践

采访嘉宾|蒋纪匀,众安保险 CTO


每一次技术浪潮的兴起,或多或少都会对各行各业产生深远的影响,并带来突破和进步的机会。此时行业中总有一些敏锐的从业者会及时抓住机遇,积极采用新技术,优化业务流程,改进产品和服务,从而获得更大的竞争优势。


众安保险,是当下 AIGC ( AI-generated Content,人工智能生成内容)浪潮里其中一个敏锐的先行者,它自 2022 年开始调研 ChatGPT 并探索 AIGC 在自身业务的落地应用。


“随着 AIGC 浪潮的兴起,我们认为,协作智能将成为数字化向智能化转型的科学前沿。而在这个趋势下,特别是金融保险这类数据密集、并且直接服务于人的行业,将迎来快速突破和进展。”众安保险 CTO 蒋纪匀近日接受 InfoQ 采访时如是说。

探索 AIGC 在保险业务的应用,技术与业务双向奔赴


作为互联网保险公司,众安保险一直都侧重于通过科技手段打破传统保险业的行业壁垒。据了解,目前众安保险已将 AIGC 技术应用到内部多个流程环节中,尤其在营销服务场景, AIGC 已经做到能够辅助众安保险的员工快速生成各类营销素材、加速产品上线,比如制作文案内容、视觉设计、优化推文效果等等。


其中,在制作文案内容方面,员工可以利用 AIGC 工具生成符合品牌形象和市场趋势的文案、标题、描述、标语等内容,提高广告文案的工作效率,并快速批量生成科普类文章。


视觉设计方面,通过 AIGC 相关的工具和平台,能够快速生成符合品牌形象和市场趋势的视觉设计元素,大幅提升了营销素材的设计效率。比如,以前需要三天才能完成的产品海报图,现在只需两三个小时就能生成多套不同风格的图片。此外,在直播背景墙、活动营销图片、图标、动画等多个场景中,员工都可以迅速应用 AIGC 工具为营销的各个环节赋能,加快产品和活动的上线速度。


与此同时,众安保险还可以利用 AIGC 的文本数据分析能力优化营销内容,根据社交媒体平台的数据分析,优化现有的营销内容,生成更具吸引力的推文标题、内容和标签,以提高推文的点击率和曝光率。


此外,除了内容生成相关的能力,AIGC 还被应用在智能客服领域,充当辅助助手的角色。当坐席与用户沟通的时候,它可以帮助坐席自动生成回答,并在通话结束后自动生成会话总结,根据场景和语义提取新线索。


据了解,众安保险一直都有配智能客服服务,但传统智能客服是基于自然语言处理(NLP)技术,如今团队则基于LLM开发了新的智能客服,并通过 AB 测试发现新的智能客服在准确率方面提高了 25%,实现了更高级别的智能化。


“这些应用都取得了积极的效果,并得到各业务部门的肯定和积极反馈。”蒋纪匀表示,目前众安保险内部的业务人员对数据 AI 模型的认知不断提升,许多人都积极学习 AI 技术,包括 AIGC 的使用,“技术和业务团队之间开始展现双向奔赴的趋势”。

有针对性地应用 AIGC


当我们使用像 ChatGPT 或 Midjourney 这类 AIGC 应用时,可能会觉得这很简单,就像雇了一个数字员工。然而,在垂直行业里的实际应用情况并没有宣传片中看起来那么简单。


面对 AIGC 的应用,不同公司会采取不同策略,比如自建大模型、fine-tuning(微调)和 embedding(嵌入)等,每种方式都有其优缺点。众安保险认为,中小型保险公司采用 embedding 是较为合适的路径,因为自建大模型需要大量的数据、资源和人力来标注,这对普通公司来说是难以承载的。此外,数据的合法性和合规性也是一个核心问题,尤其对于像保险公司这样的金融机构来说,客户数据的安全和隐私不可忽视,因此不可以拿客户数据来训练。


此外,由于 ChatGPT 3.5 已经无法很好地支持 fine-tuning,所以众安保险最终选择基于 embedding 的思路打造了自己的 AIGC 中台——灵犀,为企业提供了一套 AIGC 应用场景研发落地的标准范式,其 embedding 能力主要基于一站式文本嵌入、知识库切片的复杂性屏蔽,以及知识库向量化复杂度的屏蔽等。


蒋纪匀指出,将 AIGC 应用于保险业务场景的过程中还面临着一些比较大的挑战。

寻找价值点,“对话”不是唯一形式


首先,众安保险团队需要根据 AIGC 场景下的最佳实践进行产品化,并进行内部调优和提升。


对此,蒋纪匀进一步解释称,虽然 AIGC 在处理自然语言和逻辑推理方面非常强大,但若面对一些感性或过于复杂难以理解的问题,它可能无法给出准确的答案。这也是通用人工智能的一个比较显著的问题。


因此,团队首先需要对复杂问题进行理解和抽象,将其简化为大模型可以解决的问题。在这个过程中,众安保险团队进行了很多适应不同场景的提示工程和知识库的开发。这些提示工程和知识库的目的是帮助用户更好地使用 AIGC ,而不是仅依赖通用化的人工智能来解决问题。


对于上述挑战,蒋纪匀分享了一些实践经验。一方面,始终坚持以价值为导向,寻找 AIGC 在落地应用中的价值点。


“将 AIGC 应用到实际业务中是为了增加业务价值,而不是为了验证技术的可行性。”其指出,很多时候,我们可能会陷入一种误区,就是认为任何问题都可以通过 AIGC 来解决。然而,最核心的问题其实是要判断某个问题是否适合使用 AIGC 来解决。


而在此判断过程中,需要进行价值增量的分析和推演,判断是否简化了原有流程、提升了用户体验、增加了整体吞吐量,以及对业务价值和成本降低的贡献。如果最终答案不能令人满意,那就不应该在这个点上投入资源。


其次,要意识到对话是一种选项,但不是唯一的选项。虽然在使用 AIGC 时,默认的交互方式是对话,许多人认为只要不断与之对话并细化需求,最终问题就能得到解决。然而,在实际应用中,提示工程对微小变化非常敏感,而对大多数用户来说,掌握这些技巧并不容易。


因此,如果仅仅以对话的方式供用户使用,效率并不高。因此,众安保险的工程团队需要不断积累针对具体问题的提示工程,让终端用户无需重复输入;同时,设计一些图形化的用户界面,隐藏背后的复杂性,让业务人员专注于他们擅长的领域,而不必关注繁琐的工程问题。


简言之,众安保险主要通过封装和提示工程来聚焦和优化 AIGC 的回答,使其更加高效和专注于解决问题,而不会“胡言乱语”。

如何确保可靠性和安全性


除了针对特定场景定制化应用,AIGC 的另一大落地难点在于敏感信息的安全性


蒋纪匀提到,应用 AIGC 难免涉及到大量的数据和训练模型。由于在 ChatGPT 3.5 及以上版本中无法进行调优式训练,因此通常采用提示工程与 ChatGPT 进行交互。在提示工程中,需要向 AIGC 的供应商提供问题和一些上下文信息。然而,这种情况存在数据隐私泄露的风险。


为了解决这个问题,众安保险需要建立相应的数据安全保障机制。首先,如果直接让每个人直接调用 AIGC ,肯定会出现各种问题,因此众安保险在平台架构层面采取了一些封装措施,使其输入和输出更可控。


灵犀的产品架构划分为模型即服务层(MaaS 层)、大模型应用框架层和平台层,通过不同的分层能力为企业内部提供基础的模型服务和开发能力。而通过这样的封装,他们在输入和输出端便实现了安全可控的拦截机制。



平台能力方面,蒋纪匀首先介绍了审计能力,对于大模型服务的使用,他们需要审计用户输入的合理性以及模型服务的输出的合理性,这是在 AIGC 服务网关中必须具备的功能。如此一来,当发生风险事件时,可以根据审计日志进行追溯,这也有助于规范用户对 AIGC 相关应用的使用。


其次,敏感信息的检测和脱敏也是核心举措之一。为了应对敏感信息泄露的挑战,众安保险采用了正则表达式和敏感词知识库两种方式进行敏感词检测,以拒绝非法的输入和输出。这有效地规避了政治敏感、数据敏感和用户敏感信息泄漏等事件的发生。


第三,API 的安全性。众安保险要求所有的大模型服务 API 都必须进行身份验证和健全,无论是用户调用还是应用程序调用,以确保用户使用的合法性和可追溯性。

保险行业如何应对技术发展


谈及众安保险如何保持对技术的敏锐度和关注,蒋纪匀指出,保险行业一直注重数据分析和运用,但该行业过去主要使用老旧的机器学习范式,整体模型是分散的,并且需要从零开始构建,导致效率相对较低。


尽管一些头部的保险公司逐步采用机器学习平台和特征工程化平台等方法来降低模型研发成本,但基于这种范式的效率仍然偏低,限制了模型的发展潜力。


于众安保险而言,从 2010 年开始,其采用了文本加结构化数据的多模态模型的方式,显著提高了健康险理赔风控模型的性能。从 2022 年开始,众安保险还基于 Transformer 结构的用户行为序列模型,在头部互联网媒体的实时广告投放筛选模型中取得了传统模型无法达到的水平,并简化了在海量稀疏特征场景下的特征工程开发。


这些都是采用新的模型策略来应对技术发展速度变化、并在尝试过程中取得的进步。”蒋纪匀感慨道。


他亦再次强调场景驱动的重要性,“不能因为现在有了 AIGC 就认为所有场景都可以用 AIGC 解决,需要判断它是否适合。”


不同的模型在不同场景有各自的优势,企业可以通过对大模型的调优,或者提示工程来满足定制化需求。而一旦找到合适的场景,如何实施则因企业而异,这也是企业未来最重要的核心竞争力。


对于众安保险而言,目前他们在 AIGC 方面的应用和服务还没有对外销售或提供,仍处于自我探索阶段,需要持续研究如何更好地应用 AIGC 技术。


短期内,众安保险计划在智能营销、保险核心业务系统、研发运维一体化平台和数据产品等方面应用 AIGC。从中长期来看,众安保险将继续基于 AI 和 AIGC 构建具有差异化的核心竞争力。“只有具备差异化的核心竞争力,公司才能在国内竞争激烈的保险行业中脱颖而出。”


据悉,未来,众安保险还可能会孵化一些产品,并将这些成果输出到保险行业中。在众安保险看来,AIGC 的普及将缩小中小型保险公司与大型保险公司在 AI 技术能力方面的差距,同时也为中小型保险公司提供了“弯道超车”的机会。


AIGC 行业有哪些最新动态?Prompt 工程师、AIGC 辅助编程实践如何了?企业在算力优化、智能客服等表现如何?

 

本期《架构师》,我们围绕“ 天工开物 AIGC”主题,邀请了来自不同领域、不同行业的 AIGC 早期实践者进行分享,还汇集了最近备受关注的热门事件,尽可能为读者同步 AIGC 领域的第一手信息!点击链接即可下载电子书!



AIGC 课程推荐



极客时间《AI 大模型应用开发 · 实战营》首发,作者是深耕 AI 领域多年的技术专家彭靖田。

 

课程 8 周全程直播授课,覆盖硬件选型、大模型理论、 LangChain 开发框架剖析和落地实践,全程紧贴实际生产环境。现在市面上流行实用的,比如 AutoGPT 数字员工、翻译助手、智能销售顾问等经典项目,课程中都会带你动手实践。

 

不容错过的历史机遇,帮助你掌握利用大模型开发相关的 AI 应用的能力!

2023-07-12 10:335544

评论 1 条评论

发布
用户头像
how?

灵犀的产品架构划分为模型即服务层(MaaS 层)、大模型应用框架层和平台层,通过不同的分层能力为企业内部提供基础的模型服务和开发能力。而通过这样的封装,他们在输入和输出端便实现了安全可控的拦截机制。

2023-09-11 09:51 · 英国
回复
没有更多了
发现更多内容

为什么不建议你用 MongoDB 这类产品替代时序数据库?

TDengine

数据库 tdengine 时序数据库

uni-app进阶之Weex/nvue【day6】

恒山其若陋兮

6月月更

web前端培训如何提高React界面性能

@零度

前端开发 React

转转统一权限系统的设计与实现(前端实现篇)

转转技术团队

前端开发 umijs 权限设计

JDK8 HashMap如何实现?

源字节1号

软件开发

特定MPC问题包含哪些常见技术,有什么作用,什么场景需要用到?

Jessica@数牍

隐私计算 安全多方计算 特定mpc问题

java就业培训 | 面试官如何判断应聘者能力的,这一篇就够了

@零度

JAVA开发

技能速成!教你10分钟内在电脑上配置运行Hive Metastore和Presto

Alluxio

presto 技能 Alluxio hive metastore 初学者

阿里云CIPU下笔惊雷,方寸间书写中国算力故事

脑极体

2023年广州美博会-2023年春季广州美博会

Geek_0b38bb

美博会 2023年广州美博会 春季广州美博会 3月份广州美博会

java程序员培训 | 10年后程序员的薪资会怎么样

@零度

JAVA开发

InfoQ 极客传媒 15 周年庆征文|跨平台应用开发进阶(二十二) :uni-app Android APP上线准备工作汇总

No Silver Bullet

前端 签名 安全检测 6月月更 InfoQ极客传媒15周年庆

ABAP-调用WebService服务

桥下本有油菜花

abap

云堡垒机单机部署的优缺点讲解-行云管家

行云管家

网络安全 堡垒机 云堡垒机 堡垒机部署

Vue-12-条件渲染(可重复元素)

Python研究所

6月月更

个推CTO趣谈元宇宙:从概念、成因到核心技术

个推

数据智能 元宇宙

基于深度学习的水冷工作站加速遥感测绘应用研发

GPU算力

华为云携手鸿蒙,培养创新型开发者

华为云开发者联盟

云计算 鸿蒙 华为云

人才一站式服务平台开发,高层次人才管理系统

a13823115807

Javascript API自动代码生成需求征集

百家饭隐私计算平台创业者

JavaScript OpenAPI axios

探索质量外延 - 质量安全故事

QualityFocus

质量管理 软件质量与安全

大数据系统包含哪些组件?需要过等保吗?

行云管家

大数据 数据 过等保

多年亿级流量下的高并发经验总结,我毫无保留的写在了这本书中

冰河

并发编程 多线程 高并发 异步编程 6月月更

科创人·酷渲科技创始人华少:用双赢思维做产品、连生态,实现规模化发展

科创人

个推TechDay直播预告 | 6月22日,开启大数据降本提效的破局之道!

个推

大数据 分布式计算 分布式存储 标签

时序数据是如何被压缩的?具体有哪些可选择的压缩算法?

TDengine

数据库 tdengine 时序数据库

如何使用物联网低代码平台进行数据分析?

AIRIOT

物联网 低代码开发

Mysql数据库查询好慢,除了索引,还能因为什么?

C++后台开发

MySQL 数据库 中间件 后端开发 C++后台开发

Neat Syntax Design of an ETL Language (Part 1)

Bright

数据开发 ETL 大数据开发 EasySQL

帮助中心应该怎样设计?

小炮

易观分析《计算机视觉市场研究,2022》研究报告正式启动

易观分析

人工智能

探索大模型智能:众安保险基于AIGC 的应用实践_保险_罗燕珊_InfoQ精选文章