当前技术领域的发展速度可谓日新月异,为我们带来了前所未有的可能性。人工智能、大数据、云计算等前沿技术正以前所未有的深度和广度重塑着我们的生产生活方式。在人工智能的驱动下,我们能够更高效地处理海量信息,优化决策过程;大数据技术的崛起,使我们能够深入挖掘数据价值,洞察市场趋势;而云计算技术的发展,则为我们提供了弹性、高效的计算和存储服务。这些技术的融合应用,推动了智能家居、自动驾驶汽车、远程医疗等领域的显著进步,为我们的生活带来了诸多便利。我们有理由相信,随着技术的不断创新和应用,未来的生活将会变得更加美好。
然而,与此同时,技术的快速发展也带来了诸多挑战和风险。数据隐私泄露、网络安全威胁等问题日益凸显,要求我们必须重新审视技术的发展方向和应用范围。技术的更新换代速度不断加快,也要求我们不断学习和适应新的知识和技能,否则就可能被时代所淘汰。因此,在享受技术带来的便利时,我们也需要清醒地认识到其潜在的风险和挑战,确保技术的健康发展,避免技术失控带来的潜在危害。
为了深入探讨 2024 年技术领域的发展趋势,我们非常荣幸地邀请到了某金融企业普惠数字金融部负责人祝世虎博士,商汤 Copilot 技术负责人 张涛先生,以及 Thoughtworks 中国区 CTO 冯英睿先生,作为我们的特别嘉宾。他们将与我们分享他们在技术应用领域的宝贵经验和深刻见解。我们将深入探讨在过去的一年中 AI 的快速发展给工作带来了哪些挑战与惊喜、快速发展的 AI 技术又将如何影响技术服务市场。我们还会讨论在工作中团队应该如何高效地利用 AI 技术、2024 年大模型市场的发展趋势是什么,以及技术的快速发展是否会对我们的工作造成危险。这场圆桌会议将是一个探索大模型前沿信息、洞察未来趋势的绝佳机会。
2023 年 AI 在自身工作领域带来的最大挑战以及最大惊喜是什么?
王媛娅: 我想请问一下各位老师,2023 年 AI 在您所在的工作领域带来的最大挑战是什么?以及在过去的一年当中 AI 和大模型软件技术发展中最大的惊喜是什么?
张涛
最大的挑战的话我认为还是大模型的稳定性和效率问题,还是希望大模型在加持了一些工具之后能够为我们稳定的输出可信的结果。因为在很多数据处理或者其他的应用场景上,我们不仅仅是需要大模型在吃掉输入的数据之后只进行简单的“next token production”式的推理,而是希望大模型能够理解用户需求并通过严谨的代码生成处理逻辑,得到一个可信的结果。
冯英睿
我印象最深的一个挑战是在我们在跟客户交流和服务的过程当中发现不同的人对于 AI 的认知是有偏差的。无论是高看 AI 还是低估 AI,其实在应用和实施上都会带来一些不利的一些影响。另外一个比较大的挑战就是算力的挑战。因为算力的情况决定了大模型的成本与稀缺性,这也是落地过程中一直比较重要的一部分。惊喜的话,其实我觉得最大的惊喜应该就是保持了惊喜的常态化。纵观整个发展过程,无论是大模型的数据、算力还是规模,目前都还没有看到瓶颈,这种现象本身就是一个惊喜。另外就我个人来说的话,我对机器人领域的一些发展还是很惊喜的,也希望后续这一领域能有更大的发展。
祝世虎
从业务与应用的角度来看,在过去一年中面临的最大挑战是数据,最大的惊喜还是数据的问题。比如做大模型,如果训练的中能拿到好的语料,那大模型就一定能成功。从数据的保护角度来看,民法中对数据属于跟网络虚拟财产并列,是一种财产性的权益。后来颁布的数据安全法更是强调了数据安全的重要性。所以从法律对数据的表述来看,一是强调其权益性,二是强调其安全性。所以我认为数据流通问题是我们面临的一个重大挑战。
惊喜的话,在我看来是数据制度的变化。国家颁布的《数据二十条》带来了一个制度的变化,因为二十条强调的是数据的“数据的流通”。《数据二十条》对数据权益进行三权分制:持有权、加工权和经营权;数据的三分类:划分为公共数据、企业数据和个人数据。这为数据的管理、处理和商业应用提供了明确的法律框架,这使数据更加容易流通,也必将极大地促进科技的发展。
更看好哪些 AI 应用领域?这些领域又将如何影响技术服务市场?
王媛娅: 去年科技界似乎已经达成了一个共识,那就是大型模型的研发投入是巨大的。因此,大家更加看好大型模型的应用潜力。然而,目前来看,大型模型的应用尚未广泛普及,或者说还没有出现能够大众化、广受欢迎的爆款应用。所以想请教一下各位老师,您们更看好哪些新的 AI 应用领域?这些领域又将如何影响技术服务市场呢?
冯英睿
在我看来,AI 技术的发展对软件信息服务行业产生了重大影响,不仅仅提升了个人技能而且改变了我们的工作方式。从我自身工作的领域出发的话,我比较关注 AI 在软件开发方面的应用,尤其是去年 AI 的兴起让我们不得不重新思考其在软件辅助研发中的角色。实际上我们最初关注的是个人能力的提升,但后来逐渐认识到 AI 将全面影响技术流程和组织结构。尽管研发人员为很多业务构建了数据平台,但是我们却忽略了为研发本身建一个研发的数据平台。未来,随着人们认知能力的提升,我们是否可以从学习、思考、实践等多个层面,基于我们的研发数据资产实现更全面的进步。
另外随着 AI 技术能力的显著提升,我们不仅看到了它在提升业务能力方面的潜力,也意识到了随之而来的风险。AI 的强大功能无疑增强了传统非智能业务应用的能力,但同时,它也扩大了业务风险的暴露面。无论是在数据开发还是业务应用开发中,安全和其他相关因素的重要性变得更加突出。因此,对于专业人员来说,整体能力的要求提高了,特别是在安全性方面。这是我们从去年到今年特别关注的一些变化。
祝世虎
金融领域的核心应用就是要在政府监管的框架下,合规地管理风险,并为客户提供服务。那么面对这一基本情况,大模型在金融领域的关键运用领域就包括了监管科技、合规管理、风险管理和客户管理等。其中,智能风控尤为复杂,是这些应用中最为挑战性的部分。因此,我认为大模型在智能风控方面的发展不仅是必要的,而且是迫切的。
当前智能风控系统正面临四个关键挑战,也正是这些挑战推动着智能风控从被动到主动演变。首先,中小银行受限于数据,难以构建丰富的特征库,需要能在数据有限情况下建模的解决方案,而大型 AI 模型在这方面展现了潜力。其次,相对于为每个风险评估任务建立成本高昂的单任务模型,大型模型能整合多任务,提升效率并更深入地理解风险。第三,虽然构建大型模型本身成本较高,但它们的复制和运用成本较低,提供了通过利用这些模型能力来构建风控系统以节约成本的可能性。最后,随着新客户行为和黑灰产挑战的出现,传统基于历史数据的预测模型效果减弱,这使得模型对抗将成为一个持续的挑战。换句话说,智能风控领域需要大模型进行进一步的创新和自我革新,以适应不断变化的金融环境和提升风险管理的效率和效果。
张涛
两位老师所提及的内容中都涉及了使用大型模型进行编程的实践,这也是我目前专注的领域。我认为,大型模型在自然语言处理方面所提供的灵活性和创造性,结合编程代码固有的严谨性和形式化语言的规范性,能够有效地解决人们在日常工作中遇到的一些问题。因此,我对这一领域的发展前景持积极态度,并且正在投入资源进行相关研究。此外,我认为视频或图像生成领域的应用前景也非常广阔。随着移动设备上剪辑软件的普及,人们可以轻松编辑和发布短视频,这无疑推动了短视频行业的繁荣。AI 在视频生成过程中的应用,不仅提升了视频制作的质量,还极大地拓宽了创作的可能性。以往,视频的制作受限于工具的能力,而非人们的审美或创造力。现在,随着更先进的工具的出现,我们的创造力得到了更大的释放,个人的短视频制作能力也得到了显著提升。
王媛娅: 接下来问题是 AI 浪潮引导的大时代背景下,您的团队是计划如何迎战 AIGC 带来的冲击和挑战?能否为我们分享一下咱们的这个策略还有方向。
冯英睿
目前我们的团队主要专注于软件的研发,并致力于在当前时代大幅提升我们自身的能力,为未来的竞争和发展做好准备。同时鉴于应用层面的投资风险较高,我们不太会选择在该层面进行大量投资。相反,我们将重点投资于平台层和核心层,并以自助服务的形式提供给内部员工,从而降低尝试新方向的成本。
因为事实上在任何方向上的努力都有可能取得成功,因此我们的策略是提供自主能力,鼓励员工自发创新,同时降低员工尝试的成本以增加成功的可能性。所以说我们的目标是通过长线投资触发低成本的应用创新,并在此过程中让团队成员更深入地理解大语言模型和 AI 的应用,同时也帮助我们的客户取得成功。
祝世虎
我从两个观点说,第一个观点就是专门从大模型的角度来说,第二个观点就是从大模型的应用的角度来。
首先从大模型的角度来说,大模型的主要作用是提高整个社会的平均智能水平,而不仅仅是针对特定行业如金融的智能提升。说白了大模型的能力有可能被用于不正当的途径,比如黑色产业可能会更有“创意”地去利用这些模型。因此,我们面临的一个主要挑战不是大模型是否能帮助我们减少人力或提高效率,而是如何确保它们不被用于恶意目的。例如,在构建智能客服系统的同时,我们需要考虑黑色产业可能会利用同样强大的模型来创建用于发起欺诈投诉的机器人。这就要求我们在发展大模型时,不仅要关注其正面应用,还要积极防范潜在的滥用风险。
第二点在金融行业中,大模型的实施策略往往遵循一个分层的金字塔结构,该结构分为三个主要层次:
基础层:这是金字塔的底层,由领先的 AI 公司开发的通用基础大模型构成,这些公司拥有丰富的数据资源和强大的技术力量,为基础 AI 能力提供支持。
行业层:位于中层的是针对金融行业的大模型,由对银行业务和金融专业知识有深刻理解的公司基于基础层模型进一步开发,以满足金融领域的特定需求。
机构层:最顶层是各个银行或金融机构根据自身的具体任务和数据集定制的大模型,这些模型从行业级模型出发,通过个性化训练和微调,以适应特定机构的业务需求。对于中小型金融机构,由于科技预算有限,他们需要将资源集中投资在关键领域。这意味着他们可能不会自行构建基础大模型,而是依托于基础层和行业层的模型,并利用自身数据进行精细化调整,以确保模型能够满足特定的业务需求。
因此,中小银行应专注于以下三个核心领域的投资:首先是数据整合,即整合内部数据并辅以外部数据,以构建具有本行特色的综合知识库;其次是算力合作,考虑到算力是非核心竞争能力,银行应寻求成本效益更高的外包方式来满足算力需求;最后是模型精调,结合本行的数据和知识库,利用外包的算力资源对大模型进行迁移学习,以打造适合本行的轻量级推理模型。
张涛
其实在这个方面我们商汤是具备代表性优势的,因为我们的 AIDC 智算中心配备了必要的硬件基础设施,这使得商汤有能力进行大模型的预训练(Pre training)。这意味着我们可以从基础模型出发,构建具有竞争优势的 AI 能力。
商汤公司在硬件基础设施方面具有优势,这确保了我们在激烈的竞争中能够保持领先地位。我们目前专注的方向有两个:
真正地将数据与代码结合起来,开发能显著提高生产力和效率的实用工具。
在多模态领域进行探索。尽管目前的多模态模型大多数还称不上真正的多模态,例如从文本到图像或视频的转换,或者从图像进行视觉问答(VQA)等操作,这些仍然是简单的单模态到单模态的转换。然而,如果我们要在产业链中融合这些模态,就需要超越现有的工作流概念,实现对模态的统一理解,使大模型能够一次性完成复杂的推理任务。
目前,我们将这些处理步骤组织成工作流,或者视为上下文中的一部分,这与人脑处理的效率和效果相比还有很大差距。因此,我们认为对多模态模型的投资是一个重要的技术进步点,也是确保我们在技术上保持领先的方式。
除了硬件基础设施外,数据也是构建大模型的一个关键要素。因为即使是参数达到千亿级别的大模型,在预训练阶段使用的数据量实际上也是有限的,这意味着大模型仍然处于不断学习的阶段,潜力尚未被完全挖掘。因此,我们一方面需要不断准备高质量的数据,以支持模型的持续学习;另一方面,这些未挖掘的潜力为我们提供了空间,使我们能够对特定垂直行业的数据进行精调,或者在特定场景下优化模型。我们可以更有信心地将这些数据整合到模型中,而不必担心新数据会负面影响模型原有的基础能力。这是我们在新的应用场景中保持技术优势的一个重要策略。
没有技术背景但了解市场的人能否独立完成研发工作?现有的研发团队如何有效地利用 AI 工具?
王媛娅: 随着越来越多的工具问世,对于那些没有技术背景但深入了解行业场景和市场需求的非研发团队人员来说,他们是否能够独立完成研发工作?此外,现有的研发团队如何有效利用大模型和 AI 工具?我想听听各位专家对这两个问题的看法。
祝世虎
当前,我们见证了低代码和零代码平台的兴起,这对于几年前就开始出现的技术趋势来说是一个重要的发展。
首先,在我看来低代码和零代码平台提高了效率和效能。一些有经验的程序员开始使用低代码平台,这显然有助于提升工作效率。同时,对于那些不会编写代码的人来说,他们也可以使用低代码平台进行开发。然而,这里存在一个本质的区别就是:不会编写代码的人缺乏算法思维。当他们使用零代码平台时,由于缺乏算法框架,他们更多地进行统计分析而不是真正的计算工作。因此,仅依靠低代码和零代码平台是不够的,这可能会带来一些问题。
其次,大模型的出现引发了一个问题:大模型是否会取代程序员?如果未来没有人再编写代码,那么零代码和低代码平台是否会被大模型所取代?这是一个未来的疑问,目前还无法给出确切的答案。然而,大模型能够帮助解决的另一个问题是人机沟通,或者说业务部门与科技部门之间的沟通问题。当业务部门能够使用低代码平台或大模型简单地编写一些东西让机器理解时,无论是通过大模型让机器理解还是通过低代码平台让机器理解,我认为这都比通过科技人员作为中间层的效率更高。
冯英睿
在探讨低代码和传统编程方法时,我们必须承认,尽管它们具有一定的表现力,但在面对复杂逻辑时往往显得力不从心。大语言模型则提供了更高级别的抽象化能力,使我们可以更深入地处理复杂的任务。随着编程语言的发展,专门为执行特定任务而设计的、能够更有效地满足特定领域的需求的领域特定语言(DSL)就变得愈发重要。在大语言模型的加持下,它们可以根据用户的需求生成相应的高级语言代码,从而轻松应对复杂的任务。
另外在企业数字化和服务化的进程中,有效的服务化对于人工智能(AI)与系统之间的交互至关重要。AI 需要依赖现有系统进行实际操作,因此确保服务化的顺利实施是 AI 正常运作的关键。而企业需要程序员能够以高效、简洁的方式实现业务的数字化和服务化,从而为大模型提供更好的运行环境。所以说科技的投入对于降低系统复杂度是至关重要的。
再者微服务在业务与应用层的集成中起着至关重要的作用。大型语言模型有望在这一层面上取代许多传统的开发工作,减少了对软件库进行修补或调整的需求。
从业务角度来看,这种趋势是受欢迎的,因为它使获取数据和为企业提供服务变得更加便捷。对于研发人员而言,尽管这种变化可能对一些中间层开发人员产生影响,但只要他们理解大模型的特性,并学会如何增强对模型的理解、知识、推理和表达能力,他们就能适应这种工具的不断出现与迭代升级。
张涛
大语言模型目前仍然存在不确定性和不稳定性。因此,在实际应用当中,我们常需要结合编程语言来增强回复效果。同时在我们的实验中,我们让大语言模型处理数据可视化任务时发现它是能够高效地完成这一工作的。但这个过程中,我们也遇到了一些问题,这提示我们仍需对大语言模型进行进一步的优化和调整。
关于大语言模型是否会取代程序员的问题,我认为目前并不需要过分担忧。大语言模型的发展实际上降低了技术门槛,它使得非专业人士也能轻松利用其功能。它更像是一个强大的工具,而非完全取代程序员的存在。大语言模型的主要优势在于其生成能力,能够根据不同的需求生成相应的代码,从而满足用户的个性化需求。
总的来说,大语言模型的发展为编程领域带来了新的可能性,它使得编程更加普及和易于上手。虽然目前仍存在一些问题和挑战,但随着技术的不断进步,我们相信大语言模型将会在未来的发展中发挥更加重要的作用。
在 2024 年可能出现的大型模型市场趋势有哪些?
王媛娅: 接下来是我们讨论下一个议题,除了我们报告中所预测的趋势,还想了解一下各位老师认为在 2024 年可能出现的大型模型市场趋势有哪些。当然,这些趋势可以是近期的也可以是远期的。
冯英睿
我相信在 2024 至 2025 年间,大语言模型的能力将显著提升,而且将颠覆我们的认知。在 2023 至 2024 年的探索期,已经有许多企业尝试把大语言模型应用于实际工作当中去了。随着这些模型能力的增强,我们也将消除对它们在实际使用中的疑虑,大模型将是值得我们信赖的工作伙伴。
因此,我认为 2024 年将是大语言模型广泛应用的一年。正如我们之前讨论的,我们正在努力降低大语言模型的应用门槛,提供更多自助服务,以便在工作过程中帮助企业做好准备,大规模应用这些模型。我们期待在 2025 年到来之前,看到大语言模型在实际工作中的广泛应用。
然后我个人的一个看法是大模型在核心业务上的影响可能不会特别显著,我更倾向于它是一个在实际运用中更多地提升我们个人能力和认知的一个工具。而且它在业务实施过程中确实有效地辅助了我们提高工作的效率和质量,从而使工作更加顺畅和易用。
从技术角度来看,我对多模态技术的进展非常关注,因为它在应用场景和体验上具有巨大的潜力。例如,已经有人尝试使用大语言模型和生成式 AI 来重建与已故亲人的联系,满足人们在情感方面的需求。这已经是一个发展趋势了,并且有许多场景可以应用。因此,我会更加关注元宇宙和数字人这两个方向,因为它们对商业和个人消费者的价值可能才真正开始体现。
张涛
在应用场景方面,我能做出的预测相对较少,因为各个行业从自己的视角出发,都会发现各自的结合点。实际上,我们目前能期待的是更多地借用大模型的一些能力,在图像生成或意图理解等方面的单点提升,这就像刚才我们提到的多模态领域。
但是我必须要指出的是,尽管我们的远期愿景是让机器能够像人一样,至少像一个简化版的大脑来帮助我们工作,但即使是像 Sora 这样的大模型现在的多模态能力也是明显不如人类的。大家可能会觉得它好像理解了真实的物理世界,但实际上它离理解物理规律还差得很远。它只是从大量的训练数据中得到了合理的、概率性的数据分布。
但是我觉得这可以理解为牛顿提出物理定律之前,人们已经在他们的认知范围内利用这些定律一样,只是缺少一个人来总结而已。因此,虽然强人工智能时代还没有到来,但在这条路上我们看到的一些现有缺陷并不是阻碍,反而让我们看到了一些使 AGI 更好进化的途径。
祝世虎
我认为大模型可能会在一两年内进入金融机构的核心应用中,特别是在中小金融机构和中小银行的智能风控体系中。相比于目前银行使用的小模型,大模型有以下优势:
大模型能够以极低的迁移成本引入金融领域的能力。
大模型能够感知风险浓度,而小模型更侧重于风险排序和评级。
大模型可以事前感知欺诈态势,而小模型只能感知到欺诈事件。
大模型能够感知到风险背后的人为因素,这是小模型无法做到的。
大模型能够有效对抗新型的黑产攻击,而小模型容易被黑产攻击。
大模型可以预测和感知新型风险,而小模型基于历史数据预测未来的方法存在弊端。
尽管大模型目前也存在一些劣势,如计算复杂度高、可解释性差等,但大模型和小模型可以先以共存方式出现,即以大模型作为中控大脑,外围由可解释的小模型组成一个新型的智能风控体系。随着人们对大模型的认可度提高、解释性增强和复杂度降低,大模型极有可能取代传统的小模型。
另外从发展的角度来看呢,技术从来都不是平等的。因为中小银行在人力、设备和数据资源方面的投入是无法与大银行相比的,这自然就导致了技术方面的不平等。因此,在数字化转型的过程中,小银行和大银行之间的差距会越来越大,智能风控也是如此。但大模型的发展为中小银行提供了迎头赶上的机会。通过引入大模型的能力,中小银行可以在风控能力方面与大银行对齐,再凭借其机制相对灵活,在某些具体的风控场景上赶上甚至超越大银行是完全可能的。
大模型应用会更早落在哪些领域?
王媛娅: 非常感谢几位老师的精彩分享。那在这个分享的过程中,我们也看到评论区有一些留言和问题,第一个问题是想请教冯老师,您觉得大模型应用会更早落在哪些领域?或者说哪些领域会更有机遇一些?
冯英睿
我认为金融领域是大模型技术投资的热门领域之一。虽然政府监管、资金投入和大模型的准确率等因素会对大语言模型的投资产生影响,但随着大模型能力的提升,这些影响预计会逐步减少。
我想强调的是,在业务过程中,如果以知识密集型人才作为核心成本,那么这部分的影响将更为显著。而对于体力劳动人群的影响相对较小,实际上,这种影响主要是由机器人等其他技术引起的。所以另一个受大模型影响的行业就是软件研发行业。在软件研发领域,所有的输入和输出都可以数字化,而且其核心依赖于人力。因此,对于这一领域的相关工作人员,大模型的影响将更为显著。
在当前发展趋势下,未来前端类的工作是否会面对危险?
王媛娅: 接下来,我想请教张老师一个问题。在当前的科技发展趋势下,我们是否应该担忧未来前端和 UI 设计的工作岗位会面临危险?您是如何看待这一问题的?
张涛
实际上,我认为当前的情况与之前提到的低代码和视频创作工具的例子有相似之处。在大型模型出现之前,已经有一些基于 CRUD 的工具可供初级开发者使用。
在 UI 开发领域,人们可能会认为 screen2code 这种应用的出现对自己的工作构成了威胁。然而,在我看来,这种应用的出现实际上对我们是有帮助的。因为在以前,仅仅搭建和复刻一个界面可能就需要花费很多时间,而现在这些过程可以大大简化,为我们节省了时间和精力。这使得我们能够将更多的精力投入到更高级的工作上,例如 UE(用户界面)的设计和后台数据的交互等。这些领域是我们真正发挥专长的地方。
因此,对于这个问题,大家完全可以放松心态,因为这种应用的出现实际上是在帮助我们,而不是威胁我们的工作。我们可以利用这些工具来提高工作效率,从而更好地展示我们的能力。
训练大模型时高质量数据不足怎么解决?
王媛娅: 最后一个问题想请教一下祝老师,训练大模型时高质量数据不足是个问题,我们通常是怎样解决这一难题的呢?希望能听听您的经验和建议。
祝世虎
首先,在金融机构训练大模型这个方面,许多银行已经启动了相关项目。然而,银行的结构化数据虽然丰富,但对训练大模型的价值十分有限,因为单一的结构化账目数据不足以支撑有效的模型训练。所以,一些银行利用以前的公文等非结构化数据进行训练,可以在智能 OA、智能客服等方面带来实际帮助。
其次,在智能客服方面,银行需要整合内部数据,并适当补充外部数据。当然,大型银行可能具备这样的条件,但对于小型银行或算力不足的银行来说,我还是建议采用精调模型的方式,即利用自己的特色数据来迁移大模型的能力,而不是尝试独立训练一个大模型。因为自行训练大模型的投入巨大且风险较高。
以上是本次圆桌会议“2024 年技术发展趋势解读”的访谈实录,更多关于 2024 年中国软件技术发展洞察和趋势的完整内容请关注《中国软件技术发展洞察和趋势预测报告2024》欢迎点击链接,进行完整报告下载。
评论