写点什么

AI Agent 与行业融合应用的前景及创新应用案例 |InfoQ《极客有约》  

  • 2023-12-22
    北京
  • 本文字数:9711 字

    阅读完需:约 32 分钟

大小:4.76M时长:27:42
AI Agent与行业融合应用的前景及创新应用案例 |InfoQ《极客有约》   

嘉宾|周健,澜码科技创始人兼 CEO;周元剑,澜码科技联合创始人

特邀主持人|吴少杰,InfoQ 社区编辑、高级算法专家

 

在数字化、智能化的时代,人工智能(AI)已经渗透到各个行业领域,其中 AI Agent 作为人工智能的重要分支,正在引发一场前所未有的行业融合革命。AI Agent 以其智能交互、自主学习、灵活适应等特点,在各个行业中展现出巨大的潜力和价值。

 

作为一个比较新的概念,AI Agent 与行业融合应用的前景非常广阔,它们可以应用于各个领域,如医疗、金融、教育、零售等。本期《极客有约》,我们邀请到了澜码科技创始人兼 CEO 周健和澜码科技联合创始人周元剑,一同来探讨 AI Agent 目前的落地情况以及未来的发展趋势。我们还将为大家分享一些成功的 AI Agent 应用案例,以及探讨如何应对 AI Agent 应用中可能出现的挑战和问题,如数据隐私、算法透明性等。

 

InfoQ:请问下您是如何看待最近两年 AIGC 引发的技术变革的?

 

周健:我认为当前技术领域正在经历一场巨大的变革。过去,人们一直担心深度学习是否会面临瓶颈,但从 GPT-1 到 GPT-3,尤其是 ChatGPT 在去年 11 月 30 日推出后,社会很快达成了共识,如 Sam Altman 所说:“我们可以期待未来 5 到 10 年内,以大型模型为核心的算力将成为智能基础设施的主要驱动力。”这种算力将带来智能水平指数级的成本下降,正如 OpenAI 在过去一年中三次降价所示。这一趋势类似于过去 CPU 价格的下降,对产业发展具有强大的推动力,随着智能的发展,生产力将迅速增加。

 

另一方面,我们看到 OpenAI 正在不断提升算法和数据,人们猜测可能会有 Q*算法和 GPT-5 等新的发展。随着算法、数据和算力的增加,我们可以期待更强大的智能。如果我们将智能看作是通用编码能力的衡量标准,其提升可能呈指数级增长。这意味着在 ToB 和 ToC 领域,很多业务和事务都将发生重大改变。对于澜码而言,我们将迎来一场波澜壮阔的变革,这也是为什么我们选择这个名字。我们相信,就像海啸即将抵达海岸一样,这一变革将迅速改变我们的工作和生活。

 

周元剑:从一个更技术的角度来看。近两年,AIGC 似乎最初主要在图像领域崭露头角,例如 Stable Diffusion 和 Midjourney 等,这确实为我们带来了一些与之前的人工智能不同的地方。在我看来,以前的人工智能更多地属于理解能力,可能有助于解答选择题、判断题或填空题等。而随着 AIGC 的出现,它可能具备了一些处理问答题的能力。在最初的图像领域,这种能力可能还局限在某一种类型的问答题。

 

去年 ChatGPT 取得巨大成功之后,我们看到了大语言模型不仅在单一任务上能够进行问答,甚至可以在更通用的领域中执行问答任务,这基本上等于是智能的雏形。有了这个智能雏形之后,整个想象空间就被打开了。在以前,进行人工智能的整个流程非常漫长,从收集数据、训练模型到不断迭代,需要花费大量时间。如今,大语言模型具有一定的通用性,我们只需通过简单的提示工程,就能在一些常见或相对简单的场景中完成任务。这无疑将极大地提高生产力。

 

InfoQ:请简要介绍一下澜码科技的背景,为什么要选择 AI 这条赛道,您看到了哪些机遇?

 

周健:澜码科技的创建过程有许多偶然和机遇。去年年底,随着整个经济和投资环境的巨大变革,我当时就职公司的内部对 AI 业务的投资意见分歧较大。当时我们觉得公司可能不会继续发展 AI 业务了,于是考虑出来创业。

 

初期想法可能是在自动化方向上,因为在 RPA 领域,我们看到了很多自动化的潜力。恰好在去年 11 月 30 日 OpenAI 推出 ChatGPT,我们突然发现,传统自动化那些“代价”很大的事情在有了大语言模型的支持下变得容易实现了。虽然现在看起来似乎很容易,但实际上在这个过程中,我们经历了不少的迭代和反思。我们最初的想法是在大语言模型上构建一个超级自动化平台,这个方向至今仍然是我们正在努力实现的目标。

 

InfoQ:在您看来,AI Agent 到底是什么?它到底能解决什么技术问题?

 

周元剑:我认为真正的 Agent,其中一个关键点是“tool using”,即使用工具的能力,这是一种与众不同的技能。这也回到了我一开始提到的大语言模型具备了一些初级智能的特质。大语言模型带来的主要变革在于,它可以极大地释放其模型本身的能力,它不仅仅能执行单一任务,而且配合一些工具,比如调用 RPA、API 或其他工具,完成更智能的工作。以前,如果纯粹采用模型的方法,需要投入大量的精力才能完成任务。但在现有的大语言模型框架下,再加上一些工具,就能够轻松实现。这带来了一种独特的变革,如果脱离这种能力,大概就无法展现其智能的一面,技术上也就没有太多的特别之处。

 

周健:刚才我们主要从技术供给的角度讨论了一些关于大语言模型的变化。关于 Agent 的概念,实际上在 AI 领域很早就被提及了。有人追溯到过去的 AI 理论,比如马文·明斯基(Marvin Minsky)提出的“Society of Mind”,这个理论认为,人类在执行某些任务时,比如驾驶,实际上有时候是自动进行的,你不需要完全关注驾驶,还可以同时考虑其他事情,比如工作或与家人聊天。这里有一个重要的概念是 Autonomous Agent,即能够自主地执行任务。从这个自主执行的角度来看,我们未来的软件在某种程度上可能会脱离目前的束缚,会变得更像一个机器人。

 

实际上,未来软件应该是具备大语言模型的语言理解能力,能够听懂并与用户互动。同时,按照 Autonomous 的理论,软件自身具有一定的领域知识,能够规划并提出计划,评估计划的好坏,执行计划,并在遇到困难时进行调整,使其变得越来越智能。

 

从人类的角度来看,AI Agent 的未来是否有意识,是否会演变成硅基生命,或者是否会与人类相互竞争,这些问题可能还需要更深入的思考。但至少从社会的角度来看,不仅是人与 AI Agent 之间,还是 Agent 之间相互互动,无论是在生产还是消费端,这里都是一个充满潜力的领域。从技术的角度来看,刚才提到的事情从逻辑上是可以实现的,但是目前还需要更多的资本投入和商业形态的调整,以及相应的模式调整,以便让这些技术能够成功落地。

澜码科技 AI Agent 自动化平台技术实践

 

InfoQ:请老师和我们分享一下澜码科技的 AI Agent 自动化平台的落地情况。

 

周元剑:我们创建澜码科技的初衷是构建一个基于大语言模型的自动化平台,最终的目标是建立一个分为三个层次的平台。

 

首先是底层的基础 AI 能力层,然后是中间的 Agent 构建层,最上面是一些具体的业务应用层。在实践中,我们并不是一层一层地堆叠,而是强调与真实业务场景的对接。我们与客户紧密合作,了解他们的实际业务场景,并根据需求调整平台能力。

 

我们平台的核心是提供对话的形式,使用户可以通过自然语言进行交流。同时,我们也考虑提供一些 CUI 形式,结合自然语言和图形用户界面,以更高效地满足用户需求。在平台的搭建过程中,我们遇到了一些挑战,主要集中在两个方面:客户对私有化的需求和稳定性的问题。

 

客户通常期望平台能够提供私有化解决方案,涉及到数据时可能需要微调,这是一项复杂的任务。客户的数据可能不完整,我们需要与他们一起整理领域知识和数据。此外,私有化还涉及到算力的问题,我们提供了租赁机器的方式以提高灵活性。

 

另一个挑战是平台的稳定性和性能。我们采用合成式 AI 的思路,强调符号主义(基于符号和规则的方法)。这意味着我们需要预先梳理用户的知识结构和推理分析的结构,以引导系统。通过这种方法,我们能更好地解决大语言模型应用中的“幻觉”问题。

 

总的来说,我们的平台不仅提供基础的 AI 能力,还强调与真实业务场景的对接,以满足客户的需求。在私有化和稳定性方面,我们通过与客户合作、提供机器租赁和采用合成式 AI 的思路来应对挑战。

 

周健:我们从自动化的角度出发,早早就在关注如何将人的技能复制出去。我们意识到,当前的大语言模型需要评估其智能的边界。因此,我们与一些 AI Agent 框架进行了比较,例如 AutoGPT、MetaGPT 等,发现它们的理念与我们不太一样。它们主要基于大语言模型进行理解。

 

相比之下,我们更注重核心业务逻辑的编写,代码是有效的。我们坚持使用传统的工程方法,结合像 Java、Python 这样的代码和大语言模型,以获得最高的性价比。与其他框架(如 Langchain、MetaGPT、Dify)不同,我们关注业务逻辑的核心,强调在一开始就编写代码。从编码的角度来看,我们认为这是百分之百准确的方式。例如,无论是工资计算还是银行转账,我们都不愿意接受大语言模型的“下一个对话预测”带来的不确定性。因此,我们强调专家的知识技能应该以某种方式通过编码或传统数据库的方式实现,然后依赖大语言模型的语言理解能力进行互动,这样可以更好地对接那些技能水平可能不太高的一线业务员。总的来说,我们的理念是,通过让专家指导我们的 AI Agent,使其能够赋能一线业务人员,提高他们的水平。

 

InfoQ:目前,大模型出来后,AI Agent 的应用落地案例也层出不穷,两位老师如何看待这个问题?

 

周健:在这个领域,最主要的问题是底层技术突然迎来了一波红利,这是以前未曾发生的,可能是因为当今社会信息传播速度的加快,以及像 ChatGPT 这样的形态使得每个人都能够尝试使用,因此它带来的社会影响是巨大的。这实际上为所有基于大模型进行应用开发的人提供了巨大的优势,就像突然间开启了一个新的时代。目前很多大公司都在尝试探索它的边界和应用,这在某种意义上是一个红利。

 

反过来看,我们在行业内已经做了很长时间,但在实际落地时仍然遇到了很多困难。这里有一个误解,比如 AutoGPT 提到的“AI 毁灭世界需要几步”,实际上,AI 软件与传统软件非常不同,它并不是通过一个简单的标准路径就可以实现的。因为 AI 需要高准确率,就像当年深度学习在人脸识别时所面临的问题一样。虽然创建标准路径是容易的,但实际上在生产中使用起来是困难的,因为它对数据的要求和准确率要求都很高。

 

从结果来看,能够实现良好 ROI 的 AI Agent 并不多见。像微软的 GitHub Copilot,虽然广受欢迎,但实际上是亏本的。ChatGPT 本身也是亏本的。飞书、钉钉,我相信他们算过成本和利润后可能也是不挣钱的。因此,今天从商业成功的角度来看,AI 在实际应用中并没有变得非常普及。这需要大家共同努力。

 

从技术的新颖性角度来看,可能确实有很多创新,但从实际应用的角度来看,与大模型、ChatGPT 相比,AI Agent 带来的额外增值可能并不是那么明显。

 

周元剑:虽然我们可以找到一些 AI 落地的案例,但真正为企业带来额外的价值在实际中并没有如此明显。在这个领域,我们仍然面临着一些挑战,特别是在尝试解决企业实际业务中的问题时。这表明 AI 的落地并不是一件容易的事情。

AI Agent 落地的瓶颈是什么?

 

InfoQ:目前了解到的有哪些已经落地的 AI Agent 可以分享吗,有哪些技术瓶颈?

 

周元剑:从技术的角度来看,我个人认为目前在落地应用方面的瓶颈主要存在于这些大型模型本身,它们在理解和逻辑推理方面的能力仍然不够强。因此,在实际应用的过程中,技术团队通常需要为这些大型模型的不足之处提供支持。这种支持不仅仅包括算法和模型方面的调优,还可能需要产品设计和工程方面的能力来保障整个流程。

 

从另一个角度来看,落地不仅仅是技术层面的问题。我们在实际应用中也遇到了专业知识的问题。即使是一些专业咨询服务的客户,他们内部的专业知识可能并不清晰。因此,我们经常需要与客户合作,共同讨论和梳理专业知识的结构和应用方式。

 

在长期来看,我认为专业知识和 AI Agent 的结合是不可避免的。数字化专业知识的转化过程将成为 Agent 在实际应用中关键的一环。我了解到行业内的一些 Agent 主要集中在一些大公司内部。这可能是因为这些公司在技术团队、算力和数据方面相对准备充足,同时内部团队更容易推动知识梳理的工作,因此相对容易在内部实现。

 

另外,有一个有趣的案例是国外的一个 Agent,它能够帮助维护代码库。例如,它可以阅读 GitHub 上某个项目的 issue,并分析项目的代码,然后自动回复和编辑者的意图相关的内容,提供建议,甚至执行一些“魔法任务”。在 GitHub 上已经有一些开源项目正在使用这种 Agent 协助代码库的维护,这确实是一个令人兴奋的领域。

 

周健:我认为目前算力是一个相当大的瓶颈。由于一些原因,例如在紧急情况下无法及时交付,我们通常采取私有化部署的方式。一些应用场景对算力要求是起伏不定的,例如为客户生成汉语考试题目,或者支持银行员工销售保险。在这方面,我们遇到了一些具体的问题,比如在实施过程中观察到训练和推理之间的差异,以及在移动设备上可能出现的端侧算力与云端算力之间的调度问题。

 

此外,算力问题还受到地缘政治和供应链状况的影响,有些先进的显卡可能难以获取。企业内部的 IT 建设需要考虑如何搭建与大模型相关的技术设施,同时需要解决包括碳排放和绿色环保在内的可持续性问题。在商业运作中取得经济效益,仍然是一个巨大的挑战。我认为,解决这些问题需要至少 2~3 年的时间,才有可能看到一个能够达到及格标准的解决方案。

 

InfoQ:根据您们的观察,哪个行业目前在 AI Agent 商业化落地大模型方面走得最快?

 

周健:最终我觉得有两个方面,一方面,在大企业服务领域,资金实力较为雄厚。我们今天已经明显感受到信息化是数字化的基础,没有信息化就无法进行数字化。对于我们今天所提到的数智化或者 AI Agent,其前提条件必然是数字化程度相对较高的领域,这是可以逆向推导的。比如金融、能源、零售等行业,实际上都处于数字化程度相对较高的状态。在这种场景下,AI Agent 的实际落地可能会更加容易一些。

 

另一方面可能与个体相关,我们可以看到整个灵活用工正在从传统的劳动力市场,如快递、滴滴司机等,逐渐扩展到企业端。企业可能有一些工作是可以外包的,这也符合灵活用工的需求。以前可能会有猪八戒网这样的平台,它允许我们将一些工作外包出去。今天有很多政府园区也在考虑 GPT 技术的应用,即我们是否可以通过有限的专业人员,再通过大语言模型,提供一些人才法务等方面的支持,以支持中小企业的发展。

 

因此,在 SaaS 领域,将专业服务以 SaaS 化的方式快速复制出去,可能是一个更大的趋势。通过算力,将服务以“Agent as a Service”的形式提供,实际上相当于迅速释放了大量生产力。我们认为在一两年内,可能会形成一些重要的示范效应和案例。

如何规范地引导 AI Agent 的发展?

 

InfoQ:AI Agent 的伦理和数据隐私问题如何解决?我们应该如何规范和引导 AI Agent 的发展?

 

周元剑:我认为这个问题本身是比较开放的,目前还没有一个被广泛认可的解决方案。随着应用场景的增加,新的问题也会不断涌现。

 

对于数据隐私问题,脱敏和私有化是最基本的解决方案。我们可以允许系统和模型在客户的环境中运行,需要微调时,微调的数据和过程也可以保留在客户端。我们更愿意将计算资源移动到客户端,同时确保数据的安全性。通过这些手段,我们可以最基本地保障数据的安全。

 

在实践中,可能会涉及一些更详细的需求,例如权限管理和数据权限管理,这些与隐私相关。但是,如果数据已经进入模型,管理起来可能会比较困难。因此,通常我们会考虑一些策略,例如通过外部的支付方式,采用应用内购的方式,或者让 Agent 的设计和执行过程分离等。在我们的解决方案中,核心思想是将整个过程构建成一个多阶段的流水线,而不仅仅是一个 AIM(人工智能模型)。这样我们就可以在策略层面上对数据进行更好的管理。

 

通过这种方式,我们对模型的需求变成了让模型具有能力,比如解答问题、写作、总结文档等,而不仅仅是对知识数据的依赖。模型的能力是局部的,而全量的支持数据都保留在外部。在需要获取数据时,可以通过信息系统进行传统的获取方式,同时可以在信息系统上实施各种隐私保护和权限管理。

 

此外,随着算法流水线的开放,算法的透明度也得到了一些缓解。用户可以看到 Agent 是如何一步一步地工作的,每一步的输出都可以供用户审查,确保最终结果基本合理。

 

未来随着专家知识的沉淀和数据的积累,个体、组织可以选择性地开放独特且稀有的知识和数据,让他人去查阅。这种情况下,个体和组织可以通过让他人使用自己的知识来获取一定的回报。

 

周健:关于数据的问题,我们在实际的落地过程中遇到了一些挑战,特别是在初期阶段。我们最初考虑在法律行业进行落地,但后来发现可能会面临较大的困难。律师认为他们过去处理的案件是最核心的竞争壁垒,因此他们可能不愿意分享这些信息。正如我们之前提到的,专家知识的数字化是 AI Agent 落地的必要条件。如果由于经济原因或竞争原因,专家不愿分享知识,就必须设计相应的机制。

 

国家目前也已经设立了大数据局,对于数据要素和隐私方面也在不断进行探讨。在 B 端,不同的 Agent 可能扮演不同的角色,负责不同的任务,拥有不同的权限和责任。类似于企业中对于人员的管理、运用和安排,Agent 是否会有相应的权责利体系,是一个需要考虑的问题。因为在没有这些设计的情况下,Agent 只是一个程序,这时去处理隐私问题是非常困难的。Agent 作为一个能够获取知识、数据和做决策的实体,必然会涉及一些隐私问题。在处理 Agent 性质和相关隐私问题的过程中,需要进行更深入的讨论,以达成共识。

 

InfoQ:未来,AI Agent 的发展趋势和前景是什么?您看好 AI Agent 未来的发展吗?您认为多久我们会迎来 AI Agent 的大规模落地?

 

周健:目前大语言模型的能力还不够,我们期待它的实施门槛能够降低,让绝大多数人都能够使用。我认为这可能要等到至少 GPT-5 发布之后,在国外可能需要一年左右,而在国内可能需要 2~3 年的时间才能实现。

 

我认为,关键的能力之一是让大语言模型知道自己擅长和不擅长的领域。一旦大语言模型具备了这个能力,它就会更像一个“人”,即使只有高中水平的知识,但它知道自己的能力范围,这就为咨询顾问、企业内部专家构建一个自己的虚拟助手创造了可能。目前,一些知名人士和 KOL 都在尝试构建自己的虚拟助手。如果大语言模型真的具备了这样的能力,并且成为一种普遍的基础设施,那么我相信这样的应用将会迅速普及。

 

周元剑:目前,Agent 发展的主要制约还在于大模型本身的限制。然而,Agent 作为一种有效的治理承载形式,我相信未来它会逐渐发展壮大,尽管这可能需要一些时间。正如之前提到的,可能国外明年可能会有 GPT-5,使用起来会更加便捷,而国内可能需要更多时间。但无论如何,我相信那个时刻终将到来。

 

InfoQ:对于想要进入这个领域的公司或个人来说,需要了解哪些相关知识?您有什么意见给到这些人吗?

 

周元剑:这个问题涉及到个体和组织之间的相关性,因此很难提出通用的解决方案,因为每个人或组织的需求和情境都可能有所不同。然而,从技术的角度来看,对大语言模型算法的一些基本了解是必要的。尽管不要求深入进行类似算法的工作,但了解其基本原理,对于在技术判断中理解模型的边界非常有帮助。

 

此外,了解与 Agent 相关的应用知识也很重要,目前业界最流行的是 RAG。关于这方面的知识,有很多可以学习的资源,包括经验总结、文献以及与业务相关的学术论文。阅读一些 InfoQ 的文章也是一个不错的选择,因为它们通常总结得比较全面。

 

另外,与业务紧密联系也是至关重要的。无论使用什么技术,最终目的都是解决业务问题。脱离业务的技术发展是缺乏基础的。因此,深入了解业务需求,与业务团队密切合作,将有助于更好地应用技术解决实际问题。

 

周健:这次的变革实际上是一个底层的颠覆,我们公司的起名来源于波澜壮阔的代码,象征着激荡的变化。在这个高速变化的时代,不变的是高速的变化。在真正领先的 AI Agent 领域中,知识的迭代速度会更快,大约两、三个月就可能刷新一次。

 

要进入 AI 领域,定制 AI 是一个关键的步骤。在过去的经验中,我们学到的是尽量不要做过多的功能,更关注数据集和准确性。与以前编写工程代码时编写测试用例一样,你应该关注采样的数据集是什么样的,它的分布是什么样的,以及训练出的 Agent 的表现如何。

 

新的软件越来越像人一样,因此设计 AI Agent 或者像人一样的软件仍然是重要的。了解人是如何完成任务、学习、进步和成长,将有助于设计人机交互。从命令行到 GUI,交互方式一直在不断摸索。在新时代,我们需要思考人与机器之间如何进行更智能的交互,结合命令行、GUI、自然语言理解等技术,形成全新的交互方式。

 

最后,我们可以从科幻小说中借鉴一些设计思路,例如《钢铁侠》中的贾维斯。这个时代有点像文艺复兴,我们需要重新思考人与机器之间的互动,努力创造出更好的 AI Agent。

 

InfoQ:这里有个观众提问:“ AI Agent 跟 RPA 在能力上有什么区别?”

 

周健:它们之间的差距很大。RPA 相比之下有点“傻”,只能执行预定的任务,比如通过 Java 或 Python 进行简单的循环和变量设置。而大语言模型则具有更强大的能力,它能够真正理解对话,生成行动计划,具有更强的通用性和复用性。

 

InfoQ:这里有个专注于开发垂直行业的对话机器人的观众,他的方法是基于本地知识库构建。他希望通过采用一些技术手段来提高系统提供精确答案的准确度。老师有哪些建议可以帮助解决这个问题?

 

周元剑:从技术角度来看,我们目前更倾向于采用一种合成式 AI 的方法。这意味着,首先对所涉及领域的知识进行一定的理解或结构化整理,这有助于更好地完成当前的任务。举个例子,法律领域的文档通常具有特定的结构,是按条目编写的,这是一个独特的特征。整个文档可以根据这些条目进行结构化处理。另外,对于报表等文档,其结构可能涉及行和列,有标题和表头信息。这些表头信息可以单独提取,并作为关键信息用于抽象或关键词匹配等任务。

 

对于文档 Agent,当进行切片时,你需要关注是否存在更好的策略来合并最相关的切片,这有助于提升效果。此外,在传统搜索中,采用多路召回的方法,不仅仅通过单一向量进行搜索结果的获取,还可能结合其他关键字或方式,进行综合排序。

 

InfoQ:有观众问:“AI Agent 之间如何协同工作?”

 

周健:我认为目前处于很早期的阶段,企业服务可能会划分为不同类型的功能 Agent。在我们目前的领域中,我们更多地专注于标准操作流程的自动化,涵盖数据、文档和应用流程等不同方面。

 

在这个设想中,一些 Agent 专注于处理数据,而另一些专注于分析流程。例如,数据 Agent 可能负责回答与数据相关的问题,而文档 Agent 可能负责整合文档。这也引出了一个关键问题,即如何在团队中设置不同角色,并将数据和流程的权限进行切片,以分配不同的职责。

 

尽管我认为目前还处于较早的阶段,但在更抽象的层面上,我觉得重要的是因为单个 Agent 在实现上可能做得不够出色,在技术本身或概念层面上,多个 Agent 的实质意义尚不清晰。将两段代码组合在一起实际上等同于一段代码。因此,对于多个 Agent 的概念,我认为在技术和概念层面上仍然需要更深入的思考。

 

周元剑:我赞同这种观点,即在当前阶段,大语言模型的智能水平尚未达到足够的程度。为了提升端到端效果,可能会考虑引入一些类似反问者或审查者的角色,并使多个角色协同工作以更好地完成任务。然而,在当前大语言模型的能力尚不强大的情况下,这样做可能事倍功半。你可能会花费大量时间来调整不同部分的性能,协调它们的合作方式,但这过程会很耗费精力。举例而言,如果单个模型的准确率只有 70%,那么将三个模型串在一起可能会导致总体准确率更低,因为错误的概率会更高。

 

另外,即使你投入更多精力进行调优,仍然存在一个风险,即大语言模型的能力会不断提升。我们有过这方面的经验,使用了类似的思路,例如在使用 GPT-3.5 时,尝试通过多个 Agent 协同工作来完成任务。然而,当我们使用新模型 GPT-4 时,发现之前的系统,即使经过大量努力进行调整,其结果可能还不如 GPT-4 效果好。因此,我们对内部采用多个 Agent 协同工作的做法持谨慎态度。

 

嘉宾简介:

 

周健,澜码科技创始人兼 CEO。毕业于上海交通大学计算机系,在校期间荣获 ACM 国际大学生程序设计竞赛的世界冠军,是首个在此项竞赛夺冠的亚洲团队成员。曾在谷歌和阿里云从事搜索领域的工作,涉及底层基础分布和基础设施相关的工作。后加入依图,是公司的第十位员工,负责开展 AI 工程和产品方面的工作;也曾在 RPA 公司弘玑担任 CTO。2023 年初创业,创立了澜码科技公司。

 

周元剑,澜码科技联合创始人人。本科毕业于上海交通大学。作为依图科技的第 6 号员工在依图工作 10 年左右,工作领域涵盖算法、工程、运维、产品经理,以及 SaaS 业务技术等方面。主导了多个 AI 落地相关业务,对于这一领域有深刻的理解。在过去的两年在弘玑工作,负责 AI 产品线。今年初随周健一起创办澜码,投身新创业项目。

 

2023-12-22 10:008984
用户头像
李冬梅 加V:busulishang4668

发布了 982 篇内容, 共 586.5 次阅读, 收获喜欢 1139 次。

关注

评论

发布
暂无评论
发现更多内容

提高 C# 的生产力:C# 13 更新完全指南

EquatorCoco

C# 数据结构 算法

使用IPIDEA海外代理助力宠物跨境电商

热爱编程的小白白

程序员,到底要懂多少业务?

秃头小帅oi

你知道程序员再过几年会没落?

高端章鱼哥

如何在 SpringBoot 中优雅的做参数校验?

快乐非自愿限量之名

Java Spring Boot 后端

全面解析:抖音商品列表数据接口的使用与集成技巧

tbapi

抖音 抖音商品列表数据接口 抖音商品列表数据采集 抖音API接口

Kubernetes集群的ETCD分布式数据库高可用原理解析

inBuilder低代码平台

开源 云原生 Kubernetes, 云原生, eBPF

涨见识了!脱离vue项目竟然也可以使用响应式API

快乐非自愿限量之名

JavaScript Vue 前端

Vehicle + UNS : 为 SDV 提供全生命周期的数据可互操作性

EMQ映云科技

车联网 mqtt 软件定义汽车 emqx

发现了一个优秀的在线表格

大师兄

前端 vue cli JavaScrip

《饿殍:明末千里行》PC+手机版分享,高达97%的好评率。

你的猪会飞吗

单机游戏

【YashanDB知识库】使用select * 创建的物化视图无法进行查询重写

YashanDB

yashandb 崖山数据库 崖山DB

火山引擎VeDI数据技术分享:两个步骤,为Parquet降本提效

字节跳动数据平台

云服务 数据平台 火山引擎 数据飞轮

澳鹏Appen入选大模型产业链基础层图谱及案例研究

澳鹏Appen

大模型训练 大模型 百模大战

如何借助逻辑数据编织平台实现“数据优先堆栈( DFS )”

Aloudata

数据仓库 数据虚拟化 数据编织

大咖公开课 | 大模型场景讲解以及测试方法

测吧(北京)科技有限公司

测试

【YashanDB知识库】设置归档日志上限,但归档日志没自动清理,导致磁盘空间满

YashanDB

yashandb 崖山数据库 崖山DB

项目管理优化:7款顶级多项目软件解析

爱吃小舅的鱼

项目进度管理 项目进度管理软件 项目进度管理工具

智胜未来:国内大模型+Agent应用案例精选,以及主流Agent框架开源项目推荐

不在线第一只蜗牛

人工智能 AI

写报告 进图谱 做演讲,可信数据库大会上亚信科技AntDB可太忙了

亚信AntDB数据库

HAProxy 可观测性最佳实践

观测云

HAProxy

云原生代表技术(1)-不可变基础设施

虚实的星空

电商平台集成:京东商品详情API的应用实践

技术冰糖葫芦

API 文档 API 测试 API 优先 API Hub

MySQL 备库可以设置 sync_binlog 非 1 吗?

爱可生开源社区

MySQL 数据库 MySQL主从复制

大咖公开课 | 大模型场景讲解以及测试方法

霍格沃兹测试开发学社

商品图片与详情描述:1688 API返回值的重要部分

技术冰糖葫芦

API 文档 API 测试 API 优先 API Hub

AI Agent与行业融合应用的前景及创新应用案例 |InfoQ《极客有约》   _生成式 AI_李冬梅_InfoQ精选文章