AICon 上海站|90%日程已就绪,解锁Al未来! 了解详情
写点什么

Fellou 发布业界首个 Agentic 浏览器:侧重端到端自主行动,融合 Browser、Agent、Workflow Automation

  • 2025-04-22
    北京
  • 本文字数:6321 字

    阅读完需:约 21 分钟

大小:3.33M时长:19:22
Fellou 发布业界首个 Agentic 浏览器:侧重端到端自主行动,融合 Browser、Agent、Workflow Automation

得益于自由开放的 Web,浏览器成为我们探索数字世界的核心入口,社交、娱乐、信息获取、生产力,它几乎可以承载我们全部的数字生活。

 

然而,在办公室中,键盘的敲击声此起彼伏,鼠标的点击声不绝于耳。每天,我们平均要打开 40 个网站、切换 26 个标签页、填写 20 张表单。浏览器本该是我们的助手,却让我们成了数字世界的劳工。那些本该探索世界的指尖,被困在重复操作的循环中;那些本该用于创造的时间,被浏览器分割成信息碎片。

 

当 AI 已经开始深刻改变我们的工作与思考方式,浏览器这个「入口」本身,似乎还停留在上个时代。

 

时代需要一个既能提升传统浏览效率与体验,又能智能执行复杂任务的新浏览器。他理解你的意图,将繁琐的点击化为一句简单的指令,将多个网站整合成智能工作流,在你需要时提供恰到好处的帮助,比如表单自动填充、标签页自动管理;同时,它也拥有强大的「自主行动力」,在你授权下,作为一个可靠的助理,为你处理那些跨越多个网站的繁琐事务。

 

这不仅是浏览器的升级,更是一场让工具更好服务于人的变革:使人类挣脱「工具的工具」的枷锁,让产品回归生产力服务本质,让每个人重获时间的主权。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    Fellou 发布业界首个 Agentic 浏览器


    浏览器在全球有 30 亿用户,几乎是所有用户最常用、最熟悉的应用。无论是查看信息、观看流媒体,还是使用 SaaS 应用,浏览器都承担了「总入口」的角色。在全球 SaaS 生态下,浏览器已发展为类似操作系统的地位。例如,Chromebook 的 ChromeOS 直接将浏览器作为主要用户界面,强调云端存储和多重安全防护,体现了浏览器在操作系统层面的重要性。

     

    浏览器的形态已经多年未变,但在大模型和 Agentic AI 的推动下,浏览器正从「信息浏览工具」升级为「行动与工作流聚合智能体」。这为新玩家带来了类似于 iPhone 颠覆诺基亚的机遇:只要抓住「浏览器+ AI +工作流」这三个关键要素的融合,并为用户提供颠覆性的交互与自动化体验,就有可能在这个看似饱和的市场中实现弯道超车。

     

    以往,浏览器分为三种:


    • 传统普通浏览器:侧重信息浏览,目前浏览器的最常见形态;

    • 对话式浏览器(Conversational Browsers):侧重信息交互与内容生成,侧重于通过 AI 辅助实现信息交互与内容生成。例如 Microsoft Edge(Copilot)、Opera One + Aria、360 AI 浏览器、豆包和部分 Arc 版本,均以自然语言交互、问答和内容摘要为主,但整体操作仍由用户主导;

    • 搜索优化型 AI 浏览器(Search-Optimized AI Browsers):侧重深度信息检索和摘要,通过 AI 技术对网页内容进行整合和生成精准答案。例如 Perplexity Comet 和新夸克均以深度检索和内容整合为主要卖点,提供精准信息查询服务;

     

    而 Fellou 尝试开创第四种浏览器:Agentic Browser 行动型浏览器,侧重端到端自主行动,一种集成了具备思考和行动能力的智能代理的浏览器,其不仅展示信息,更能根据用户高层目标自主拆解任务、跨界操作并完成端到端任务交付。专为忙碌的上班族、知识工作者、创业者以及高效工作者打造,让你不再为重复性网络操作浪费宝贵时间。只需一句话指令,Fellou 就能将繁琐的在线任务自动化、调研的自动化——无论是查找资料、提交申请、在线下单还是研究新领域,调研产品或者行业,都将变得轻松快捷,真正让你体验到人工智能时代的高效服务。

     

    换句话说,Agentic Browser 不仅是一个信息展示和交互的浏览器,更是一个能够主动替用户执行复杂任务的数字助手。用户只需要提出一个意图或目标,浏览器内嵌的智能代理便能自主进行信息检索、数据整合、操作执行等多步骤流程,从而大幅提升用户的生产力。

    融合 Browser、Agent 和 Workflow Automation


    Fellou 将 Browser、Agent、Workflow Automation 三者整合成 Agentic Browser:


    1. Browser(浏览器):负责最广泛的 Web 内容访问与渲染,以及对操作系统、文件系统、命令行与本地应用的直接控制;

    2. Agent(智能体):负责「思考」和「决策」,基于 LLM 或其他算法来理解上下文、规划行动;

    3. Workflow Automation(工作流自动化):负责「执行」和「工具化」,能调用不同的 API、插件、脚本,实现跨网站、跨应用的自动化操作,并能与 A2A、MCP 等协议集成。



    这三者的结合能够创造出「可思考、可操作、可执行」的闭环,让浏览器不再仅仅是信息载体,而是一个具备行动力与自动化能力的「多功能工作平台」。此外,Fellou 还在传统浏览器的基础之上增加了对本地电脑的控制能力,使其成为互联网与本地空间的桥梁,在处理用户任务时同时可以拥有 Web 应用与本地的 Context,在数字世界内拥有无限的行动空间和跨平台任务处理能力

     

    这种全新架构使得 Fellou 从传统的信息展示工具转变为真正「帮你工作」的智能生产力平台,完全解放用户双手,让复杂任务在毫无干预下自动完成,实现从意图到结果的一站式交付。

     

    Fellou 主要由四大核心能力组成:


    1. 深度行动(Deep Action):这是使 LLM 从「问什么都会」,到「干什么都行」的关键能力;

    2. 主动智能(Proactive Intelligence):这是使 Agent 从「被动响应需求」到「主动为用户提供行动推荐和结果建议」的关键能力,换句话说,这项能力使得用户不需要写出非常明确的需求,Fellou 仅通过用户的行为就可预测用户想要完成的事情,最终将结果交付给用户;这种主动智能还会为用户形成个人知识库(Personal Knowledge Base),从而强化用户个性化体验,增强知识自动化整合

    3. 混合影子空间(Hybird Shadow Workspace):这是不抢占用户电脑,且能根据不同任务类型获取用户上下文、了解用户、增强用户体验和与 Agent 协作体验的关键技术;

    4. 智能体网络(Agent Store):这是使用户能享受到更多垂直 Agent 能力的关键生态网络,他连接了垂直与通用,使有垂直 Know-how 的 Agent 创作者可以向全网用户开发、共享自己的经验、知识和工作流

    深度行动(Deep Action):从「信息获取」到「行动聚合」


    Fellou 不同于市面上任何传统浏览器和 AI 浏览器。传统浏览器主要用于展示内容,用户需要手动点击、复制、填写表单等一系列重复性操作,而这些操作往往分散在多个标签页和不同平台之间,无法实现高效的跨界整合。


    Fellou 推出了独特的 Deep Action 功能。用户只需要一句话,Fellou 就能自动解析指令、智能拆解任务,并跨多个网页和系统调度操作,从数据采集、表单填写到最终报告生成,整个复杂工作流均能实现一站式无缝交付,让您彻底摆脱繁琐操作,释放双手,专注更高价值的决策与创新。

     

    实际上,用户在浏览器上的行为可以大致分为两类:


    1. Search ——用户通过浏览海量网页来收集信息、分析数据,获取所需知识,Fellou 可以批量并行化一次性辅助用户阅读大量网页信息;

    2. Workflow ——用户需要依靠一系列序列化操作完成具体任务,如在线购物、预订会议、填写报告、交互提交等,Fellou 可根据用户需求自行规划任务并自主行动;

     

    为验证生成的报告效果,Fellou 团队找了 60 个用户测评,分为五大维度(准确性、描述清晰性、思考深度和广度、可读性),和 Deep Research、Manus、Perplexity 做了打分比较,Fellou 综合评分为最高,其中可读性>表述清晰性>准确性>思考深度和广度



    同时,从执行速度层面来看,Fellou 也优于其他相似产品,在 49 个任务中,Fellou 的平均耗时仅为 3.7 分钟,相比较 Manus 的 18.6 分钟和 OpenAI DeepResearch 的 11.5 分钟皆有显著的速度优势:



    Fellou 的自动化 Workflow 依托于 Fellou 团队自研的浏览器使用框架 Eko,其以生产级可干预特性、更快的执行速度、更低的执行成本(Fellou 单次任务的执行费用在 3 毛人民币到 3 元人民币)显著优于同类产品:


    Eko 框架在执行网页任务时平均速度比 Browseruse 框架快 2.83 倍



    在生产过程中,Hook 系统允许实时监控任务执行,并可以通过人工或 AI 干预来调整行为

    更多用例可访问 fellou.ai/use-cases 查看。


    相比起传统的对话式浏览器 (Conversational Browsers),Fellou 核心优势包括:


    • 深层私有访问:像 Perplexity 这类 AI 答疑搜索工具只能回答问题,无法登录并浏览私密内容。而 Fellou 的深度搜索可安全地访问需登录的网站(如论坛、职业社交网等)并进行搜索,发掘其他 AI 浏览器错失的信息。

    • 标签页作为上下文记忆:Fellou 允许与用户共享本地工作空间,能够准确捕捉并用户操作的标签页作为任务处理的上下文,实现跨网站信息连续性处理;

    • 影子空间:Fellou 通过独立的沙箱虚拟化环境同时操作多个网页,确保任务执行之间、智能体和用户之间不互相干扰,安全高效,增强用户体验;

    • 并行化、自动化任务编排:内置 Agent 模块不仅解析用户指令,还能自动拆解任务、规划操作路径,优化多步骤工作流,并行化执行;

    • 可视化调研呈现:集成智能分析报告功能,可以将多网页信息整合并以直观图表和摘要形式呈现,方便一键共享和决策;

    主动智能(Proactive Intelligence):浏览器预判你的需求,从「交付信息」到「交付结果」


    Fellou 正在重塑人工智能代理与人类之间的生产关系,不再满足于被动应答,而是以一种充前瞻性的方式主动为用户服务,为用户提出需求,由用户来原则。不同于传统产品只能被动响应用户指令,Fellou 利用先进的深度语义理解和上下文记忆技术,实时捕捉用户在各个网页上的操作轨迹,并不断积累用户的行为数据和操作习惯——从常访问的网站到重复执行的任务,都成为它记忆的一部分。这种「数字记忆」不仅仅是数据的堆叠,而是一种对用户工作模式和习惯的深刻洞察。


    正因为具备这样的能力,Fellou 能够超前识别用户潜在的任务需求:当它察觉到用户即将进行某项重复性操作,或发出一个隐晦的需求信号时,Fellou 会主动发出询问,提醒用户是否需要提前介入或直接接管任务。用户无需再花费精力详细描述需求,而能感受到 Fellou 似乎早已预知下一步,并用温暖而精准的方式将服务送到用户手边。


    这种主动服务不仅显现了人工智能技术的演进,更是一种全新的数字劳动体验:在 Fellou 的陪伴下,用户仿佛拥有了一位善解人意的数字伙伴,它不仅能完成任务,更懂得关怀用户的日常压力与高效需求。正如哲学家所探讨的「技术即关怀」,Fellou 以超越传统工具的智能和敏感,赋予了数字工作一种温度和情感,让生产力的提升不再冰冷,而是充满人性化的温情与智慧。

    混合影子空间(Hybird Shadow Workspace):从「AI 抢占人类电脑」到「人与 AI 和谐相处」


    Fellou 非常重视 Agent 在终端用户实际生产环境中的表现,Fellou 认为 Agent 的执行环境需要划分为本地、本地虚拟化和云桌面的方式,用以处理不同的任务。比如,用户对 Fellou 说「打开我的日历,新建一个周六早上 9 点的健身日历」,这种单步骤 20s 以内就可以执行完成的任务,可以放在本地执行,用户能容忍短暂的对用户电脑的抢占;而像比如「整理我过去一周的日历和邮件,整理成 Todo」这种既依赖本地上下文,又是长程的任务,适合放到本地的虚拟化环境中执行,这种环境即被称作「影子空间」,他可以做到在 Agent 执行任务时不干扰用户使用电脑,同时用户还可以看到 Agent 的执行进程并在适当时刻加以干预;而对于那些不依赖本地上下文,又是长程的任务,如「在 Github 上找 Transformers 的 Issue 列表,分析其目前存在的 Bug」,则适合放在云桌面中运行,这样就能做到用户关掉电脑外出后还可以在手机上与 Fellou 交互。


    影子空间的核心技术基于操作系统虚拟化,通过构建精密的虚拟容器实现环境高效隔离。在此虚拟环境中,Fellou 得以安全运行,同时共享 Session 会话信息,从而实现网站的无缝免登录访问。AI Agent 在虚拟环境中模拟人类的鼠标与键盘操作,驱动 Fellou 执行各类复杂任务,大幅提升工作效率与用户体验。

    智能体网络(Agent Store):从「人和人之间的 Connection」到「人和 Agent 之间的 Connection」


    在 Fellou 的世界里,智能不仅仅是技术产物,而是一种全新的互动方式,就像人与人之间的连接。正如创始人谢扬所言,人与智能的关系应当建立在相互选择、深度互动与彼此支持之上。Fellou 致力于打造一个自然且开放的平台,让每个用户都能将自身的经验和能力沉淀为一个独立的垂直 Agent,这些 Agent 不仅可以帮助自己,更能在社区中共享、相互学习,为他人提供智慧服务。


    在这个平台上,每位用户不仅能发布自己独特的经验,打造个性化的对话智能体;同时,也可以将自己在执行某项任务过程中形成的操作序列封装为一个完整的工作流,供其他用户直接调用,实现真正意义上的行动智能体。这里,每一个 Agent 都是智慧与经验的结晶,是人类对自身能力的一种数字化沉淀和再造。


    对于高代码开发者,Fellou 提供了 Eko Framework——一套通过自然语言设计和部署高效 Agentic Workflow 的开发框架,同时是开源框架 Browser use 的生产级进阶版本。Eko 允许开发者以自然语句编写、调试和优化工作流程,将创意迅速转化为智能化操作模型。在 Eko 的支持下,开发者不仅可以自定义工具,实现全新的行为模式,还能通过 Hook 机制在 Agent 执行过程中动态干预和调整,从而保证每一个工作流都足够灵活、精准并符合实际生产需求。


    这一智能体生态体系不仅打破了传统浏览器只是被动信息展示的局限,更将智能与人类的交互提升到了「共生」层面。Fellou 让每个人都能成为智能生态的一部分:你可以将自己的经验沉淀为 Agent,既为自身赋能,也为社区贡献智慧;你可以通过开放平台不断发现和学习他人的智能方案,共同推动整个生态的进化。正如人与人之间通过交流建立起彼此的信任和合作,Fellou 正在构建一个以「智能体」为媒介的全新数字生态,让技术与情感、经验与创新在这个平台上自由流动,携手赋能每一个用户。

    混合反馈的经验学习(Hybird Feedback Experience Learning)


    生产级的智能体一个关键挑战在于:如何让智能体不仅依赖环境交互来持续优化行为,还能从结构化的失败反馈中获得改进。我们提出了一种混合反馈经验学习(Hybird Feedback Experience Learning)框架:当基于浏览器的智能体在执行任务过程中失败——无论是由于查询模糊、工具使用错误,还是规划错误——都会触发一个次级分析机制。在这一阶段,人类监督者或大型语言模型(LLM)将对失败的执行轨迹进行回顾性分析,从中提取出可操作的经验洞察,例如误解、次优决策点或被忽视的交互机会。


    混合反馈的经验学习架构


    这些提炼出的经验随后被注入至结构化的经验库中,形成一个不断扩展的「失败感知型示范语料库」。当智能体未来再次遇到类似查询或情境时,基于检索的泛化机制使其能够主动调用此前的纠正策略,从而降低重复失败的概率,加速任务掌握过程。这一混合机制整合了检索增强生成(RAG)与人类参与监督的优势,使智能体的经验库不仅是自我生成的,更是经过反思性丰富的。它标志着迈向具备自我纠错能力的智能体的关键一步,这种能力建立在真实世界交互与元认知分析的双重基础之上。

    Fellou 的背后: 95 后创业者、25 岁融资过亿,脚踏实地,仰望星空的新时代 AI 航海人


    Fellou 是由 Authing 身份云创始人谢扬创建的 Agent 产品,他在 2019 年创办了 Authing 身份云,为企业和开发者提供事件驱动的身份认证云服务。截止 2024 年,Authing 已服务 700+ 客户和数亿用户,平台拥有数万开发者,每月有千万级认证次数,获得过多家基金数千万美元投资。


    同时值得注意的是,Authing 在美国最大的竞争对手 Okta 在 2024 年投资了一家名为 Browserbase 的云浏览器 Infra 公司,这也表明了浏览器相关技术和产品在全球的关注度之高。

    Fellou Benchmark: Agentic Browser 的新标准


    据悉,Fellou 即将开源 Agentic Browser 的评估 Benchmark,以用户的实际生产场景和用户体验为中心,构建跨环境、跨应用、跨设备的 Agent 任务集,用以评估 Agentic Browser 提高用户在真实生产环境下生产力的表现。



    目前,Fellou 已开启全球内测,提供 PC Mac(Apple 芯片和 Intel 芯片)版供下载使用(fellou.ai/download),预计在今年下半年会开放 Windows 版和移动版。


    2025-04-22 17:5764

    评论

    发布
    暂无评论

    CORS 和 CSRF 修炼宝典

    Geek_z9ygea

    大前端 Web CORS CSRF

    如何通过DDD构建一辆汽车

    冯文辉

    领域驱动设计 DDD

    阿里四面你都知道吗?

    root

    Java 程序员 互联网 阿里 简历

    聊聊Spring的IOC以及JVM的类加载

    小隐乐乐

    架构师训练营-作业5

    紫极

    数据库分片

    Axe

    为了把握新基建风口,科技公司都在紧密筹备这件事...

    极客时间企业版

    毕业三年了,我开始明白为什么说三年是一个坎

    鄙人薛某

    程序员 程序人生 职场回顾

    啃碎并发(七):深入分析Synchronized原理

    猿灯塔

    Java

    依旧乐观的李彦宏,十年寻光的百度AI

    脑极体

    华为云FusionInsight MRS通过信通院大数据能力评估 单集群突破2万+规模

    数据湖洞见

    大数据 FusionInsight MRS 华为云

    统一物品编码破解追溯“断链”困局

    CECBC

    这样的二维码,你见过吗?

    诸葛小猿

    Java Python 后端 二维码 myqr

    分布式缓存与消息队列

    紫极

    Scala中如何优雅地实现break操作

    吴慧民

    scala

    kubernetes集群安装(二进制)

    小小文

    Kubernetes 容器

    如何学习Visual Studio Code

    博文视点Broadview

    学习 读书笔记 vscode 能力提升 编辑器

    信创舆情一线--5省发布区块链发展计划

    统小信uos

    区块链 舆情

    开发者必备——API设计问题

    Noneplus

    redis系列之——分布式锁

    诸葛小猿

    Java redis 分布式 分布式锁

    鲲鹏说:高考之路你们走,高考阅卷我来守

    脑极体

    Hadoop大数据存算分离下,如何解决新旧存储共存?

    XSKY星辰天合

    Struct embedding in Go

    Interstate5

    time.Time dynamodb apigateway Go 语言

    golang内存对齐

    PONPON

    go内存对齐 Go 语言

    数据分析师成长体系漫谈-数仓模型设计

    analysis-lion

    学习 数据仓库 数据分析 随笔杂谈

    架构师训练营第六周总结

    Melo

    极客大学架构师训练营

    Newbe.Claptrap 框架入门,第一步 —— 创建项目,实现简易购物车

    newbe36524

    Docker Reactive ASP.NET Core

    人生就是体会矛盾的过程

    封不羁

    成长 感悟

    技术选型课程小结

    梅子黄时雨

    极客大学架构师训练营

    ArrayList源码阅读

    慌张而黑糖

    ArrayList 源码阅读

    typora设置图片自动上传,实现快速发文章

    诸葛小猿

    Typora PicGo gitee 上传图片

    Fellou 发布业界首个 Agentic 浏览器:侧重端到端自主行动,融合 Browser、Agent、Workflow Automation_生成式 AI_Fellou AI_InfoQ精选文章