QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

Quora 的陨落:AI 时代知识社区的困境

  • 2024-03-05
    北京
  • 本文字数:4478 字

    阅读完需:约 15 分钟

大小:2.11M时长:12:16
Quora 的陨落:AI 时代知识社区的困境

这个网站曾经是一个充满活力的社区,然而现在用户正在逃离……


为什么有这么多音乐会使用Ticketmaster?”“要成为寿司厨师需要进行怎样的培训?”“武术家是如何打碎混凝土块的?”如果你是在 10 年前寻找这类问题的答案,那么最有可能找到详细、专业的回答的一个地方是互联网上最有趣、存在时间最长的社区之一:Quora。


大多数人都以某种形式接触过 Quora,无论他们是否知情:在谷歌搜索结果,在著名作家的写作示例中,在数字出版物转载的某些问答中,比如Slate。其中一位Slate-via-Quora的贡献者,作家兼研究员Erica Friedman,在 2011 年就加入了这个网站,当时 Quora 正因为Yahoo Answers的衰落而吸引到了一波流量。她说,这让 Quora 作为一个以准确性为重点、以知识为中心的文本平台脱颖而出。在这个 Facebook 和 Twitter 开始主导社交互联网、YouTube在做自己的事情的时代,它是一款独特的产品。


Friedman 对这个古怪的问答巨头如此着迷,并和其他许多人无偿贡献着答案。她说:“有一段时间,也就是在 2010 年代中期,我们很多人真的专注在一个特定的使命上,那就是‘让 Quora 成为互联网上一个说你不能在这里胡作非为的地方。我们把这些政策付诸行动,不让人们心怀不轨地来到这里做一些心怀不轨的事。’ ”一个聪明而充满激情的社区,致力于维护一个积极正向的空间——有什么比这更理想的呢?难怪 Quora 在 2010 年代会有如此迅猛的增长


然而,今天的 Quora 几乎与那些乌托邦的理想无关。这个曾经受人喜爱的论坛现在充斥着没完没了、无意义的、重复的垃圾,充满了奇怪的荒谬的令人生厌的、AI 生成的内容,以及一大堆全大写的非问题内容,比如“OMG! KING CHARLES SHOCK the WORLD with ROYAL BAN ON PRINCE HARRY AND MEGHAN MARKLE. SAD?(天哪!查尔斯国王宣布王室禁止哈里王子和梅根·马克尔结婚,震惊世界。应该感到悲伤?)”这个“问题”的答案,获得了约700万点击量,链接到一个奇怪的、几乎无法使用的皇室观察网站 red-carpett.com。以前你可以在谷歌上搜索时事问题,并在搜索结果的前几名找到 Quora 答案的链接,而现在,你更可能遇到像是一群人在 2024 年询问一贯的种族主义者特朗普是否真的是种族主义者。或者,特色的谷歌片段会告诉你,鸡蛋会融化,这要感谢搜索爬虫捕捉到了 Quora 网站上毫无意义的回答。


这真的很滑稽。Quora 通过搜索引擎优化让自己排名靠前,但又在自己的页面上提供 ChatGPT 的答案,因此这些答案传播到了谷歌的搜索结果中。


互联网正在崩溃 pic.twitter.com/gcV9b36vEA


——Tyler Glaiel (@TylerGlaiel) 2023年9月25日


Quora 的搜索引擎优化只会让更多的人关注到这个问题。各种论坛上的评论者都在哀叹Quora质量的下降,《大西洋月刊》最近发文问道:“如果没有愚蠢的问题,你会如何看待Quora?”如果你想看更多这种质量明显下降的例子,只需要浏览一下 Reddit 的“Insane People Quora”子版块。


Quora 的实用性缩水并非完全是因为 AI:长期以来的作者们认为,早在 ChatGPT 之前,Quora 就存在审核和功能方面的问题。但随着这个新知识经纪人的崛起,它的衰落在加速,这让本已分崩离析的社区感到更加愤怒。早些时候,支持 AI 加速的风投Andreessen Horowitz向 Quora 提供了一笔7500万美元的资金,但这也只是为了开发其现场生成文本聊天机器人 Poe。


在 2000 年代后期,Quora 相对于其他许多问答网站的优势在于它在设计时就考虑到了网络社交。联合创始人 Adam D'Angelo 和 Charlie Cheever 都是 Facebook 的早期员工,他们于 2009 年辞职,建立了一个网站,正如他们当时告诉TechCrunch的那样:“我们试图从人们的大脑中获取信息,而不是从互联网上那些难以获取的资源中获取,并将其转化为真正有用的格式,形成一个有价值的数据库。”他们的计划是说服专业领域的专家和寻知者分享他们的见解,并以此为基础,围绕这种真实、自由的信息交换建立一个充满活力的社区。Friedman 说,“有很多高质量的答案来自那些喜欢分享经验的人”,这与“从未建立起这种社区”的 Yahoo Answers 形成了鲜明的对比。


Quora前50万名用户之一Ariel Williams 对此表示赞同。她说:“Yahoo Answers 的质量很糟糕,你提出问题,就有人说一些恶心的话。Quora 注重质量,他们在寻找高质量的答案和问题,有积极的审核,整个网站都是围绕着人,围绕着用户建立的。”


不久之后,像Stan Hanks这样的专家开始出现。他是一位网络工程开创者建立了第一个IP 虚拟私人网络。2012 年末,他告诉我,他会登录到 Quora,“那里有一些我亲身经历东西、我知道的人和背景故事,这让我感到兴奋,我就会开始写。”


为了让志愿者专家们保持热情,Quora 推出了一系列福利,为 Quora 最优秀、最热情的回答者建立了一个 Top Writer 计划和一个激励深思讨论的系统,甚至邀请这些快乐的 Quora 用户参加在公司总部举办的峰会。本身就是 Top Writer 的 Williams 说:“Top Writer 计划从 2012 年一直持续到 2018 年。其中有一位曾与 Freeman Dyson 共事的物理学家,有 NASA 的工作人员,有博士学位的人。”


所有这些专家背后都有强大的人力支持。Hanks 说:“他们有审核团队、审查团队和支持团队。全职版主是 Quora 的员工,兼职版主有其他工作。”还有有偿工作的社区管理人员,他们秉持 BNBR(“友好、尊重”)的基本原则,以及客户服务支持人员和一个专门用于将特定问答发布到 Forbes 和 HuffPost 等网站的部门。


这个社交网络积累了数亿的页面浏览量,从投资者那里筹集了数百万美元,并在维基百科、Reddit 或 Facebook 之外开辟了一个独特的互联网角落。它可能没有像这些网站那样的知名度,但没关系——每个接触过 Quora 的人都知道它代表着什么。


但即便如此,仍有一些问题困扰着 Quora,并在之后继续恶化。首先,一位不愿透露姓名的前 Quora 用户告诉我,网站开始“缩短问题的长度”。公开的理由是为了增加 Quora 在谷歌上的可见度,但这种简洁是有代价的:这让用户难以提出专家可以回答的复杂的问题,包括极为具体的与业务相关的问题。 例如:“作为一名创始人,我应该获得多少股权来白手起家创办一家初创公司?他们给了我 10%的薪水,但可以稀释,和 CEO 一样。公司还没有开始,还没有原型。10%对于 CTO 来说是很低的。多少才是公平的?”



然后是前 Top Writer J. Starr(后来她把自己的账号删除)向我描述的“信息流优化”。起初,当用户登录到 Quora 时,他们看到的是他们来这里的目的:等待回答的问题。但很快,Quora 开始“将‘内容’文章放到每个人的信息流里”,用 Starr 的话来说,这里充斥着“各种垃圾信息,各种关于好莱坞的流言蜚语”。


早期的广告和机器人泛滥也是个问题。2016 年,Quora 开始在网站上投放广告,Williams 和其他 Top Writers 建议设立某种创作者分成计划。Williams 说,结果高层创建了“Quora合作伙伴计划,我自己也加入了。但这完全是为了让人们想出能够吸引更多浏览量的问题”——而不是为了激励高质量的答案。


Quora 的“合作伙伴”并不是唯一被招募来完成这项任务的人——Quora 还吸引到从 Reddit 提取问题并发布到 Quora 页面的机器人。这些都不是 Quora 社区想要的问题。Williams 说:“你会看到人们用‘最好的餐厅在哪里’这样的模板创建机器人,然后它会插入城市名、州名、国名。”r/Quora的Reddit用户开始注意到并抱怨这种做法。


另一位前 Top Writer Bethann Siviter说:“写作质量已经让位于纯粹的流量。随着合作伙伴计划的推出,数量变得比质量更重要,这一点非常明显。你可以一次又一次地举报,但什么都不会发生。”尽管合作伙伴计划并没有给参与者太多钱(最多可能是几千美元),但制造机器人的人很快就意识到,这是快速致富最简单的方法。


这一切都是由于 Quora 的变现速度缓慢造成的,而且尽管这个网站很受欢迎,但它的目标是在数字广告这块大蛋糕上分一杯羹,而这块蛋糕已经迅速被Facebook 和亚马逊(以及它的头号流量来源谷歌)占据。考虑到其高昂的开支,投资者对向 Quora 继续注资犹豫不决。因此,Quora 削减了预算,缩小了审核团队、客户支持体系和 Top Writer 计划。其他最初的功能——Quora 用户必须使用真实姓名、读者可以为存在错误或拼写错误的答案提出“建议编辑”——也被取消了。所有这些做法导致了更多未经检查的垃圾信息和大量的喷子的泛滥,志愿者用户无法自己阻止这些。


2013 年加入 Quora 的作者Nelson McKeeby表示,在“玩家门”事件之后,情况变得更糟。因为匿名和被削弱的审核,极右翼、喜欢特朗普的喷子们入侵了 Quora。他在一封电子邮件中写道:“当真正的用户试图撤下明显错误的答案,却抵不过拥有众多服务器的喷子们”。此外,随着 Quora 推出“Spaces”——基本上是由用户运营的私人社区博客——审核问题继续恶化,丑陋的意识形态变得猖獗。忠诚的 Quora 用户试图举报有偏见的恐同的淫秽的内容,但却没有得到 Quora 足够的支持。


然后,AI 来了。随着垃圾信息机器人的泛滥,Quora 改变了服务条款,取消了 BNBR,然后自动化了审核过程。不用说,这并没有让情况变好。AI 聊天机器人并没有提供好的问题或答案。相反,用户Steven P. Robinson在一封电子邮件中写道:“它们编造了一些非常普通且低水准的问题,这是 AI 尚未准备好迈入黄金时段的一个很好的例子。”现在,Quora 甚至还提供 AI 生成的图像来配合用户的答案,尽管生成的插图毫无意义。



最重要的是,Quora 开始使用 AI 在一些选定的问题页面上“生成机器答案”,并明确表示人类的回答可能被用于训练 AI。这意味着 Quora 用户提供的内容将免费提供给一个定制的大型语言模型。更新的服务条款和隐私政策于去年夏天生效。天使投资人(也是 Quora 用户)David S. Rose转述了其中一些条款:“你授予所有其他 Quora 用户无限的权利来重复和改写你的答案”、“你授予 Quora 使用你的答案来训练 LLM 的权利,除非你明确选择退出”,以及“你完全放弃参与任何针对 Quora 的集体诉讼的权利”,等等。Quora 的帮助中心声明:“到目前为止,我们不使用 Quora 上的答案、帖子或评论来训练用于在 Quora 上生成内容的 LLM,但这在未来可能会发生变化。”Quora 提供了一个选择退出的设置,尽管它承认“选择退出并不包括所有的内容”。


这引发了所有权问题,因为 Quora 用户必须决定是否同意新的条款或带着他们的作品离开。一些知名用户,比如奇幻作家 Mercedes R. Lackey 正在从其个人资料中删除他们的作品,并写下说明。Lackey 告诉我:“AI、服务条款问题已经导致 Quora 顶尖人才的大量流失。”并不是所有的 Quora 用户都想离开,但他们很难选择留在一个他们现在必须不断对抗错误、垃圾信息、喷子甚至帐号 冒名的网站上。


Quora 并不是唯一一个在 AI 时代面临存亡之战的数字社区——Reddit谷歌面临着相关的、尽管略有不同的担忧。Quora 的悲剧不仅在于它摧毁了曾经建立起来的繁荣社区。它把所有的善意、社区、专业知识和好奇心都带走了,并假定它可以自动化出一个系统,而显然并没有考虑到这种比较是多么的苍白。


McKeeby 对未来有一个令人沮丧的预测:“最终 Quora 将只剩下机器人提问、机器人回答,其他什么都没有了。”我想知道,如果有人愿意问的话,那么 Quora 将如何回答“为什么 Quora 会走向衰落”这个问题。


【声明:本文由 InfoQ 翻译,未经许可禁止转载。】


原文链接:https://slate.com/technology/2024/02/quora-what-happened-ai-decline.html

2024-03-05 16:295191

评论 1 条评论

发布
用户头像
没Quora,又何来训练数据。
2024-03-05 16:35 · 广东
回复
没有更多了
发现更多内容

测试InfoQ 平台发布文章

木子的昼夜

技术扫盲:关于低代码编程的可持续性交付设计和分析

小傅哥

Java 小傅哥 服务端 低代码开发 可持续交付

先收藏!关于Java类、接口、枚举的知识点大汇总

华为云开发者联盟

Java 接口 枚举

MySQL查看及杀掉链接方法大全

Simon

MySQL

我身边的高T,问了Java面试者这样的问题......

京东科技开发者

MySQL 数据库

Flink SQL 性能优化:multiple input 详解

Apache Flink

flink

WinDbg 分析高内存占用问题

圣杰

dotnet windbg

Dapr 知多少 | 分布式应用运行时

圣杰

架构 云原生 k8s dapr

Kafka.04 - Kafka 部署

insight

kafka 2月春节不断更

详解SSH 框架中对象调用流程

华为云开发者联盟

spring hibernate struts SSH 框架

为什么不推荐使用汉字作为密码?

不脱发的程序猿

程序人生 密码学 28天写作 二月春节不断更

浅谈nodejs进程和线程

梁龙先森

大前端 nodejs 2月春节不断更

用Stylish精简极客时间专栏页面

Tao

CSS

1.1 Go语言从入门到精通:开发环境搭建

xcbeyond

vscode 环境安装 28天写作 Go 语言

私有云、公共云、混合云安全性的优点和缺点

云计算

一文带你熟悉Pytorch->Caffe->om模型转换流程

华为云开发者联盟

网络 模型 PyTorch caffe 算子边界

技术解析 | Doris SQL 原理解析

百度开发者中心

百度 Doris SQL优化

超强前端面试真题+资源推荐

爱学习

面试 大前端 面经

话题讨论 | 你在互联网大厂是个啥级别?

架构精进之路

话题讨论 28天写作 话题王者

日记 2021年2月22日(周一)

Changing Lin

2月春节不断更

诊所数字化:诊所开展私域运营的优劣势

boshi

医疗 私域运营 七日更 28天写作

Apache Flink 在快手的过去、现在和未来

Apache Flink

flink

架构师不至于“架构”-《架构师应该知道的37件事》阅读笔记

Harris

读书笔记 架构 架构师

工作日志2-20

技术骨干

基于证券云服务的总体架构设计应该怎么做?

Jason Tien

配合Github Actions 做一个自动推送的 Rss 订阅机器人

Leetao

Python RSS Github Action

我与技术面试那些事儿

我是哪吒

CSS html 大前端 28天写作 2月春节不断更

【LeetCode】托普利茨矩阵Java题解

Albert

算法 LeetCode 28天写作 2月春节不断更

还愁追不到女神吗?一键生成舔狗日记,一秒速成舔狗之王

不脱发的程序猿

程序人生 28天写作 二月春节不断更 舔狗文化

容器 & 服务:一个Java应用的Docker构建实战

程序员架构进阶

Docker 容器 七日更 28天写作 2月春节不断更

JVM又曾放过谁,垃圾终将被回收!

Simon郎

Java 大数据 架构 后端 JVM

Quora 的陨落:AI 时代知识社区的困境_生成式 AI_Nitish Pahwa_InfoQ精选文章