写点什么

LinkedIn 被裁定应开放对其公开资料数据的爬取

  • 2017-08-29
  • 本文字数:1371 字

    阅读完需:约 4 分钟

一位美国联邦法官裁定,Microsoft 旗下的 LinkedIn 公司不能阻止第三方 Web 爬虫爬取其公开资料数据。这一裁定是根据初创企业 hiQ Labs 针对 LinkedIn 的诉讼而于 8 月 14 日做出的,这次诉讼是在 LinkedIn 向该初创企业发出一份要求其停止并中断爬取数据的信函后发起的。

hiQ Labs 爬取 LinkedIn 用户资料中的公开可见信息,为企业了解是否雇员有意向离职提供帮助。这类爬取行为违反了 LinkedIn 的反爬取软件禁令,因此在2017 年5 月23 日,LinkedIn 向HiQ Labs 发出了信函,要求该公司停止这类爬取行为,并威胁要依据《电脑欺诈和滥用法》(CFAA,Computer Fraud and Abuse Act)而采取法律行为。就此,hiQ Labs 发起了对LinkedIn 的诉讼,指责LinkedIn 具有反竞争行为,侵犯了企业访问公开可用信息的言论自由权利。该初创企业的代理律师指出, hiQ Labs 应该并未访问 LinkedIn 的主要数据源。法官 Edward Chen 在裁定中,特意呼吁 LinkedIn 对 CFAA 做“广泛的诠释”:“如果采纳 LinkedIn 的行为,那么将对互联网的开放访问产生深远的影响,这是议会在三十年前颁布 CFAA 时所不愿意看到的结果”。据报道,LinkedIn 将对这一裁决提出上诉

对于数据所有者及隐私,以及社会媒体公司对用户公开发表信息的控制程度,该联邦政令的影响重大。HiQ Labs 认为,LinkedIn 对公共资料获取的限制违反了建立在最高法院最近的一项裁决上的“第一修正案”(the First Amendment),即将社交媒体网站等同于一种“现代公众广场”。 Hacker News 的一个热议话题显示,社交媒体用户是否将他们公开发布数据等同视作将信息张贴在公开广场上,这依然有待观察。

在本次法庭案例中,涉及了数据隐私问题的另一个意外维度,那就是LinkedIn 宣称它想要保护的并非仅是数据本身,而是包括对被更改数据的访问。LinkedIn 允许用户公开发表个人资料,默认情况下并不会共享对简历的某些更改。但是hiQ Labs 通过大规模抓取可以检测到资料中的更改情况,并使用这些发现情况去告警企业雇主存在潜在的雇员流失问题。虽然有部分用户明白公开发表资料的深层影响,但是大多数用户不可能时刻惦记从数据中可以产生何种洞察,以及这些数据会被如何使用,而有一些他们所不了解的企业却在持续地监测个人资料的更新情况。

Programmable Web 网站的主编 David Berlind 最近评论了该裁定对API 经济的影响。他指出,LinkedIn 数据的价值并非在于数据本身,而是其后的数据模型。该裁定将允许机器人毫无顾忌地利用这些数据企业,这降低了LinkedIn 等产品的整体价值。他进一步提出,该裁定强制企业允许爬虫规避企业发布的API,妨碍了企业去“扩展并理解数据和数据所驱动价值之间的关联性”。

虽然LinkedIn 确实提供了一些 API ,但是看上去很多开发人员并不认为这些 API 适合自身的需要,因为编程界业已形成了广泛爬取 LinkedIn 数据的事实。已有提供在 Github 上的开源爬取库,开发人员可在 Stack Exchange Quora 上就相关话题开展交流,商业数据爬取公司也提供了采集 LinkedIn 数据的教程。在2016 年,该Microsoft 旗下的公司发起了一次针对一百个匿名爬取数据机器人用户的诉讼,所涉及的机器人意图通过伪造的用户账号访问非公开的简历数据。值得注意的是,LinkedIn 非常支持白名单服务提供商(如搜索引擎)的爬取行为。

查看英文原文: LinkedIn Ordered to Allow Scraping of Public Profile Data

2017-08-29 19:002948
用户头像

发布了 391 篇内容, 共 143.1 次阅读, 收获喜欢 257 次。

关注

评论

发布
暂无评论
发现更多内容

华为大牛总结的超全Linux学习笔记,看这一篇就够了!

Java 架构 面试 程序人生 编程语言

阿里巴巴架构师十年整理出的JavaSpringBoot核心文档,真是太全了

Java 架构 面试 程序人生 编程语言

互斥锁、自旋锁、读写锁...理清它们的区别和应用

行云创新

云计算 编程 开发 应用

如何让文件共享 SDK 支持使用 Uri 上传文件

ZEGO即构

文件存储 分区存储 文件共享

002云原生之架构定义

穿过生命散发芬芳

云原生 9月日更

拥抱开源,共建生态 - 开源生态与效能提升专场 | CIF 精彩看点

CODING DevOps

DevOps 研发效能 腾讯云 CIF 峰会 开源生态

超十年渗透专家总结出636页渗透测试全笔记,100课时一次讲清

Java 架构 面试 程序人生 编程语言

FunTester框架Redis性能测试之map & INCR

FunTester

redis 性能测试 测试框架 测试开发 FunTester

手把手教你使用Studio Lite + Digtal car!助力智能汽车场景、轻应用开发更轻松!

SOA开发者

智能网联汽车行业信息安全现状与威胁

SOA开发者

金九银十不要怕!有了腾讯这本2021年最新Java面试手册,offer手到擒来!

Java 程序员 架构 面试 后端

打造“大国重器”高性能计算,联想与英特尔如何携手点亮数字经济加速度?

脑极体

四面字节跳动(高级开发岗):分布式+中间件+TCP+JVM+Hashmap

Java 编程 架构 面试 计算机

从工具、工具箱到数字化软件工厂——DevOps 设计理念与工程实践专场 | CIF 精彩看点

CODING DevOps

DevOps 数字化 研发工具 腾讯云 CIF 峰会

史上最全Java高频面试合集,命中率高达95%

Java 程序员 架构 面试 后端

音视频终端引擎优化实践

百度开发者中心

最佳实践 音视频 实践案例 智能视频 行业深度

5G三年成厦,泛在千兆为应用造榫卯

脑极体

提高工作效率的三种方法

石云升

团队管理 管理 引航计划 内容合集 9月日更

行云创新:云原生技术助力企业数字化转型

行云创新

技术 云原生 转型 数字化 平台

CTF压轴题解题思路和过程

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 安全漏洞

掘金热榜第一!阿里P8用近十个月整理出来999页Java岗核心笔记限时开源!

Java 架构 面试 程序人生 编程语言

如何做一场有趣又高效的迭代回顾会议?

万事ONES

Scrum 敏捷 回顾会

浪潮云洲荣获两项工业自动化及数字化行业年度大奖 inspur浪潮云 昨天

云计算

智能大数据专场,百度智能云带来智能大数据产品架构全景图

百度大脑

人工智能 大数据

AlibabaP9力荐!最新出品1297页JDK源码+并发核心原理解析小册

Java 架构 面试 程序人生 编程语言

JVM g1 gc 学习笔记二

风翱

GC 9月日更

通俗易懂!306页图解计算机网络,涵盖所有基础知识

Java 架构 面试 程序人生 编程语言

快手、知乎等平台严厉打击“病媛”炒作行为:自媒体行业不能被流量裹挟

石头IT视角

【新品尝鲜】OCR磅单识别上线邀测,为货运物流提速增效

百度大脑

人工智能 OCR

重磅来袭,虚拟化技术分类

hanaper

用Python绘制专业的K线图【含源代码】

恒生LIGHT云社区

LinkedIn被裁定应开放对其公开资料数据的爬取_语言 & 开发_Shelby Switzer_InfoQ精选文章