写点什么

Facebook 是如何应用大数据的?

2015 年 12 月 15 日

在 Facebook 上,每天会产生 100 亿条消息、45 亿次“喜欢”按钮点击和 3.5 亿张新图片。对于许多人而言,这些信息没有任何意义,但借助大数据技术,Facebook 可以了解用户的位置、朋友、喜好等信息。近日,Medium 分享了一篇关于 Facebook 如何应用大数据的文章

Facebook 不只是会收集、存储和分析用户数据,他们还会通过下列方式确定或影响用户的行为:

  • 跟踪 Cookies:Facebook 通过使用跟踪 Cookies 来跟踪用户浏览 Web 的行为。如果用户在登录 Facebook 的同时浏览 Web,那么 Facebook 就可以跟踪用户访问的站点。
  • 面部识别:Facebook 可以借助用户分享的图像数据在 Web 和其他 Facebook 用户资料中跟踪用户。
  • 标注建议:借助图像处理和面部识别,Facebook 可以为用户提供照片标注建议。
  • 分析用户喜好:最近的一项研究表明,仅仅通过分析用户在 Facebook 上点击“喜欢”按钮的行为,就可以准确地预测用户的个性与品质这种高度敏感的信息。

不久前,Facebook 还向他的一些合作伙伴推出了“主题数据(Topic Data)”。主题数据可以向市场营销人员展示受众对于品牌、事件、活动和主题的反应。市场营销人员可以据此有选择地调整他们在该平台及其他渠道中的营销方式。此前,这些数据由第三方提供,但由于样本规模太小,那并不怎么有用。

数据是一个巨大的金矿,但对于数据的挖掘利用而言,隐私是一个绕不开的问题。虽然Facebook 一直宣称,用户信息只有在获得用户许可的情况下才会被分享,而在出售给市场营销人员时会隐去姓名资料,但是问题总会出现。例如,许多用户都抱怨隐私设置过于复杂,很容易在无意间分享一些东西。另外,Facebook 的图搜索为陌生人访问用户的隐私数据提供了更多的机会。

另外,按照Facebook 首席分析师Ken Rudin 的说法,依赖大数据的公司会将挫折归因于两个问题:一是过多依赖于某一种技术,如Hadoop。Facebook 安装了大量的Hadoop 软件,甚至为此设计了自己特有的硬件。二是公司使用大数据回答无意义的问题。据Rudin 介绍,在Facebook,有意义的问题是指其答案可以为改变行为提供依据的问题。


感谢郭蕾对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。

2015 年 12 月 15 日 18:004969
用户头像

发布了 1008 篇内容, 共 313.6 次阅读, 收获喜欢 282 次。

关注

评论

发布
暂无评论
发现更多内容

wee1作业总结

极客大学架构师训练营

为什么哈希表可以管理亿级数据?

八两

php redis hash rehash

十五年后苹果再次变心

池建强

apple 苹果 芯片 wwdc

好奇心, 优秀软件工程师的内核品质

亚伦碎语

读书感悟 随笔杂谈

别兜售你自己不会购买的东西

Neco.W

创业 销售管理 销售

线性表(数组、链表、队列、栈)详细总结

淡蓝色

Java 数据结构 算法 链表 线性表

架构师训练营 - 第三周学习总结

清风徐徐

多个maven项目启动顺序

terrytian

maven

李艺:建立订阅者意识,当好一名知识服务生,做好知识课程

程序员LIYI

知识付费

二叉树深度优先遍历

封不羁

Java 算法 二叉树

辟谣:程序员不配谈恋爱?你错的可以!真相来了

码农神说

程序员 漫画 相亲 程序员恋爱

centos7 操作

InfoQ_1c4a1f813eb1

区块链目前实际的应用场景汇总

CECBC区块链专委会

区块链技术 去中心化 应用场景

工作那么久,才知道的 SOLID 设计原则

闻人

架构师 极客大学架构师训练营

设计原则与设计模式

dapaul

极客大学架构师训练营

食堂就餐卡系统设计

John

极客大学架构师训练营

RabbitMQ跨机房迁移数据零丢失

心平气和

RabbitMQ 消息队列

【极客大学】【架构师训练营】【第二周】依赖倒置原则和接口隔离原则

NieXY

极客大学架构师训练营

设计模式之单例模式和组合模式

dapaul

极客大学架构师训练营

查找算法系列文(一)一文入门二叉树

淡蓝色

Java 数据结构 算法 二叉树

循序渐进的中台研发

理帆

中台 业务中台

游戏夜读 | 《老残游记》很有趣

game1night

【在云端 002】云时代,何以安放我的个人数据

Bora.Don

云计算 云存储

SpringBean的生命周期

编号94530

Java spring Spring Boot 生命周期

ARTS Week5

丽子

Redis系列(三):缓存过期该如何剔除?RDB和AOF又是什么?

z小赵

Java redis 高并发 高并发系统设计

每日一题-翻转字符串里的单词

程序员老王

LeetCode

基于业务表 Binlog 的事件驱动设计

理帆

MySQL 事件驱动 Binlog

【极客大学】【架构师训练营】【第二周】总结:设计原则

NieXY

极客大学架构师训练营

第四周 学习总结

冯凯

就餐卡系统架构设计文档

极客大学架构师训练营

演讲经验交流会|ArchSummit 上海站

演讲经验交流会|ArchSummit 上海站

Facebook是如何应用大数据的?-InfoQ