写点什么

又被大量收集数据,Kindle“监控”你读书

  • 2020-09-08
  • 本文字数:1725 字

    阅读完需:约 6 分钟

又被大量收集数据,Kindle“监控”你读书

作为书迷,我购买过很多版本的 Kindle 设备,从最初版本到 Paperwhite 都有,并对每一版都很喜欢。但我对这个全新文本格式的潜在滥用情况心怀警惕。


从技术上来讲,亚马逊持有读者们阅读内容的所有权,他们随时可以删除这些内容。之前就曾经出现过亚马逊从客户账户及他们的Kindle删除特定书目的情况。这还不是最糟的,亚马逊甚至可以删除用户账户并撤销用户对已购买书籍的访问权限


Kindle 利用用户阅读数据来提供一些传统书籍无法提供的功能:管理设备间书签和笔记,同步所有设备中最后阅读位置等等,Kindle 同样可以显示广告或相关阅读推荐。


我想知道 Kindle 是否只会上传这些服务需要的数据,还是会将用户相关数据一同上传给亚马逊。

事实证明,Kindle 收集了海量的数据

Kindle 不仅会发送设备信息,使用大量元数据,甚至是用户在使用设备或 app 进行的所有操作都会被发送,这些数据都与用户账户直接连接。


打开 app、读书、翻页、关闭书籍,这些简单的操作会向亚马逊服务器上传上百条请求数据。



Kindle 数据请求

侵犯隐私的行为信息

总的来说,用户在读书时手指的每一次点击或互动都会被 Kindle 追踪。


读者阅读的每一页书籍都会发送下列信息:


  • 每页打开时间:每当读者翻页,都会生成一个时间戳

  • 每页的首个单词/文字:会以诸如“书中第 7705 个字”的形式记录其具体位置

  • 每页最后一个单词/文字

  • 该页是文字还是图片


以下是读者在阅读每页时会被发送的简单记录:


{    "created_timestamp": 1597743233808,    "payload": {        "context": "Reading",        "continuous_scroll_state": "disabled",        "end_position": 4708,        "is_scrolled_over_span": false,        "span_type": "Text",        "start_position": 4193    },    "schema_name": "kindle_positions_consumed_v2",    "schema_version": 0,    "sent_timestamp": 1597743233855,    "sequence_number": 26}
复制代码


每个阅读区间都会生成一个阅读页数与浏览模式的总结。


{    "created_timestamp": 1597743255324,    "payload": {        "action_type": "PageTurn",        "book_length": 2003478,        "context": "Reading",        "count": 10,        "navigation_end_location": 7884,        "navigation_mode": "Horizontal",        "navigation_start_location": 3599    },    "schema_name": "reader_in_book_navigation_v2",    "schema_version": 0,    "sent_timestamp": 1597743265854,    "sequence_number": 36}
复制代码


打开 app 时同样会上传类似数据,包括应用是否在后台开启、书籍是打开或关闭、诸如字号等设置是否有变动等。高亮或双击单词/词语,会在将其发送到 bing 翻译或维基百科的同时发送回亚马逊。


这些请求都不是像上次阅读位置这类的数据一样用于客户功能的。高亮、上次阅读位置,以及其他一些信息都会在一定周期内被再次发送向不同目的地,区别在于第二次发送所包含的信息量会大幅减少。


每条请求都不会在生成的同时上传。很多记录生成后会先保存在本地,然后才会被上传(注意前面的 sequence_number 字段)。即使用户在离线情况下阅读,一旦联网,这些存储在本地的数据都会被上传。

设备信息

Kindle 同样会上传一些私人信息,诸如:


  • 用户所在国家

  • 试图获取本地网络 IP 地址(Kindle 获取到作者的地址为 10.,并不准确)

  • 设备和版本信息(屏幕大小、品牌、设备型号),iPhone/安卓/Kindle 软件版本

  • Good Reads 账户信息

  • 设备方向(横屏/竖屏)


部分数据可能会帮助亚马逊了解用户对 app 的使用情况,方便他们后续调整。但本地 IP 是唯一一个困扰作者的数据,虽然除了 IP 作者并没有发现什么其他被上传的本地网络信息有问题。

结论

Kindle 可以说是我见过对用户隐私最不手下留情的 app 了,它记录了很多令我感到不适的阅读行为数据。在过去的几年中,我一直在尝试避免使用 Kindle 生态系统,目前在用Marvin在 iPhone 上阅读。虽然已经不再用 Kindle 设备了,但还是难免会怀念 e-Ink。


不幸的是,如果使用非 Kindle 应用,就需要买 DRM-Free 的书。这类书并不是很好找,但 Kobo 书店以及一小部分利基供应商经常会提供这类书,有些甚至还能在亚马逊上找到。


相关阅读:


Kindle Collects a Surprisingly Large Amount of Data


2020-09-08 07:002044

评论 3 条评论

发布
用户头像
图里的数据用的是什么抓包工具?
2020-09-08 10:21
回复
应该是 mitmproxy
2020-09-08 10:48
回复
多谢, 确实是这个工具
2020-09-15 10:29
回复
没有更多了
发现更多内容

企业如何挑选OKR目标管理软件?9款工具功能全面分析

易成研发中心

盘点本轮牛市币价再创新高的「老山寨」

TechubNews

知乎启用AutoMQ替换Kafka,开辟成本优化与运维提效新纪元

AutoMQ

Java 数据库 kafka 客户案例

改变仿真游戏规则,Altair的AI与HPC技术创新仿真之路

Altair RapidMiner

数据分析 仿真 CAE #人工智能 altair

探索1688阿里巴巴API接口:图片搜索商品列表(拍立淘)与店铺所有商品列表的实战应用

代码忍者

API 接口 pinduoduo API

从仪表盘探索 MongoDB 关键指标

巴辉特

云桌面年终狂欢,多重福利等你来拿!

Finovy Cloud

云主机 云服务器 云桌面 云电脑

翻倍只是山寨币季的点火阶段:市场分歧与未来趋势

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

汽车摆臂行业生产设备数据采集及集成

万界星空科技

mes #汽车 设备数据采集 汽车摆臂行业 汽车摆臂mes

牛客网最新的Java面试八股文通关手册

架构师之道

程序员 java面试

人事人才信息管理系统:2024年10大推荐系统

易成研发中心

Spring AI Alibaba 配置管理,用 Nacos 就够了

阿里巴巴云原生

阿里云 云原生

苹果m1能玩steam吗,苹果笔记本玩steam游戏教程

阿拉灯神丁

游戏 MacBook steam M1芯片 CrossOver Mac下载

探索1688阿里巴巴API接口:揭秘商品详情与关键字搜索的奥秘

代码忍者

API 接口 pinduoduo API

在“黑天鹅”时代,如何锻造创业者的认知韧性?| 陶建辉演讲分享

TDengine

数据库 tdengine 时序数据库

云数仓ByteHouse的湖仓一体设计与实践

字节跳动数据平台

大数据 数据仓库 湖仓一体

TikTok账号封号原因有哪些?

Ogcloud

TikTok tiktok运营 TikTok养号 tiktok封号

客户案例|大模型加持智能会议,金融机构实现“写纪要”到“审纪要”的飞跃

澜舟孟子开源社区

人工智能 大模型 智能办公

工业公辅车间数智化节能头部企业,蘑菇物联选择 TDengine 升级 AI 云智控

TDengine

数据库 tdengine 时序数据库

AI智能体的开发流程

北京木奇移动技术有限公司

AI应用 AI智能体

Supersonic 平台上线Top Creatives Library 功能,为手游开发者打造广告投放素材库

Geek_2d6073

从开发者工具转型 AI 呼叫中心,这家 Voice Agent 公司已服务 100+客户

声网

YashanDB 开机自启

YashanDB

数据库 yashandb 崖山数据库 开机自启

YashanDB在地理信息系统(GIS)领域的关键功能和技术优势

YashanDB

yashandb 崖山数据库 地理信息系统

判断TikTok节点IP的纯净度高不高的几个方法

Ogcloud

tiktok运营 tiktok节点 tiktok网络 tiktok封号 tiktok代理节点

定制化NFT链游DAPP开发:一站式解决方案助力游戏创新

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

数据同步、流计算全面强化,TDengine 3.3.4.3 版本正式发布

TDengine

数据库 tdengine 时序数据库

一行代码都不改,Golang 应用链路指标日志全知道!

阿里巴巴云原生

阿里云 云原生

又被大量收集数据,Kindle“监控”你读书_安全_Charlie Belmer_InfoQ精选文章