写点什么

145 亿次播放,6 千余万用户,凯叔讲故事 APP 数据埋点治理及分析实践

  • 2022-09-01
    北京
  • 本文字数:2109 字

    阅读完需:约 7 分钟

145 亿次播放,6 千余万用户,凯叔讲故事 APP 数据埋点治理及分析实践

2014 年,前央视主持人凯叔创办北京凯声文化传媒有限责任公司,并于 2016 年推出凯叔讲故事 APP。截至目前,凯叔讲故事 APP 总用户数量已经超过 6000 万,总播放超 145 亿次,用户平均日收听时长可达 70 分钟。内容形式及用户数的不断增多导致内部形成了一张错综复杂的数据网络,亟待被厘清。


本文,从数据驱动全链路技术难点解析入手到“凯叔讲故事”的具体解决方案分享,希望为广大企业和开发者提供有效的建设路径参考。

数据驱动全链路技术难点解析


过去十多年,我们可以看到全球很多互联网公司通过数据驱动决策在各个领域里取得非常好的效果,也经历过从没有数据、没有指标,到后来的全面数据采集,大量的决策都基于数据驱动的理念进行,并在整个行业流行数据驱动型决策 (DDDM) 文化。甚至,很多企业都设有“首席数据官”这一职位,普华永道思略特(2011 年)对全球市值最大的 2500 家上市企业调查显示,已任命首席数据官的比例为 21%。


但是,数据驱动增长这件事情存在很大的技术挑战。首席数据官既要面对在传统信息化建设中留下的“信息孤岛”、“信息烟囱”等阻碍数据发挥价值的“绊脚石”,又要面对“垃圾进垃圾出”的低质量数据,还要驱动文化变革使大家接受以数据来驱动业务的数据文化思维。更具体地来说,数据驱动体系涉及数据采集、指标体系、数据分析、业务增长归因及精准运营多个环节,每个环节又都存在众多要解决的问题。


在数据采集层面,埋点设计至关重要,埋点数据的质量直接影响后续的数据应用质量和数据回溯。但在实际的工作中,我们经常面临埋点重要信息缺失、埋点少、埋点口径不统一或者埋点浪费等问题,要保障埋点数据的质量,埋点验证也很关键,要做好埋点验证面临着很多技术挑战,比如易用性、准确性、实时性、稳定性、扩展性。


在指标体系搭建层面,指标定义环节可能存在指标管理不统一、指标口径不一致、指标流程不规范等问题;指标生产环节,企业可能面临着重复建设,数据汇算成本较高等问题;指标消费环节可能存在数据出口不统一、重复输出、输出口径不一致等问题。这些都造成指标管理混乱,数据价值未得到充分发挥。


在数据采集和指标体系搭建完成之后,我们需要合适的分析模型、归因模型发现指标背后的增长可能,找到可能带动增长的方法,并固化为行之有效的业务范式,最终实现精准运营。


在这个过程中,有很多开源和商用方案可以选择,但效果不一。仅在埋点治理层面,凯叔讲故事 APP 就经历过自研和采用第三方数据产品两大阶段,在技术路线选择上有一定发言权。

凯叔讲故事 APP 四个月完成埋点生命周期全流程自动化

业务现状


凯叔讲故事 APP 从诞生到成熟已经走过 6 个年头,随着用户量量级不断上涨,从前线市场反馈过来的新需求日渐增多,对数据的把握与洞察也有了更高要求,而更多的用户和数据量级带来的也是更大的压力。


仅在埋点治理层面,凯叔讲故事 APP 就经历过自研和采用第三方数据产品两大阶段。其中,数据上报不准确、点位管理混乱、验点难,属于老大难问题。北京凯声文化传媒有限责任公司研发 VP 万路表示:“尤其是验点的问题,由于没有合适的验检工具,开发人员不得不通过抓包的形式来进行,如果验证点位不够准确,甚至需要一个字段一个字段地比对,耗时耗力却不能保证 100% 的准确率,这使得开发人员一度对验点产生了抗拒的情绪。”

决定重构,引入 DataFinder 解决问题


2022 年 4 月,凯叔讲故事对 APP 进行了一番重构,不仅重写了底层代码,还首次引入了火山引擎的用户增长分析平台 DataFinder。万路表示:“因为之前我们也有用过其他厂商的产品,说实话,在投入相当人力、时间的前提下,距离我们的预期还是存在一定差距。”


4 月份至今,DataFinder 为开发团队能效带来了巨大提升,不仅有效解决了此前凯叔讲故事 APP 埋点结构缺乏整体规划、数据模型冗余、效率低、数据质量不高、数仓团队压力大等问题,还实现了埋点需求管理、埋点方案设计、埋点评审、埋点生命周期管理等全流程的线上化与自动化。在异动指标方面,火山引擎提供十余种分析模型,帮助开发团队快速定位问题,提升排查效率。


以验点为例,DataFinder 实时埋点验证和用户细查的功能,将这项任务的耗时从过去的至少三天缩减到仅需 2 到 3 个小时,而且随时随地可以查询,得到了开发团队的一致好评。


后续,DataFinder 提供的产品能力和服务,也让凯叔讲故事的技术团队有了一些惊喜。通过对 DataFinder 产品的实际运用,以及现阶段初显的业务效果,凯叔讲故事技术团队对火山引擎云上数据产品有了更多兴趣,期待能够在未来与火山引擎有更多场景的合作。


对 DataFinder 在内的火山引擎全系列云上数据产品来说,加强与凯叔讲故事 APP 等企业的持续合作,是继历经字节跳动内部多业务多场景打磨后,自身数据能力面向外界产品化输出时的关键一步。


最后,DataFinder 的产品官网提供了完善的使用文档,可以帮助企业和开发者快速开启“增长分析”之旅。如果你对数据驱动的全链路技术还处在观望阶段,或者有计划进行内部改造还未有具体步骤,再或者你恰好就是扛起这面大旗的首席数据官,都可以在 9 月 2 日观看火山引擎数据智能科技峰会。届时,火山引擎云上全系列数据产品会集中亮相,并迎来部分产品的重磅发布与能力升级,总有一个可以解决你的问题。



2022-09-01 09:503153
用户头像
赵钰莹 极客邦科技 总编辑

发布了 883 篇内容, 共 647.7 次阅读, 收获喜欢 2680 次。

关注

评论

发布
暂无评论
发现更多内容

蓝易云 - 深入理解HTTP请求的五个要点

百度搜索:蓝易云

云计算 Linux TCP 运维 HTTP

蓝易云 - Python雪花代码

百度搜索:蓝易云

Python 云计算 运维 云服务器 ID

蓝易云 - Java:commons-codec实现byte数组和16进制字符串转换

百度搜索:蓝易云

Java Apache 云计算 云服务器 高防服务器

智汇宁夏,共创未来!天翼云携手宁夏共建“中国算力之都”!

天翼云开发者社区

云计算 开发者大会 生态大会

项目管理系统哪个好?2024最新解析

爱吃小舅的鱼

项目管理 项目管理软件 Tapd

多模态合规分析平台,保障AIGC营销新时代对客服务高质合规

中关村科金

天润融通分析AI技术助力客户服务,实现满意度三倍增长

天润融通

人工智能

Nginx 开启 gzip 压缩,让网站飞一会!

左诗右码

nginx

MYSQL 深入浅出系列 - 锁机制

间隙锁 :MySQL 数据库 临键锁

蓝易云 - php所有函数总结

百度搜索:蓝易云

php 云计算 运维 函数 云服务器

TiDB 资源管控的对撞测试以及最佳实践架构

PingCAP

最佳实践 #TiDB TiDB Operator 资源管控 组织架构最佳实践

LeetCode题解:205. 同构字符串,哈希表,JavaScript,详细注释

Lee Chen

实践指南,终于有大佬把Python和机器学习讲明白了!

我再BUG界嘎嘎乱杀

Python 人工智能 机器学习 开发语言

办公必备:2024年值得信赖的10款电子合同签约app

爱吃小舅的鱼

电子合同 合同管理软件 电子签名软件

从OpenAI停服看中国市场:国产替代崛起的机遇与挑战

极限实验室

国产替代 openai easysearch

吃个瓜而已,AI居然写了份研究报告??

Openlab_cosmoplat

人工智能 ChatGPT

亮相2024世界人工智能大会,扫描全能王AIGC“黑科技”助力敦煌遗书数字化修复

合合技术团队

人工智能 OCR 合合信息 古籍修复

蓝易云 - 海外服务器指的是什么?有哪些优势?

百度搜索:蓝易云

云计算 服务器 云服务器 服务器租用 海外服务器

超级实用 Python GUI 入门

我再BUG界嘎嘎乱杀

Python 开发语言 GUI

GitHub星标破千!斯坦福大学的284个机器学习小抄(漫画中文版)

我再BUG界嘎嘎乱杀

Python 人工智能 机器学习 AI 开发语言

以 Go 语言为例解释什么是伪共享以及如何解决

江湖十年

Go 后端 go tool

提升办公效率!2024年5大主流AIPPT软件一网打尽!

彭宏豪95

人工智能 职场 在线白板 AIGC AI生成PPT

雨҈ 雨҈ 雨҈ 雨҈ 雨҈ 雨҈

天翼云开发者社区

人工智能 云计算 论坛

低代码开发平台发展现状及标准化研究

快乐非自愿限量之名

低代码

我的上班搭子之有小浣熊的一天-日常统计分析工作应用

老壳有点爽

人工智能 AI 商汤 办公小浣熊 商汤科技

145 亿次播放,6 千余万用户,凯叔讲故事 APP 数据埋点治理及分析实践 _AI&大模型_赵钰莹_InfoQ精选文章