Quora 是一家以“分享和推动全球知识增长”为己任的网站。 Xavier Amatriain 是 Quora 的工程副总裁。近日,他撰文介绍了Quora 如何应用机器学习。
Quora 希望提供一个高效且有吸引力的知识分享平台。他们非常关注下面三个维度:
- 相关性:确保每个人都获得了他们最感兴趣的那类知识;
- 需求:确保许多人都有的问题得到好的回答;
- 质量:确保知识的高质量。
在数据上,可以将 Quora 看作是一个知识库、主题兴趣网络和社交网络的结合体,如下图所示:
可以看出,Quora 创建了一个可以用于机器学习的数据及数据关系生态系统。例如,一个用户可以在特定主题上跟随并支持另一个用户,一个用户可以关注一个主题,等等。这个复杂的生态系统为 Quora 利用数据改进产品和用户体验提供了许多机会。Quora 的数据科学团队已经在这方面做了许多有趣的研究( 1 、 2 )。
Quora 的许多功能都使用了机器学习算法,以下是其中的部分功能:
- 答案排序
- 订阅讯息排序
- 主题推荐
- 用户推荐
- 邮件摘要
- Ask2Answer
- 重复问题
- 相关问题
上述每一种解决方案都需要不同的数据用于不同机器学习模型的训练、测试和特征生成。下面是 Quora 用到的部分机器学习模型:
他们之所以用到了这么多模型,是因为不同的模型都有其最适合的场景。
感谢郭蕾对本文的审校。
给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ , @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群(已满),InfoQ 读者交流群(#2))。
评论