InfoQ Geekathon 大模型技术应用创新大赛 了解详情
写点什么

王守崑:搜索、计算广告、个性化推荐趋于融合

  • 2014-03-18
  • 本文字数:2236 字

    阅读完需:约 7 分钟

在电商、互联网广告、移动互联网,推荐系统发挥着越来越大的价值。豆瓣是国内较早涉及推荐算法和推荐系统的公司,在国内技术圈,豆瓣还有明显的工程师驱动的风格。在 QCon 北京 2014 大会上,豆瓣首席科学家王守崑将分享《大数据环境下社交图谱和兴趣图谱的融合》的话题。日前,InfoQ 对王守崑进行了专访,以下为采访内容:

InfoQ:王守崑你好,首先做个自我介绍吧。

王守崑:我在 2006 年加入豆瓣,8 年来一直从事个性化推荐技术、数据挖掘等互联网算法相关的工作。在此之前,我做过供应链优化建模、管理咨询,以及项目管理等工作。

InfoQ:过去一年中,你观察到推荐领域有哪些值得关注变化?

王守崑:过去几年来,一个明显的趋势是搜索、计算广告,以及个性化推荐这三者在底层模型和技术工具上越来越趋于融合。各种机器学习算法作为这三者的基础起到了至关重要的作用。运用各种成熟的机器学习方法来改善推荐质量,提升用户体验已经是从业者必备的技能之一。此外,移动互联网的蓬勃发展为个性化推荐提供了更加广阔的前景和想象空间,相比于 PC 互联网,用户使用场景和习惯的改变使得用户行为模型在个性化推荐领域的重要性获得了空前提升。个性化推荐不再单单局限于兴趣领域,兴趣、关系、场景、行为模式,这四者都会起到至关重要的作用。在技术上,个性化推荐也促进了很多机器学习算法并行化的发展,新的并行范式、新的数据存储方式层出不穷。可以毫不夸张的说,当前是个性化推荐领域飞速前进的时代。

InfoQ:社交图谱和兴趣图谱的建立,强烈依赖于用户是否想在这个平台上展示自己。想展示自己的用户的数量是有限的,那么怎么挖掘出那些用户活跃度不是很高的用户的兴趣图谱呢?即怎么解决数据的稀疏性的问题。

王守崑:数据稀疏性或冷启动问题的确是个性化推荐领域的经典问题之一。改进推荐算法,提升精准度在这个问题上有一定帮助,但是坦白的说,获取启动数据的关键更多的在产品和运营,尤其在产品初创阶段,算法能够起到的帮助比较有限。也就是说,关键在于产品的功能能否满足用户的需求,能否激发用户的分享和传播,从而使内容和数据的增长进入一个良性循环的轨道。当然,我们可以用一些隐式模型或降维的方法来预先处理数据,缓解稀疏性的问题,当更加主要的,还是要看产品的方向。

InfoQ:解决人与人、人与物的关联形成的图分析,目前有哪些比较好的开源计算框架?豆瓣现在使用了什么样的架构?这个架构能够分析什么样的数量级的数据?

王守崑:图计算也是引人瞩目的领域之一,利用图的特殊性进行数据存储和并行化计算,非常适合进行以链接和关系为基础的数据分析和相关的机器学习算法。比如 GraphLab、GraphDB、GraphSQL、Neo4j 等等都是大家使用比较多的工具。

InfoQ:兴趣图谱表明的是用户的兴趣的问题,如何把这个兴趣商业化呢?在购买交易等行为中,用户往往会综合考虑兴趣、价格、位置等多方面的因素,也就是如何把兴趣图谱应用到电子商务的商品推荐上呢?

王守崑:广义来看,兴趣是人们很多行为的持久驱动力之一。因此,从这个意义上讲,由兴趣而派生的商业行为和商业模式也会有持久的生命力。至于兴趣图谱在电子商务中的应用,很多电子商务的个性化推荐从业者都做的非常好,在这方面他们比我更有经验。

InfoQ:社交关系往往是社交网络才具有这样的数据,而对于其他企业(特别是电商)如何利用这些社交关系创造利润呢?也就是社交网络公司怎么才能把自己的数据的价值变现呢?

王守崑:社交关系会作为基础设施而存在,事实上我们在一些大的社交平台上已经可以很清楚的看到这一趋势了,这是正在发生的事情。各种应用,无论是电商、工具还是游戏,都可以社交关系这一基础设施中获得更好的传播和流量输入,从而获取更多利润。拥有大规模社交关系的公司一定是平台级的公司,他们变现的方式多种多样,有很大的想象空间。在这一过程中,个性化推荐可以帮助各方更有效的分配资源、提升利用率。

InfoQ:豆瓣一直专注推荐系统,说说你在 QCon 北京 2014 大会上的分享有哪些新信息?

王守崑:主要还是分享我们在兴趣图谱和社交图谱融合方面的一些经验和教训,以及对用户行为模式的一些理解和发现。

InfoQ:豆瓣的兴趣图谱与国外的 PInterest 等有何异同?社交图谱是只来自于豆瓣本身,还是会考虑其他的社会关系(如微博)?

王守崑:我们力图建立一个能够涵盖用户的各种兴趣的体系,并以此和社交图谱为基础串联起整个用户体系和用户在网站上的各种行为。社交图谱主要来自于豆瓣本身,在得到用户授权的情况下,我们也会考虑使用用户其他的社会关系。

InfoQ:豆瓣对两种图谱的融合,除了用于个性化推荐,还有哪些用途?

王守崑:搜索、广告、提醒,动态交互等等各方面都可以利用兴趣图谱和社交图谱融合所得到的结果。

InfoQ:除了这两种图谱,现在很多人还在说知识图谱,这个有没有可能与其他两种图谱结合?

王守崑:如果我们说的是 Knowledge Graph,那是 Google 对搜索未来的一种判断和期待。背后是 Google 整合人类所有信息和知识的努力,是语义网、认知科学和人工智能长久以来的积累和发展。这会是未来我们值得期待的突破之一,但目前对它的各种实用性要求,还为时尚早。

此专题详细信息,请见专题页面。关于此次 QCon 北京其他专题的详细信息,请移步至大会官网

需要特别注明的是,每年 QCon 大会门票都会在开幕前售罄,及早预定可提前确保席位,并享受更低折扣。3 月 26 日前报名参加可享受 9 折优惠。团体购票(5 人及以上)将享有更多优惠。详请咨询 qcon【at】cn.infoq.com,或直接致电 010-64738142。报名请点击报名页面。

活动推荐:

2023年9月3-5日,「QCon全球软件开发大会·北京站」 将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题,策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229(微信同手机号)。

2014-03-18 01:383856
用户头像

发布了 45 篇内容, 共 13.2 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

什么是IP 欺骗以及如何防范?

郑州埃文科技

网络安全 IP

极盾·析策,XDR的正确打开方式

极盾科技

网络安全 安全 数据安全 xdr

从0到1打造推荐系统工程实战

Jay Wu

推荐系统

从GitHub火到了InfoQ!共计1658页的《Java岗面试核心MCA版》,拿走不谢

收到请回复

Java 程序员 金九银十 Java面试八股文 常见面试题

兆骑科创创新创业大赛,双创活动,赛事承办,三招三引

兆骑科创凤阁

传媒数字化转型思考:小程序是音视频内容的更优载体技术

Speedoooo

小程序 数字化转型 小程序生态 传媒

小企业自动化运维管理用什么软件好?有便宜的吗?

行云管家

IT运维 行云管家 自动化运维 小企业

使用 HTML、CSS 和 JavaScript 的简单模拟时钟

海拥(haiyong.site)

开源 8月月更

CSDN 加入星策开源社区,携手推动企业智能化转型建设

星策开源社区

企业转型 智能化 CSDN

MySql主从同步介绍

京东科技开发者

MySQL 数据库 主从同步

重磅发布!阿里云全链路数据湖开发治理解决方案

阿里云大数据AI技术

大数据 阿里云 数据湖 数据分析

推荐 | 移动开发主流热更新技术

Speedoooo

小程序 APP开发 热更新

干货!XDR产品安全检测体系如何更好的落地?

极盾科技

网络安全 安全 信息安全 数据安全 xdr

容器化 | 一文搞定镜像构建方式选型

RadonDB

MySQL Docker Kubernetes 镜像 RadonDB

谁在构建超云?

Kent Yao

超云

Louvain算法在反作弊上的应用

百度Geek说

大数据 算法

带你玩转“超大杯”ECS特性及实验踩坑

科技怪咖

什么是知识库,为什么需要它?

Geek_da0866

XSKY星辰天合与观测云完成产品兼容性互认证 构建全业务链路的可观测性

观测云

火热与争议并行,XDR路在何方?

极盾科技

网络安全 安全 信息安全 数据安全 xdr

直播系统源码——重视哪些功能的开发?

开源直播系统源码

软件开发 直播系统源码 直播功能

重磅升级!TDengine3.0正式发布

TDengine

数据库 tdengine 时序数据库

这份由腾讯技术大牛耗费几个月总结的1518页的Netty学习笔记GitHub获赞96.5K

了不起的程序猿

Java 后端 Netty JAVA开发 java程序员

基于DevCloud进行黑白棋实时对战游戏开发实践

科技怪咖

7 天找个 Go 工作,Gopher 要学的条件语句,循环语句 ,第3篇

梦想橡皮擦

Python 爬虫 8月月更

让GitHub炸锅的深入理解MySQL实战手册,竟出自阿里云“藏经阁”

冉然学Java

Java MySQL 高可用 阿里 构架

企业实践|基于软件研运一体化DevOps平台的应用解析

云智慧AIOps社区

DevOps 自动化 敏捷开发 研发管理 代码托管

HUAWEI内网最新发布了一份452页网络协议手册,GitHb百万收藏

小柴说Java

Java 网络协议 java程序员 TCP/IP Java工程师

【Java】:程序流程的控制

翼同学

Java 学习 编程语言 分享 8月月更

湖南省株洲市有等保测评机构吗?咨询电话多少?

行云管家

网络安全 等保测评 等级测评 株洲

点赞破百万!字节算法大佬亲撰30W字数据算法笔记:GitHub标星93K

小柴说Java

数据结构 算法 算法题 算法与数据结构 算法面试题

  • 扫码添加小助手
    领取最新资料包
王守崑:搜索、计算广告、个性化推荐趋于融合_QCon_包研_InfoQ精选文章