写点什么

ArchSummit 讲师专访:百度主任架构师廖若雪谈搜索新时代

  • 2012-07-06
  • 本文字数:1655 字

    阅读完需:约 5 分钟

编者按:由 InfoQ 中文站主办的首届 International ArchSummit 架构师峰会即将召开。我们也对一些专题的讲师进行了采访,谈谈他们要讲的议题。

廖若雪,百度主任架构师,现在主要负责推荐。在百度之前做了很长时间跟搜索架构、图形分析相关工作。

InfoQ:您在百度内负责了哪些与搜索相关的技术和架构?

廖若雪:我最早进百度就是开始做检索架构,后来就逐渐扩展到跟 ranking 相关的,比如说排序、相关性,逐渐扩展到用户行为分析,后来又做了一段下一代搜索架构相关工作。

InfoQ:您认为搜索目前面临哪些问题?有哪些地方可以改进?

廖若雪:现在搜索引擎本身是从满足用户需求角度出发的,然后扩展到一些新问题,包括时效性、权威性、相关性,以及这两年新出来的一些东西,比如我们推出一些满足用户真正潜在需求的功能。尽管有绝大部分用户需求我们已经满足的不错了。但是还有相当一部分用户需求我们满足得不好,我们可以看到很多。举个例子,用户,尤其中国用户的自然语言表达成分越来越多,这对于搜索是巨大的挑战。在很多国家,或者一些高端用户,他们在查询的时候,他会写一些独立的、用空格隔开的词。在中国,很多用户一上来就直接输入问题。比如可能有人输入:一篇描写春天的作文,五百字左右,然后空格,快一点。这是一个很有意思的概念,用户使用搜索引擎,是把你当成一个万事通。如何去满足这样的需求呢,我们用了很多方法。从语义角度,从用户行为分析的角度,去解决这样的问题。我们解决了一部分,但还有很大一部分问题没有解决,这是一个方面。

第二个比较大的挑战:很多时候,现在用户在使用搜索引擎时,他的需求是隐藏的,我们称之为潜在需求,流行一点,就是个性化需求。这种潜在需求是和他的个性化有关的。举个最简单的例子,用户搜索天气,这个个性化产生在什么地方呢?在于他的位置,在北京,北京的天气,在深圳,深圳的天气。这是跟地理相关的。比如说他搜苹果,对于很多人来说,可能是吃的苹果;最近新闻上面也有一些跟跟吃的苹果相关的新闻。还有很多人是对于苹果电脑、苹果公司和 WWDC 大会的新闻。这就需要我们把这个人搜索时的上下文,对他所处的环境,融入搜索结果中。

InfoQ:这次“搜索新时代”专题中目前有这几个演讲:百度陈竞凯的“网页搜索新技术探讨”、搜狗茹立云的“深层网络搜索核心技术探讨”、一淘网曲琳的“购物搜索引擎架构的变与不变”。对于这几个演讲,您有什么期望?

廖若雪:这些议题都是我们现在搜索中随时面临的一些主要问题。实际上百度对这些问题或多或少有自己的研究,或者很多自己的方法,也希望看到很多同行有没有新的方案,新的思路,或者说比我们做得更好的,我们可以借荐的地方。

InfoQ:除 Google、Bing 之外,国外还有一些其他搜索引擎,比如像 DuckDuckgo、WolframAlpha 等等,但是他们并不像 Google 和 Bing 这么成功,您觉得原因何在?

廖若雪:这些搜索引擎是在某一方面产生了突破,比如说在处理自然语言方面,或者说处理一些更复杂的结构化数据上面,会更加得力。但是我们知道:搜索引擎,现在已经不是一个小众的、或者能满足用户一部分就能做起来的产品。首先要满足用户大量的需求,如果对于比较通用的需求满足不好,只在某一方面有突破,其实没有办法作为用户日常使用的搜索引擎存在。

InfoQ:请您对参加“搜索新时代”和 ArchSummit 架构师峰会的参会者说几句话。

廖若雪:希望这个架构峰会办好,真正能使得做架构的同仁们在里面学到知识,真正解决问题,让大家一起讨论得比较开心,能够交到真正的朋友。

相关信息


给 InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2012-07-06 00:402143
用户头像

发布了 479 篇内容, 共 159.3 次阅读, 收获喜欢 50 次。

关注

评论

发布
暂无评论
发现更多内容

八月最新首发!这份Dubbo 3.0 分布式实战笔记由阿里巴巴P8亲自撰写真是大厂offer收割机

了不起的程序猿

Java 分布式 dubbo java程序员 java编程

字节跳动嵌入式数据分析最佳实践

字节跳动数据平台

字节跳动 数据分析 BI 嵌入式分析 数据看板

泄露了,Alibaba697页的MySQL应用实战与性能调优手册,太强了

冉然学Java

Java MySQL 编程 性能优化 构架

【Java】:数组的创建、赋值、访问以及长度

翼同学

Java 学习 编程语言 分享 8月月更

HTML

武师叔

8月月更

有关Java性能优化,这是我见过阿里大佬总结的最全的一份实战文档了

程序员小毕

Java 程序员 面试 程序人生 性能优化

将使用回调函数作为参数的函数改造为返回 Promise 的一个具体例子

汪子熙

JavaScript web开发 Promise 异步编程 8月月更

合作再升级!云原生加速器成员企业云霁科技获得阿里云产品生态集成认证

阿里巴巴中间件

阿里云 云原生 合作 阿里云云原生加速器

打破底层技术瓶颈,RTC技术或成为物联网市场的强劲引擎

擎声科技

物联网 RTC sdk 实时音视频 擎声Qtt

技术团队管理者的三十六计

申屠鹏会

团队管理

如何开发一款基于 vite+vue3 的在线表格系统(下)

葡萄城技术团队

Vue 前端 vite

Java架构岗9大性能优化经验总结,我不允许你不会

程序员小毕

Java 数据库 程序员 面试 程序人生

浅谈云上攻防系列——云IAM原理&风险以及最佳实践

腾讯安全云鼎实验室

安全攻防 云安全 安全研究

从程序员到架构师,阿里巴巴2022全新出品Java程序员“成长笔记”满足了我的所有幻想

Java全栈架构师

Java 程序员 面试 后端 架构师

开源贡献者计划 2022 第二期正式启动!争做战“码”先锋!

InfoQ写作社区官方

开源 OpenHarmony 热门活动

「望繁信科技」完成过亿元A+轮融资,全面加速流程智能产品建设

望繁信科技

大专的我狂刷29天“阿里内部面试笔记”最终直接斩获十七个Offer

收到请回复

Java 程序员 阿里 面试八股文 Java面试八股文

渲染与云渲染——渲染行业的新趋势

Finovy Cloud

云渲染 GPU算力

本周四晚19:00知识赋能第七期第2课丨OpenHarmony WiFi扫描仪UX设计

OpenHarmony开发者

Open Harmony

罗技产品究竟能不能带来便捷感

Amazing_eve

#开源

多线程+JVM+设计模式+数据库,阿里巴巴Java性能优化全解实战笔记真香

Java永远的神

Java 数据库 程序员 面试 多线程

openEuler代码贡献之星:麒麟软件裴建康

openEuler

开发者 成长 代码规范 openEuler 开源社区

个推TechDay直播预告 | 8月24日晚19:30,实时数仓搭建保姆级教程开课

个推

数据仓库 实时数仓 Flink 平台

2022上半年PMP考试通过率得多低,才能换来一次免费补考机会

索隆

程序员面试太卷?我选择背这份阿里最新Java面试八股文(详解版)

Java面试那些事儿

Java 面试 Java 面试 java程序员 java 编程

短视频源码APP开发——短视频的功能

开源直播系统源码

软件开发 直播系统源码 短视频直播系统

从函数计算到 Serverless 架构

阿里巴巴中间件

阿里云 开源 Serverless 云原生

架构设计文档模板

maybe

OpenYurt 邀你共赴 2022 EdgeX 中国挑战赛!

阿里巴巴中间件

阿里云 云原生 openyurt 边缘容器

避免 10 大 NGINX 配置错误(下)

NGINX开源社区

nginx 配置 配置分析 故障排除

GitHub破百万访问的阿里神作:并发实现原理JDK源码笔记

冉然学Java

Java 编程 jdk 源码刨析 JDK 1.5

ArchSummit讲师专访:百度主任架构师廖若雪谈搜索新时代_百度_郑柯_InfoQ精选文章