云搜索服务在不同场景下的技术能力主要体现在四个方面:
站内搜索场景的智能化增强
在网站、APP、对话机器人等众多站内搜索场景中,经常会碰到两类问题导致搜索不准确。
一类是分词。比如新词或特有名词无法搜索、短语查询不准确、词库无法支持多租户等等。针对这些场景,华为将自研分词器嵌入云搜索服务中,为用户提供新词或者特有名词识别、英文短语支持、索引级别自定义词库等众多功能。
另一类是搜索结果排序。在 ES 中做搜索定制排序规则时,都是静态的,比如制定各个字段的权重,打分的算法等。但是在现实场景中,用户往往不是按照我们的打分规则来评判自己想要的东西。针对这些场景,云搜索服务可以根据用户点击历史数据训练模型进行重排序,达到越搜越准的效果。
多媒体检索场景的多元化延伸
在多媒体搜索场景中,最通常的就是通过图片的描述进行搜索,但是这种方式很有局限性,搜索的结果完全取决于描述的正确性以及搜索语句是否合适。云搜索服务在开源的 ES 基础之上,增强了对图片特征向量检索相关技术的支持,实现了以图搜图,以及图片与文本的协同搜索。有了对图片搜索的支持,云搜索服务把 ES 扩展到了图片版权查询、手机拍照查询等更多的应用场景中。
音频检索中,如何用音频片段在大量音频内容高效的找到匹配的音频,是传统方法面临的难题。云搜索服务结合全文检索技术,将音频指纹检索利用倒排索引加速,很好地解决了音频检索的性能问题。
日志分析场景的便捷化扩展
在日志分析场景中,如何有效进行日志分析成为一个难题。总体而言,包括以下四个方面:日志分散,分析困难,容量有限和速度受制。云搜索服务利用云上优势,和数据接入、实时流计算、云数据迁移等服务打通,用户无需编程就可以搭建一套完整的日志解决方案。
同时,云搜索服务还给 ES 添加了更多的算子,比如 Last Hit,满足了用户更多的统计分析需求。
云端运维能力的专业化积累
云服务在生产环境中必须要能长期、稳定、可靠的运行,这离不开运维系统和运维团队的保障。云搜索服务一键式的部署和扩容功能、自动备份机制、开放的 API 和可配置的监控告警平台,让用户从运维中解放出来。运维团队也构筑了 SRE 能力,从研发、基础设施、运营、运维等多个层次展开,并 7*24 小时 oncall 守护用户的服务稳定运行。
云搜索服务在对外提供服务的同时,也在为自己的服务提供着运维支撑。其利用 filebeat+logstash 收集管理面和业务面的日志,实现日志的可视化分析;收集数据库运维数据和用户 ES 集群的监控数据,做实时的监控和告警,让运维人员先于客户发现问题。这种自己的产品自己应用的方式,不仅检验了云搜索服务的稳定性,也在产品使用上积累了丰富的经验,从而为用户使用云搜索服务提供了更好的保障。
本文转载自华为云产品与解决方案公众号。
原文链接:https://mp.weixin.qq.com/s/UZZLmLPnhGADAYWsgu5gIw
评论