写点什么

多模块进行时: 同时使用 RedisGraph 和 RediSearch 模块

  • 2020-03-01
  • 本文字数:2713 字

    阅读完需:约 9 分钟

多模块进行时:同时使用 RedisGraph 和 RediSearch 模块

在 2019 年的 RedisConf 会议上,我演示了一个在 RedisGraph 节点上进行全文 RediSearch 的解决方案。当时讲的有点模糊,但现在,我意识到我们应该解释一下我们是如何做到这一点并发布源代码。



在这个演示中我展示了一个小界面,它支持搜索动物并通过生物分类系统(界、门、类、目等)查看它们之间的关系。全文部分基于维基百科的第一段英文。例如,搜索“宠物猫”和“蓝鲸”,会发现他们都是哺乳动物,而如果搜索“宠物猫”和“雪豹”,则会发现他们都属于同一个科:猫科。


这个演示项目出乎意料地简单,但我应该指出 RediSearch 和 RedisGraph 之间的集成仍处于早期阶段,在编写本文时还没有准备好应用于生产环境。所以,我建议您在了解 RediSearch 和 RedisGraph 的集成将在未来几个月逐渐成熟的前提下,确定此方法是否能够满足您的需求。


让我们再讨论一下如何从源码构建。要完成的第一件事是基于代码库中正确的分支构建 RediSearch 和 RedisGraph。RediSearch 使用的是当前的主分支,而 RedisGraph 是 redisconf 分支。如果您想根据自己的需要构建解决方案,可以从源代码构建这两个模块。RedisGraph 和 RediSearch 的网站上都有关于如何构建的详细说明,这并不困难,只是需要一点时间。


配置模块的位置在 redis.conf 文件中,为了确保在 RediSearch 之前加载 RedisGraph,需要在 redis.conf 文件的模块部分将 RediSearch 的 loadmodule 配置项放在 RedisGraph 的 loadmodule 配置项之前。在完成编辑 redis.conf 之后,需要重启 Redis 服务器让配置生效。


在之前演示的 demo 中,我使用 RedisGraph-bulk-loader 脚本将以下内容从 CSV 加载到 RedisGraph,从而包括了我们收集的数据集。这个数据集只包括哺乳动物,因为其他动物的数据质量较低(非哺乳动物物种很少有好的维基百科描述)。


下面是加载数据的例子:


$ cd redisgraph-bulk-loader/$ python3 bulk_insert.py MAMMALS -q -n /path/to/demo/dataload/Class.csv -n/path/to/demo/dataload/Family.csv -n /path/to/demo/dataload/Genus.csv -n/path/to/demo/dataload/Order.csv -n /path/to/demo/dataload/Species.csv -r/path/to/demo/dataload/IN_CLASS.csv -r /path/to/demo/dataload/IN_FAMILY.csv -r/path/to/demo/dataload/IN_GENUS.csv -r /path/to/demo/dataload/IN_ORDER.csv -ayourpassword1 nodes created with label 'Class'157 nodes created with label 'Family'1272 nodes created with label 'Genus'29 nodes created with label 'Order'5616 nodes created with label 'Species'29 relations created for type 'IN_CLASS'1272 relations created for type 'IN_FAMILY'5616 relations created for type 'IN_GENUS'157 relations created for type 'IN_ORDER'Construction of graph 'MAMMALS' complete: 7075 nodes created, 7074 relationscreated in 0.443749 seconds$ redis-cli -a yourpassword GRAPH.QUERY MAMMALS "CALLdb.idx.fulltext.createNodeIndex('Species','description')"Warning: Using a password with '-a' or '-u' option on the command lineinterface may not be safe.1) (empty list or set)2) (empty list or set)3) 1) "Query internal execution time: 324.970000 milliseconds"
复制代码


(gist:https://gist.github.com/stockholmux/0727a4a784a46f8cb9e8329d393a513a)


在这里,key MAMMALS 包含了我们的整个图表。一些重要的注意事项:


•bulk_insert.py 上的-q 开关非常重要,因为它允许在读取 CSV 时进行智能引用。


•调用一次 redis-cli 对所有节点进行批量索引,从而为全文搜索摄取了 7000 多个文档。


现在让我们启动并运行一个 UI。和几乎所有 Node.js 应用程序一样,我们先安装 npm。安装大概需要几秒钟,因为我们不仅要管理 Node 的服务器端文件。还有前端的 Vue.js 组件。如果你最近没有花很多时间在前端 JavaScript 上,那你大概不能使用一个 FTP 和 HTML 文件来实现这些功能。所幸现代前端确实重视工具,所以我们可以安装 VueCLI(我建议遵循 Vue CLI 入门指南)。


在你的前端工具准备好过后,让我们继续来讲 npm 安装和启动运行前端上:


$ npm run build
复制代码


这将创建我们所有前端文件的 dist 目录。现在我们有数据在 Redis 里,我们的前端文件也准备好启动服务,所以我们可以连接 Redis 服务器:


$ node server.js -p 6379 -a yourpassword -hyourhostOrlocalhost
复制代码


让我们先讨论一下关于我们刚刚打开的这个服务器的一些问题。它构建在 Express.js 上,主要使用 WebSocket 进行通信。我还集成了可视化引擎调试工具,它允许您在单独的浏览器窗口中查看正在执行的命令。你可以把浏览器指向地址:http://localhost:4444


总之,相对于它所实现的功能来说,它非常的简短——只有 75 行代码。我们的解决方案不需要那么长,因为我们实际上所做的就是接受 WebSocket 连接,根据传递的消息运行 Redis 命令,然后将这些消息与结果一起传递回来。Redis(Graph)做了所有复杂的工作。让我们看看正在执行的命令。


为了搜索关键字,我们运行这个命令:


> GRAPH.QUERY MAMMALS"CALL db.idx.fulltext.queryNodes('Species','cat house pet')"
复制代码


这很简单。我们的键是哺乳动物,我们使用一个特殊的语法调用了一个特定的函数,它的第一个参数是我们要查找的节点的标签,另一个参数是实际要搜索的字符串。您可以传递有效的 RediSearch 参数进行查询,但请记住,目前这只是全文本搜索,因此不要使用地理空间、标记或数字子句。


一旦我们确定了我们要比较的两种动物,我们就可以使用一个简单的命令进行查询:


GRAPH.QUERY MAMMALS"MATCH (s:Species)-[]->(x)<-[]-(c:Species) WHERE c.fullname =‘Felis catus’ AND s.fullname = ‘Balaenoptera borealis’ RETURN x.name,labels(x) LIMIT 1"

在 server.js 文件中,这些查询被表示为 JavaScript 模板字符串,没有对用户隐藏,用户输入的字符串被直接插入到输入中进行查询。但如果在生产环境中部署类似这样的东西,就需要小心接收和校验用户输入。

如果打算修改前端代码,请确保编辑的是/src 目录,而不是/dist。编辑之后,您需要再次运行 npmrun build 或使用开发服务器(npmrun serve),该服务器自动编译对前端代码的更改,并将其提供给另一个端口。这是一个非常标准的 Vue.js 和 Bootstrap 应用。唯一真正相关的文件是:

/src/App.js, /src/components/panels.vue and /src/components/search.vue.

以上就是一个简单的功能强大的 demo,集成了两个不同的 Redismodule:RediSearch 和 RedisGraph。我鼓励你使用你自己数据集来体验这个 demo。


本文转载自 中间件小哥 公众号。


原文链接:https://mp.weixin.qq.com/s/dbqatouGwg0P_L9_SR5v_Q


2020-03-01 21:42851

评论

发布
暂无评论
发现更多内容

互联网上正规平台的辨别方法?被AG黑网投黑钱拿回的技巧方案

InfoQ_6b6a6317a692

架构师训练营—第三周学习总结

Geek_shu1988

架构师训练营 1 期第 3 周:代码重构 - 总结

piercebn

极客大学架构师训练营

LeetCode题解:242. 有效的字母异位词,哈希表两次循环,JavaScript,详细注释

Lee Chen

大前端 LeetCode

架构师训练营第一期 - 第三周课后 - 作业一

极客大学架构师训练营

区块链12年:应用在了哪些领域?

CECBC

区块链 教育 金融 物流

架构师训练营第 3 周作业

netspecial

极客大学架构师训练营

架構師訓練營第 1 期 - 第 02 周總結

Panda

架構師訓練營第 1 期

架构师训练营第 1 期 -- 第三周作业

发酵的死神

极客大学架构师训练营

第三周总结

_

极客大学架构师训练营 第三周总结

UML学习笔记

Edison

UML

架构师训练营—第三周作业

Geek_shu1988

为啥你用@JsonFormat注解时,LocalDateTime会反序列化失败?

冰河

springboot LocalDateTime JsonFormat

智能的本质—DIKW结构

良少

学习 AI 智能 DIKW

区块链到底是什么?它为什么如此受人关注

CECBC

区块链 金融

spring-boot-route(一)Controller接收参数的几种方式

Java旅途

Java Spring Boot

【读书笔记二】《企业IT架构转型之道-阿里巴巴中台战略思想与架构实战》

Man

中台 分布式 研发管理

go语言设计的理解-工程化语言

superman

Java 面向对象编程 Go 语言

极客时间 - 架构师一期 - 第三周作业

_

极客大学架构师训练营 第三周

LeetCode题解:242. 有效的字母异位词,哈希表一次循环,JavaScript,详细注释

Lee Chen

大前端 LeetCode

Ui Automator 框架和Ui Automator Viewer你会用吗?附送「必备adb命令」拿走不谢 !

清菡软件测试

android

为什么go中的receiver name不推荐使用this或者self

Gopher指北

后端 Go 语言

架构师训练营第 1 期 - 第三周学习总结

Anyou Liu

极客大学架构师训练营

架構師訓練營第 1 期 - 第 02 周作業

Panda

架構師訓練營第 1 期

如何理解区块链行业的安全问题?

CECBC

区块链 人工智能 大数据

一个草根的日常杂碎(10月1日)

刘新吾

随笔杂谈 生活记录 社会百态

第三周用组合设计模式编写程序

Geek_fabd84

架构师训练营第 1 期 -- 第三周学习总结

发酵的死神

极客大学架构师训练营

架构师训练营第 1 期 - 第三周课后练习

Anyou Liu

极客大学架构师训练营

架构师训练营第一期 - 第三周课后 - 作业二

极客大学架构师训练营

最完整的PyTorch数据科学家指南(1)

计算机与AI

学习 PyTorch

多模块进行时:同时使用 RedisGraph 和 RediSearch 模块_行业深度_翻译自redis.io_InfoQ精选文章