信息化技术的飞速发展,带来了海量数据的爆发。一方面,越来越多的数据可以为我们的生活带来便利,但另一方面,也给软件开发者带来了巨大的挑战——图片、视频、语音、文本数据越来越多地出现,开发者也不得不随之经历结构化数据处理、半结构化数据处理、非结构化数据处理的历程。
对于结构化数据来说,开发者已经有了非常成熟的索引算法,常见的有 Bitmap、哈希表和 B 树等,也建立了 Oracle 和 DB2 为代表的关系型数据库;而对于半结构化数据,倒排索引也是非常成熟的索引算法,诞生了 Solr 和 ElasticSearch 等搜索引擎;但是面对以图片视频为代表的非结构化数据,由于难以被传统计算方法和处理器进行处理与归类,长期以来始终困扰着开发者,成为搜索的便利精准度和实际落地难度的矛盾爆发点。
为此,Zilliz 推出了开源向量搜索引擎 Milvus,帮助用户应对以图片、视频、语音、文本为主的海量非结构化数据检索。在 Milvus 中,开发者通过灵活地选择多种向量相似度计算方式和索引类型,以主流的欧式距离、点积、余弦相似度等维度进行相似性计算,可以提高非结构数据的比对精准度,获得最优的搜索性能,而基于开源社区的特性,开发者还能发挥自身的主观能动性,参与到产品的开发及设计中,打造出更符合自己使用习惯的独家专属向量检索数据库。
众所周知,深度学习是目前最有效的非结构数据处理方式之一,而 Milvus 向量搜索引擎则对接了包括图片识别,视频处理,声音识别,自然语言处理等多种深度学习模型,不仅更方便于开发者的调用,也能通过引入 GPU 等高算力 ASIC,有效降低大规模向量搜索所需的硬件规模,从而在降低系统成本的同时,大幅提高向量搜索性能,支持企业在单台通用服务器上完成对十亿级数据的毫秒级搜索需求。
目前,在电子商务、泛互联网服务、智能产品设计、智慧城市建设、安防、生物制药、医疗方面,Milvus 都进行了广泛的服务覆盖,扩展了 AI 搜索服务的更多可能性。
当然,纸上得来终觉浅,作为最关注开发者体验的开源社区,怎么会不为大家提供更多一起放肆“造作”的机会?
10 月 17 日,在开源即将一周年之际,为了解答更多企业在使用非结构化数据过程中遇到的疑惑,也为了让更多开发者可以发掘非结构化数据的隐藏价值,Zilliz 携合作伙伴将在北京万达文华酒店举办第一届 Milvus Community Conf,供大家交流探讨。
在这次大会上,不仅有 Zilliz 的创始人兼 CEO,LF AI 基金会的董事会主席星爵为大家分享商业愿景和产品演技路线图,还有来自 Facebook、爱奇艺、贝壳找房、企查查、焦点科技与澜起科技等用户与合作伙伴,为大家进行基于计算机视觉、自然语言处理、推荐机制等与向量检索紧密相关案例的落地经验分享和分析,相信干货满满的演讲,和面对面提问技术大咖们的机会,会激发各位更强烈的脑洞碰撞,玩转向量搜索,拓展更多 AI 场景的性感玩法。
非常遗憾的是,因为疫情影响,本次大会仅开放 100 个入场名额,坐席紧张,赶紧在下图中扫码参与报名,和技术流玩家们一起加入 Milvus 的开发者社区,为技术狂欢,赢取神秘礼物吧。
(扫码报名)
评论