6 月 13 日,记者获悉,腾讯云数据库三篇论文再次入选数据库行业顶会 SIGMOD,被 SIGMOD 2022 Research Full Paper(研究类长文)收录。
本次被收录的研究成果中,新型数据结构设计、AI 智能调参优化等均属于业界首次提出。腾讯云数据库多次入选 SIGMOD,表明腾讯云数据库在存储、智能管控等方面的积累与前沿创新获得了国际权威认可。
SIGMOD,全称数据管理国际会议(Special Interest Group on Management Of Data),是由美国计算机协会(ACM)数据管理专业委员会(SIGMOD)发起、在数据库领域具有最高学术地位的国际性学术会议。
第一篇入选论文题目为 HUNTER: An Online Cloud Database Hybrid Tuning System for Personalized Requirements,由腾讯云数据库团队和华中科技大学合作完成,在 AI 智能调参优化上取得进一步突破。
通俗理解,数据库的参数设置多达几百个,这些参数控制着数据库的性能表现。专业运维人员会花大量时间,根据经验来调优数据库的参数,以匹配不同硬件、需求和业务场景。如何利用 AI 技术解决数据库系统性能问题变得越来越重要和紧迫。
在此篇论文中,腾讯云数据库 TDSQL-C 团队提出了混合调优系统 Hunter,主要解决了如何在保证调优效果的前提下显著减少调优时间的问题。实验表明:随着并发度提升实现调优时间准线性降低,在单并发度场景下调优时间只需 17 小时,在 20 并发度场景下调优时间缩短至 2 小时。
第二篇入选论文由中国人民大学和腾讯云数据库团队合作完成,题为 CompressDB: Enabling Efficient Compressed Data Direct Processing for Various Databases,论文针对压缩数据的直接操作与处理,提出一项新型数据库处理技术——CompressDB。
面对当下指数级增长的数据量,行业普遍使用数据压缩来减少存储空间。在大数据管理系统中,直接在压缩数据上进行操作,可以获得存储空间的节约和处理性能的提升。但是,当前的此类系统只关注数据查询,而一个完整的大数据管理系统必须支持数据查询和数据操作。
本研究提出并实现了新型数据库技术,利用上下文无关文法来压缩数据,通过新的数据结构和算法设计实现对语法规则进行解析,CompressDB 支持直接对压缩后的数据进行数据查询和操作,并且支持各种数据库系统。实验表明,CompressDB 平均达到 40%的吞吐量提升和 44%的延迟缩短,并实现 1.81 倍的压缩率。
第三篇入选论文由腾讯和北京大学合作完成,题为 BlindFL: Vertical Federated Machine Learning without Peeking into Your Data。针对数据隐私安全问题,该论文提出了一个新的纵向联邦学习范式 BlindFL,可支持多种特征数据类型,且可以在半诚实安全假设下证明其安全性。实验结果表明,BlindFL 可有效保护参与方的隐私数据,并具有更高的运行效率。
腾讯历来重视数据库领域的研发,通过校企联合实验室共建,面向青年学者的 CCF-腾讯犀牛鸟基金,腾讯犀牛鸟科研专项等与高校、科研机构构建“产学研”一体的长期合作,将技术研究成果转换为应用落地,校企联合持续输出前沿技术创新与示范性应用。
此前,腾讯云数据库 TDSQL 曾多次亮相数据库三大顶会 SIGMOD、ICDE、VLDB,以及数据科学领域的顶级期刊 IEEE TKDE 等。腾讯云数据库 TDSQL 将继续加大对数据库基础研究创新、数据库产学研合作生态的建设投入,充分释放领先技术的红利,助力国产数据库学术人才培养和技术创新生态建设发展。
评论