海山数据库(He3DB)+AI（五）：一种基于强化学习的数据库旋钮调优方法

大模型开发/技术交流

2024.10.23285看过

@[TOC]

0 前言

在海山数据库(He3DB)+AI（三）中，介绍了四种旋钮调优方法：基于启发式，基于贝叶斯，基于深度学习和基于强化学习。本文介绍一种基于强化学习的旋钮调优方法：QTune: A Query-Aware Database Tuning System with Deep Reinforcement Learning。

1 QTuner框架

数据库旋钮调优问题是一个NP-hard问题，现有的解决方法中仍存在一些不足：

DBA无法在不同的环境中对大量的数据库实例进行调优；
传统的机器学习方法依赖训练数据，而高质量的数据集难以获取；
大多数方法只支持粗粒度调优，如负载层面的调优，无法提供细粒度的调优，如query层面的调优。

为了解决以上不足，本文提出了基于强化学习的调优框架QTuner。QTuner首先将SQL语句进行特征向量化，然后将特征向量输入到训练好的模型中获得合适的旋钮配置。该深度模型使用了强化学习中的actor-critic网络，基于查询向量和数据库状态进行调优，能够在训练样本不足的情况下获得较好的效果。

QTuner中提供了三种不同粒度的调优：

Query-level：在该调优方法下，对于每个query，首先调整数据库的旋钮，然后执行查询，该方法可以优化延迟，但可能无法实现高吞吐量。
Workload-level：该调优方法对整个工作负载的数据库旋钮进行调优，这种方法不能优化查询延迟，因为不同的query可能需要使用不同的最佳旋钮值，然而，这种方法可以实现高吞吐量，因为不同的query可以在设置新调整的旋钮后并行处理。
Cluster-level：在该调优方法下，将query分成不同的组，为每个组进行旋钮调优，同一组中使用相同的旋钮配置，并执行并行查询，该方法可以同时优化延迟和吞吐量。

三种不同粒度的调优流程如下图所示：

2 query特征化

在特征化的过程中，需要考虑以下问题：1）如何来捕获query的信息，如query中涉及多少表？2）如何捕获执行query的代价？3）如何对向量进行编码使得其维度一致？

2.1 特征提取

本节主要回答第一和第二个问题，即如何捕获query和代价信息。

（1）Query信息

将一条Query语句进行分解，一般包括以下几个部分：query类型（如insert，delete和update等），涉及的表，属性，操作（如selection，join和groupby)。在以上部分中，哪些特征是重要的呢？首先，query类型是重要的，不同的类型具有不同的代价。其次，涉及的表也是重要的，表的数据量和结构会显著影响数据库的性能。而属性和操作可以忽略，原因有三：一是代价信息中会捕获操作信息，不需要对该信息进行重复编码；二是操作信息太过于具体，可能会导致泛化性能降低；三是属性和操作信息更新过于频繁，每次更新都需要对模型进行重新设计。

（2）代价信息

代价信息捕获处理这条query时的执行代价，出于实际情况，使用优化器的成本估计来代替实际的执行成本。

2.2 编码方法

本节回答向量化的第三个问题，如何编码使其维度一致。

3 DS-DDPG

在对query向量化后，将其输入DS-DDPG模型得到推荐的旋钮参数。本节首先介绍DS-DDPG框架，然后介绍该框架的训练过程。

3.1 模型框架

DS-DDPG将旋钮调优问题建模为强化学习，将调优过程中的各个问题映射到各个强化学习模块，映射关系如下图所示：

3.2 训练方法

在DS-DDPG模型中，包含了Predictor模型，Actor和Critic模型（Agent模型）。整体的训练流程如算法1所示:

训练Predictor模型如算法2所示：

训练Agent模型如算法3所示：

4 Query分组

在Cluster-level进行调优时，对query进行分组调优，从而结合query层间调优的优化延迟和负载层面调优的高吞吐量这两个优点。每一个query得到一组配置参数，对所有的配置参数进行聚类分组。每个旋钮的值为不同区间的连续值，聚类中不需要如此精确的值，因此本文将每个旋钮离散化为 - 1，0，1 。具体来说，对于每个旋钮，如果调整后的旋钮值在默认值附近，将其设置为0；如果估计值远大于默认值设为-1，如果估计值远小于默认值设为-1。

同时，为了避免聚类过程中的维度灾难问题，只选择最常调整的旋钮作为特征，如在Postgre中，选择20个旋钮，每个旋钮有3个可能的值，那么就有3^{20}种可能的情况，本文利用深度模型对离散特征进行进一步映射降低计算量，深度模型结构如下图所示。

在获得每个query的深度特征后，根据特征的相似性将其分类到不同的簇中。本文使用DBSCAN算法进行聚类，DBSCAN在配置模式的基础上，根据距离度量和需要聚类的最少点数将距离较近的模式聚在一起，从而得到不同分组中的配置参数。

————————————————

原文链接：https://juejin.cn/post/7418237666397093925

如有侵权，请联系千帆社区进行删除

海山数据库(He3DB)+AI（五）：一种基于强化学习的数据库旋钮调优方法

0 前言

1 QTuner框架

2 query特征化

2.1 特征提取

2.2 编码方法

3 DS-DDPG

3.1 模型框架

3.2 训练方法

4 Query分组

热点话题

首个云超算国标正式发布！百度智能云CHPC首批通过并获最高评级

百度智能云x兴业银行，共建金融智能体产业生态

打破算力瓶颈！起底百度智能云高性能存储加速系统如何让昆仑芯3万卡集群火力全开

表现优异！百度智能云VectorDB首批完成中国信通院向量数据库性能测试