4.7 | AzrMedit0x,冥思构造体

《IWEK: An Interpretable What-If Estimator for Database Knobs》

两个模型，四张图解释。

简而言之是使用回归模型，从一个旋钮knob候选集中找到最佳旋钮调优。

这里面$R^2$是指一些二阶误差评估方法，比如

左边是评估器，右边是转换器

输入数据库的日志信息，并获取它的数据指纹
这里考虑两种旋钮：1.资源旋钮（内存/并行性……）2.执行旋钮（SUID/索引……）
为这两种个旋钮设计了两种统计学特征。
然后我们设计了数据指纹：通过组合SUID向量（代表执行）和物理操作符向量（代表物理资源）。
在经验库中连接相似的数据指纹

欧氏距离来判断相似性。

为了解决旋钮中特征过于多样化的问题，我们设计了一个统一且稳定的旋钮转换网络。
核心思想：计算得到的训练数据有限的新场景O 以获得 K-P数据分布相似性。

采样策略：
算法：Latin HyperCube Sampling
采样空间：IV-B 节的迁移排序机制筛选

最终：通过上述策略，在场景 O 中收集高质量样本 S，作为计算 K-P 分布相似性的基础。

K-P构建：

特征计算：通过捕捉K-P点集的分布趋势特征，量化分布之间的相似性。

相似性度量：余弦距离。

上面的步骤拼起来。

TODO：翻译连锁