为什么同一个SQLite查询在只获取两倍结果时要慢30倍？

3条回答

网友

1楼 · 编辑于 2024-05-21 04:52:50

考虑对查询中涉及的表使用covering indices。

您确实在select语句以及相应的inner join和where子句中获取了有限数量的列。通过使用一个包含列的覆盖索引，您将得到一个非常快速的查询，即您将删除scan table，而不是^{} using a ^{}。

尝试在表中使用这些索引：

CREATE INDEX `fk_covering_feature` ON `feature` (`msrun_msrun_id`,`mzMin`,`mzMax`,`rtMin`,`rtMax`,`feature_table_id`);
CREATE INDEX `fk_covering_spectrum` ON  `spectrum` (`msrun_msrun_id`,`scan_start_time`,`spectrum_id`);
CREATE INDEX `fk_covering_MSMS_precursor` ON  `MSMS_precursor` (`spectrum_spectrum_id`,`ion_mz`,`precursor_id`);

在追求速度时，还应该提示查询计划器理解msrun msrun id是一个常量，用于检查feature和spectrum表。在查询中添加常量测试，方法是将此附加测试放在查询的末尾（并通过spectrumFeature_InputValues两次）：

"AND spectrum.msrun_msrun_id = ?"

网友

2楼 · 编辑于 2024-05-21 04:52:50

我建议您尝试使用R*Tree index，它们是为高效的范围查询而设计的。

我实际上并没有太多使用R*Tree，只是阅读了文档，但我认为您可能使用错误。您可以尝试将查询更改为使用

WHERE convexhull_edges.rtMin <= spectrum.scan_start_time AND convexhull_edges.rtMax >= spectrum.scan_start_time AND
convexhull_edges.mzMin <= MSMS_precursor.ion_mz AND convexhull_edges.mzMax >= MSMS_precursor.ion_mz

这应该相当于您当前的查询，但我认为应该更快（您应该从R*树中选择一个范围，而不是将点与范围进行比较）

网友

3楼 · 编辑于 2024-05-21 04:52:50

执行时间与每个表中的行数成几何比例，而不是算术比例，例如

3 tables with 10 rows each => 1,000 comparision

3 tables with 10, 10 and 40 rows => 4,000 comparisons

3 tables with 20 rows each => 8,000 comparisons

您可能会重新调整查询的因子，以避免某些连接/游标—何时需要答案？

你能这样做吗：

SELECT precursor_id, feature_table_id 
FROM MSMS_precursor
INNER JOIN 

    (
        SELECT mzMin, mzMax, rtMin, rtMax, spectrum_id, feature_table_id, msrun_msrun_id

        FROM spectrum
        INNER JOIN 

           (select feature_table_id, mzMin, mzMax, rtMin, rtMax, msrun_msrun_id
            from feature
            where feature.msrun_msrun_id = 'value'
           ) subquery 

        ON subquery.msrun_msrun_id = spectrum.msrun_msrun_id
        WHERE 
            spectrum.scan_start_time BETWEEN subquery.rtMin AND subquery.rtMax 
    ) subquery

    ON subquery.spectrum_id = MSMS_precursor.spectrum_spectrum_id 

WHERE 
    MSMS_precursor.ion_mz BETWEEN subquery.mzMin AND subquery.mzMax

使用子查询可以减少表之间的比较次数-可以在搜索合适的前体之前快速筛选出不需要的特征，然后筛选出不相关的光谱。

我不使用SQLLite-但原则仍然适用。

更新：修复了SQL中的错误

注：

你不必担心这些，你只会得到：

feature.msrun_msrun_id='值'
这些特征的光谱和光谱扫描的起始时间 subquery.rtMin和subquery.rtMax
这些光谱的前体，以及subquery.mzMin和子查询.mzMax

5月18日更新：

这是索引！！！您在搜索字段上有索引，但在参与联接的字段上没有索引-外键索引确实提高了性能：

CREATE INDEX `fk_msrun_msrun_id_feature` ON `feature` (`msrun_msrun_id` ASC); 
CREATE INDEX `fk_spectrum_spectrum_id_feature` ON `feature` (`msrun_msrun_id` ASC); 
CREATE INDEX `fk_spectrum_spectrum_id_MSMS_precursor` ON `MSMS_precursor` (`spectrum_spectrum_id` ASC);

更新1：

更新2：

更新3

更新4

更新5

相关问题更多 >

编程相关推荐

热门问题

热门文章