使用pandasq优化查询

2024-06-16 12:19:46 发布

您现在位置:Python中文网/ 问答频道 /正文

根据我的业务需求,我需要使用pandasql检索数据。我在代码中使用了大约4个查询&我的基本数据大小是2000000

我正在我的数据库中使用以下类型的查询代码。请注意,这里提供的变量名是伪变量,但语法是相同的。你知道吗

import pandasql as pdsql    
str1="""select distinct class,year,section,student_name  from student_data where class=%d and year='%s'"""
        str2=str1%(class,year)
        pysql = lambda q: pdsql.sqldf(q, globals())
        df1 = pysql(str2)

当前代码需要5分30秒来执行逻辑。在python3.x中有没有任何方法可以使用pandasql来优化它


Tags: 数据代码import数据库类型as语法业务