如何使用PandasSQL优化查询?

2024-04-18 06:36:25 发布

您现在位置:Python中文网/ 问答频道 /正文

对于业务,我需要使用PandaSQL检索数据。我在代码中使用了大约4个查询,基本数据大小为2000000

我在代码中使用以下类型的查询。请注意,这些变量是虚拟变量,但语法是相同的

import pandasql as pdsql    
str1="""select distinct class,year,section,student_name  from student_data where class=%d and year='%s'"""
        str2=str1%(class,year)
        pysql = lambda q: pdsql.sqldf(q, globals())
        df1 = pysql(str2)

目前,执行代码需要5分30秒。如何在Python3.x中使用PandaSQL使其运行得更快


Tags: 数据代码import类型as语法业务year