从URL读取Zip文件，并将Ms Access文件转换为数据帧

from zipfile import ZipFile from io import BytesIO import urllib from urllib.request import urlopen from sqlalchemy import create_engine import pandas as pd r = urlopen("https://rgl.faa.gov/Regulatory_and_Guidance_Library/rgPMA.nsf/f6a80b2e3c91131686257bcf0063a042/bc1b3424cc899bee86257beb006237ae/$FILE/PMA.zip").read() file = ZipFile(BytesIO(r)) pma_accdb = file.open("PMA.accdb") connection_string = (r'DRIVER={Microsoft Access Driver (*.mdb, *.accdb)};' r'DBQ=pma_accdb;' r'ExtendedAnsiSQL=1;' ) connection_url = f"access+pyodbc:///?odbc_connect={urllib.parse.quote_plus(connection_string)}" engine = create_engine(connection_url) sql_df = pd.read_sql("SELECT * FROM Parts", con=engine) print(sql_df.head())

from zipfile import ZipFile from io import BytesIO from urllib.request import urlopen import pyodbc import pandas as pd r = urlopen("https://rgl.faa.gov/Regulatory_and_Guidance_Library/rgPMA.nsf/f6a80b2e3c91131686257bcf0063a042/bc1b3424cc899bee86257beb006237ae/$FILE/PMA.zip").read() file = ZipFile(BytesIO(r)) pma_accdb = file.open("PMA.accdb") driver = '{Microsoft Access Driver (*.mdb, *.accdb)}' filepath = pma_accdb myDataSources = pyodbc.dataSources() access_driver = myDataSources['MS Access Database'] cnxn = pyodbc.connect(driver=access_driver, dbq=filepath, autocommit=True) crsr = cnxn.cursor() crsr.execute("SELECT * FROM Parts") sql_df = pd.read_sql("SELECT * FROM Parts", con=engine) print(sql_df.head())

1条回答

网友

1楼 · 发布于 2024-05-23 14:23:53

我得到一个朋友的帮助。这就是解决方案：


        from zipfile import ZipFile
        from io import BytesIO
        import urllib
        from urllib.request import urlopen
        from sqlalchemy import create_engine
        import pandas as pd
        
        resp = urlopen("https://rgl.faa.gov/Regulatory_and_Guidance_Library/rgPMA.nsf/f6a80b2e3c91131686257bcf0063a042/bc1b3424cc899bee86257beb006237ae/$FILE/PMA.zip").read()
        zipfile = ZipFile(BytesIO(resp))
        
        connection_string = (r'DRIVER={Microsoft Access Driver (*.mdb, *.accdb)};'
        r'DBQ=' + zipfile.extract('PMA.accdb') + ';'
        r'ExtendedAnsiSQL=1;'
        )
        connection_url = f"access+pyodbc:///?odbc_connect={urllib.parse.quote_plus(connection_string)}"
        engine = create_engine(connection_url)
        sql_df = pd.read_sql("SELECT * FROM Parts", con=engine)

相关问题更多 >

编程相关推荐

热门问题

热门文章