是否可以将dask dataframe与teradata python模块一起使用?

2024-05-16 13:43:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我有这个代码:

import teradata
import dask.dataframe as dd

login = login
pwd = password

udaExec = teradata.UdaExec (appName="CAF", version="1.0",
                                    logConsole=False)

session = udaExec.connect(method="odbc", DSN="Teradata",
                                  USEREGIONALSETTINGS='N', username=login,
                                  password=pwd, authentication="LDAP");

而且连接正常。在

我想要一个dask数据帧。我试过了:

^{pr2}$

我得到一条错误信息:

^{3}$

有人有什么建议吗?在

提前谢谢。在


Tags: 代码importdataframeversionaspwdloginpassword
1条回答
网友
1楼 · 发布于 2024-05-16 13:43:25

read_sql_table需要一个SQLalchemy连接字符串,而不是传递时的“session”。我没有听说过teradata是通过sqlalchemy使用的,但是显然至少有one connector可以安装,而且可能还有其他使用通用ODBC驱动程序的解决方案。在

但是,您可能希望使用更直接的方法使用delayed,类似于

from dask import delayed

# make a set of statements for each partition
statements = [sqlStmt + " where id > {} and id <= {}".format(bounds)
              for bounds in boundslist]  # I don't know syntax for tera

def get_part(statement):
    # however you make a concrete dataframe from a SQL statement
    udaExec = ..
    session = ..
    df = ..
    return dataframe

# ideally you should provide the meta and divisions info here
df = dd.from_delayed([delayed(get_part)(stm) for stm in statements],
                     meta= , divisions=)

我们很想知道你的成功。在

相关问题 更多 >