雪花python连接器无法处理AWS lamb中的较大数据集

connector = snowflake.connector.connect( account=os.environ['SNOWFLAKE_ACCOUNT'], user=os.environ['SNOWFLAKE_USER'], password=os.environ['SNOWFLAKE_PASSWORD'], role="MY_ROLE", ocsp_response_cache_filename="/tmp/.cache/snowflake/" "ocsp_response_cache", ) print("Connected to snowflake") cursor = connector.cursor(DictCursor) cursor.execute('USE DATA.INFORMATION_SCHEMA') query = "SELECT * FROM TABLE WHERE X=Y" # FAKE QUERY print("Execute query: \n\t{0}".format(query)) cursor.execute(query) print("Execute query done!") posts = [] processed = 0 for rec in cursor: processed += 1 print("Processed count: {}".format(processed)) posts.append(rec) # These attempts also didn't work. # posts = cursor.fetchmany(size=cursor.rowcount) # posts = cursor.fetchall() cursor.close()

2条回答

网友

1楼 · 编辑于 2024-04-28 05:13:06

我也遇到过类似的问题，但是使用雪花JDBC连接器。在

Select*from table：获取第一个数据块（600个记录），然后在获取下一个数据块时得到“连接超时”

如果我这样做，Select*from table limit 1200，它可以很好地工作，没有任何超时

所以，把整个过程分成两个步骤。。在

rowcount=从表中选择count（*）
从表中选择*限制行数

网友

2楼 · 编辑于 2024-04-28 05:13:06

从日志来看，python连接器似乎一直在尝试从s3下载结果。如果查询生成大量数据，这是预期的行为。我建议您尽量确保lambda环境能够访问s3bucket。一个简单的curl命令应该可以验证它。在

curl -v https://sfc-va-ds1-customer-stage.s3.amazonaws.com

如果你能得到一些http代码回来（比如403），那就意味着你有了连接。否则，如果挂起，则说明您的环境中没有正确配置某些内容。在

相关问题更多 >

编程相关推荐

热门问题

热门文章