我们在Kaggle上仍然没有访问Google Drive文件夹的方法吗?

0 投票
1 回答
38 浏览
提问于 2025-04-13 18:46

我有一个比较大的数据集(大约5GB),里面存的是一些图片,这些图片存放在谷歌云盘的一个文件夹里。我想对这些图片进行处理,并应用深度学习算法。为了做到这一点,我必须把数据集放到Kaggle这个环境中。我在网上查了一下,发现似乎没有办法,或者说我目前找到的信息就是这样。

这个回答提到了使用gdown库,但可能是因为cookies的问题,谷歌云盘拒绝了访问。我试着把我的cookies挂载到Kaggle环境里,但这并没有用。

我可能需要写一些其他的脚本来下载数据。也许可以先把谷歌云盘文件夹里每个文件的链接存下来,然后在Kaggle环境中逐个访问这些链接,这样可能会有帮助。不过我有点懒。

我想知道有没有什么方法可以做到这一点?

1 个回答

0

虽然我没找到更好的方法,但这是我根据@PaoloJ42的建议找到的解决办法:

  1. 首先,从谷歌云盘下载数据集。(下载时它已经是压缩文件格式)

  2. 不要直接把这个压缩文件上传到Kaggle的“上传数据”选项中,最好是在Kaggle里自己创建一个数据集。可以选择使用“数据集 > 新建数据集”。你可以把它设置为私有。

  3. 上传后,压缩文件会自动解压。你可以使用这个链接。只需添加以下代码片段:

    import os
    os.environ['KAGGLE_USERNAME'] = 'username'
    os.environ['KAGGLE_KEY'] = 'kaggle_key'
    

你可以在设置中找到这个,路径是“设置 > 创建新令牌”(在API部分)。

这样你就不需要频繁上传文件了。

撰写回答