我们在Kaggle上仍然没有访问Google Drive文件夹的方法吗?
我有一个比较大的数据集(大约5GB),里面存的是一些图片,这些图片存放在谷歌云盘的一个文件夹里。我想对这些图片进行处理,并应用深度学习算法。为了做到这一点,我必须把数据集放到Kaggle这个环境中。我在网上查了一下,发现似乎没有办法,或者说我目前找到的信息就是这样。
这个回答提到了使用gdown库,但可能是因为cookies的问题,谷歌云盘拒绝了访问。我试着把我的cookies挂载到Kaggle环境里,但这并没有用。
我可能需要写一些其他的脚本来下载数据。也许可以先把谷歌云盘文件夹里每个文件的链接存下来,然后在Kaggle环境中逐个访问这些链接,这样可能会有帮助。不过我有点懒。
我想知道有没有什么方法可以做到这一点?
1 个回答
0
虽然我没找到更好的方法,但这是我根据@PaoloJ42的建议找到的解决办法:
首先,从谷歌云盘下载数据集。(下载时它已经是压缩文件格式)
不要直接把这个压缩文件上传到Kaggle的“上传数据”选项中,最好是在Kaggle里自己创建一个数据集。可以选择使用“数据集 > 新建数据集”。你可以把它设置为私有。
上传后,压缩文件会自动解压。你可以使用这个链接。只需添加以下代码片段:
import os os.environ['KAGGLE_USERNAME'] = 'username' os.environ['KAGGLE_KEY'] = 'kaggle_key'
你可以在设置中找到这个,路径是“设置 > 创建新令牌”(在API部分)。
这样你就不需要频繁上传文件了。