Python：使用gdata方法上传启用OCR的图像？

1 投票

1 回答

643 浏览

数据工程师

提问于 2025-04-16 00:48

在这个PHP代码的示例中，(http://code.google.com/p/gdata-samples/source/browse/trunk/doclist/OCRDemo/ocr.php?r=194)

你可以把一张图片上传到谷歌文档，然后它会自动把图片里的文字转换成文本。我想知道怎么用Python来实现这个功能。虽然有一个“上传”的方法，但我不太明白怎么开启OCR（光学字符识别）功能。

php 文件上传图像处理 ocr 光学字符识别 gdata 谷歌文档自动化转换

1 个回答

假设你已经从这里开始学习：http://code.google.com/apis/documents/docs/3.0/developers_guide_python.html

你已经创建了一个经过身份验证的 client 对象。

f = open('/path/to/your/test.pdf')
ms = gdata.data.MediaSource(file_handle=f, content_type='application/pdf', content_length=os.path.getsize(f.name))
folder = "https://docs.google.com/feeds/default/private/full" # folder in google docs.
entry = client.Upload(ms, f.name, folder_or_uri= folder + '?ocr=true') # ?ocr=true is the kicker

在指定文件夹或网址时，加上后缀 ?ocr=true 这个参数就是让转换发生的关键。

创建完成后，你可以把它导出为一个txt文档。

回答于 2025-04-16 由 Python大师

分享举报

Python：使用gdata方法上传启用OCR的图像？

1 个回答

撰写回答