Python:使用gdata方法上传启用OCR的图像?

1 投票
1 回答
643 浏览
提问于 2025-04-16 00:48

在这个PHP代码的示例中,(http://code.google.com/p/gdata-samples/source/browse/trunk/doclist/OCRDemo/ocr.php?r=194)

你可以把一张图片上传到谷歌文档,然后它会自动把图片里的文字转换成文本。我想知道怎么用Python来实现这个功能。虽然有一个“上传”的方法,但我不太明白怎么开启OCR(光学字符识别)功能。

1 个回答

2

假设你已经从这里开始学习:http://code.google.com/apis/documents/docs/3.0/developers_guide_python.html

你已经创建了一个经过身份验证的 client 对象。

f = open('/path/to/your/test.pdf')
ms = gdata.data.MediaSource(file_handle=f, content_type='application/pdf', content_length=os.path.getsize(f.name))
folder = "https://docs.google.com/feeds/default/private/full" # folder in google docs.
entry = client.Upload(ms, f.name, folder_or_uri= folder + '?ocr=true') # ?ocr=true is the kicker

在指定文件夹或网址时,加上后缀 ?ocr=true 这个参数就是让转换发生的关键。

创建完成后,你可以把它导出为一个txt文档。

撰写回答