Python:使用gdata方法上传启用OCR的图像?
在这个PHP代码的示例中,(http://code.google.com/p/gdata-samples/source/browse/trunk/doclist/OCRDemo/ocr.php?r=194)
你可以把一张图片上传到谷歌文档,然后它会自动把图片里的文字转换成文本。我想知道怎么用Python来实现这个功能。虽然有一个“上传”的方法,但我不太明白怎么开启OCR(光学字符识别)功能。
1 个回答
2
假设你已经从这里开始学习:http://code.google.com/apis/documents/docs/3.0/developers_guide_python.html
你已经创建了一个经过身份验证的 client
对象。
f = open('/path/to/your/test.pdf')
ms = gdata.data.MediaSource(file_handle=f, content_type='application/pdf', content_length=os.path.getsize(f.name))
folder = "https://docs.google.com/feeds/default/private/full" # folder in google docs.
entry = client.Upload(ms, f.name, folder_or_uri= folder + '?ocr=true') # ?ocr=true is the kicker
在指定文件夹或网址时,加上后缀 ?ocr=true
这个参数就是让转换发生的关键。
创建完成后,你可以把它导出为一个txt文档。