2024-04-29 02:09:08 发布
网友
我正在努力使我公司的应付帐款系统更加自动化,我想知道是否可以用Python编写一个程序,从扫描的文档或PDF中获取信息(例如发票号、日期、公司名称),然后将其发送到PeachTree Accounting。目标是减少数据输入量,只需扫描发票的硬拷贝,获取当前手动输入的信息,并将其放置在PeachTree中的适当位置。我知道这可能是瞎猜,但任何帮助都将不胜感激。
你试图解决两个截然不同的问题。在
首先,能否从扫描的文档中提取信息主要取决于扫描文档的格式和使用的字体。如果你谈论的是发票,也就是说,从你做生意的任何一方收到的任何发票,那么这可能是一个几乎无法解决的问题。如果你说的是一家公司的发票,使用OCR友好的字体以保证一致的格式打印,那么你很可能能够提取数据。如果你能诱导给你发票的当事人修改发票,使其包含条形码信息,那么问题就更容易解决了。在
确实存在Python的OCR库,但它们不会创造奇迹。一般来说,如果您想自动处理发票,您应该要求供应商以机器可读的格式(如XML)提交发票,并使用约定的格式。在
您要解决的第二个问题是是否可以将信息写入Peachtree。这取决于Peachtree是否提供了一种已发布的文件格式,或者更好的是一种允许访问其文件的API。一个快速的google就表明了。在
你试图解决两个截然不同的问题。在
首先,能否从扫描的文档中提取信息主要取决于扫描文档的格式和使用的字体。如果你谈论的是发票,也就是说,从你做生意的任何一方收到的任何发票,那么这可能是一个几乎无法解决的问题。如果你说的是一家公司的发票,使用OCR友好的字体以保证一致的格式打印,那么你很可能能够提取数据。如果你能诱导给你发票的当事人修改发票,使其包含条形码信息,那么问题就更容易解决了。在
确实存在Python的OCR库,但它们不会创造奇迹。一般来说,如果您想自动处理发票,您应该要求供应商以机器可读的格式(如XML)提交发票,并使用约定的格式。在
您要解决的第二个问题是是否可以将信息写入Peachtree。这取决于Peachtree是否提供了一种已发布的文件格式,或者更好的是一种允许访问其文件的API。一个快速的google就表明了。在
相关问题 更多 >
编程相关推荐