如何使用Python或MonkeyRunner获取截图中的字符串和坐标

2 投票
1 回答
1554 浏览
提问于 2025-04-17 07:18

假设我用猴子跑步(monkey runner)工具截了一张屏幕。这张截图上有一些文字,比如“联系人”、“拨号器”等等。我想从这张截图中提取出这些文字和它们的位置坐标。所以,在我的猴子跑步脚本里,我可以搜索这些文字并获取它们的坐标。然后,我可以用这些坐标让猴子跑步去点击相应的位置。这样就能实现在屏幕上搜索文字并点击它的目的。有没有人能帮我解决这个问题呢?

1 个回答

1

这是一个关于光学字符识别(OCR)的问题。

可以试试这个链接:

https://code.google.com/p/pytesser/

直接访问一些底层的用户界面元素可能会比试图理解截图上的内容更简单。不过,这个问题没有提供关于使用的软件、操作系统等相关信息。

撰写回答