import sys
from PIL import Image, ImageOps
PAT_SIZE = (8, 10)
NUMS = 3
FIRST_NUM_OFFSET = 5
NUM_OFFSET = (1, 3)
NUMBERS = []
for i in xrange(10):
try:
NUMBERS.append(Image.open('n%d.png' % i).load())
except IOError:
print "I do not know the pattern for the number %d." % i
NUMBERS.append(None)
def magic(fname):
captcha = ImageOps.grayscale(Image.open(fname))
im = captcha.load()
# Split numbers
num = []
for n in xrange(NUMS):
x1, y1 = (FIRST_NUM_OFFSET + n * (NUM_OFFSET[0] + PAT_SIZE[0]),
NUM_OFFSET[1])
num.append(captcha.crop((x1, y1, x1 + PAT_SIZE[0], y1 + PAT_SIZE[1])))
# If you want to save the split numbers:
#for i, n in enumerate(num):
# n.save('%d.png' % i)
def sqdiff(a, b):
if None in (a, b): # XXX This is here just to handle missing pattern.
return float('inf')
d = 0
for x in xrange(PAT_SIZE[0]):
for y in xrange(PAT_SIZE[1]):
d += (a[x, y] - b[x, y]) ** 2
return d
# Calculate a dummy sum of squared differences between the patterns
# and each number. We assume the smallest diff is the number in the
# "captcha".
result = []
for n in num:
n_sqdiff = [(sqdiff(p, n.load()), i) for i, p in enumerate(NUMBERS)]
result.append(min(n_sqdiff)[1])
return result
print magic(sys.argv[1])
import sys
from PIL import Image, ImageOps
PAT_SIZE = (8, 10)
NUMS = 3
FIRST_NUM_OFFSET = 5
NUM_OFFSET = (1, 3)
NUMBERS = []
for i in xrange(10):
try:
NUMBERS.append(Image.open('n%d.png' % i).load())
except IOError:
print "I do not know the pattern for the number %d." % i
NUMBERS.append(None)
def magic(fname):
captcha = ImageOps.grayscale(Image.open(fname))
im = captcha.load()
# Split numbers
num = []
for n in xrange(NUMS):
x1, y1 = (FIRST_NUM_OFFSET + n * (NUM_OFFSET[0] + PAT_SIZE[0]),
NUM_OFFSET[1])
num.append(captcha.crop((x1, y1, x1 + PAT_SIZE[0], y1 + PAT_SIZE[1])))
# If you want to save the split numbers:
#for i, n in enumerate(num):
# n.save('%d.png' % i)
def sqdiff(a, b):
if None in (a, b): # XXX This is here just to handle missing pattern.
return float('inf')
d = 0
for x in xrange(PAT_SIZE[0]):
for y in xrange(PAT_SIZE[1]):
d += (a[x, y] - b[x, y]) ** 2
return d
# Calculate a dummy sum of squared differences between the patterns
# and each number. We assume the smallest diff is the number in the
# "captcha".
result = []
for n in num:
n_sqdiff = [(sqdiff(p, n.load()), i) for i, p in enumerate(NUMBERS)]
result.append(min(n_sqdiff)[1])
return result
print magic(sys.argv[1])
我希望这个验证码不在任何地方使用。
下面是一个虚拟的解码方法。基本上你需要的是从0到9的模式出现在这些标题中。从你的例子来看,我只有0345788的模式。因为所有的东西都是固定的,所以你知道在哪里分割每个角色。你也知道每个字符都是固定大小和固定字体的数字。如果它还包含字母或更多字符,但大小和字体固定,那么可以很容易地修改以下代码。
代码的作用是:a)加载模式(我认为它们被命名为n0.png,n1.png,…);b)将验证码分割成NUMS片段;c)对每个模式和每个分割数之间的平方差求和;d)确定分割数是总和最小的那个。它按顺序返回验证码中每个数字的列表。要获得初始模式,可以取消对保存拆分数字的行的注释,在该部分后面放置一个
return
,然后调整文件名。我希望你使用它的诚意,你不会伤害(/垃圾邮件)任何人。
我不会给你写脚本,也不会将你转发到外部插件。但如果你是自己写的,这可能会有帮助:
我希望这个验证码不在任何地方使用。
下面是一个虚拟的解码方法。基本上你需要的是从0到9的模式出现在这些标题中。从你的例子来看,我只有0345788的模式。因为所有的东西都是固定的,所以你知道在哪里分割每个角色。你也知道每个字符都是固定大小和固定字体的数字。如果它也包含字母或更多字符,但大小和字体固定,那么可以很容易地修改以下代码。
代码的作用是:a)加载模式(我认为它们被命名为n0.png,n1.png,…);b)将验证码分割成NUMS片段;c)对每个模式和每个分割数之间的平方差求和;d)确定分割数是总和最小的那个。它按顺序返回验证码中每个数字的列表。要获得初始模式,可以取消对保存拆分数字的行的注释,在该部分后面放置一个
return
,然后调整文件名。这是一个很好的项目,因为学术原因,我对这个感兴趣前一阵子。你有几个选择:
你可以在这个网站的帮助下写自己的文章:http://www.wausita.com/captcha/
使用OpenCV进行匹配。
如果认为有专门的神经网络图像匹配库,但我似乎找不到它。
基本上,正如其他人所说,你想要去除噪音,分成单个字符,并使用选定的技术将其与模型字符进行比较。
相关问题 更多 >
编程相关推荐