图片处理 - python PIL 图片放大的问题
问题描述
尝试用pytesseract来识别一些图片:
原始图片尺寸较小,用pytesseract无法识别,开始尝试用 Mac 自带的预览工具来放大尺寸 ,发现可以正常识别了,然后尝试用 PIL 来放大图片,代码如下:
images.resize((1985, 336),Image.ANTIALIAS).save(’/images’, quality=95,dpi=(72, 72))
问题是,通过 PIL 放大的图片不能被pytesseract 正常识别,我对比了两张图片的信息,如下图:
发现除了图片尺寸不同外,其他信息都是相同的,但是就是无法被pytesseract正常识别,所以求教如何用 PIL 放大出可以正常被pytesseract识别的图片(其他工具也可以)
问题解答
回答1:你可以尝试改变tesseract的-psm参数:
image = Image.open(’ocr.png’)image.show()for p in range(4,14): print(p, ’-’, pytesseract.image_to_string(image, config='-psm {}'.format(p)))
输出如下:
4 - 3 4’1 4’1 I] I]5 - DDd.d._...I._6 - 3 4’1 4’1 I] I]7 - 3 4’1 4’1 I] I]8 - 344009 - 3440010 - W11 - 3£1I1I]I]12 - 13 - 34400
如果图片只有数字你也能尝试用tessedit_char_whitelist:
pytesseract.image_to_string(image, config='-psm 8 -c tessedit_char_whitelist=1234567890')
相关文章:
1. docker api 开发的端口怎么获取?2. 在windows下安装docker Toolbox 启动Docker Quickstart Terminal 失败!3. [MySQL] 如何存储 array比较合适?4. python - Flask内如何跳转至其他页面。5. python - 使用 phantomjs 打开页面不完整,是哪里出了问题?6. php - mysql 模糊搜索问题7. android - 百度地图拖拽图标后原来位置的图标还在?8. python - 两千万条结构化数据怎么进行数据分析9. python 多进程 或者 多线程下如何高效的同步数据?10. mysql优化 - mysql 多表联合查询中有order by和sum的情况下,索引如何设计?

网公网安备