Python的OCR工具pytesseract解决TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information环境变量问题

发布时间 2023-07-25 13:31:15作者: HIIT

pytesseract是基于Python的OCR工具, 底层使用的是Google的Tesseract-OCR 引擎,支持识别图片中的文字,支持jpeg, png, gif, bmp, tiff等图片格式。

如何安装使用请看我的上一篇。

在使用pytesseract打开图片是遇到没有找到文件解决pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.

 解决办法:

1.添加环境变量 系统-属性-高级-环境变量

系统变量path添加tesseract的安装路径D:\Program Files\tesseract

 2.系统变量增加一个TESSDATA_PREFIX变量名,变量值还是安装路径D:\Program Files\tesseract\tessdata这是语言字库文件夹

 

3.修改D:\python路径\Lib\site-packages\pytesseract\pytesseract.py文件

 

tesseract_cmd = r'D:\Program Files\tesseract\tesseract.exe'

 然后就可以了