TextShot-截屏文字识别安装使用(Windows)

发布时间 2023-09-15 10:55:19作者: Jimmy996

TextShot项目地址:https://github.com/ianzhao05/textshot

功能:截屏选中需要识别的区域、右键粘贴得到文字识别结果。

项目底层调用的是Tesseract OCR(最新下载地址:https://github.com/UB-Mannheim/tesseract/wiki),所以首先需要安装Tesseract OCR(这部分网上教程很多,可以参考:https://blog.csdn.net/qq_43576028/article/details/102907170,不再赘述)。

安装后确保已经将Tesseract 添加至了环境变量,可以在cmd输入tesseract -v,如果出现一下内容则说明配置成功。

其实到这一步了,如果不嫌麻烦的话,可以直接可以把需要识别的图片截好,然后用tesseract console终端进行识别,就不用再使用TextShot了(手动狗头)。

tesseract命令:

- tesseract 图像路径 结果输出文件名   如:tesseract  E:\test.png result      识别的结果会生成一个result.txt文件 

 

但毕竟懒是人类进步的阶梯,言归正传,下面正式开始安装TextShot:

1.git clone/下载项目压缩包解压到本地。

2.选一个或者新建一个python3的conda环境,(我用的python3.8)。

3.cd到项目路径下, 安装依赖。

 pip install -r requirements.txt

4.运行时,我又继续cd到了textshot文件夹下,运行: (使用可选的命令行参数指定语言。例如,python textshot.py eng + fra 将使用英语作为主要语言,使用法语作为次要语言。默认值为英语(eng)。同时确保为其他语言安装了适用于 Tesseract 的数据文件。)

E:\textshot-master\textshot> 

python textshot.py eng

(里面的文件import时路径有问题,我是把textshot下面5个文件互相import时前面的. 都去掉了,才能运行成功)

如果不cd到textshot下,直接在textshot-master运行也是一样的:

E:\textshot-master> 

python ./textshot/textshot.py eng

5.运行结束后等待截图功能出现,截后再把结果粘贴到想要的地方就可以了。