opencv结合tesseract识别图片文字

发布时间 2024-01-12 11:39:18作者: ukyo--BlackJesus
import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = '/opt/homebrew/bin/tesseract'

# img = cv2.imread('/Users/Ukyo/PycharmProjects/TaskSaas/web/static/uploads/2024011208140036389812023-12-09 16.05.01.png')
img = cv2.imread('/Users/Ukyo/Desktop/cv2test1.png')

gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
_, thresh = cv2.threshold(gray,0,255,cv2.THRESH_BINARY + cv2.THRESH_OTSU)

# text = pytesseract.image_to_string(thresh,lang='eng') #可以设置语言参数
text = pytesseract.image_to_string(thresh,lang='Hans') #可以设置语言参数

print(text)

opencv识别图片准确度只能说能大概知道是什么,但并不精确:
image
(测试图片)
测试结果:

云 原生 是 一 种 构建 和 运行 应 用 程序 的 方法 ,

它 充分 利

云 计 算 的 优势 ,

包括 弹性 、 可 扩展 性 、 高 可 用 性 等 。 云 原生 应 用 程序

可 以 跨 平 台 运 行 ,

具有 更 高 的 性 能 和 可 靠 性 。 云 原生 概念 包括 容器 、 微 服务 、DevOps 等 多

个 方面 。 通 过 云 原 生 技 术 , 企 业 可 以 实现
部 署 , 降 低 运 维 成 本 。

快速 、

高 效 的 软件 开发 和

(output)