Tesseract-OCR安装与python中使用

安装Tesseract-OCR

在官网下载最新的Windows安装包，双击运行

根据需要选择，一路Next，直到这个页面

安装选项

在Additional language data(download)中选择要下载的其他语言的数据，之后程序会自动下载。一直到安装成功

进入高级系统设置，选择高级->环境变量

选中系统变量中Path->编辑

新建一项，地址为Tesseract-OCR的安装目录即可（例如C:\Program Files\Tesseract-OCR）

可以通过在控制台中输入tesseract命令来检查是否配置成功，输出如图即表示成功

控制台配置tesseract成功

直接使用pip install pytesseract进行安装

image_to_data(image, lang=None, config='', nice=0, output_type=Output.STRING)

识别一张图像中字符并直接输出

import pytesseract

im = "C:/Users/1/Desktop/test.jpg"
result = pytesseract.image_to_string(im)

print(result)

这样识别到的字符就会转化成字符串输出