博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pytesseract OCR 识别
阅读量:6293 次
发布时间:2019-06-22

本文共 530 字,大约阅读时间需要 1 分钟。

pip install pytesseract   但是缺少各种语言文本解析的库

下载tesseract-ocr-w64-setup-v4.0.0-beta.1.20180414.exe 并点击安装

git clone   可以观察到将里面的所有.tessdata  复制到文件夹Tesseract-OCR/tessdata里

修改site-packages对应文件夹中pytesseract.py tesseract_cmd = 'D:\\program_files\\Tesseract-OCR\\tesseract.exe'

将tesseract.exe添加到环境变量PATH中

创建环境变量TESSDATA_PREFIX,添加地址D:\\program_files\\Tesseract-OCR 或者 D:\\program_files\\Tesseract-OCR\\tessdata

重启电脑(非常好用的方法,遇到按照说明操作,最后还不行的,都可以试一下重启电脑)

 

print(text)

 

print('cost time:',time.time()-start_time)

cost time: 6.498211622238159

识别一个图片,速度有点慢

转载地址:http://zzjta.baihongyu.com/

你可能感兴趣的文章
hadoop、hbase、zookeeper集群搭建
查看>>
python中一切皆对象------类的基础(五)
查看>>
modprobe
查看>>
android中用ExpandableListView实现三级扩展列表
查看>>
%Error opening tftp://255.255.255.255/cisconet.cfg
查看>>
java读取excel、txt 文件内容,传到、显示到另一个页面的文本框里面。
查看>>
《从零开始学Swift》学习笔记(Day 51)——扩展构造函数
查看>>
python多线程队列安全
查看>>
[汇编语言学习笔记][第四章第一个程序的编写]
查看>>
android 打开各种文件(setDataAndType)转:
查看>>
补交:最最原始的第一次作业(当时没有选上课,所以不知道)
查看>>
Vue实例初始化的选项配置对象详解
查看>>
PLM产品技术的发展趋势 来源:e-works 作者:清软英泰 党伟升 罗先海 耿坤瑛
查看>>
vue part3.3 小案例ajax (axios) 及页面异步显示
查看>>
浅谈MVC3自定义分页
查看>>
.net中ashx文件有什么用?功能有那些,一般用在什么情况下?
查看>>
select、poll、epoll之间的区别总结[整理]【转】
查看>>
CSS基础知识(上)
查看>>
PHP中常见的面试题2(附答案)
查看>>
26.Azure备份服务器(下)
查看>>