光学字符识别(Optical Character Recognition, OCR),是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。
与之类似的还有手写文本识别(Handwritten Text Recognition, HTR)。
https://pearocr.com/
一个免费的在线OCR网站
华中科大白翔教授的实验室算是目前国内OCR做的比较好的了。
白翔的个人主页:
http://cloud.eic.hust.edu.cn:8071/~xbai/
该主页上有一个OCR方面的综述,是入门的最好资料。
http://www.cnblogs.com/lillylin/
这是一个OCR方面的blog。对白翔的论文,几乎都有阅读笔记。
https://github.com/hwalsuklee/awesome-deep-text-detection-recognition
Github:深度学习文本检测识别(OCR)精选资源汇总
近年来场景文字检测工作主要分为两大类:
自上而下的方法主要借鉴的是通用物体检测的思路,并且根据文字的特点设计相应的检测模型。这类方法通常难以处理不规则文本的检测问题。
自下而上的方法,通常先学习文本行的基本组成单元,然后进行单元之间的组合得到文本行检测框。由于其灵活的表征方式,对不规则形状的文本检测有着天然的优势。
自下而上的方法按照组成单元的不同又分为两类:组成单元为像素的基于分割的方法,以及组成单元为文字块的基于单元组合的方法。但是,自下而上的方法通常很难区分密集文本。密集文本检测问题是文本检测中一个广泛存在的难点问题。
linux下可以使用tesseract作为OCR工具。当然这个工具目前使用的还是传统算法。
4.0版本加入了基于LSTM的神经网络技术。
安装方法:
sudo apt install tesseract-ocr libtesseract-dev tesseract-ocr-chi-sim
使用方法:
tesseract ./111.png 1 -l chi_sim+eng
RapidOCR是目前已知运行速度最快、支持最广,完全开源免费并支持离线快速部署的多平台多语言OCR。
官网:
https://rapidai.github.io/RapidOCRDocs/
2010年的时候车牌检测用AdaBoost,铺天盖地的Boosting/SVM,以及各种魔改。
2020年的时候车牌检测全部用Scrfd了,铺天盖地的CNN网络,种类多到叫不上名字。
2030年的时候车牌检测又是啥呢?不知道,说不清。
https://github.com/liuruoze/EasyPR
一个开源的中文车牌识别系统。(使用传统算法)
https://blog.csdn.net/Relocy/article/details/78629441
HyperLPR:一个基于深度学习的支持多种车牌的中文开源车牌识别框架
https://blog.csdn.net/yang_daxia/article/details/90408160
车牌识别论文survey
https://mp.weixin.qq.com/s/6dsufEVsuEILa1gSOBt32w
用于提高车牌识别的单幅噪声图像去噪和校正
https://mp.weixin.qq.com/s/ynpqG7Vfu5b8lYNW6Y-TpA
快准狠!Intel论文揭示自家车牌识别算法:LPRNet
https://mp.weixin.qq.com/s/JIoTsadw4JBkr0e40RwVQQ
这篇论文开源的车牌识别系统打败了目前最先进的商业软件
https://mp.weixin.qq.com/s/fqpZ8EHgiNupXumvTMSecw
北大团队研发“车脸”识别系统,不看车牌看外观特征实现精确识别
https://mp.weixin.qq.com/s/Shz6BmsOrtbEFtoJRSkl9A
简单车牌检测
https://mp.weixin.qq.com/s/iwPI8g2JwabwiCO8kfw8Hw
用开源工具DIY车牌识别系统
https://mp.weixin.qq.com/s/0Lh8821SbDdmM7IZS3IEBg
构建自动车牌识别系统
https://mp.weixin.qq.com/s/plUxIatkBHd2jjnsMy2nmw
基于OpenCV的车牌识别
CRNN是白翔小组的作品。
论文:
《An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition》
代码:
https://github.com/bgshih/crnn
参考:
https://mp.weixin.qq.com/s/UEGvnNwKW315S68ye4QITQ
一文带你搞懂OCR识别算法CRNN:解析+源码
https://mp.weixin.qq.com/s/XFrgmdEz1d9vg6U0hYr7Qw
中英文文字检测与识别项目(CTPN+CRNN+CTC Loss原理讲解)
ASTER也是白翔小组的作品。
《ASTER: An Attentional Scene Text Recognizer with Flexible Rectification》
代码:
https://github.com/bgshih/aster
参考:
https://www.cnblogs.com/lillylin/p/9315180.html
论文阅读笔记
https://mp.weixin.qq.com/s/Ai43GvLsEtFrfArHUvqLXg
Aster:具有柔性矫正功能的注意力机制场景文本识别方法
https://zhuanlan.zhihu.com/p/34757009
场景文字检测—CTPN原理与实现
https://mp.weixin.qq.com/s/lV2yjhvnRLDfNbZXOSjofg
ctpn:图像文字检测方法
https://mp.weixin.qq.com/s/yxNIw8WDkJZ782HSDyfniw
深度解析文本检测网络CTPN
https://mp.weixin.qq.com/s/h7HVyGbmtLmNVJp4p0rCRQ
字符识别(OCR)相关工具/库/教材/论文等资源整理
https://mp.weixin.qq.com/s/XvtmPUbS2KV0zNXTPgtgDA
史上最全端到端场景文本检测识别资源合集(14篇重要论文 + 5个开源代码 + 49个实验结果 + 222个统计信息)
https://mp.weixin.qq.com/s/qLPfs5nHCVn5J-q3CbeECg
史上最全场景文字识别资源汇集(56篇重要论文 + 20 个开源代码 + 330 个实验结果 + 1882个统计信息)
https://mp.weixin.qq.com/s/rsJZ3R71gSAC4T501-LSQA
史上最全场景文字检测资源合集(70篇重要论文 + 15个开源代码 + 176个实验结果 +
https://mp.weixin.qq.com/s/k_pYPq4QO1aR7DImLSCgoQ
OCR100篇相关论文与代码,从文本识别到验证码识别
https://mp.weixin.qq.com/s/KFgC8zHWS7ysb9GfbkfLRA
OCR技术简介
https://zhuanlan.zhihu.com/p/65707543
文字OCR方法整理
https://mp.weixin.qq.com/s/0ysaJGNslckesv21o752FA
图像OCR年度进展
https://mp.weixin.qq.com/s/VIEsfc4qKAGsi-O9LD4mng
深度学习在OCR中的应用
https://blog.csdn.net/linolzhang/article/details/82780071
OCR文字识别
https://mp.weixin.qq.com/s/TDlxB6F8wwkcTgqPuWJQPw
如何构建识别图像中字符的自动程序?一文解读OCR与HTR
https://www.cnblogs.com/skyfsm/category/1123384.html
一个OCR方面的blog
https://zhuanlan.zhihu.com/c_1261635421517598720
一个OCR方面的专栏
https://mp.weixin.qq.com/s/WmsHrTIMJhSt8MtFO7-yXA
证件全文本OCR技术,了解一下
https://zhuanlan.zhihu.com/p/21344595
端到端的OCR:验证码识别(LSTM+CTC)
http://www.jianshu.com/p/86489f1afd36
端到端的OCR:基于CNN的实现
http://www.jianshu.com/p/4fadf629895b
端到端的OCR:LSTM+CTC的实现
https://mp.weixin.qq.com/s/AGmxdVSw8F0z-NdkhFtPUg
一文全览,深度学习时代下,复杂场景下的OCR如何实现?
https://mp.weixin.qq.com/s/F1d_pZQoVeUd9Uy5Z0Hc1Q
深度学习时代的OCR
https://mp.weixin.qq.com/s/axpA7Y_Rhiols5bDIdc6jg
Tesseract-OCR 3.0.1训练自己的语言库之图像文字识别
http://mp.weixin.qq.com/s/n8C80a3B54FhrCe-GhhcDA
文档扫描:深度神经网络在移动端的实践
https://mp.weixin.qq.com/s/NT9dTaTvX8T-NTbtv4OWaQ
最新《自然场景中文本检测与识别》综述论文,26页pdf
https://mp.weixin.qq.com/s/MYhQt9uC16BadiZKWjPTzA
华中科技大学提出多向文本检测方法:基于角定位与区域分割
http://ilovin.me/2017-04-23/tensorflow-lstm-ctc-input-output/
tensorflow LSTM+CTC/warpCTC使用详解
https://mp.weixin.qq.com/s/k0dRu1wx49HTi_oJYJEGPw
阿里提出IncepText:全新多向场景文本检测模块
https://mp.weixin.qq.com/s/h3VaKs0Pc44n-hXYNlkALA
开源OCR文字识别软件Calamari
https://mp.weixin.qq.com/s/FjoJA0gF4LgsB8hw24I0EQ
华科白翔老师团队ECCV2018 OCR论文:Mask TextSpotter
https://mp.weixin.qq.com/s/SulL2Y83xUlkv8qFbu6K7w
Mask TextSpotter v3来了!最强端到端文本识别模型
https://mp.weixin.qq.com/s/x-_fuVPgDYnle23IDsYCTw
百度深度学习图像识别决赛代码分享
https://mp.weixin.qq.com/s/r7GaYsdKLELXPmW5u2ysPw
OpenCV深度学习文本检测示例程序(EAST text detector)
https://mp.weixin.qq.com/s/Twki3TeNWwj_SqP9chXuxw
AdvancedEAST高效场景文本检测
https://mp.weixin.qq.com/s/PyV0Ml9ppTx0HZvz5VTe-Q
ICPR图像识别与检测挑战赛冠军方案出炉,基于偏旁部首来识别Duang字
https://mp.weixin.qq.com/s/gxpDyd5Lf0fmNZwFrJJZzg
OCR大突破:Facebook推出大规模图像文字检测识别系统——Rosetta
https://mp.weixin.qq.com/s/zeN-QYXBZzVtWUH10DXjVw
Facebook的新AI“Rosetta”会识别表情包,还会删帖
https://mp.weixin.qq.com/s/lVRIy6DdwfRxdoVW3qFiNg
OCR如何读取皱巴巴的文件?深度学习在文档图像形变矫正的应用详解
https://mp.weixin.qq.com/s/-KdR3buxFOrPE-w-IMLQ9A
最强开源OCR!印刷体古籍文字识别超越著名商业软件ABBYY
http://mp.weixin.qq.com/s/rS4xCsytYGqBLMUzlyA12A
构建多层感知器神经网络对数字图片进行文本识别
https://mp.weixin.qq.com/s/qTnFQK0CkvdJfZaKj2wUtQ
海康威视联合提出注意力聚焦网络FAN:提升场景文本识别精确度
https://zhuanlan.zhihu.com/p/50521715
云从科技在自然场景OCR任务取得技术突破
https://zhuanlan.zhihu.com/p/51397423
SPCNet
https://mp.weixin.qq.com/s/9f158VM_FoNVuODNER-BUw
端到端的弯曲文本检测与识别
https://mp.weixin.qq.com/s/J5DGF3JRZxk1-fAQSQNvkQ
MORAN文本识别算法开源,刷新多个OCR数据集state-of-the-art
https://mp.weixin.qq.com/s/cLB2CPjLVJAuDVVmHRKHEA
弯曲文字检测之SPCNet
https://mp.weixin.qq.com/s/gKsfsRxsbfXGOsSqeQEDbw
CVPR2019:文本检测算法综述
https://mp.weixin.qq.com/s/H2VjRKMsuL_yrhP_v_LiVQ
自然场景文本检测与识别中的深度学习方法综述
https://zhuanlan.zhihu.com/p/68058851
自然场景下的文字检测:从多方向迈向任意形状
https://mp.weixin.qq.com/s/jO2xc7Ri6TvrHyXHH0uX4w
金山WPS:基于本地TensorFlow Lite和AI云服务的文档矫正功能
https://mp.weixin.qq.com/s/3t8yzjMXiZwgqBb8izVfFg
场景文字检测模型PixelLink详解与使用
https://zhuanlan.zhihu.com/p/68356509
TensorFlow 2.0中文手写字识别(汉字OCR)
https://mp.weixin.qq.com/s/F0bPat3KUEVnej77OdfYAg
文本检测大满贯!自适应文本区域表示改进形状任意的文本检测
https://mp.weixin.qq.com/s/QwkKqybzW0tYcGojQg9r2w
深度学习场景文字检测识别,20页综述带你了解领域最新动态
https://mp.weixin.qq.com/s/j8Xvj7OSoFZp-zIrd3Xjow
华科提出对称性约束的校正网络ScRN,显著改进场景文本识别
https://github.com/ctripcorp/C-OCR
携程自研的OCR项目
https://mp.weixin.qq.com/s/fZN8mtZdB4Fd6gj2dAKURw
金连文:“文字检测与识别:现状及展望”
https://mp.weixin.qq.com/s/_GU5y7v8HNDOjEGvWh8Fkw
旷视研究院提出文字检测新方法:像素聚合网络PAN
https://mp.weixin.qq.com/s/rWqmIfgNGoC4D2wl8INmtQ
OCR深度实践系列:图像预处理
您的打赏,是对我的鼓励