Antkillerfarm Hacking V8.0

DL » 深度学习（四十六）——OCR（2）, AI可解释性, 第四范式

2018-09-13 :: 6248 Words

OCR（续）
AI可解释性
第四范式
多任务学习+

OCR（续）

https://mp.weixin.qq.com/s/_znXs8pkfgmWsb26HIfhLQ

复杂环境文字识别技术研究及应用进展

https://mp.weixin.qq.com/s/JA6ey6N3Zho92L6jh_bRkg

EAST场景文字检测模型使用

https://mp.weixin.qq.com/s/uMzx_U-wx94GRTQtM11d8Q

OCR技术在携程业务中的应用

https://mp.weixin.qq.com/s/-zMVO47AL1iKFmF16KsfOw

文本检测算法PSENet解读与开源实现

https://mp.weixin.qq.com/s/UFfBoxQwsB_GUqTDRv3Asg

免费数学神器！再复杂的公式，只要有照片就能转成LaTeX

https://mp.weixin.qq.com/s/x8iyl4gwz31XOCw3oSHSwg

开源！基于TensorFlow/Keras/PyTorch实现对自然场景的文字检测及端到端的OCR中文文字识别

https://mp.weixin.qq.com/s/eVhId0OqKB-jNCg4j8qaNg

仅用200个样本就能得到当前最佳结果：手写字符识别新模型TextCaps

https://mp.weixin.qq.com/s/z5hRafxepA4Zj5pbbK8HzA

基于模板的文字识别结果结构化处理技术

https://mp.weixin.qq.com/s/Buv6m66kj3RjKq0LjqNAiA

mathAI手写拍照自动能解高数题，还不快试试？

https://mp.weixin.qq.com/s/bmJCLUlOA364AvK90sXE3Q

用于算术习题自动批改的结构文本精确识别方法

https://zhuanlan.zhihu.com/p/130855699

怎样构建一个端到端的文字识别系统（CTC Loss）

https://mp.weixin.qq.com/s/5eTugA70myKxDTZUby87Pw

任意形状文本检测：Look More Than Once

https://mp.weixin.qq.com/s/RuYZ-nmW2p7jMIJ7sbxbIw

任意形状文本检测的像素聚合网络

https://mp.weixin.qq.com/s/T0QeYbkmD4jwhWB47Fnn2w

基于深度学习的端到端在线手写数学公式识别

https://mp.weixin.qq.com/s/l1rmGxOVrXKAaf4yYUt4kQ

自然场景文字定位技术详解

https://mp.weixin.qq.com/s/rJ7guL-Hxxr2Ezl7LRhQrA

基于对抗学习的数据稀缺手写文本识别

https://mp.weixin.qq.com/s/YixrjGTU4p7LlyfQCEmmmQ

端到端任意形状场景文字识别

https://mp.weixin.qq.com/s/Lk_P74kJCjmQo1S2piTplA

针对不规则场景文字识别的对称约束矫正网络

https://mp.weixin.qq.com/s/ENvoZ4ZPKT1HXaQjD9VgSA

王晶：华为云OCR文字识别服务技术实践、底层框架及应用场景

https://mp.weixin.qq.com/s/sigPeclXz12NUk_nX8TZ-A

文档分析与识别技术回顾与反思

https://mp.weixin.qq.com/s/4WXb6igvxZP_XoIHl4AiQA

ESIR:一种基于迭代矫正的端到端场景文本识别方法

https://mp.weixin.qq.com/s/MDxltLKP-SQf_31Zp1RL8A

文本识别新王者CharNet：卷积字符网络

https://mp.weixin.qq.com/s/H8ECjqEcIjcm5YNFu6ONdw

开源OCR文本检测器，基于TextBoxes++和RetinaNet

https://mp.weixin.qq.com/s/CwLN2SRyN7RTEFtNx3u8Pg

基于图卷积网络的视觉富文本数据中文档图像信息抽取

https://mp.weixin.qq.com/s/2wxZSWCfwl_z502MjisdzQ

ICDAR 2019表格识别论文与竞赛综述（上）

https://mp.weixin.qq.com/s/wD7UNeLfCOaOzrSdzMB5qA

ICDAR 2019表格识别论文与竞赛综述（下）

https://mp.weixin.qq.com/s/L_Rz1yHR0Q3L3y32WAYjkg

从边界到文本—一种任意形状文本的检测方法

https://mp.weixin.qq.com/s/CcPhmxCFWYddaQgfJmO9UQ

最新图文识别技术综述

https://mp.weixin.qq.com/s/-XPlEnszjBc_NCCIvD9zHg

手写签名认证的逆鉴别网络

https://mp.weixin.qq.com/s/LS_8424jn_3ksemKBgg88w

SegLink++：基于实例感知与组件组合的任意形状密集场景文本检测方法

https://mp.weixin.qq.com/s/vuRRcnlTugsUcfW5D5uYyA

旷视研究院提出TextScanner：确保字符阅读顺序，实现文字识别新突破

https://mp.weixin.qq.com/s/huvQszaBcVOxUEz0tJ_Psg

基于OCR的身份证要素提取

https://mp.weixin.qq.com/s/hVjTz3ofg3NsvZwAB53_eQ

PRN：面向不规则文字识别的渐进矫正网络

https://mp.weixin.qq.com/s/T6GlweGUguUAYIjfsabPHQ

徒手素描的深度学习:综述论文，Deep Learning for Free-Hand Sketch

https://mp.weixin.qq.com/s/QR53KZwIpQbCqX4TJAhAlQ

面向场景文本识别的带聚焦注意力机制的convLSTM

https://mp.weixin.qq.com/s/dg3ydVozTN1wJB-SnjkPGQ

GNN手绘草图识别新架构：Multi-Graph Transformer网络

https://mp.weixin.qq.com/s/enVx8sLoxmaSM8NlUL5IMQ

实测超轻量中文OCR开源项目，总模型仅17M

https://mp.weixin.qq.com/s/vNYG6vq_LAotj_21PG_P9w

扫描式SSD用于公式检测，代码已开源

https://mp.weixin.qq.com/s/5M9AIjEs6i1tPMVXA2a2Zg

TE141K：用于文字风格转换的大规模艺术文字数据库

https://mp.weixin.qq.com/s/nsZ64_7jgugvDlBZoiJ1ZA

UnrealText：基于虚拟场景的真实场景文本图像合成

https://mp.weixin.qq.com/s/Fku4chvC9VX0p7NI8yYc0Q

OCR光学字符识别方法汇总

https://mp.weixin.qq.com/s/cKR3B6Av_C4nBzMeAoDYEA

截屏、文字提取一气呵成，超实用OCR开源小工具

https://mp.weixin.qq.com/s/t5LdXMHW3SyBzMST-3ZtgQ

比OCR更强大的PPT图片一键转文档重建技术

https://mp.weixin.qq.com/s/rm7G6MqMjSyy8oGjSOWk3A

CV赛题总结：人民币面值与编码识别

https://mp.weixin.qq.com/s/5rny9_oF2-urF2JUp13fUw

OpenCV实现银行卡号识别，字符识别算法你知多少？

https://mp.weixin.qq.com/s/P8TiEk482o2Mye76_YC0rg

EasyOCR: 支持40+语言的OCR模块

https://mp.weixin.qq.com/s/i1Dm18qp93jzWnMoqRU2gA

8.6M超轻量中英文OCR模型开源，训练部署一条龙

https://mp.weixin.qq.com/s/RqsjyYwvbj41cMCXkFj6sg

B站UP主自制的开源OCR翻译器走红Github

https://mp.weixin.qq.com/s/K_qAWYTA9fBTAeNRR7s82A

文字识别在高德地图数据生产中的演进

https://mp.weixin.qq.com/s/x-HE-86T5SK6Y_SVX_ZJBA

使用神经网络提取PDF表格工具来了，支持图片

https://mp.weixin.qq.com/s/4lRwiR-3devARVX1rQLzEQ

文档智能：通用文档预训练模型与数据集，推动NLP落地升级

https://mp.weixin.qq.com/s/xuJxpJ970uoFNva-45y2eA

微信OCR(1)——公众号图文识别中的文本检测

https://mp.weixin.qq.com/s/KpEJYs6ANLqUbVz1CazF6Q

微信OCR(2)——深度序列学习助力文字识别

https://mp.weixin.qq.com/s/6IGXof3KWVnN8z1i2YOqJA

三年磨一剑——微信OCR图片文字提取

https://mp.weixin.qq.com/s/6STRTuKdrM0OP3qrVArfCg

OCR in the Wild：文本检测和识别的SOTA

https://mp.weixin.qq.com/s/TcjaK7dzU44_EA6Hp1oc0g

日漫迷有福了！这个系统可以全自动翻译日漫，再也不用啃生肉了

https://mp.weixin.qq.com/s/gd86GgUxsWCKn6NihuHzZw

58安全-证件识别之版面分析实践

https://mp.weixin.qq.com/s/749JZKSrQnlvrcbbS23Njw

MMOCR：OpenMMLab全流程的文字检测识别理解工具箱

https://mp.weixin.qq.com/s/HvOn8SZ2uPjekkDd4VB-9A

一行代码从PDF提取Excel文件

https://zhuanlan.zhihu.com/p/453513716

大白话Benchmarking Chinese Text Recognition

AI可解释性

XAI(Explainable Artificial Intelligence)

https://github.com/pbiecek/xai_resources

AI可解释性资源汇总

https://mp.weixin.qq.com/s/XVl6voP5cwdC7DcvTMQvVQ

机器学习可解释性工具箱XAI

https://github.com/jphall663/awesome-machine-learning-interpretability

最全的机器学习可解释性资料

https://mp.weixin.qq.com/s/OV4vXu7TAuyV7qU9BAMF6g

机器学习模型的“可解释性”到底有多重要？

https://mp.weixin.qq.com/s/33VQNVvb7JGlk10Jc3mmeg

从可视化到新模型：纵览深度学习的视觉可解释性

https://github.com/ModelOriented/DrWhy

可解释AI(XAI)工具集—DrWhy

https://mp.weixin.qq.com/s/1OODeAFaRLFK3elECyZcng

机器学习模型可解释性的详尽介绍

https://mp.weixin.qq.com/s/Ax_Iv8IbDWid7EIO5usTbw

可解释人工智能(XAI): 工业界挑战与经验教训，180页ppt

https://mp.weixin.qq.com/s/-ZhYXTIiEFHd-G-NZEqlcA

深度学习可解释性！深度taylor分解

https://mp.weixin.qq.com/s/yzCTQvjeyyF2IFORzrTBVg

黑盒模型实际上比逻辑回归更具可解释性

https://mp.weixin.qq.com/s/gAidXX4YrezZcSa6Jpl8nQ

万字长文概览深度学习的可解释性研究

https://mp.weixin.qq.com/s/OpnDHf5r2j-D962eMurx9w

SHAP值：用博弈论的概念解释一个模型

https://zhuanlan.zhihu.com/p/238202269

初探Explainable AI

第四范式

第一范式，是指以实验为基础的科学研究模式。例如以伽利略为代表的文艺复兴时期的科学发展初级阶段。

第二范式，即理论研究为基础的科学研究模式。在这个阶段，科学家们会将无法用实验模拟的科学原理用模型简化，去掉一些复杂的因素，只留下关键因素，然后通过演算得到结论。例如，牛顿三大定律和爱因斯坦相对论。

第三范式，即利用电子计算机对科学实验进行模拟仿真的模式。

第四范式，数据密集型科学发现（Data-Intensive Scientific Discovery）。由James Gray于2007年提出。

James Gray，1944～2007，美国数据库专家。UCB博士（1969）。图灵奖得主（1998）。先后供职于IBM、Tandem Computers、DEC、MS等公司。提出了ACID、Two-tier transaction commit semantics、OLAP等概念。2007年独自驾船出海后失踪。

参考：

https://mp.weixin.qq.com/s/5U4iH1n3kqUCAodUVKGTNQ

从经验到理论、从数据到网络——脑科学研究的四次范式转移

https://zhuanlan.zhihu.com/p/30608976

第四范式：大数据对于科研的意义

多任务学习+

https://blog.csdn.net/CoderPai/article/details/80087188

利用TensorFlow一步一步构建一个多任务学习模型

https://mp.weixin.qq.com/s/mm9bXXTEzd8DwyYlMgGMZg

NLP多任务学习：一种层次增长的神经网络结构

https://mp.weixin.qq.com/s/fcFb6WkJVP8TYpoxkQgiWQ

CMU提出“十字绣网络”，自动决定多任务学习的最佳共享层

https://mp.weixin.qq.com/s/i7WAFjQHK1NGVACR8x3v0A

自然语言十项全能：转化为问答的多任务学习

https://zhuanlan.zhihu.com/p/362330594

深度学习多目标优化的多个loss应该如何权衡

https://mp.weixin.qq.com/s/ZyokVuCLHNbt7aXWzoJTFA

多任务学习在推荐系统和自然语言处理领域的总结

您的打赏，是对我的鼓励

DL » 深度学习（四十六）——OCR（2）, AI可解释性, 第四范式

OCR（续）

AI可解释性

第四范式

多任务学习+

Recent Posts in DL

Recent Posts in All Blogs