OCR系列:主流深度学习OCR文字识别方法对比_ocr深度识别比较-程序员宅基地

技术标签: AI论文中文翻译  机器学习  深度学习  神经网络  

● 1 主流深度学习OCR文字识别方法对比(重点试): 

文章地址:https://blog.csdn.net/lovebyz/article/details/84959818

1. Tesseract(LSTM) + Densenet  (无代码)

2. CTPN+CRNN (中文 、重点试)   代码地址:https://github.com/xiaofengShi

提供了keras和pytorch两个版本的CRNN中文识别模型

3.opencv mser算法框出图片文字区域 (有代码,试试)

●  2 运用tensorflow实现自然场景文字检测,keras/pytorch实现crnn+ctc实现不定长中文OCR识别  (重点试): 

文章地址 https://blog.csdn.net/wuting3680278/article/details/80445936

github : https://github.com/jiangxiluning/chinese-ocr

●  2 基于深度学习(端到端)的OCR文字识别( 参考)

文章地址:https://blog.csdn.net/wsp_1138886114/article/details/83864582

1、ctpn  (有代码 https://github.com/eragonruan/text-detection-ctpn) 

2、 crnn     (有文章和代码  https://blog.csdn.net/wsp_1138886114/article/details/82555728

3、vgg没有代码

 

●基于keras的RNN英文字母识别( 图片英文识别,可让组员试试)

http://chongdata.com/articles/?p=32

 

●基于深度学习的OCR-from 美團技術團隊(只参考)

 

CRNN-基于序列的(端到端)图像文本识别(看看)

●主流ocr算法:CNN+BLSTM+CTC架构(重点看原理  c++ cafe )

https://blog.csdn.net/forest_world/article/details/78566737

 

●   基于深度学习的自然场景文字检测及端到端的OCR中文文字识别(和2 相同  无代码)https://yq.aliyun.com/articles/647008

● 基于CTPN(tensorflow)+CRNN(pytorch)+CTC的不定长文本检测和识别(有代码 可以参考)

https://blog.csdn.net/cbd_2012/article/details/85639763

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_46403555/article/details/104628106

智能推荐

【剑指offer】反转链表(递归+非递归)_反转链表 剑指offer-程序员宅基地

文章浏览阅读2.2k次。题目:输入一个链表,反转链表后,输出链表的所有元素。分析:反转链表只需改变链接方向,改变方向时需要将原本指向后一个结点的链接方向指向前一个结点,因此需要记录下三个结点。实现:public ListNode ReverseList(ListNode head) { ListNode cur = head; ListNode next = null; Li_反转链表 剑指offer

未加载kernelbase.pdb,问题-程序员宅基地

文章浏览阅读4.2w次,点赞13次,收藏16次。最近在调试新电脑的时候,配置opencv感觉完全没有问题,为什么会出现这种情况,百思不得其解,又重新配置OpenCV,又是百度,又是github。搞了好长时间没弄好,不弄之后偶尔想到了一个原因,电脑显示的原因,就能调好了,也是无语.......给大家借鉴一下这个原因,,, 上代码:很基础的显示图像的代码测试新配置的opencv环境: #include <opencv2/op..._未加载kernelbase.pdb

老杨玩python_老杨 python-程序员宅基地

文章浏览阅读1k次。跟着老杨玩pythonpython的特点​ 上回说到,python是一门解释型的强类型的动态的高级语言。python崇尚优美,清晰,简单,且免费开源。因此python这门语言具有以下几个特点简单易学,明确优雅,开发速度快适合新手学习,学习成本低,容易上手跨平台,可移植,可拓展。交互式,解释型,面向对象的动态语言跨平台,Linux,Mac,Windows都可以运行,可以在..._老杨 python

梳理——后缀数组应用-程序员宅基地

文章浏览阅读1.8k次,点赞2次,收藏4次。// 难度从 * ~ ***** 递增,*为简单2016.03.4.241. POJ 2774题意:给两个长度不超过 100000 的字符串,求他们的最长公共子串。难度:*算法&&技巧:字符串拼接, 后缀数组,找 Height 数组中最大的(注意特判两个是否属于不同字符串)_后缀数组

web页面国际化,web页面中英文切换,vue项目国际化----------vue-i18n详细用法。_web系统支持中文和英文切换的技术-程序员宅基地

文章浏览阅读1.2k次。什么是web页面国际化web页面国际化页面国际化,就是可以让网页的文字信息,根据用户的选择,显示中文、英文、韩语、等等。如下图举例:第一张用户选择中文第二用户选择韩语前端应该如何实现国际化思路:如上面举的例子,用户点击选自不同的语言,页面就会展示对应的语言文字,类似与翻译功能;首先我们编写我们国际化配置文件,配置文件中是页面需要显示的文字信息,通过用户的选择页面展示不同的配置文件。1、下载vue-i18nnpm install vue-i18n2、配置国际化文件zh.js中的配置如_web系统支持中文和英文切换的技术

【UnityDOTS 小知识】Job的依赖项_unity job schedule-程序员宅基地

文章浏览阅读202次。因为Job多数都是多线程处理,所以处理好线程之间的依赖关系就很重要。类比于Task之间的依赖处理。_unity job schedule

随便推点

ROS中base_link, odom, fixed_frame, target_frame和虚拟大地图map的关系-程序员宅基地

文章浏览阅读166次。前面已经介绍了如何使用URDF建造机器人小车并显示在Rviz的仿真环境里面,但是小车是静止的。下面介绍如何让它在Rviz里面动起来,并理清URDF,TF 和 odom 的关系。1. ROS中base_link, odom, fixed_frame, target_frame和虚拟大地图map的关系一般在urdf文件中都要定义base_link,它代表了机器人的主干,其它所有的frame都是..._target_frame frame cartographer

使用OpenGL实现遮罩效果_opengles 透明遮罩-程序员宅基地

文章浏览阅读7.9k次。本文适合于Cocos2d-X等使用OpenGL API的渲染框架一般实现自定义遮罩效果主要介绍以下几种:使用Stencil Buffer使用GL_SCISSOR_TEST(适合矩形区域)使用Shader使用BlendFunc(推荐!)_opengles 透明遮罩

《 2020年抖音用户画像报告 》-程序员宅基地

文章浏览阅读5.5k次。via:巨量算数抖音DAU超4亿,较去年同期的2.5亿,增长了60%。抖音与头条的重合度为32.1%,重合用户占抖音的42.2%。抖音与西瓜的重合度为24.6%,重合用户占抖音的29.5..._2020年抖音用户画像分析报告

Python3 SciPy解常微分方程 用Matplotlib演示_matplotlib 微分方程-程序员宅基地

文章浏览阅读7.8k次,点赞4次,收藏33次。Python科学计算 简单记录几篇笔记 SciPy解常微分方程integrate模块提供的odeint函数Anaconda 3的jupyter notebook上matplotlib 2D 绘制求解 牛顿冷却定律matplotlib 3D 绘制求解 洛伦兹吸引子_matplotlib 微分方程

黑马程序员--------语法基础_632485820-程序员宅基地

文章浏览阅读346次。-----Java培训、Android培训、iOS培训、.Net培训、期待与您交流! -------Java语法基础1,关键字:其实就是某种语言赋予了特殊含义的单词。保留字:其实就是还没有赋予特殊含义,但是准备日后要使用过的单 词。 2,标示符:Java中的包、类、方法、参数和变量的名字,可由任意顺序的大小写字母、数字、下划线(_)和美元符号($)组成,但标识符不能以数_632485820

Linux下常用软件推荐列表(欢迎补充。。。)_linx软件-程序员宅基地

文章浏览阅读2.4k次。Linux下推荐的常用应用程序列表一,网页浏览1,firefoxfirefox是现在最火的一个浏览器,支持好多扩展和插件,也有很多漂亮的主题.firefox就是mozilla-firefox,他是把mozilla的网页浏览的功能分离为一个单独的浏览器.Firefox一般是linux系统自带的默认浏览器.2,opera(非开源免费软件)opera是号称最快的浏览器.能直接浏览wa_linx软件