利用AForge+Tesseract制作视频OCR程序_aforge ocr_Hello World,的博客-程序员秘密

技术标签: C#  Tesseract  OCR  

先上界面:



实现功能及流程:

1:从摄像头获取图像,框选要识别的区域

2:对选区进行图像处理,方便识别

3:识别文字

4:获取芯片上的内容(使用客户提供的芯片解码程序)

5:比较两个内容是否一致

6:写入数据库(带图片)

7:对历史数据进行查阅、导出Word(导出时带图片)


此版本将4~7功能去除了

获取图像:

使用AForge组件(参考项目:http://download.csdn.net/detail/jrlxsy/6927833),为了绘选区,将图像通过PictureBox显示出来,事件:videoSource.NewFrame += VideoSource_NewFrame;

        /// <summary>
        /// 视频产生新祯时的事件
        /// </summary>
        /// <param name="sender"></param>
        /// <param name="eventArgs"></param>
        private void VideoSource_NewFrame(object sender, NewFrameEventArgs eventArgs)
        {
            try
            {
                srcBitmap = (Bitmap)eventArgs.Frame.Clone();
                pictureBoxIn.Image = drawRectangle(new Bitmap(srcBitmap));
                GC.Collect();
            }
            catch (Exception) { }
        }

图片框事件:

        #region 视频预览框事件
        private void pictureBoxIn_MouseDown(object sender, MouseEventArgs e)
        {
            sx = e.X;//记录当前鼠标坐标信息
            sy = e.Y;
            isDrawRect = true;//鼠标点下是绘制矩形
            w = h = 0;
            pictureBoxIn.Refresh();
        }

        private void pictureBoxIn_MouseMove(object sender, MouseEventArgs e)
        {
            if (!isDrawRect)
            {//如果不允许绘制 直接返回
                return;
            }
            w = e.X - sx;
            h = e.Y - sy;
            //pictureBoxIn.Refresh();//刷新窗体(主要是在move事件里面在不停绘制绘制一次刷新一次(上次绘制的就被清除了))
            pictureBoxIn.Image = drawRectangle(pictureBoxIn.Image);
        }

        private void pictureBoxIn_MouseUp(object sender, MouseEventArgs e)
        {
            isDrawRect = false;// 鼠标抬起禁止绘制矩形 并且把矩形区域的图像绘制出来
        }
        #endregion

然后就是图像的预处理和识别了,预处理用的是 ZPhotoEngine库,地址:http://download.csdn.net/detail/trent1985/9591030,主要就是进行前景与背景分离,得到黑白的图像(右下图片框的图片)。

使用了中值滤波、高斯模糊、高反差保留、阈值几个方法。


识别就使用Tesseract3.0.2.0,不过这家伙的语言库有点大,一个eng的居然快50M,2.0.4.0的才1.6M。


另外,ZPhotoEngine库需要设置允许不安全代码,SQLite需要设置2.0环境,App.config设置如下(重点是startup段的配置):

<?xml version="1.0" encoding="utf-8"?>
<configuration>
  <startup useLegacyV2RuntimeActivationPolicy="true">
    <supportedRuntime version="v4.0" sku=".NETFramework,Version=v4.0"/>
    <supportedRuntime version="v2.0.50727"/>
  </startup>
  <system.diagnostics>
    <sources>
      <source name="Tesseract" switchValue="Verbose">
        <listeners>
          <clear />
          <add name="console" />
          <!-- Uncomment to log to file
                <add name="file" />
                -->
        </listeners>
      </source>
    </sources>
    <sharedListeners>
      <add name="console" type="System.Diagnostics.ConsoleTraceListener" />
    </sharedListeners>
  </system.diagnostics>
</configuration>



版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/apollokk/article/details/71642803

智能推荐

9行代码实现ssh多个服务器执行相同命令_一台服务器启动其他服务器相同的脚本_刘大大__的博客-程序员秘密

在工作中大家肯定遇到过要进入不同的服务器执行命令,这个脚本实现了进入不同服务器执行相同命令,节省了大量的时间。脚本如下所示:#!/bin/bashFILE_LIST=/opt/myshell/listCMD=$1NAME=$2for IP in `cat $FILE_LIST|grep -v '^#'|grep "|$NAME" |awk -F'|' '{print $1}'`do echo "--------------------$IP------------------ "

Ubuntu系统下载(清华大学开源软件镜像站)(ubuntu-20.04.1-desktop-amd64.iso)_-借我杀死庸碌的情怀-的博客-程序员秘密

清华大学开源网站镜像站网址:https://mirrors.tuna.tsinghua.edu.cn/进入之后在搜索框中搜索“ubuntu”

解决ScrollView嵌套RecyclerView只显示一行的一种比较简单的方法_AkersMan的博客-程序员秘密

解决ScrollView嵌套RecyclerView只显示一行的一种比较简单的方法ScrollView嵌套RecyclerView用多了,有些时候就会发现RecyclerView的数据只显示一行。具体情况不是很清楚,只是知道一种解决的办法,话不多说 <RelativeLayout android:layout_width="mat

一个正整数分解为几个连续的正整数之和_梓逸宸的博客-程序员秘密

题目: 给定你一个数字 如:15 15可分解为7+84+5+61+2+3+4+5再如:88不可分解为任何连续的正整数之和所以输出NONE此题就是给定一个数字如果这个数字可以分解为几个连续的正整数之和那么就输出所有的形式,如果不能就输出NONE今天这道题困扰了我好久,最后发现,一开始求和的时候算错了。 输入数n,设置起始位置i,再遍历连续正整数的长度k,由公式计算出 s

BZOJ 3625 [Codeforces Round #250]小朋友和二叉树 ——NTT 多项式求逆 多项式开根_ducode的博客-程序员秘密

生成函数又有奇妙的性质。$F(x)=C(x)*F(x)*F(x)+1$然后大力解方程,得到一个带根号的式子。多项式开根有解只与常数项有关。发现两个解只有一个是成立的。然后多项式开根、求逆。不太会算复杂度为什么是$n\log {n}$的。开根号里套了一个求逆,不应该是两个$\log$?#include &lt;map&gt;#include &lt;cmath...

.net core EFCORE以数据库为中心创建实体类_ef core 根据数据库创建实体_JunRuyuL的博客-程序员秘密

1、使用EFCORE 需要下载nuget 包 在程序包管理器输入Install-Package Microsoft.EntityFrameworkCore.SqlServer,Install-Package Microsoft.EntityFrameworkCore.Tools,Install-Package Microsoft.EntityFrameworkCore.SqlServer.Desi...

随便推点

ARCGIS中某字段递增赋值_gis递增数字代码_Andy是个男子名的博客-程序员秘密

ARCGIS中某字段递增赋值在地段计算器中使用一下代码:rec=0def autoIncrement(): global rec pStart = 1 pInterval = 1 if (rec == 0): rec = pStart else: rec = rec + pInterval return rec然后在字段里输入autoIncrement(...

http和tcp以及websocket协议_websocket http tcp_MarryOnlyQueen的博客-程序员秘密

解析常见的协议TCP/IP协议HTTP协议什么是超文本什么是传输什么是协议优点总结HTTPSSSL/TLS协议分层模型TCP/IPOSI一个HTTP的请求过程二层转发以及三层路由HTTP/1HTTP/1.0HTTP/1.1队头阻塞问题HTTP/2websocket特性TCP/IP协议三次握手和四次挥手三次握手第一次握手:建立连接时,客户端发送syn包(syn=j)到服务器,并进入SYN_SENT状态,等待服务器确认;SYN:同步序列编号(Synchronize Sequence Numbers

ODOO11开发手册_yanhaiwang的博客-程序员秘密

今看到一篇ODOO11开发文档,希望能够分享给大家。原文地址http://www.docin.com/DocinViewer-2137881329-144.swf

音频编解码_音乐解码_一摩尔自由的博客-程序员秘密

https://www.cnblogs.com/skyofbitbit/p/3651270.htmlhttps://www.cnblogs.com/imstudy/p/10289944.html音频编解码常用的实现方案有三 种: 第一种就是采用专用的音频芯片对 语音信号进行采集和处理,音频编解码算法集成在硬件内部,如MP3编解码芯片、语音合成 分析芯片等。使用这种方案的优点就...

nginx php 静态化,nginx下WordPress伪静态化与静态化_城闭喧的博客-程序员秘密

在强大的模板、插件的支持下,WordPress从一个博客后台工具,直接升级为CMS内容发布系统,已经是没有任何疑义的一个事实。但是WordPress的文章链接,以xxx.xxx.xxx.xxx/?p=123之类的形式存在,对于网站的SEO来说,确实是不太友好。对于这个问题,其实wordpress本身是有支持的。在wordpress里,链接地址可以是“固定链接”的形式。这种形式,我们很多时候称它为“...

RPC框架对比_Bagba的博客-程序员秘密

由于项目需要,准备开发一个分布式限速服务,参考:分布式限速,会应用到RPC服务,所以需要先调研主流RPC服务的性能,可靠,易用性。Go RPCgolang原生的rpc服务GRPC底层协议基于HTTP2RPCX...

推荐文章

热门文章

相关标签