图像处理基础知识_图像处理理论基础-程序员宅基地

技术标签: 计算机视觉  深度学习与自然语言处理  

图像

1、模拟图像

模拟图像,又称连续图像,是指在二维坐标系中连续变化的图像,即图像的像点是无限稠密的,同时具有灰度值(即图像从暗到亮的变化值)。

2、数字图像

数字图像,又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。
数字图像是由模拟图像数字化得到的、以像素为基本元素的、可以用数字计算机或数字电路存储和处理的图像。
通常的二维数字图像是一个矩阵,可以用一个二维数组 f(x,y) 来表示,其中 x,y 是二维空间中的某坐标系的坐标,f(x,y) 表示图像在该点处的灰度值等性质。

3、颜色模式(颜色存储)

颜色具有三个特性,即色相,明度和饱和度。颜色的三个特性及其相互关系可以用三度空空间的颜色立体说明。
颜色模式,是将某种颜色表现为数字形式的模型,或者说是一种记录图像颜色的方式。分为:RGB模式、CMYK模式、HSB模式、Lab模式、位图模式、灰度模式、索引颜色模式、双色调模式和多通道模式。

● RGB模式(发光模式)
RGB 是最常用的彩色模式,RGB 分别代表红、绿、蓝三原色,RGB 采用此模式每个像素占用 3 个字节(一个字节 8 位),分别用于表示颜色的 R、G、B 分量(255、255、255)属加色模式 0-255(黑色-白色)。
特点文件小。色彩丰富且饱满。RGB模式是一种发光的彩色模式。屏幕上显示的图像,就一般都是以 RGB 模式,因为显示器的物理结构就是遵循 RGB 的 。
当3种基色的亮度值相等时,产生灰色;当3种亮度值都是255时,产生纯白色;而当所有亮度值都是0时,产生纯黑色。当3种色光混合生成的颜色一般比原来的颜色亮度值高,所以RGB模式产生颜色的方法又被称为色光加色法。

4、色彩模式(显示方式)

色彩模式是数字世界中表示颜色的一种算法,在数学世界中,为了表示各种颜色,人们通常将颜色划分为若干分量。由于成色原理的不同,决定了显示器、投影仪、扫描仪这类靠色光直接合成颜色的颜色设备和打印机、印刷机这类靠颜料的印刷设备在生成颜色方式上的区别。分为:RGB模式、CMYK模式、HSB模式、Lab模式、位图模式、灰度模式、索引颜色模式、双色调模式和多通道模式。

5、图像的分型

(1) 二值图像

只有黑白两种颜色。黑为0,白为1。二值图像适合于由黑白两色构成而没有灰度阴影的图像。
在这里插入图片描述

(2)灰度图像(GrayScale)

灰度图像矩阵元素的取值范围通常为[0,255]。因此其数据类型一般为8位无符号整数的(int8),这就是人们经常提到的256灰度图像。“0”表示纯黑色,“255”表示纯白色,中间的数字从小到大表示由黑到白的过渡色。灰度图像只有灰度颜色而没有彩色。我们通常所说的黑白照片,其实包含了黑白之间的所有灰度色调。
在这里插入图片描述

(3)索引颜色图像(Index Color)

颜色表红、绿、蓝分量值不全相等;像素值是图像颜色表的索引地址
在这种模式下,颜色都是预先定义的,并且可供选用的一组颜色也很有限,索引颜色的图像最多只能显示256种颜色
索引颜色通常也称为映射颜色,一幅索引颜色图像在图像文件里定义,当打开该文件时,构成该图像具体颜色的索引值就被读入程序里,然后根据索引值找到最终的颜色。
索引图像的文件结构比较复杂,除了存放图像的二维矩阵外,还包括一个称之为颜色索引矩阵MAP的二维数组。MAP的大小由存放图像的矩阵元素值域决定,如矩阵元素值域为[0,255],则MAP矩阵的大小为256Ⅹ3,用MAP=[RGB]表示。MAP中每一行的三个元素分别指定该行对应颜色的红、绿、蓝单色值,MAP中每一行对应图像矩阵像素的一个灰度值。
索引图像的数据类型一般为 8 位无符号整形(int8),相应索引矩阵MAP的大小为256Ⅹ3,因此一般索引图像只能同时显示256种颜色,但通过改变索引矩阵,颜色的类型可以调整。
索引图像一般用于存放色彩要求比较简单的图像,如Windows中色彩构成比较简单的壁纸多采用索引图像存放,如果图像的色彩比较复杂,就要用到RGB真彩色图像。
在这里插入图片描述

(4)真彩色RGB图像

RGB图像与索引图像一样,它分别用红(R)、绿(G)、蓝(B)三原色的组合来表示每个像素的颜色。
但与索引图像不同的是,RGB 图像每一个像素的颜色值(由RGB三原色表示)直接存放在图像矩阵中,由于每一像素的颜色需由 R、G、B 三个分量来表示,每个分量占 1 个字节,表示0到255之间的不同的亮度值,这三个字节组合可以产生1670万种不同的颜色
M、N分别表示图像的行列数,三个M x N的二维矩阵分别表示各个像素的R、G、B三个颜色分量。RGB 图像的数据类型一般为8位无符号整形,通常用于表示和存放真彩色图像,当然也可以存放灰度图像。
在这里插入图片描述
RGB 图像按行列存储,每列含有三个通道(注意:通道的顺序是 BGR 而不是 RGB)
在这里插入图片描述

5、rgb图像和索引图像的主要区别

(1)RGB彩色模式图像:又叫加色模式图,是屏幕显示的最佳颜色,由红、绿、蓝三种颜色组成,每一种颜色可以有0-255的亮度变化。
在这里插入图片描述

(2)索引颜色图像:这种颜色下图像像素用一个字节表示它最多包含有256色的色表储存并索引其所用的颜色,它图像质量不高。它的数据信息包括一个数据矩阵和一个双精度色图矩阵,它的数据矩阵中的值直接指定该点的颜色为色图矩阵中的某一种,色图矩阵中,每一行表示一种颜色,每行有三个数据,分别表示该种颜色中红、绿、蓝的比例情况,所有元素值都在[0,1]内。占空间较少。通常用于网络上的图片传输、对图像像素、大小有严格要求的地方。

6、像素

像素是指由图像的小方格组成的,这些小方块都有一个明确的位置和被分配的色彩数值,小方格颜色和位置就决定该图像所呈现出来的样子。 数字图像均由像素点构成,依据坐标原点位置的不同常分为两类,每个像素点标示为 I(r,c) 或 f(x,y)。灰度图像的值域 I 是一个一元标量: I=greylevel ;彩色图像的值域 I 是一个多元向量: 如 I=(r,g,b)。
可以将像素视为整个图像中不可分割的单位或者是元素。不可分割的意思是它不能够再切割成更小单位抑或是元素,它是以一个单一颜色的小格存在。
每一个点阵图像包含了一定量的像素,这些像素决定图像在屏幕上所呈现的大小。

7、分辨率

分辨率是度量位图图像内数据量多少的一个参数。通常表示成每英寸像素(Pixel per inch, ppi)和每英寸点(Dot per inch, dpi)。

(1)图像分辨率

图像中每单位长度上的像素数目,称为图像的分辨率,其单位为像素/英寸(PPI)或是像素/厘米。在相同尺寸的两幅图像中,高分辨率的图像包含的像素比低分辨率的图像包含的像素多。
图像的尺寸、图像的分辨率和图像文件的大小三者之间有着密切的联系。图像的尺寸越大,图像的分辨率越高,图像文件也就越大。调整图像的大小和分辨率即可改变图像文件的大小。
在这里插入图片描述

(2)屏幕分辨率

屏幕分辨率是显示器上每单位长度显示的点的数目 (DPI)。屏幕分辨率取决于显示器大小及其像素设置。
当图像分辨率高于显示器分辨率时,屏幕中显示的图像比实际尺寸大。
在这里插入图片描述

图像数学模型

1、两种基本的图像数学模型

连续模型

一般的图像都是能量的连续分布,我们前面所说的胶卷成像。

离散模型

把数字图像看成离散采样点的集合,每个点具有其各自的属性。处理运算就是对这些离散单元的操作。不能反映出图像的整体状态以及图像内容间的联系。用卷积进行操作会更好。
两个模型都各有优缺,但之后的方向还是离散模型,其便于计算机处理,之后我们主要还是从离散模型出发,进行图像处理。

2、图像数学模型的应用原则

在图像处理中,根据任务和目的的不同,经常会采用不同的模型来处理图像,或者在不同的阶段是用不同的模型,保证系统的最佳性能。图像在数字化时必须满足采样定理,这样离散的图像才能与它的连续形式对应。“数字图像处理”不是指“数字图像的处理”,而是指“图像的数字处理”。

3、采样定理

采样定理是美国电信工程师H.奈奎斯特在1928年提出的,在数字信号处理领域中,采样定理是连续时间信号(通常称为“模拟信号”)和离散时间信号(通常称为“数字信号”)之间的基本桥梁。该定理说明采样频率与信号频谱之间的关系,是连续信号离散化的基本依据。它为采样率建立了一个足够的条件,该采样率允许离散采样序列从有限带宽的连续时间信号中捕获所有信息。

4、数字化(连续 —> 离散)

将一幅图像从其原来的形式转换为数字形式的处理过程,包括“扫描” (scanning)、“采样” (sampling)与“量化”
(quantization)三个步骤。 通常将“扫描”合并到“采样”阶段,合并为两个过程。
在这里插入图片描述
(1)采样

采样是将空间上连续的图像变换成离散的点,采样频率越高,还原的图像越真实。
采样把一幅连续图像在空间上分割成 M×N 个网格,每个网格用一亮度值来表示。一个网格称为一个像素。M×N 的取值满足采样定理。
在这里插入图片描述

(2)量化

量化是将采样出来的像素点转换成离散的数量值,一幅数字图像中不同灰度值得个数称为灰度等级,级数越大,图像越是清晰。
量化就是把采样点上对应的亮度连续变化区间转换为单个特定数码的过程。
量化后,图像就被表示成一个整数矩阵。每个像素具有两个属性:位置和灰度。位置由行、列表示。灰度表示该像素位置上亮暗程度的整数。此数字矩阵M×N就作为计算机处理的对象了。灰度级一般为0-255(8bit量化)。下图表示的是如何将连续的转化为离散的情况。
在这里插入图片描述

综合而言的数字化过程如下图所示,其表示的是从图像的真实来源,到最后的数字图像:
在这里插入图片描述

图像处理

数字图像处理包括内容:

● 图像数字化;
● 图像变换;
● 图像增强;
● 图像恢复;
● 图像压缩编码;
● 图像分割;
● 图像分析与描述;
● 图像的识别分类。

常用图像变换算法

图像的几何变换(图像畸变校正、图像缩放:双线性插值、旋转、拼接)
图像变换(傅立叶、余弦、沃尔什-哈达玛、K-L变换、小波变换)
图像频域处理(增强算法:高频率提升、同态滤波;平滑去噪:低通滤波)

图像增强

图像增强的目的是要改善图像的视觉效果,针对给定图像的应用场合,有目的的增强图像的整体或局部特性,将原来不清晰的图像变得清晰或增强某些感兴趣的特征,扩大图像中不同物体的特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,将强图像判读和识别效果,满足某些特征分析的需求。

常用图像增强方法:图像的线性变换;图像的非线性变化;图像的直方图均衡化和规定化。

图像复原

图像在形成、传输和记录中,由于成像系统、传输介质和设备的不完善,导致图像质量下降,这一现象称为图像退化。图像复原需知道图像退化的机制和过程等先验知识,据此找出一种相应的逆过程解算方法,从而得到复原的图像。如果图像已退化,应先做复原处理,再做增强处理。

常用的图像复原方法:
● 代数恢复方法:无约束复原;约束最小二乘法
● 频域恢复方法:逆滤波恢复法;去除由均匀运动引起的模糊;维纳滤波复原法

图像压缩

图像数据之所以可以被压缩,是因为数据中存在着冗余。 在图像压缩中,有三种基本的数据冗余:编码冗余;像素间冗余;视觉冗余。

● 无损压缩:是对文件本身的压缩,和其它数据文件的压缩一样,是对文件的数据存储方式进行优化,采用某种算法表示重复的数据信息,文件可以完全还原,不影响文件内容,对于数字图像而言,也不会使图像细节有任何损失。无损(亦称无失真、无误差、信息保持)编码中删除的仅仅是图像数据中冗余的数据,经解码重建的图像和原始图像没有任何失真。
● 有损压缩:是对图像本身的改变,在保存图像时保留了较多的亮度信息,而将色相和色纯度的信息和周围的像素进行合并,合并的比例不同,压缩的比例也不同,由于信息量减少了,所以压缩比可以很高,图像质量也会相应的下降。有损(亦称有误差、有失真)编码是指解码重建的图像与原图像相比有失真,不能精确的复原,但视觉效果上基本相同,是实现高压缩比的编码方式。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/IT__learning/article/details/118609675

智能推荐

Flutter自定义功能强大的下拉筛选菜单gzx_dropdown_menu-程序员宅基地

文章浏览阅读1.9k次。gzx_dropdown_menu是一个Flutter自定义功能强大的轻量级下拉筛选菜单Package,它支持iOS和Android。_gzx_dropdown_menu

【MySQL】mysql | MySQL5.7升级到MySQL8.0 | docker安装mysql8 | docker mysql8 连接失败问题 | docker mysql8 表名大小写不敏感问_docker环境mysql5.7升级mysql8.0-程序员宅基地

文章浏览阅读289次。1、安全扫描MySQL5.7安全漏掉较多,要求将数据库升级到指定的8.0版本2、MySQL已经存有大概6个库的正在跑业务3、时间要求紧迫,需要尽快处理4、5.7用的是物理机yum安装。_docker环境mysql5.7升级mysql8.0

paip.php的调试--attilax总结-程序员宅基地

文章浏览阅读151次。paip.php的调试--attilax总结php的调试可用PDT与XDEBUGGER,或者与zend debugger来。。如果是php WEB项目,只能进行远程调试,XDEBUGGER/zend debugge 加载起来后,把PHP的信息截获,然后连接PDT的9000/10000端口,把内部信息发往ECLIPSE PDT了。。---------1.使用xdebugger--..._dllhopst

【C C++服务器开发】什么是服务器?服务器分类及构建一个简单的服务器系统_软件开发服务器是什么意思_软件中服务器包括什么-程序员宅基地

文章浏览阅读833次,点赞12次,收藏26次。随着Internet的发展壮大,“主机/终端”或“客户机/服务器”的传统的应用系统模式已经不能适应新的环境,于是就产生了新的分布式应用系统,相应地,新的开发模式也应运而生,即所谓的“浏览器/服务器”结构、“瘦客户机”模式。应用服务器便是一种实现这种模式核心技术。[1]Web应用程序驻留在应用服务器(Application Server)上。应用服务器为Web应用程序提供一种简单的和可管理的对系统资源的访问机制。它也提供低级的服务,如HTTP协议的实现和数据库连接管理。_软件中服务器包括什么

BUUCTF web admin (flask_session问题)_kxck-程序员宅基地

文章浏览阅读1.3k次。检查源码,发现有注释<!-- you are not admin -->,应该是提示用admin账号登录。两个功能,注册和登录,想到之前做过一个注册admin加空格的题,试了一下不成功。然后老老实实注册一个普通用户显示了自己的用户名,我们的目的因该是让自己的用户名变成admin才行。change password只能修改自己账号的密码,没有漏洞。post可能有xss漏洞,交..._kxck

ssh放行端口_linux系统防火墙开启放行其他端口-程序员宅基地

文章浏览阅读1.9k次。我司弹性云主机默认在外部未对端口进行限制,如果服务运行后端口外部不通,可参考本教程在防火墙放行对应端口。1、WDCP 系统端口放行:(1)3.2版本登录wdcp面板后点击“安全管理”——“防火墙设置”——“快速添加”,如图填写端口(协议默认都使用tcp),保存即可放行。(2)2.5版本登录wdcp后,点击“安全管理”——“防火墙(iptables)”——增加规则如图,一般直接填写需要放行的端口,点..._ssh怎么放行端口

随便推点

webshell检测方式深度剖析 ---统计学特征检测_neopi-程序员宅基地

文章浏览阅读1.1k次。目录概论统计学特征重合指数概论该篇文章讲述了NeoPI如何利用统计学特征来检测webshell,笔者认为NeoPI选择的这些统计学方法在webshell检测上有些鸡肋,没有太大的实用效果。反而其中的各种统计学方法值得学习一下,因此文章会重点讲解这些统计学特征的原理,以求可以举一反三,并应用在其他领域。统计学特征NeoPi使用以下五种统计学特征检测方法,下面分别来分析各种方法的原理和代码实现(代码部分只选择了核心代码并附加了注释,方便大家阅读。):重合指数重合指数法是密码分析学的一种工具,主要_neopi

高可用之限流降级_压测流量降级-程序员宅基地

文章浏览阅读446次。高可用之限流降级1、前言在大规模微服务架构的场景下,为了避免服务出现雪崩,要减少停机时间,尽可能的提高服务可用性。提高服务可用性,可以从很多方向入手,比如缓存、池化、异步化、负载均衡、队列和降级熔断等手段。缓存以及队列等手段,增加系统的容量限流和降级则是关心在到达系统瓶颈时系统的响应,更看重稳定性缓存和异步等关注提高系统战力,而限流降级则关注增强系统防御,具体实施方法可以归纳为八字箴言,限流、降级、熔断、隔离。2、限流&降级2.1、限流限流,顾名思义,即提前对各个类型的请求设_压测流量降级

K8S--K8S有什么作用?K8S与Docker有什么区别?,Linux运维驱动工程师面试题-程序员宅基地

文章浏览阅读904次,点赞21次,收藏6次。本书第﹖版以最新的Ubuntu 12.04为版本,循序渐进地向读者介绍了Linux 的基础应用、系统管理、网络应用、娱乐和办公、程序开发、服务器配置、系统安全等。Kubernetes提供了强大的资源管理功能,可以对应用程序的CPU、内存、存储等资源进行有效的管理和分配。Kubernetes支持自动部署和回滚功能,可以轻松地将新版本的应用程序部署到集群中,并在需要时回滚到之前的版本。Kubernetes具备内建的负载均衡功能,可以自动将流量分配到应用程序的各个实例之间,从而实现高效的请求处理和资源利用。

java基本数据类型_java整型类型分为-程序员宅基地

文章浏览阅读345次。放在操作元前面的自增,自减运算符,会先将变量的值加1(减1),然后再使该变量参与表达式的运算,放在操作元的自增,自减运算符,会先使变量参与表达式的运算,然后再将该变量加1(减1)。char型:字符类型(char)用于存储单个字符,占用16个位(两个字节)的内存空间,在定义字符型变量时,要以单引号表示,如's'表示一个字符串,虽然只有一个字符,但由于使用双引号,它仍然表示字符串,而不是字符;java中的算术运算符主要有+(加),-(减),*(乘),/(除),%(求余),它们都是二元运算符。_java整型类型分为

linux安全--CentOS7安装Tomcat,远程管理ManagerApp-程序员宅基地

文章浏览阅读486次,点赞11次,收藏6次。【代码】linux安全--CentOS7安装Tomcat。

浅谈Native、Web App、Hybrid、RN 和 Weex优劣-程序员宅基地

文章浏览阅读698次。一句话概要Native、Web App、Hybrid、React Native(后面以RN简称)、Weex 间的异同点,后期同步 小程序 和 PWAApp常用开发模式【简介】此处App为应用,application,并非我们通常讲的手机App常用的几种APP开发模式-脑图Native App传统的原生App开发模式,有iOS和aOS两大系统,需要各自语言开发各自App。优点:性能和..._native 运行比rn快?

推荐文章

热门文章

相关标签