【基础知识】tiff格式图片介绍及读取-程序员宅基地

技术标签: python  【自动驾驶】  图像处理  【AI模型训练与部署】  

一、什么是tiff格式

TIFF格式也叫TIF,属于位图格式,全名是Tag Image File Format

TIFF格式和JPEG及PNG都是属于一种主流且高位彩色图像格式

使用过扫描仪或传真的小伙伴应该还记得,很多品牌及其默认文件就是.tiff后缀。因为TIFF最初的设计目的就是在1980年左右,扫描仪厂商达成一个公用的统一的扫描图像文件格式,而不是每个厂商使用自己专有的格式造成混乱。

  1. TIFF是一种比较灵活的图像格式,它的全称是Tagged Image File Format,文件扩展名为TIF或 TIFF。该格式支持256色、24位真彩色、32位色、48位色等多种色彩位,同时支持RGB、CMYK以及 YCbCr等多种色彩模式,支持多平台。
  2. TIFF文件可以是不压缩的,文件体积较大,也可以是压缩的`,支持RAW、RLE、LZW、JPEG、 CCITT3组和4组等多种压缩方式。
  3. TIFF格式(Tag Image File Format)是Macintosh上广泛使用的图形格式,具有图形格式复杂、存贮信息多的特点。3DS、3DS MAX中的大量贴图就是TIFF格式的。TIFF最大色深为32bit,可采用LZW 无损压缩方案存储。
  4. TIFF 格式可以制作质量非常高的图像,因而经常用于出版印刷。它可以显示上百万的颜色(尽管灰度图像仅局限于 256 色或底纹),通常用于比 GIF 或 JPEG 格式更大的图像文件。如果您要在一个并非创建该图像的程序中编辑图像,则以这种格式保存将很有帮助,因为多种程序都可以识别它。
  5. 用于在应用程序和计算机平台之间交换文件。TIFF 是一种灵活的位图图像格式,几乎受所有的绘画、图像编辑和页面版面应用程序的支持。而且,几乎所有的桌面扫描仪都可以生成 TIFF 图像。

二、tiff的组成

此部分内容参考自:https://blog.csdn.net/tony5243/article/details/123410603 ,仅作学习记录

TIFF(Tagged Image File Format)是一种基于标志域的图形,依靠指针连接来组织数据。TIFF与其他标记语言不同的是除了图像数据还可以记录其他信息其他的图像格式可以嵌入到TIFF中为其所用。TIFF有四种类型:

  • TIFF-B,双色;
  • TIFF-G,黑白灰度;
  • TIFF-P,带调色板的彩色图形;
  • TIFF-R,适合RGB色彩的图形。

TIFF由四部分组成,分别是

  • 图像文件头Image File Header(IFH)、
  • 图像文件目录Image File Directory(IFD)、
  • 目录项Directory Entry(DE)、
  • 图像数据。

图像由8字节的文件头起始,文件头指向第一个文件目录。文件目录中包含了图像的各种信息,也包含了一个指向实际图像数据的指针

1.图像文件头(IFH)

Byte 0-1: 字节顺序标志位, 值为II或者MM。II表示小字节在前, 又称为little-endian。MM表示大字节在前,又成为big-endian。

Byte 2-3: TIFF的标志位,一般都是42

Byte 4-7: 第一个IFD的偏移量。可以在任意位置, 但必须是在一个字的边界,也就是说必须是2的整数倍。

2.图像文件目录(IFD)

由于一个TIFF文件中可以有多个图像,而一个IFD只标识一个图像的所有属性,所以,一个TIFF文件中有几个图像,就会有几个IFD

Byte 0-1: 表示此IFD包含了多少个DE每个DE只标识了图像的一个属性,那么这幅图像有N个属性就会有N个DE。在此假设数目为n

Byte 2-(n*12+1): n个DE

Byte (n12+2)-(n12+5): 下一个IFD的偏移量,如果没有(只有一幅图像)则置为0

3.目录项(DE)

Byte 0-1: TAG,即该属性的标签编号,在文件目录中按升序排列。

Byte 2-3: 数据类型。

Byte 4-7: 数量。通过类型和数量可以确定存储此TAG的数据需要占据的字节数

Byte 8-11: 如果占用的字节数少于4, 则数据直接存于此。 如果超过4个,则这里存放的是指向实际数据的指针
在这里插入图片描述
注:ASCII类型为文本类型,是7位ASCII码加1位二进制0;Rational为分数类型,由两个long组成,第一个是分子,第二个是分母。

4.图像数据

这些数据可能是压缩的,也可能是未压缩的。如果经过压缩,那么压缩算法又有许多种,所以,图像数据是TIFF文件中最为复杂的部分,暂还没有哪个软件能译出所有的压缩算法。

实例分析

用16进制图片查看器查看tiff数据如下:
在这里插入图片描述

  • 文件头:Byte 0000-0007

**Byte 0-1:**值都为49,对应ASCII码为II,即小字节在前

**Byte 2-3:**值为42,TIFF标志位

**Byte 4-7:**第一个IFD的偏移量,为8e,即从8e开始是第一个IFD。该tif文件只有一张图像,因此只有一个IFD。

  • 图像文件目录:Byte 008e-015f

**Byte 008e-008f:**值为11,即有17个目录项DE,每个DE占12个字节,17个DE共占204字节;

**Byte 0090-015b:**17个DE共204字节,每个DE分析见下

**Byte 015c-015f:**值为0,即没有第二个图像(IFD)

  • 目录项:Byte 0090-015f
    在这里插入图片描述

三、tiff与jpg格式的区别

一、主体不同

  1. tif:是一种灵活的位图格式,主要用来存储包括照片和艺术图在内的图像。

  2. jpg:常见的一种图像格式,它由联合图像专家组开发。

二、特点不同

  1. tif:对图像信息的存放灵活多变,可以支持很多色彩系统,而且独立于操作系统,因此得到了广泛应用。

  2. jpg:用有损压缩方式去除冗余的图像和彩色数据,在获得极高的压缩率的同时能展现十分丰富生动的图像,即可以用较少的磁盘空间得到较好的图片质量

三、优势不同

  1. tif:在各种地理信息系统摄影测量遥感等应用中,要求图像具有地理编码信息,例如图像所在的坐标系、比例尺、图像上点的坐标、经纬度、长度单位及角度单位。

  2. jpg:能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示。

四、如何读取tiff图片

1. python-opencv

tif图片的编码格式一般是16bit的,在使用python-opencv读取tif文件时,为了保留其编码格式,我们需要用以下的方式:

import numpy as np
import cv2

img = cv2.imread('demo.tif', -1)
print(img.dtype)

输出结果为:uint16

对于opencv中imread函数最后的参数解释如下:

  • 当参数>0时,opencv读取的是3通道的彩色图灰度图也会被默认转化成彩色图),编码格式会转化成8bit

  • 参数=0时,opencv读取的是1通道灰度图,编码格式会转化成8bit

  • 参数<0时,opencv会按照原图的格式读取,编码格式会返回16bit

2. tifffile

另外一种读取tif图片的方式是使用tifffile库进行读取,在python中你可以先通过pip安装:

pip install tifffile
import tifffile as tiff
import numpy as np

a = tiff.imread('demo.tif')
print(a.shape)
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/All_In_gzx_cc/article/details/127433271

智能推荐

python html转TXT python读取html指定区域文本内容转成txt文件_python读取html文件中的内容并输出-程序员宅基地

文章浏览阅读1.7k次。夹以及子目录、子目录里面的 ,获取到该目录下所有的【.html】文件后,返回一个list对象2、遍历完成后得到一个html文件列表对象,将该列表交给html_to_txt方法,html_to_txt方法里面循环逐个读取html文件中指定标签中标签中标签中的文字,和中指定标签里面标签的文字提取出来3、读取到的文本内容输出到txt文件中,这里可以加上一个替换replac_python读取html文件中的内容并输出

HOG matlab练习-程序员宅基地

文章浏览阅读84次。matlab练习程序(HOG方向梯度直方图)HOG(Histogram of Oriented Gradient)方向梯度直方图,主要用来提取图像特征,最常用的是结合svm进行行人检测。算法流程图如下(这篇论文上的):下面我再结合自己的程序,表述一遍吧:1.对原图像gamma校正,img=sqrt(img);2.求图像竖直边缘,水平边缘,边缘强度,边缘斜率。3....

新闻客户端案例开发_客户端开发技术案例-程序员宅基地

文章浏览阅读6.6k次,点赞5次,收藏20次。新闻客户端,顾名思义就是看新闻用的客户端。该新闻用到的知识模块有:android高级界面设计(Fragment、ViewPager),android网络通信(http通信),开源组件(xutils框架-HttpUtils模块、xutils框架-BitmapUtils模块),开源框架(library)。所需jar包:xUtils、gson、android-support-v4。•主界_客户端开发技术案例

python爬虫如何避免ip被限制_python爬虫防封ip的一些技巧-程序员宅基地

文章浏览阅读999次。使用代理ip,即使我们频繁了一点,也可以在被限制后更换新的ip,大大节省我们的时间,同时选择使用高匿ip,可以更有效的伪装,更有效的避开反爬机制,提高我们的工作效率。在开始工作前,我们可以先测试一下我们需要爬取的网站它的最大访问频率是多少,然后我们根据这个网站所允许的最大访问频率做出一点调整,因为我们必须清楚一点,越靠近最大频率我们的ip越容易被限制,有适当的做出调整。在日常使用爬虫去爬取数据的时候,经常会发现我们的ip被限制了,从而极大的降低了我们的工作效率,那为了避免这种情况我们应该怎么办呢?_python爬虫防封ip的一些技巧

为什么要前后端分离?有什么优缺点?_前后端分离的初衷-程序员宅基地

文章浏览阅读469次。一、前戏前后端分离已成为互联网项目开发的业界标准使用方式,通过nginx+tomcat的方式(也可以中间加一个nodejs)有效的进行解耦,并且前后端分离会为以后的大型分布式架构、弹性计算架构、微服务架构、多端化服务(多种客户端,例如:浏览器,车载终端,安卓,IOS等等)打下坚实的基础。这个步骤是系统架构从猿进化成人的必经之路。核心思想是前端html页面通过ajax调用后端的restu..._前后端分离的初衷

台式计算机主板电池型号,台式机主板电池没电会怎么样 主板电池怎么换-程序员宅基地

文章浏览阅读3.7k次。大家在使用电脑的时候可能很少会注意到主板电池这个东西,也有人将台式机主板电池和电源混为一谈。主板电池就是一个很小的纽扣电池(见下图),既然是电池,都会有电量用完的时候,那你有没有想过主板电池没电会怎么样呢?红色方框里边就是主板电池主板电池没电第一种情况:每次开机都需要按F1,系统时间归零电脑主板没电后,电脑开机停留在一个黑底白字的画面,上面会有很多英文字母,最下边会提示Press F1 to lo..._台式电脑电池没电了

随便推点

2.Form表单数据转Json格式_"$(\"#frmchangejson2cvs\").serialize() json"-程序员宅基地

文章浏览阅读1.4k次。//将form表单实例化后数据转换成Json格式$.fn.serializeJson=function(){ var serializeObj={}; var array=this.serializeArray(); $(array).each(function(){ if(serializeObj[this.name]){ if..._"$(\"#frmchangejson2cvs\").serialize() json"

OpenCV Mat类基本操作_opencv cvmat mat-程序员宅基地

文章浏览阅读877次。cv::Mat上面列举了Mat的基本构造函数,主要分为几个类型:要求输入行数和列数来构造一个二维数组的、使用cv::Size对象来构造一个二维数组的、_opencv cvmat mat

为什么基因检测沦为了娱乐项目?-程序员宅基地

文章浏览阅读366次。不久之前,《麻省理工学院技术评论》公布了其评选的2018年十大突破性技术。令人有点意外的是,最近几天针对获选技术的讨论,居然有很多都集中在“基因占卜”上。当然,相比于其他其他“看不见摸不着”的技术,基因占卜这件事听起来就和每个人息息相关,尤其还粘上了一点点“玄学”的味道。尤其关于这门技术的介绍中说道,未来我们很可能在婴儿出生时就获得一份“人生剧透报告”,通过基因检测,我们将可以了解一个婴儿的祖源分_基因检测amp什么意思

PortSwigger Authentication_portswigger 老是登录失败-程序员宅基地

文章浏览阅读856次,点赞15次,收藏19次。我的理解是这里的登录分3步 login login2 然后重定向到my-account。重置密码的最后一个阶段 我们传的参数中带了username 尝试改为carlos。猜测当vertify的值为carlos的时候 会向carlos的邮箱发验证码。在login2处直接访问my-account就跳过了login2的验证。在爆破的时候要确保当前的cookie是可用的 不然会302到登录界面。其中访问login2的时候会带上cookie。这个没回显的就是正确的密码 等待一分钟后提交。_portswigger 老是登录失败

TKCTF-学校内部的校赛_{fbtsytyanowx}ns-程序员宅基地

文章浏览阅读3k次。*Reverseeasy_Ceasy_re1.exe 在网络百度到解决逆向需要用到软件IDA 然后用IDA打开一条条的找我找到了一条很怪的ZmxhZ3s1ZWU1ZjYyOC1mMzVhLTQxNzktODg1Yi1hYzRiMjkxNTg然后失败了,当时试过很多还解码了,以为是加密的然后不对在重新看看了IDA看到后面还有一小段这个1NTl9,把他+上就对了 。然后给他加上flag{Zmxh..._{fbtsytyanowx}ns

SSH-程序员宅基地

文章浏览阅读905次,点赞21次,收藏11次。SSH:Secure Shell Protocol,安全的远程登录,实现加密通信,替代传统telnet协议。端口:22/tcp。

推荐文章

热门文章

相关标签