数据压缩第六周作业——DPCM预测编码_预测编码的码元效率计算-程序员宅基地

技术标签：数据压缩网络 p2p

实验要求

实验原理

实验内容

实验步骤

实验代码

1、将bmp文件转换为yuv文件（使用之前做的bmptoyuv代码）

实验要求

1、掌握DPCM编解码系统的基本原理。

2、初步掌握实验用C/C++/Python等语言编程实现DPCM编码器，并分析其压缩效率。

实验原理

DPCM（差分预测编码）：利用信源相邻符号之间的相关性。早在电视原理和通信原理课上我们便已经接触了DPCM算法。在电视原理在传输视频数据时，经常将预测编码运用到帧内预测和帧间预测，由于视频两帧之间有大量相同内容，利用预测编码，先传输第一个采样点数值，再传输相邻采样点之间的差值，每次传输直接传输差值，第二个采样点=第一个采样点+差值...以此类推。由于视频之间相同内容较多，差值较小，每次传输时可用小比特表示图像，降低了对传输带宽的要求；在通信原理中，在对模拟信号进行编码传输时，也用到了DPCM算法。

（本质：建立一个新信源，将原始信源变为预测误差的信源）

简单总结DPCM算法思想为：根据模型利用以往的样本值对新样本进行预测，每次传输时，只需要传输预测值和实际值之间的差值。

DPCM算法逻辑图：（重点观察两个地方：上半部分量化、下半部分预测）

DPCM算法重点在于理解负反馈过程。注意这里的意思：

实验内容

在本次实验中，我们采用固定预测器和均匀量化器。

预测器采用左侧、上方预测均可，量化器采用8比特均匀量化，还可对预测误差进行1比特、2比特和4比特的量化设计（提高要求）。

本实验的目标是验证DPCM编码的编码效率。在DPCM编码器实现的过程中可同时输出预测误差图像和重建图像。将预测误差图像写入文件并将该文件输入Huffman编码器，得到输出码流、给出概率分布图并计算压缩比。将原始图像文件输入Huffman编码器，得到输出码流、给出概率分布图并计算压缩比。

最后比较两种系统（1.DPCM+熵编码和2.仅进行熵编码）之间的编码效率（压缩比和图像质量）。压缩质量以PSNR进行计算。

实验步骤

1.输入图片（提前将bmp文件转换为yuv文件）

2.根据给定的量化比特数进行量化和预测

3.输出预测误差图像和重建图像

4.将预测误差图像写入文件并将该文件输入Huffman编码器

5.根据输出码流画概率分布图、计算压缩比

4.度量失真程度（计算PSNR峰值信噪比）

5.对原始图像和预测误差图像进行Huffman编码

实验代码

1、将bmp文件转换为yuv文件（使用之前做的bmptoyuv代码）

以Birds.bmp为例，arg[1]表示输入，arg[2]表示输出，1表示读写次数1次，输入rgb文件，输出yuv文件

2、新建项目，设置命令行参数

arg[1]表示输入原图，arg[2]表示预测误差，arg[3]表示重建图，arg[4]表示原图概率分布，arg[5]表示残差概率分布

3、main函数

int main(int argc, char* argv[])
{
	//初始化
	int height = 768;
	int width = 512;
	int bit = 8;

	FILE* yuvname = NULL;
	FILE* e_name = NULL;
	FILE* rebuid_name = NULL;
	FILE* freq_yuv = NULL;
	FILE* freq_e = NULL;


	//定义缓冲区
	unsigned char* predict_buffer;
	unsigned char* y_buffer;
	unsigned char* u_buffer;
	unsigned char* v_buffer;
	unsigned char* rebuid_buffer;

	y_buffer = (unsigned char*)malloc(width * height);
	u_buffer = (unsigned char*)malloc(width * height / 4);
	v_buffer = (unsigned char*)malloc(width * height / 4);
	rebuid_buffer = (unsigned char*)malloc(width * height);
	predict_buffer = (unsigned char*)malloc(width * height);

	//打开文件
	fopen_s(&yuvname, argv[1], "rb");
	fopen_s(&e_name, argv[2], "wb");
	fopen_s(&rebuid_name, argv[3], "wb");
	fopen_s(&freq_yuv, argv[4], "wb");
	fopen_s(&freq_e, argv[5], "wb");

	if (yuvname == NULL || e_name == NULL || rebuid_name == NULL)
	{
		cout << "Open Error！" << endl;
		return 0;
	}

	//读取文件
	fread(y_buffer, 1, width * height, yuvname);
	fread(u_buffer, 1, (width * height) / 4, yuvname);
	fread(v_buffer, 1, (width * height) / 4, yuvname);

	//预测差分编码
	DPCM(y_buffer, predict_buffer, rebuid_buffer, width, height, bit);

	//计算PSNR
	PSNR(y_buffer, rebuid_buffer, height, width, bit);

	//计算概率分布
	int size = height * width;
	int count[256] = { 0 };
	int pro_y[256] = { 0 };
	int pro_e[256] = { 0 };

		for (int i = 0; i < size; i++) {
		int color = *(y_buffer + i);// (int_buf + i)点的灰度值
		count[color]++;
	}
	for (int j = 0; j < 256; j++)//灰度概率
	{
		pro_y[j] = (double(count[j]) / size);//原图的概率分布
	}
	for (int i = 0; i < size; i++) {
		int color = *(predict_buffer + i);// (int_buf + i)点的灰度值
		count[color]++;
	}
	for (int j = 0; j < 256; j++)//灰度概率
	{
		pro_e[j] = (double(count[j]) / size);//预测误差的概率分布
	}
	//写预测误差文件
	fwrite(predict_buffer, 1, width * height, e_name);
	fwrite(u_buffer, 1, (width * height) / 4, e_name);
	fwrite(v_buffer, 1, (width * height) / 4, e_name);

	//写预重建图像文件
	fwrite(rebuid_buffer, 1, width * height, rebuid_name);
	fwrite(u_buffer, 1, (width * height) / 4, rebuid_name);
	fwrite(v_buffer, 1, (width * height) / 4, rebuid_name);

	//写概率分布
	for (int i = 0; i < 256; i++) {
		fprintf(freq_yuv, "%f\n", pro_y[i]);
		fprintf(freq_e, "%f\n", pro_e[i]);
	}
	free(y_buffer);
	free(u_buffer);
	free(v_buffer);
	free(predict_buffer);
	free(rebuid_buffer);

	fclose(yuvname);
	fclose(e_name);
	fclose(rebuid_name);

	return 0;
}

4、定义DPCM函数：

采用左向预测

原始值取值范围（0，255），减去预测值（0，255），预测误差的范围为（-255，255），为保证传入的误差值为正，（预测误差+255），范围为（0，510）-->所需要的bit数为9bit。如果之后想要用4bit、16bit量化可以按照

int Quality(int error, int bit) {///量化
	return (error + 255) / pow(2, (9 - bit));//这里pow就是2的(9-bit)次方
}
int FanQuality(int bit, unsigned char rebuid_buffer) {反量化
	return rebuid_buffer *pow(2,(9-bit))-255;
}
void DPCM(unsigned char* y_buffer, unsigned char* predict_buffer, unsigned char* rebuid_buffer, int width, int height, int bit)
{
	int error;

	for (int i = 0; i < height; i++) {///行
		for (int j = 0; j < width; j++) {列
			if (j == 0) {    //第一列以128进行预测
				error = (y_buffer[i * width + j]) - 128;     //误差值
				predict_buffer[i * width + j] = Quality(bit, error);     //量化误差值

				rebuid_buffer[i * width + j] = FanQuality(bit, predict_buffer[i * width + j]) + 128;    //重建值（反量化之后）
			}
			else {   //其他列都以前一列进行预测
				error = (y_buffer[i * width + j]) - rebuid_buffer[i * width + j - 1];    //误差值，左侧-右侧
				predict_buffer[i * width + j] = Quality(bit, error);    //量化误差值
				rebuid_buffer[i * width + j] = FanQuality(bit, predict_buffer[i * width + j]) + rebuid_buffer[i * width + j - 1];    //重建值
			}
		}
	}
}

5、PSNR峰值信噪比函数

在客观评价图像质量时，我们经常会遇到峰值信噪比PSNR，计算PSNR需要提前计算MSE，这里给出下面两个的公式：

PS:这里的MAX为图像的灰度级，一般等于255。

double PSNR(unsigned char* y_buffer, unsigned char* rebuid_buffer, int height, int width, int dep) {
	double max = 255;
	double mse = 0;
	double psnr=0;

	for (int i = 0; i < height; i++)
		for (int j = 0; j < width; j++) {
			mse += (y_buffer[i * width + j] - rebuid_buffer[i * width + j]) * (y_buffer[i * width + j] - rebuid_buffer[i * width + j]);
		}
	mse = mse / (double)(width * height);
	psnr = 10 * log10((double)(max * max) / mse);
	return psnr;
}

得到PSNR结果：

量化比特数	PSNR(客观评价）	预测误差图像	重建图像（主观评价）	概率分布
8bit	51.1408
4bit	23.0487
2bit	9.91007
1bit	9.73155

原图的概率分布计算：

#include<iostream>
#include<math.h>

using namespace std;

int main(int argc, char* argv[])
{
	//初始化
	int height = 768;
	int width = 512;
	int bit = 1;

	FILE* yuvname = NULL;
	FILE* out = NULL;


	//定义缓冲区
	unsigned char* y_buffer;
	unsigned char* u_buffer;
	unsigned char* v_buffer;

	y_buffer = (unsigned char*)malloc(width * height);
	u_buffer = (unsigned char*)malloc(width * height / 4);
	v_buffer = (unsigned char*)malloc(width * height / 4);

	//打开文件
	fopen_s(&yuvname, argv[1], "rb");
	fopen_s(&out, argv[4], "rb");

	if (yuvname == NULL )
	{
		cout << "Open Error！" << endl;
		return 0;
	}

	//读取文件
	fread(y_buffer, 1, width * height, yuvname);
	fread(u_buffer, 1, (width * height) / 4, yuvname);
	fread(v_buffer, 1, (width * height) / 4, yuvname);


	//计算概率分布
	int size = height * width;
	double count[256] = { 0 };
	double pro_y[256] = { 0 };
	double pro_e[256] = { 0 };

	for (int i = 0; i < size; i++) {
		int color = *(y_buffer + i);// (int_buf + i)点的灰度值
		count[color]++;
	}
	for (int j = 0; j < 256; j++)//灰度概率
	{
		pro_y[j] = (double(count[j]) / size);//原图的概率分布
	}


	//写概率分布
	for (int i = 0; i < 256; i++) {
		fprintf(out, "%f\n", pro_y[i]);
	}

	free(y_buffer);
	free(u_buffer);
	free(v_buffer);


	fclose(yuvname);

	return 0;
}

总结：

观察原图概率分布和预测误差图像概率分布，我们可以看出，原图的概率分布“范围”更广，取值相比于预测误差图像而言，分布更均匀，因此其熵也更大。

对于无失真编码而言，由于香农第一定理，信源符号平均码长的下界为信源熵，如果想达到最好的压缩效果，就希望平均码长最小；利用信源符号间的相关性，减小编码的信息冗余，将均匀分布的信源符号转换为非均匀分布，减少信源熵，提高压缩效率。

补充实验：

比较DPCM+熵编码和仅进行熵编码之间的编码效率（压缩比和图像质量）

---> 打开Huffmancode.bat，写入输入、输出，利用Huffman编码器进行熵编码，将熵编码后的结果保存在birds.txt和birds_DPCM.txt中（保存后点击.bat文件）

保存、运行Huffmancode.bat，得到结果

Birds_out.huff为仅进行熵编码的文件、birds_DPCM为进行DPCM+熵编码的文件，对这两个文件比较压缩比：

DPCM+8bit量化+熵编码-----压缩比： 576/340=2.1

仅进行熵编码---------压缩比：576/488=1.6

由此可见，经过熵编码后图像的压缩比更大，即系统的压缩效果更好。

Final总结：

通过本次实验我深刻理解了预测-熵编码的过程。预测尽可能利用信源符号的相关性，减小信息冗余，最大程度的减小信源符号熵。聪明的DPCM系统，通过只传误差，对误差进行编码等，提高了压缩效率。同时在编码器里引入解码器，保证编解码端同步，减少产生误差漂移。

本文链接：https://blog.csdn.net/Adore11/article/details/124651546

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

Android：项目引入module导致Duplicate class....或Program type already present okhttp3 OkUrlFactory（包重复问题）_android okurlfactory-程序员宅基地

文章浏览阅读971次。Android：项目引入module导致Duplicate class…或Program type already present okhttp3 OkUrlFactory_android okurlfactory

hsqldb的使用方法-程序员宅基地

文章浏览阅读595次。现在很多开源项目使用hsqldb作为数据库。了解hsqldb的基本使用方法还是很必要的。这篇不是全面介绍hsqldb的文字，但我认为用这个笔记的内容调试程序够用了。一、下载数据库，地址在http://sourceforge.net/projects/hsqldb/files/hsqldb/ 我使用的是1.8.0版本。假定下载解压后的目录是D:/hsqldb/, 那么hsqldb.jar在D:/hsqldb/lib目录下。这个jar文件是hsqldb的核心包二、启动数据库，比如数据库名称为tes_hsqldb的使用

ubuntu查看固态硬盘位置_ubuntu新增加固态硬盘，格式化并挂载到根目录下-程序员宅基地

文章浏览阅读1.2k次。前言：将固态硬盘装到电脑，ubuntu系统需要格式化并挂载才能正式使用将固态装在电脑上后，打开后端1：查看现有硬盘分区及挂载状态命令：df -h没有新增的SSD固态硬盘2：查看服务器所有安装的硬盘状态(包括已安装和未安装的)命令: fdisk -l此时已经安装的磁盘，但是没有分区，先分区3, 将磁盘分区，分一个区挂载到根目录下命令：fdisk /dev/sdb (该目录是上面未安装的磁盘目录)..._怎么看固态硬盘在服务器上的挂载路径

TortoiseSVN使用简介_tortoisesvn 文件哪个版本好用-程序员宅基地

文章浏览阅读3.3k次，点赞3次，收藏16次。TortoiseSVN使用简介_tortoisesvn 文件哪个版本好用

iOS 屏幕适配浅谈-程序员宅基地

文章浏览阅读379次。作者 | 钱凯杏仁移动开发工程师，前嵌入式工程师，关注大前端技术新潮流。前端开发的屏幕适配其实算是基本功，每个码农在长期实践中都有自己的总结。在 iOS 平台上，苹果爸爸对适配的支持个人感觉很不人性化，提供了 AutoLayout、sizeClass 等技术，感觉没有前端类似 flexBox 这样的技术来得灵活。像是点歪了技能树，过于重视使用 xib 配置_cgfloat left 适配

MATLAB中eval函数和cell型数组的组合使用_matlab eval cell-程序员宅基地

文章浏览阅读674次。MATLAB中eval函数和cell型数组的组合使用一、evaleval的功能简单来说就是可以把字符串当做命令来执行。经常用于循环当中，特别是有些变量的名字中含有有规律的数字。二、{ }大括号，用于cell型的数组（就是前面讲的单元数组）的分配或引用。比如 a{3,3}=‘china’就是建立了一个3*3的单元数组，a(3,3)就是‘china’三、应用我们在matlab中有事可能会遇到a1、a2、a3…这样的组合，想利用for语句使用里面的数据却无法成功。（例如ai未定义等原因）此时我们使_matlab eval cell

随便推点

在windows server 2008 64位服务器上配置php环境_在2008服务器上面配置phpmyadmin访问-程序员宅基地

文章浏览阅读2.4w次。PHP是越来越受欢的开发语言,PHP是因网络而生,是专业于网络程序开发的基础平台.很多优势在些不作太多介绍.对于我们习惯了windows操作系统技术人员来讲,在windows系统上架设PHP环境更轻松些.接下来由向大家介绍2008 R2 64位的服务器如何配置最新PHP环境._在2008服务器上面配置phpmyadmin访问

python 特征选择卡方_4. 机器学习之特征选择-Python代码-程序员宅基地

文章浏览阅读719次。1. 特征选择------sklearn代码1.1 特征选择------方差法忽略warning错误import warningswarnings.filterwarnings("ignore")# 方差法from sklearn.feature_selection import VarianceThresholdX = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1..._python 方差法选择特征

WebGL快速入门_webgl入门-程序员宅基地

文章浏览阅读2.3k次，点赞2次，收藏11次。WebGL是一种用于在Web浏览器中实现高性能3D图形的技术。本文将帮助读者快速入门WebGL，了解其基本概念和使用方法。我们将介绍WebGL的基本架构和API，包括如何创建WebGL上下文、渲染对象和着色器编程等。此外，我们还会深入探讨WebGL的基本原理和渲染管线，以及如何通过优化渲染流程来提升性能。通过学习本文，读者将能够理解WebGL的核心概念和使用方法，并能够开始开发高性能的3D应用程序。_webgl入门

C++中的String的常用函数用法总结_string函数-程序员宅基地

文章浏览阅读10w+次，点赞1.3k次，收藏6.1k次。一. string的构造函数的形式： string str：生成空字符串string s(str)：生成字符串为str的复制品string s(str, strbegin,strlen)：将字符串str中从下标strbegin开始、长度为strlen的部分作为字符串初值string s(cstr, char_len)：以C_string类型cstr的前char_len个字..._string函数

金融风控训练营金融风控基础知识学习笔记_风控师学习笔记-程序员宅基地

文章浏览阅读162次。一、赛题理解和学习目标：本次挑战赛以个人信贷为背景，要求选手对金融风控之贷款是否违约进行预测，以此判断是否通过此项贷款的一项问题型比赛。通过学习Task1了解第一个学习内容，要求对金融风控的问题建立数学模型最后给定金融风险程度。在此过程中要了解混淆矩阵、AUC评价指标，KS统计量等二、学习内容：混淆矩阵就是一个2×2的矩阵分为真正类TP、真分类TN、假正类FT、假反类FNFP FN TP TN AUC被定义在ROC曲线下与坐标轴围成的面积（ROC曲线:以真阳性率._风控师学习笔记

哈希表添加增添删除获取方法 Js封装_js hash追加-程序员宅基地

文章浏览阅读237次。<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>D._js hash追加