深入学习二叉树(三) 霍夫曼树_等长编码-程序员宅基地

技术标签： java c语言数据结构与算法测试工具数据结构

深入学习二叉树(三) 霍夫曼树

1 前言

霍夫曼树是二叉树的一种特殊形式，又称为最优二叉树，其主要作用在于数据压缩和编码长度的优化。

2 重要概念

2.1 路径和路径长度

在一棵树中，从一个结点往下可以达到的孩子或孙子结点之间的通路，称为路径。通路中分支的数目称为路径长度。若规定根结点的层数为1，则从根结点到第L层结点的路径长度为L-1。

在这里插入图片描述
图2.1所示二叉树结点A到结点D的路径长度为2，结点A到达结点C的路径长度为1。

2.2 结点的权及带权路径长度

若将树中结点赋给一个有着某种含义的数值，则这个数值称为该结点的权。结点的带权路径长度为：从根结点到该结点之间的路径长度与该结点的权的乘积。
图2.2展示了一棵带权的二叉树

在这里插入图片描述

2.3 树的带权路径长度

树的带权路径长度规定为所有叶子结点的带权路径长度之和，记为WPL。
图2.2所示二叉树的WPL：
WPL = 6 * 2 + 3 * 2 + 8 * 2 = 34；

3 霍夫曼树

3.1 定义

给定n个权值作为n个叶子结点，构造一棵二叉树，若带权路径长度达到最小，称这样的二叉树为最优二叉树，也称为霍夫曼树(Huffman Tree)。
如图3.1所示两棵二叉树
在这里插入图片描述
叶子结点为A、B、C、D，对应权值分别为7、5、2、4。
3.1.a树的WPL = 7 * 2 + 5 * 2 + 2 * 2 + 4 * 2 = 36
3.1.b树的WPL = 7 * 1 + 5 * 2 + 2 * 3 + 4 * 3 = 35
由ABCD构成叶子结点的二叉树形态有许多种，但是WPL最小的树只有3.1.b所示的形态。则3.1.b树为一棵霍夫曼树。

3.2 构造霍夫曼树

构造霍夫曼树主要运用于编码，称为霍夫曼编码。现考虑使用3.1中ABCD结点以及对应的权值构成如下长度编码。
AACBCAADDBBADDAABB。
编码规则:从根节点出发，向左标记为0，向右标记为1。
采用上述编码规则，将图3.1编码为图3.2所示：

在这里插入图片描述
构造过程：
3.1.a所示二叉树称为等长编码，由于共有4个结点，故需要2位编码来表示，编码结果为：

则AACBCAADDBBADDAABB对应编码为：
00 00 10 01 10 00 00 11 11 01 01 00 11 11 00 00 01 01
长度为36。
3.1.b构造过程如下：
1）选择结点权值最小的两个结点构成一棵二叉树如图3.3：

在这里插入图片描述
2）则现在可以看作由T1，A，B构造霍夫曼树，继续执行步骤1。
选则B和T1构成一棵二叉树如图3.4：

在这里插入图片描述
3）现只有T2和A两个结点，继续执行步骤1。
选择A和T2构成一棵二叉树如图3.5：

经过上述步骤则可以构造完一棵霍夫曼树。通过观察可以发现，霍夫曼树中权值越大的结点距离根结点越近。
按照图3.5霍夫曼树编码结果：
在这里插入图片描述
则AACBCAADDBBADDAABB对应编码为：
0 0 110 10 110 0 0 111 111 10 10 0 111 111 0 0 10 10
编码长度为35。
由此可见，采用二叉树可以适当降低编码长度，尤其是在编码长度较长，且权值分布不均匀时，采用霍夫曼编码可以大大缩短编码长度。

3.3 代码实现

#include <iostream>
#include <stdlib.h>
using namespace std;
const int MaxValue = 10000;//初始设定的权值最大值
const int MaxBit = 4;//初始设定的最大编码位数
const int MaxN = 10;//初始设定的最大结点个数
struct HaffNode//哈夫曼树的结点结构
{
    
    int weight;//权值
    int flag;//标记
    int parent;//双亲结点下标
    int leftChild;//左孩子下标
    int rightChild;//右孩子下标
};
struct Code//存放哈夫曼编码的数据元素结构
{
    
    int bit[MaxBit];//数组
    int start;//编码的起始下标
    int weight;//字符的权值
};
void Haffman(int weight[], int n, HaffNode haffTree[])
//建立叶结点个数为n权值为weight的哈夫曼树haffTree
{
    
    int j, m1, m2, x1, x2;
    //哈夫曼树haffTree初始化。n个叶结点的哈夫曼树共有2n-1个结点
    for (int i = 0; i<2 * n - 1; i++)
    {
    
        if (i<n)
            haffTree[i].weight = weight[i];
        else
            haffTree[i].weight = 0;
        //注意这里没打else那{}，故无论是n个叶子节点还是n-1个非叶子节点都会进行下面4步的初始化
        haffTree[i].parent = 0;
        haffTree[i].flag = 0;
        haffTree[i].leftChild = -1;
        haffTree[i].rightChild = -1;
    }
    //构造哈夫曼树haffTree的n-1个非叶结点
    for (int i = 0; i<n - 1; i++)
    {
    
        m1 = m2 = MaxValue;//Maxvalue=10000;(就是一个相当大的数)
        x1 = x2 = 0;//x1、x2是用来保存最小的两个值在数组对应的下标
 
        for (j = 0; j<n + i; j++)//循环找出所有权重中，最小的二个值--morgan
        {
    
            if (haffTree[j].weight<m1&&haffTree[j].flag == 0)
            {
    
                m2 = m1;
                x2 = x1;
                m1 = haffTree[j].weight;
                x1 = j;
            }
            else if(haffTree[j].weight<m2&&haffTree[j].flag == 0)
            {
    
                m2 = haffTree[j].weight;
                x2 = j;
            }
        }
        //将找出的两棵权值最小的子树合并为一棵子树
        haffTree[x1].parent = n + i;
        haffTree[x2].parent = n + i;
        haffTree[x1].flag = 1;
        haffTree[x2].flag = 1;
        haffTree[n + i].weight = haffTree[x1].weight + haffTree[x2].weight;
        haffTree[n + i].leftChild = x1;
        haffTree[n + i].rightChild = x2;
    }
}
void HaffmanCode(HaffNode haffTree[], int n, Code haffCode[])
//由n个结点的哈夫曼树haffTree构造哈夫曼编码haffCode
{
    
    Code *cd = new Code;
    int child, parent;
    //求n个叶结点的哈夫曼编码
    for (int i = 0; i<n; i++)
    {
    
        //cd->start=n-1;//不等长编码的最后一位为n-1,
        cd->start = 0;//,----修改从0开始计数--morgan
        cd->weight = haffTree[i].weight;//取得编码对应权值的字符
        child = i;
        parent = haffTree[child].parent;
        //由叶结点向上直到根结点
        while (parent != 0)
        {
    
            if (haffTree[parent].leftChild == child)
                cd->bit[cd->start] = 0;//左孩子结点编码0
            else
                cd->bit[cd->start] = 1;//右孩子结点编码1
                                      //cd->start--;
            cd->start++;//改成编码自增--morgan
            child = parent;
            parent = haffTree[child].parent;
        }
        //保存叶结点的编码和不等长编码的起始位
        //for(intj=cd->start+1;j<n;j++)
        for (int j = cd->start - 1; j >= 0; j--)//重新修改编码，从根节点开始计数--morgan
            haffCode[i].bit[cd->start - j - 1] = cd->bit[j];
 
        haffCode[i].start = cd->start;
        haffCode[i].weight = cd->weight;//保存编码对应的权值
    }
}
int main()
{
    
    int i, j, n = 4, m = 0;
    int weight[] = {
     2,4,5,7 };
    HaffNode*myHaffTree = new HaffNode[2 * n - 1];
    Code*myHaffCode = new Code[n];
    if (n>MaxN)
    {
    
        cout << "定义的n越界，修改MaxN!" << endl;
        exit(0);
    }
    Haffman(weight, n, myHaffTree);
    HaffmanCode(myHaffTree, n, myHaffCode);
    //输出每个叶结点的哈夫曼编码
    for (i = 0; i<n; i++)
    {
    
        cout << "Weight=" << myHaffCode[i].weight << "  Code=";
        //for(j=myHaffCode[i].start+1;j<n;j++)
        for (j = 0; j<myHaffCode[i].start; j++)
            cout << myHaffCode[i].bit[j];
        m = m + myHaffCode[i].weight*myHaffCode[i].start;
        cout << endl;
    }
    cout << "huffman's WPL is:";
    cout << m;
    cout << endl;
    return 0;
}

4 结语

本文主要介绍了霍夫曼树的实际意义和如何构造一棵二叉树。学习霍夫曼树主要是掌握霍夫曼树的构造思想以及构造过程，至于代码实现则是次要的，而且霍夫曼编码实现过程中运用到了贪心算法。

本文链接：https://blog.csdn.net/qq_43842093/article/details/120539951

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

为什么我们需要企业架构？_企业架构的价值-程序员宅基地

文章浏览阅读1.8k次。良好的IT信息化建设基于两个前提：IT架构与业务价值，缺一不可，二者结合在一起就叫企业架构。IT架构服务于业务价值，而业务价值则通过业务架构来表现出来。_企业架构的价值

C++ Primer Plus（第六版）第9章内存空间和名称空间_autoscp.cpp-程序员宅基地

文章浏览阅读549次。按住ctrl键选中三个执行文件，用debug模式进行调试。coordin.h// coordin.h -- structure templates and function prototypes// structure templates#ifndef COORDIN_H_#define COORDIN_H_struct polar{ double distance; // distance from origin double angle; // ._autoscp.cpp

倾斜摄影数据OSGB转换成3DML（转载）-程序员宅基地

文章浏览阅读2k次。工具/原料skyline CityBuilder方法/步骤确定手中的osgb数据文件夹符合命名规则，如下图打开CityBuilder（软件许可目前只能申请试用），在工具栏Mesh Layer的下拉选项中选择Import OSGB Layer，弹出相应对话框，在对话框Input folder后的Browse选择上图中的上级文件夹，选择后对话框中的后两项会自动填充，将Metedat..._osgb转skyline

一文搞懂文件系统-程序员宅基地

文章浏览阅读2.2k次，点赞2次，收藏13次。文件系统是计算机操作系统中的一个核心组件，用于管理计算机中的文件和文件夹。它提供了一种组织和访问计算机存储设备上数据的方式。文件系统使用户能够创建、修改、删除和查找文件，以及组织文件和文件夹的层次结构。_文件系统

R绘制基于Cox回归模型的限制性立方样条图_限制性立方样条 cox 模型-程序员宅基地

文章浏览阅读1.4k次，点赞26次，收藏34次。R绘制基于Cox回归模型的限制性立方样条图。_限制性立方样条 cox 模型

java常见面试题（160道）_java面试题-程序员宅基地

文章浏览阅读5.4w次，点赞89次，收藏746次。java常见面试题_java面试题

随便推点

前端开发之Dom的简介和Dom操作_前端dom是什么意思啊-程序员宅基地

文章浏览阅读1.7k次。Dom的简介,Dom获取元素节点,Dom的获取父字关系节点,DOM节点创建，插入，删除，复制节点,设置节点的属性_前端dom是什么意思啊

android开发书籍下载，Android性能优化面试题集锦-程序员宅基地

文章浏览阅读511次，点赞14次，收藏9次。最后看一下学习需要的所有知识点的思维导图。在刚刚那份学习笔记里包含了下面知识点所有内容！文章里已经展示了部分！如果你正愁这块不知道如何学习或者想提升学习这块知识的学习效率，那么这份学习笔记绝对是你的秘密武器！

配置ACL包过滤防火墙典型实验_acl防火墙配置实验-程序员宅基地

文章浏览阅读2.8k次。配置ACL包过滤防火墙_acl防火墙配置实验

吴恩达《机器学习》12-4-12-5:核函数 1、核函数 2_核函数吴恩达-程序员宅基地

文章浏览阅读968次，点赞25次，收藏17次。当实例与地标距离近时，新特征的值趋近于 1，而当距离较远时，新特征的值趋近于 0。在实际应用中，通过选取不同的地标和核函数，能够构建出更加复杂且适应性强的判定边界，从而提高模型的性能。核函数的选择影响了特征的映射效果，而合适的核函数能够在新的特征空间中更好地划分不同类别。因此，需要一种更有效的方法来构造新的特征。核函数的作用在于将实例的原有特征映射到一个新的空间，从而使得在这个新空间中的判定边界更为有效。相应地，代价函数也需要进行调整，其中对于正则化项的计算引入了一个矩阵 M，该矩阵取决于选择的核函数。_核函数吴恩达

org.apache.commons.io.FileUtils 文件操作-程序员宅基地

文章浏览阅读1.1k次。转自：org.apache.commons.io——FileUtils学习笔记 FileUtils类的应用1、写入一个文件；2、从文件中读取；3、创建一个文件夹，包括文件夹；4、复制文件和文件夹；5、删除文件和文件夹；6、从URL地址中获取文件；7、通过文件过滤器和扩展名列出文件和文件夹；8、比较文件内容；9、文件最后的修改时间；10、计算校验和。..._apache common 文件夹创建

EV/HEV中的牵引逆变器驱动优化-程序员宅基地

文章浏览阅读1.6k次，点赞42次，收藏35次。什么是牵引逆变器？从本质上讲，牵引逆变器是电动汽车动力系统中的一个子系统，它从电池中获取高电压，并将其转换为交流电压——因此被称为逆变器——并基本上为电机供电。它控制电机速度和扭矩，直接影响效率和可靠性，这正成为牵引逆变器设计的设计挑战。此图片来源于网络如今的电动汽车至少有一个牵引逆变器。有些型号实际上不止一个。一个在前轴上，一个在后轴上。甚至一些高端车型实际上每个车轮都有一个牵引逆变器。因此，效率和可靠性非常重要。所以，从逆变器和电机控制的市场趋势来看——从技术趋势来看，我们看到了功率水平的提高。