个人学习

《恋上数据结构与算法一》笔记(十八)哈夫曼树

2020-03-14  本文已影响0人  路飞_Luck
目录
一 哈夫曼编码(Huffman Coding)

哈夫曼编码,又称为霍夫曼编码,它是现代压缩算法的基础

假设要把字符串【ABBBCCCCCCCCDDDDDDEE】转成二进制编码进行传输

A B C D E
000 001 010 011 100

对应的二进制编码:

000001001001010010010010010010010010011011011011011011100100 

一共20个字母,转成了60个二进制位

如果使用哈夫曼编码,可以压缩至41个二进制位,约为原来长度的68.3%

二 哈夫曼树

先计算出每个字母的出现频率(权值,这里直接用出现次数),【ABBBCCCCCCCCDDDDDDEE】

A B C D E
1 3 8 6 2

利用这些权值,构建一棵哈夫曼树(又称为霍夫曼树、最优二叉树)

如何构建一棵哈夫曼树?(假设有 n 个权值)

  1. 以权值作为根节点构建n棵二叉树,组成森林
  2. 在森林中选出2个根节点最小的树合并,作为一棵新树的左右子树,且新树的根节点为其左右子树根节点之和
  3. 从森林中删除刚才选取的2棵树,并将新树加入森林
  4. 重复2、3步骤,直到森林只剩一棵树为止,该树即为哈夫曼树
三 构建哈夫曼树
go
四 构建哈夫曼编码
image.png

left为0,right为1,可以得出5个字母对应的哈夫曼编码

A B C D E
1110 110 0 10 1111

【ABBBCCCCCCCCDDDDDDEE】的哈夫曼编码是

image.png

总结


本文参考 MJ老师的 恋上数据结构与算法

《恋上数据结构与算法一》笔记


本人技术水平有限,如有错误欢迎指正。
书写整理不易,您的打赏与点赞是对我最大的支持和鼓励。


上一篇 下一篇

猜你喜欢

热点阅读