哈夫曼树(Huffman Code)

2019-05-27  本文已影响0人  None_Ling

定义

给定n个权值作为n个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,则称之为最优二叉树,也就是哈夫曼树。

特点

使用场景

主要用于文件的不等长编码的无损压缩,如视频、文件等

构建Haffuman树

假如,有一个文件中有一串文本:hello,huffman,接着需要对该文件进行压缩。

在压缩前,文本使用ASCII进行编码,每一个字符都占用1个字节,8bit,那么写入文件后会占用13个字节,共占用104bit。

如果使用Huffuman编码进行压缩的话,会需要这几个步骤:

  1. 统计字符出现的次数,统计权重
字符 h f l e o , u m a n
次数 2 2 2 1 1 1 1 1 1 1
  1. 根据权重构建Huffman树
字符 A H L M
编码 0000 11 011 0011

由于所有的字符都在Huffman树的叶子节点上,所以编码与解码不会有冲突。

通过这棵编码树,就可以对文件进行编解码,来压缩与解压文件了。

上一篇 下一篇

猜你喜欢

热点阅读