算法与数据结构系列之[二叉树-上]
上篇从整体上介绍了树的一些基本概念,编程中我们用到的都是具体的树结构,比如二叉树。接下来我们用上、中、下三篇详细介绍二叉树,其中上篇为二叉树的理论部分,中篇为二叉树的C语言代码实现,下篇为二叉树的Java代码实现。
前言
现实中树的种类有很多种,数据结构中树的种类也不是单一的,有二叉树,B树,B+树,红黑树等,二叉树应该说是最常用的一种树形结构,这篇就重点介绍下二叉树。
一、二叉树的定义:
二叉树,顾名思义,就是每个节点最多有两个子树的树,分别是左子树和右子树,要注意这里用到“最多”这个词,就是说二叉树并不要求每个节点必须有两个子节点,有的节点只有左节点,有的节点只有右节点,同样叫做二叉树。
下图中列出几种二叉树:
二、满二叉树和完全二叉树:
上图中有两个特殊的二叉树,分别是第二个和第三个。
其中第二个二叉树,叶子节点全部在最底层,除叶子节点外,每个节点都有左右两个子节点,这种二叉树叫做满二叉树。
上图第三个树,叶子节点在最下两层,最后一层的叶子节点向左连续排列,倒数第二层的叶子节点向右连续排列,这种二叉树叫做完全二叉树。
满二叉树比较好理解,完全二叉树有时容易混淆,下面这幅图列出几种非完全二叉树的情况:
图二
图二中的六棵二叉树都不是完全二叉树,上一排不满足条件一:最后一层叶子节点向左连续排列,下一排不满足条件二:倒数第二层的叶子节点向右连续排列,我们具体分析一下每棵树不满足条件的情况。
树1第三层5这个节点没有左子节点,从而导致最后一层的叶子节点从11到8向左不连续,加上5的左子节点10就连续了。树2第三层5这个节点没有子节点,导致从6的左子节点12到8不连续,缺少了5的左右子节点10和11,加上这两个节点就连续了。树3是第三层的4这个节点没有左子节点,导致从5的右子节点11向左不连续,也就是说最后一层最左边的叶子节点一定要有,否则就不是完全二叉树。
树4第二层的3这个节点没有子节点,导致倒数第二层没有叶子节点,从2的左子节点4向右不连续,最右边的叶子节点一定要有。树5第二层3这个节点只有左子节点6,没有右子节点,也不连续,和树4情况类似。树6第二层3这个节点只有右子节点7,没有左子节点,从而导致从4向右到7不连续。其实,要满足完全二叉树的条件,倒数第二层的节点个数要达到最大,也就是倒数第二层往上的每一层的每一个节点都要有两个子节点。所以完全二叉树的定义还可以是这样:叶子节点都在最底下两层,最后一层的叶子节点都靠左连续排列,并且除了最后一层,其他层的节点个数都要达到最大。
给图二中的每棵非完全二叉树适当加上一些节点,就可以转换为完全二叉树,如下图所示:
三、二叉树的存储方式:
3.1、顺序存储结构
二叉树的顺序存储结构就是用一维数组存储二叉树中的节点,并且数组的下标要能够体现节点之间的逻辑关系,比如父节点与 子节点的关系,左右兄弟节点的关系。虽然二叉树的节点是以数组的方式存储,但要求能够以遍历树的方式遍历存储二叉树节点的数组,也就是可以用前序遍历,中序遍历,后序遍历的方式遍历数组。顺序存储结构只适合于完全二叉树,非完全二叉树并不适合用顺序存储结构,因为非完全二叉树会浪费比较多的存储空间,下面会用图说明这点的。
如下图,顺序结构图示:
图四中前一棵二叉树的根节点存储在数组中下标为0的位置,此时数组中第n个元素的左子节点我2n+1,第n个元素的右节点为2n+2,第n个元素的父节点为(n-1)/2。
为了方便计算子节点,图四中后一棵二叉树的很节点存储在数组下标为1的位置,此时数组中第n个元素的左子节点为2n,第n个元素的右子节点为2n+1,第n个节点的父节点为n/2。
下图说明非完全二叉树顺序存储浪费存储空间的问题
图五
3.2、链式存储结构
顺序存储结构只适用于完全二叉树,大多数的情况还是要用到链式存储结构,可以用双向链表来存储二叉树的节点,这个双向量表包括一个数据域,两个指针域分别指向左子节点和右子节点,这样的链表称为二叉链表。
链式存储结构如下图所示:
图六
二叉链表的节点结构定义代码:
typedef struct BinaryTreeNode{
TElemType data;
struct BinaryTreeNode *left,*right;
}BinaryTreeNode,*BinaryTree;
四、二叉树的创建
要对二叉树进行操作,首先要创建一棵二叉树,接下来才可以对二叉树进行诸如遍历等操作,这里的创建二叉树代码只是创建二叉树的逻辑实现,并不是完善的代码,缺少相应的提示内容,并且不能单独执行,完善的代码将在后面具体的代码文章中列出。二叉树的创建和遍历都要用到递归的方法,对递归不熟练的小伙伴要自己补一下递归算法的相关内容。
void CreateBinaryTree(BinaryTree *T){
TElemTpye val;
scanf("%d",&val);
if(val <= 0){ //val小于等于0都表示空树,这里是为了方便才这么写,其实0和负数是可以作为二叉树的节点的
*T = NULL;
return;
}
*T =(BinaryTree) malloc(sizeof(BinaryTreeNode));
if(!*T)
exit(-1);
(*T)->data = val;
CreateBinaryTree(&(*T)->left);
CreateBinaryTree(&(*T)->right);
}
五、二叉树的遍历
二叉树的遍历是二叉树非常重要的操作,需要用到递归算法,经典的遍历方法有三种,分别是前序遍历、中序遍历、后序遍历。
- 前序遍历:先输出父节点,再遍历左子树和右子树
- 中序遍历:先遍历左子树,再输出父节点,再遍历右子树
- 后序遍历:先遍历左子树,再遍历右子树,最后输出父节点
看输出父节点的顺序,确定是前序,中序还是后序遍历,输出父节点在先就是前序,输出父节点在中就是中序,输出父节点在后就是后序。
下面通过画图的方式详细描述这三种遍历方式:
图七
前序遍历代码:
void PreOrder(BinaryTree node){
if(node == NULL)
return;
printf("%d",node->data);
PreOrder(node->left);
PreOrder(node->right);
}
中序遍历代码:
void InOrder(BinaryTree node){
if(node == NULL)
return;
InOrder(node->left);
printf("%d",node->data);
InOrder(node->right);
}
后序遍历代码:
void PostOrder(BinaryTree node){
if(node == NULL)
return;
PostOrder(node->left);
PostOrder(node->right);
printf("%d",node->data);
}
六、总结
这篇主要介绍了二叉树的定义,两种特殊的二叉树:满二叉树和完全二叉树,通过画图方式重点掌握完全二叉树的定义和辨别。接着介绍了二叉树的两种存储结构:顺序存储结构和链式存储结构,要注意顺序存储结构只适用于完全二叉树。最后介绍了二叉树的创建以及遍历方法,其中二叉树的三种遍历方法尤为重要,要掌握递归的内涵,能够利用递归方法遍历二叉树。其实二叉树还有一些不是特别重要的操作,这里不做赘述,将在后面完整的代码中体现。接下来的两篇将完整的C语言和Java代码贴出来,以供大家参考。