python 二叉查找树

2019-09-22  本文已影响0人  落羽归尘

二叉查找树

二叉查找树又叫作二叉搜索树,具备以下特点:

每个节点包含key和value,key用于比较二叉查找树,用于二叉查找树的特性,比如一个节点的key大于他左子树的key,小于他右子树的key;value是节点真正的值。
二叉查找树的中序遍历就是一个有序的序列。

python实现二叉查找树

首先给出整体代码,后面一步步讲解这个代码:

class BSTNode(object):
    def __init__(self, key, value, left=None, right=None):
        self.key, self.value, self.left, self.right = key, value, left, right


class BST(object):
    def __init__(self, root=None):
        self.root = root

    @classmethod
    def build_from(cls, node_list):
        cls.size = 0
        key_to_node_dict = {}
        for node_dict in node_list:
            key = node_dict['key']
            key_to_node_dict[key] = BSTNode(key, value=key)   # 这里值暂时用 和 key一样的

        for node_dict in node_list:
            key = node_dict['key']
            node = key_to_node_dict[key]
            if node_dict['is_root']:
                root = node
            node.left = key_to_node_dict.get(node_dict['left'])
            node.right = key_to_node_dict.get(node_dict['right'])
            cls.size += 1
        return cls(root)

    def _bst_search(self, subtree, key):
        if subtree is None:   # 没找到
            return None
        elif key < subtree.key:
            return self._bst_search(subtree.left, key)
        elif key > subtree.key:
            return self._bst_search(subtree.right, key)
        else:
            return subtree

    def __contains__(self, key):
        """实现 in 操作符"""
        return self._bst_search(self.root, key) is not None

    def get(self, key, default=None):
        node = self._bst_search(self.root, key)
        if node is None:
            return default
        else:
            return node.value

    def _bst_min_node(self, subtree):
        if subtree is None:
            return None
        elif subtree.left is None:   # 找到左子树的头
            return subtree
        else:
            return self._bst_min_node(subtree.left)

    def bst_min(self):
        node = self._bst_min_node(self.root)
        return node.value if node else None

    def _bst_insert(self, subtree, key, value):
        """ 插入并且返回根节点
        :param subtree:
        :param key:
        :param value:
        """
        if subtree is None:   # 插入的节点一定是根节点,包括 root 为空的情况
            subtree = BSTNode(key, value)
        elif key < subtree.key:
            subtree.left = self._bst_insert(subtree.left, key, value)
        elif key > subtree.key:
            subtree.right = self._bst_insert(subtree.right, key, value)
        return subtree

    def add(self, key, value):
        node = self._bst_search(self.root, key)
        if node is not None:   # 更新已经存在的 key
            node.value = value
            return False
        else:
            self.root = self._bst_insert(self.root, key, value)
            self.size += 1
            return True

    def _bst_remove(self, subtree, key):
        """删除节点并返回根节点"""
        if subtree is None:
            return None
        elif key < subtree.key:
            subtree.left = self._bst_remove(subtree.left, key)
            return subtree
        elif key > subtree.key:
            subtree.right = self._bst_remove(subtree.right, key)
            return subtree
        else:  # 找到了需要删除的节点
            if subtree.left is None and subtree.right is None:    # 叶节点,返回 None 把其父亲指向它的指针置为 None
                return None
            elif subtree.left is None or subtree.right is None:  # 只有一个孩子
                if subtree.left is not None:
                    return subtree.left   # 返回它的孩子并让它的父亲指过去
                else:
                    return subtree.right
            else:  # 俩孩子,寻找后继节点替换,并删除其右子树的后继节点,同时更新其右子树
                successor_node = self._bst_min_node(subtree.right)
                subtree.key, subtree.value = successor_node.key, successor_node.value
                subtree.right = self._bst_remove(subtree.right, successor_node.key)
                return subtree

    def remove(self, key):
        assert key in self
        self.size -= 1
        return self._bst_remove(self.root, key)


NODE_LIST = [
    {'key': 60, 'left': 12, 'right': 90, 'is_root': True},
    {'key': 12, 'left': 4, 'right': 41, 'is_root': False},
    {'key': 4, 'left': 1, 'right': None, 'is_root': False},
    {'key': 1, 'left': None, 'right': None, 'is_root': False},
    {'key': 41, 'left': 29, 'right': None, 'is_root': False},
    {'key': 29, 'left': 23, 'right': 37, 'is_root': False},
    {'key': 23, 'left': None, 'right': None, 'is_root': False},
    {'key': 37, 'left': None, 'right': None, 'is_root': False},
    {'key': 90, 'left': 71, 'right': 100, 'is_root': False},
    {'key': 71, 'left': None, 'right': 84, 'is_root': False},
    {'key': 100, 'left': None, 'right': None, 'is_root': False},
    {'key': 84, 'left': None, 'right': None, 'is_root': False},
]


def test_bst_tree():
    bst = BST.build_from(NODE_LIST)
    for node_dict in NODE_LIST:
        key = node_dict['key']
        assert bst.get(key) == key
    assert bst.size == len(NODE_LIST)
    assert bst.get(-1) is None    # 单例的 None 我们用 is 来比较

    assert bst.bst_min() == 1

    bst.add(0, 0)
    assert bst.bst_min() == 0

    bst.remove(12)
    assert bst.get(12) is None

    bst.remove(1)
    assert bst.get(1) is None

    bst.remove(29)
    assert bst.get(29) is None
在一个BST中查找节点逻辑:

如上get方法,从根节点开始,递归查找,比较还是依据左>根>右

往一个BST中插入节点逻辑:

如上add方法,先进行查找node = self._bst_search(self.root, key),如果节点存在,就更新,否则才执行插入逻辑,执行插入逻辑时,通过比较大小,递归的找到插入位置,其实新节点总是被作为叶子结点插入

在一个BST中删除节点:

如上remove方法,删除节点比较麻烦,因为首先要查找到这个节点,之后删除后,在剩余的节点中还要维持二叉查找树的特性。
删除节点时,分下面三种情况:

删除节点是叶子节点

直接删除就好了,把父节点指向None

删除节点有一个孩子

直接删除此节点后,将这个节点的父节点指向这个节点的孩子节点即可

删除节点有两个孩子

二叉查找树有一个特点,他的中序遍历是一个有序序列,如:


中序遍历序列:[1 4 12 23 29 37 41 60 71 84 90 100]
这里有一个概念,对于节点12来说,逻辑前任(predecessor)和后继(successor),节点12的逻辑前任和后继是423,那么想要删除节点12,在中序遍历序列中移除12后,还能保存BST特性,可以用后继节点去替换这个节点,也就是将节点23放到原节点12的位置。想要找到节点12的后继节点23,实际也就是节点12的右子树的最小值
时间复杂度

最坏情况下,上面查找,添加,删除的时间复杂度都是O(n)

参考

https://github.com/darkfour/python_data_structures_and_algorithms/blob/master/docs/17_%E4%BA%8C%E5%8F%89%E6%9F%A5%E6%89%BE%E6%A0%91/bst.py

上一篇下一篇

猜你喜欢

热点阅读