《算法图解》

2018-12-03 本文已影响3人还是太菜

1. 算法简介

❑ 二分查找的速度比简单查找快得多。

❑ O(log n)比O(n)快。需要搜索的元素越多，前者比后者就快得越多。

❑ 算法运行时间并不以秒为单位。

❑ 算法运行时间是从其增速的角度度量的。

❑ 算法运行时间用大O表示法表示。

2. 选择排序

❑ 计算机内存犹如一大堆抽屉。

❑ 需要存储多个元素时，可使用数组或链表。

❑ 数组的元素都在一起。

❑ 链表的元素是分开的，其中每个元素都存储了下一个元素的地址。

❑ 数组的读取速度很快。

❑ 链表的插入和删除速度很快。

❑ 在同一个数组中，所有元素的类型都必须相同（都为int、double等）。

3. 递归

❑ 递归指的是调用自己的函数。

❑ 每个递归函数都有两个条件：基线条件和递归条件。

❑ 栈有两种操作：压入和弹出。

❑ 所有函数调用都进入调用栈。

❑ 调用栈可能很长，这将占用大量的内存。

4. 快速排序

❑ D&C将问题逐步分解。使用D&C处理列表时，基线条件很可能是空数组或只包含一个元素的数组。

❑ 实现快速排序时，请随机地选择用作基准值的元素。快速排序的平均运行时间为O(n log n)。

❑ 大O表示法中的常量有时候事关重大，这就是快速排序比合并排序快的原因所在。

❑ 比较简单查找和二分查找时，常量几乎无关紧要，因为列表很长时，O(log n)的速度比O(n)快得多。

5. 散列表

❑ 你可以结合散列函数和数组来创建散列表。

❑ 冲突很糟糕，你应使用可以最大限度减少冲突的散列函数。

❑ 散列表的查找、插入和删除速度都非常快。

❑ 散列表适合用于模拟映射关系。

❑ 一旦填装因子超过0.7，就该调整散列表的长度。

❑ 散列表可用于缓存数据（例如，在Web服务器上）。

❑ 散列表非常适合用于防止重复

6. 广度优先搜索

❑ 广度优先搜索指出是否有从A到B的路径。

❑ 如果有，广度优先搜索将找出最短路径。

❑ 面临类似于寻找最短路径的问题时，可尝试使用图来建立模型，再使用广度优先搜索来解决问题。

❑ 有向图中的边为箭头，箭头的方向指定了关系的方向，例如，rama→adit表示rama欠adit钱。

❑ 无向图中的边不带箭头，其中的关系是双向的，例如，ross - rachel表示“ross与rachel约会，而rachel也与ross约会”。

❑ 队列是先进先出（FIFO）的。

❑ 栈是后进先出（LIFO）的。

❑ 你需要按加入顺序检查搜索列表中的人，否则找到的就不是最短路径，因此搜索列表必须是队列。

❑ 对于检查过的人，务必不要再去检查，否则可能导致无限循环。

7. 狄克斯特拉算法

❑ 广度优先搜索用于在非加权图中查找最短路径。

❑ 狄克斯特拉算法用于在加权图中查找最短路径。

❑ 仅当权重为正时狄克斯特拉算法才管用。

❑ 如果图中包含负权边，请使用贝尔曼-福德算法。

8. 贪婪算法

❑ 贪婪算法寻找局部最优解，企图以这种方式获得全局最优解。

❑ 对于NP完全问题，还没有找到快速解决方案。

❑ 面临NP完全问题时，最佳的做法是使用近似算法。

❑ 贪婪算法易于实现、运行速度快，是不错的近似算法。

9. 动态规划

❑ 需要在给定约束条件下优化某种指标时，动态规划很有用。

❑ 问题可分解为离散子问题时，可使用动态规划来解决。

❑ 每种动态规划解决方案都涉及网格。

❑ 单元格中的值通常就是你要优化的值。

❑ 每个单元格都是一个子问题，因此你需要考虑如何将问题分解为子问题。

❑ 没有放之四海皆准的计算动态规划解决方案的公式。

10. K最近邻算法

❑ KNN用于分类和回归，需要考虑最近的邻居。

❑ 分类就是编组。

❑ 回归就是预测结果（如数字）。

❑ 特征抽取意味着将物品（如水果或用户）转换为一系列可比较的数字。

❑ 能否挑选合适的特征事关KNN算法的成败。