数据结构与算法-引言

2020-10-14  本文已影响0人  leo5592368

算法篇开始,将陆续介绍一些计算机中常用的数据结构和算法。在此之前先对一些基本概念进行梳理。

计算机是一门研究用计算机进行信息表示和处理的科学。这里面涉及到两个问题:

而信息的表示和组成又直接关系到处理信息的程序的效率。随着计算机的普及,信息量的增加,信息范围的拓宽,使许多系统程序和应用程序的规模很大,结构又相当复杂。因此,为了编写出一个“好”的程序,必须分析待处理的对象的特征及各对象之间存在的关系,这就是数据结构这门课所要研究的问题。

一、什么是数据结构

众所周知,计算机的程序是对信息进行加工处理。在大多数情况下,这些信息并不是没有组织,信息(数据)之间往往具有重要的结构关系,这就是数据结构的内容。那么,什么是数据结构呢?先看以下个例子。


例1、电话号码查询系统

设有一个电话号码薄,它记录了N个人的名字和其相应的电话号码,假定按如下形式安排:
(a1,b1)(a2,b2)…(an,bn)
其中ai,bi(i=1,2…n) 分别表示某人的名字和对应的电话号码。要求设计一个算法,当给定任何一个人的名字时,该算法能够打印出此人的电话号码,如果该电话簿中根本就没有这个人,则该算法也能够报告没有这个人的标志。

算法的设计,依赖于计算机如何存储人的名字和对应的电话号码,或者说依赖于名字和其电话号码的结构。

数据的结构,直接影响算法的选择和效率。

上述的问题是一种数据结构问题。可将名字和对应的电话号码设计成:二维数组、表结构、向量。

假定名字和其电话号码逻辑上已安排成N元向量的形式,它的每个元素是一个数对(ai,bi), 1≤i≤n

数据结构还要提供每种结构类型所定义的各种运算的算法。

通过上例可以直接地认为:数据结构就是研究数据的逻辑结构和物理结构以及它们
之间相互关系,并对这种结构定义相应的运算,
而且确保经过这些运算后所得到的新结构仍然
是原来的结构类型。

二、基本概念和术语

数据(Data):是对信息的一种符号表示。在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。

数据元素(Data Element):是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。
一个数据元素可由若干个数据项组成。数据项是数据的不可分割的最小单位。

数据对象(Data Object):是性质相同的数据元素的集合。是数据的一个子集。

数据结构(Data Structure):是相互之间存在一种或多种特定关系的数据元素的集合。

数据结构主要指逻辑结构和物理结构数据之间的相互关系称为逻辑结构。通常分为四类基本结构:

  1. 集合: 结构中的数据元素除了同属于一种类型外,别无其它关系。
  2. 线性结构 : 结构中的数据元素之间存在一对一的关系。
  3. 树型结构 : 结构中的数据元素之间存在一对多的关系。
  4. 图状结构或网状结构 : 结构中的数据元素之间存在多对多的关系。

数据结构的形式定义为:数据结构是一个二元组:

Data-Structure=(D,S)

其中:D是数据元素的有限集,S是D上关系的有限集。
例 复数的数据结构定义如下:

Complex=(C,R)

其中:C是含两个实数的集合﹛C1,C2﹜,分别表示复数的实部和虚部。R={P},P是定义在集合上的一种关系{〈C1,C2〉}。
数据结构在计算机中的表示称为数据的物理结构,又称为存储结构。

数据对象可以是有限的,也可以是无限的。
数据结构不同于数据类型,也不同于数据对象,它不仅要描述数据类型的数据对象,而且要描述数据对象各元素之间的相互关系。

抽象数据类型:一个数学模型以及定义在该模型上的一组操作。抽象数据类型实际上就是对该数据结构的定义。因为它定义了一个数据的逻辑结构以及在此结构上的一组算法。
  用三元组描述如下:

(D,S,P)

数据结构在计算机中有两种不同的表示方法:顺序表示和非顺序表示
由此得出两种不同的存储结构:顺序存储结构和链式存储结构。顺序存储结构:用数据元素在存储器中的相对位置来表示数据元素之间的逻辑关系。
链式存储结构:在每一个数据元素中增加一个存放地址的指针,用此指针来表示数据元素之间的逻辑关系。

三、抽象数据类型的表示和实现

数据类型:在一种程序设计语言中,变量所具有的数据种类。


例:在python中的数据类型

数据类型:基本类型和构造类型

基本类型:整型、浮点型、字符型、列表、元组、字典、集合

构造类型:类、自定义


数据对象:某种数据类型元素的集合。


例、
整数的数据对象是{…-3,-2,-1,0,1,2,3,…}

英文字符类型的数据对象是{A,B,C,D,E,...}


四、算法和算法分析

算法:是对特定问题求解步骤的一种描述,算法是指令的有限序列,其中每一条指令表示一个或多个操作。

1.算法具有以下五个特性:

2.算法设计的要求

评价一个好的算法有以下几个标准:

3. 算法效率的度量

对一个算法要作出全面的分析可分成两个阶段进行,即事先分析和事后测试。
事先分析 : 求出该算法的一个时间界限函数
事后测试 : 收集此算法的执行时间和实际占用空间的统计资料。

定义:如果存在两个正常数c和n0,对于所有的n≧n0,有︱f(n) ︳≦c|g(n) ︳

则记作

f(n)=O(g(n))

一般情况下,算法中基本操作重复执行的次数是问题规模n的某个函数,算法的时间量度记作

T(n)=O(f(n))

称作算法的渐近时间复杂度。

频度:是指该语句重复执行的次数

一个算法时间为O(1)的算法,它的基本运算执行的次数是固定的。因此,总的时间由一个常数(即零次多项式)来限界。而一个时间为O(n^2)的算法则由一个二次多项式来限界。

以下六种计算算法时间的多项式是最常用的。其关系为:

O(1)<O(logn)<O(n)<O(nlogn)<O(n^2)<O(n^3)
指数时间的关系为:O(2^n)<O(n!)<O(n^n)

当n取得很大时,指数时间算法和多项式时间算法在所需时间上非常悬殊。因此,只要有人能将现有指数时间算法中的任何一个算法化简为多项式时间算法,那就取得了一个伟大的成就。

上一篇 下一篇

猜你喜欢

热点阅读