定义
数据结构(data structure)是带有结构特性的数据元素的组合。它研究的是数据的逻辑结构和数据的物理结构以及它们之间的相互关系,并对这种结构定义相适应的运算,设计出相应的算法,并确保经过这些运算以后所得到的新结构仍保持原来的数据类型。
简而言之,数据结构是相互之间存在一种或多种特定关系的数据元素的集合,即带结构的数据元素的集合。结构就是指数据元素之间存在的关系,分为逻辑结构和存储结构。
数据的逻辑结构和物理结构是数据结构的两个密切关系的方面,同一逻辑结构可以对应不同的存储结构。算法的设计取决于数据的逻辑结构,而算法的实现依赖于指定的存储结构。
逻辑结构
逻辑结构指反应数据元素之间的逻辑关系的数据结构,其中的逻辑关系是指数据元素之前的前后间关系,而与它们在计算机中的存储位置无关。
逻辑结构包括:
- 集合:数据结构中的元素之间除了“同属于一个集合”的相互关系外,别无其它关系。
- 线性结构:数据结构中的元素存在一对一的相互关系。
- 树形结构:数据结构中的元素存在一对多的相互关系。
- 图形结构:数据结构中的元素存在多对多的相互关系。
物理结构
物理结构指数据在计算机存储空间的存放形式。
数据的物理结构是数据结构在计算机中的表示(又称映像),它包括数据元素的机内表示和关系的机内表示。由于具体实现的方法有:顺序、链接、索引、散列等多种。所以,一种数据结构可表示成一种或多种存储结构。
数据元素的机内表示:用二进制位(bit)的位串表示数据元素。通常称这种位串为结点(node)。当数据元素有若个数据项组成时,位串中与各个数据项对应的字位串称为数据域。因此,结点是数据元素的机内表示。
关系的机内表示:数据元素之间的关系的机内表示可以分为顺序映像和非顺序映像。常用两种存储结构:顺序存储结构和链式存储结构。顺序映像借助元素在存储器中的相对位置表示数据元素之前的逻辑关系。非顺序映像借助指示元素存储位置的指针来表示数据元素之间的逻辑关系。
分类
数据结构有很多种,一般来说,按照数据的逻辑结构对其简单的分类,包括线性结构和非线性结构。
线性结构
简而言之,线性结构就是表中各个结点具有线性关系。从数据结构的语言来描述,线性结构包括:
- 线性结构是非空集。
- 线性结构有且仅有一个开始结点和一个终端结点。
- 线性结构所有结点都最多只有一个直接前驱结点和一个直接后继结点。
常见的线性结构:线性表、栈、队列、串等。
非线性结构
简而言之,非线性结构就是表中各个结点之间具有多个对应关系。从数据结构的语言来描述,非线性结构应该包括:
- 非线性结构是非空集。
- 非线性结构的一个结点可能有多个直接前驱结点和多个直接后继结点。
常见的非线性结构:二维数组、多维数组、广义表、树、图等。
常用的数据结构和运算
数据结构研究的内容:如何按一定的逻辑结构,把数据组织起来,并选择适当的存储表示方法把逻辑结构组织好的数据存储到计算机的存储器里。算法研究的内容:更有效的处理数据,提高数据运算效率。数据的运算是定义在数据的逻辑结构上,但运算的具体实现要在存储结构上进行。
程序设计中常用的数据结构包括:数组(Array)、栈(Stack)、队列(Queue)、链表(Linked List)、树(Tree)、图 (Graph)、堆(Heap)、散列表(Hash)等。
程序设计中常用的运算包括:检索、插入、删除、更新、排序等。