算法精进之路(二)〖数组〗

449

数组看起来简单基础,但是很多人没有理解这个数据结构的精髓。带着为什么数组要从0开始编号,而不是从1开始的问题,进入主题。

数组如何实现随机访问 数组是一种线性数据结构,用连续的存储空间存储相同类型数据

  • 线性表:数组、链表、队列、栈

image.png

  • 非线性表:树 图

image.png

  • 连续的内存空间、相同的数据,所以数组可以随机访问,但对数组进行删除插入,为了保证数组的连续性,就要做大量的数据搬移工作

    • 数组如何实现下标随机访问。引入数组再内存种的分配图,得出寻址公式

    • 纠正数组和链表的错误认识。数组的查找操作时间复杂度并不是O(1)。即便是排好的数组,用二分查找,时间复杂度也是O(logn)。

  • 正确表述:数组支持随机访问,根据下标随机访问的时间复杂度为O(1)

低效的插入和删除

  • 插入:从最好O(1) 最坏O(n) 平均O(n)

  • 插入:数组若无序,插入新的元素时,可以将第K个位置元素移动到数组末尾,把心的元素,插入到第k个位置,此处复杂度为O(1)。作者举例说明

  • 删除:从最好O(1) 最坏O(n) 平均O(n)

  • 多次删除集中在一起,提高删除效率
    记录下已经被删除的数据,每次的删除操作并不是搬移数据,只是记录数据已经被删除,当数组没有更多的存储空间时,再触发一次真正的删除操作。即JVM标记清除垃圾回收算法。

警惕数组的访问越界问题

用C语言循环越界访问的例子说明访问越界的bug。此例在《C陷阱与缺陷》出现过,很惭愧,看过但是现在也只有一丢丢印象。翻了下书,替作者加上一句话:如果用来编译这段程序的编译器按照内存地址递减的方式给变量分配内存,那么内存中的i将会被置为0,则为死循环永远出不去。

容器能否完全替代数组

相比于数字,java中的ArrayList封装了数组的很多操作,并支持动态扩容。一旦超过村塾容量,扩容时比较耗内存,因为涉及到内存申请和数据搬移。

数组适合的场景:

  • Java ArrayList 的使用涉及装箱拆箱,有一定的性能损耗,如果特别管柱性能,可以考虑数组

  • 若数据大小事先已知,并且涉及的数据操作非常简单,可以使用数组

  • 表示多维数组时,数组往往更加直观。

  • 业务开发容器即可,底层开发,如网络框架,性能优化。选择数组。

解答开篇问题

  • 从偏移角度理解a[0] 0为偏移量,如果从1计数,会多出K-1。增加cpu负担。为什么循环要写成for(int i = 0;i<3;i++) 而不是for(int i = 0 ;i<=2;i++)。第一个直接就可以算出3-0 = 3 有三个数据,而后者 2-0+1个数据,多出1个加法运算,很恼火。

  • 也有一定的历史原因

理解

数组是最基础、最简单的数据结构了。数组用一块连续的内存空间,来存储相同类型的一组数据,最大的特点就是支持随机访问,但插入、删除操作也因此变得比较低效,平均情况时间复杂度为 O(n)。在平时的业务开发中,我们可以直接使用编程语言提供的容器类,但是,如果是特别底层的开发,直接使用数组可能会更合适。