欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

算法网课笔记(二)——数组

程序员文章站 2022-05-12 13:52:00
...

为什么数组标号都从0开始

数组(Array)是一种线性表数据结构,用一组连续的内存空间,存储一组具有相同类型的数据。
因为“下标”的本质是“偏移(offset)”,即a[0]是偏移=0的地址,即首地址;a[k]是偏移=k的地址,地址计算公式如下
a[k]_address = base_address + k * type_size
如果下标从1开始,则计算公式需要变成
a[k]_address = base_address + (k-1)*type_size
CPU每次都需要多做一次减法指令,为了效率优化,所以选择则从0开始编号

线性表(Linear List)

数组、队列、链表、栈,等。
算法网课笔记(二)——数组

非线性表

二叉树、堆、图等
算法网课笔记(二)——数组

连续内存空间

此特性让数组有了随机访问的能力,但是也让数组的插入、删除等操作变得低效,因为要维护其连续性,需要做大量的数据搬移工作

PS:数组和链表的区别
数组支持随机访问,根据下标随机访问的时间复杂为O(1),适合用来查找
链表不支持随机访问,适合插入和删除,时间复杂度为O(1)

低效的插入

按照以上思想,数组插入数据,需要将后边的数据整体向后移动,空出插入位置,那么其平均 时间复杂就是(1+2+3…+n)/n=O(n)
但是,如果数组只被当做存储数据的集合,即不要求数组中数据有任何规律,那么可以用一个简单的办法实现插入:
直接将第k位的数据搬移到数组元素的最后,把新的元素直接放入第k个位置即可。
利用这种方法,在某些场景下,可以将复杂度降为O(1)
算法网课笔记(二)——数组

低效的删除

原本的思想和插入类似,不写
在某些场景下,不一定非要追求数组中数据连续性,所以我们将多次删除操作集中执行,可以提高删除效率,即,只有数组内存不足时,才执行一次集中删除的操作,以此减少删除操作导致的大量数据搬移工作。
PS:这就是JVM的标记清除垃圾回收算法的核心

数组越界问题

下列代码会无限打印输出,因为 i <=3 的“=”会导致数组越界。
因为,C语言中,除了受限内存,其他内存都可以*访问,所以访问a[3]这个不存在的数组元素时,其会访问到某块内存地址上,而这个地址正好是存储变量 i 的地址(为什么??),导致a[3]=0,实际上是i=0,从而导致无限循环。
C语言中访问数组,本质就是访问连续内存,只要通过偏移计算的到的内存地址是可用的,则程序就可能不会报错。

int main(int argc, char* argv[]){
    int i = 0;
    int arr[3] = {0};  //声明arr数组包含3个元素,且初始全部=0
    for(; i<=3; i++){
        arr[i] = 0;
        printf("hello world\n");
    }
    return 0;
}

容器能否代替数组

各有优点,简单场景下数组就够用

PS:函数调动栈帧结构细节(操作系统or体系结构知识点)

相关标签: 算法练习