为什么大多数编程语言中的数组都是从0开始计数的，比从1开始计数有什么好处？

程序员文章站 2022-04-23 23:06:21

...

回复内容：

提供两个链接:
1. Why does the indexing start with zero in 'C'? (http://*.com/questions/7320686/why-does-the-indexing-start-with-zero-in-c)
2. Why numbering should start at zero, by Dijkstra. (http://www.cs.utexas.edu/users/EWD/ewd08xx/EWD831.PDF) 不是全部，Pascal类语言就可以不从0开始计数，比如从-100..100 考虑C语言指针
int a[10];
那么 a[0] === *(a+0)
我认为是这么考虑的先说说为什么C语言的数组是从0开始
众所周知，C语言的数组是直接操作内存，那我们肯定得从内存的寻址开始说起：
以“以行为主序”的分配为例：设数组的基址为LOC(a c1 c2)，每个数组元素占据l 个地址单元，那么aij 的物理地址可用一线性寻址函数计算：
LOC(aij)=LOC(a c1 c2)+( (i- c1) *( d2 - c2 + 1)+ (j- c2) )*l
推广到一般的三维数组：A[c1..d1] [c2..d2] [c3..d3]，则aijk 的物理地址为：
LOC(i,j,k)=LOC(a c1 c2 c3)+( (i- c1) *( d2 - c2 + 1)* (d3- c3 + 1)+ (j- c2) *( d3- c3 + 1)+(k- c3))*l
显然，此处的c1 c2 c3 为0 会大大简化计算有木有啊！！越是多维数组效果越明显
这对于计算机寻址计算来说显然好处是大大的啊
这就是为什么最早C语言的数组起始都是0
至于什么其他的原因觉得美啊什么的都是后来人们YY的
事实上，在现在很多时候计算不再是瓶颈的时候，数组的下标也有从1开始的
比如matlab
难道matlab就不美了么= = 从技术实现上讲，数组的下标就是内存的偏移量吧。如p指针指向数组的内存，p+0就是第一个元素的内存地址，p+n ×sizeOfElement就是第n个元素的内存地址学C语言的时候这么理解过：
数组名a就是数组第一个元素的内存地址
而取数组元素，就是通过a地址访问内存的过程
取第1个元素，就是*(a+0)
取第2个元素，就是*(a+1)，
...
所以下标从0开始不见得吧，ObjectPascal中数组可以从1开始，这个“从零开始”的问题，我个人认为这是个人为的历史遗留问题，就像现在的计算机键盘的字母分布，没有什么特殊理论依据很多语言数组不是从0开始的（比如 MATLAB），但是一位计算机科学先驱 Edsger Dijkstra（发明 Dijkstra 最短路算法的那位）在 1982年写过文章，推崇从0开始做下标，叫 “为啥得从0开始数数”。

全文在这里：Why numbering should start at zero (EWD 831)

总结一下：

描述自然数子序列，上界和下届的差应该是子序列的长度，数组下标可以理解为一个特殊的这种子序列。
下界应该包含数据内的元素，上届应该不包含。换句话来说，下界应该是数组第一个索引。否则可能对于某些子序列，我们得用非自然数的实数作为下界。
如果考虑条件(1) 和条件(2)，描述上界和下界有两个办法：1

翻译自 Quora Travis Addair's answer to Why do array indices start with 0 (zero) in many programming languages?
不过翻译完了感觉有些不大对劲。描述区间（根据最大值和最小值判定的实数集合）和描述程序语言中数组元素是两码事吧。。。还是从C语言的实现上解释比较靠谱。在硬件上计数什么的都是从所有位全部为低电平（正逻辑）开始的，也就是无符号整型里边的0。 0 0是+运算的幺元,1是*运算的幺元.
*比+用的多,所以用0.

上一篇： DedeHttpDown PHP远程下载网页的类，增强版 2013

下一篇：详解Linux的一些命令