欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

DataCamp学习笔记002 -Numpy Array特性与常用统计方法

程序员文章站 2024-01-30 20:21:16
...

DataCamp学习笔记[Notes- Introduction to Python_2]

1. Python List 和 Numpy Array的常用异同:

  • Python list 允许其中有多个类型, Numpy Array 只允许其中有一个类型,否则会强制转化为numpy.str_。 --Numpy数组中的所有元素的类型都是相同的,而Python列表中的元素类型是任意的,所以在通用性能方面Numpy数组不及Python列表,但在科学计算中,可以省掉很多循环语句,代码使用方面比Python列表简单。
In[1]:array = np.array([1,2,'a'])
 ...:type(array[1])
Out[1]: numpy.str_

In[2]:list= [1,2,'a']
 ...:type(list[1])
Out[2]: int
  • Python list 无法直接运算, Numpy Array 可直接运算。–Numpy Array相加是每个位置对应值相加,Python List相加类似于在列表后应用extend()
In[3]:import numpy as np
  ...:array1 = np.array([[1,2,3],[4,5,6],[7,8,9]])
  ...:array2 = np.array([[7,8,9],[4,5,6],[1,2,3]])
  ...:array1 + array2
Out[3]: 
array([[ 8, 10, 12],
       [ 8, 10, 12],
       [ 8, 10, 12]])

In[4]:list1 = [[1,2,3],[4,5,6],[7,8,9]]
 ...:list2 = [[7,8,9],[4,5,6],[1,2,3]]
 ...:list1 + list2
Out[4]: [[1, 2, 3], [4, 5, 6], [7, 8, 9], [7, 8, 9], [4, 5, 6], [1, 2, 3]]

2. np_2darray 索引通用性:

  • np_2d[0][2] == np_2d[0,2]
In[5]:np_2d = np.array([[1.64,71.78],
 ...:                   [1.37,63.35],
 ...:                   [1.6,55.09],
 ...:                   [2.04,74.85],
 ...:                   [2.04,68.72],
 ...:                   [2.01,73.57]])
Out[5]:assert (np_2d[0,1] == np_2d[0][1])

3. Numpy Array常用统计方法:

  • np.mean()–求Numpy Array 均值
In[6]:np.mean(np_2d[:,0])
Out[6]: 1.7833333333333332
  • np.median()–求Numpy Array 中位数
In[7]:np.median(np_2d[:,0])
Out[7]: 1.8249999999999997
  • np.corrcoef()–求Numpy Array 协方差
In[8]:np.corrcoef(np_2d[:,0],np_2d[:,1])
Out[8]: 
array([[1.        , 0.64924262],
       [0.64924262, 1.        ]])
  • np.std()–求Numpy Array 方差
In[9]:np.std(np_2d[:,0])
Out[9]: 0.2608107018935807