# NumPy

## 导入工具库

Numpy是Python数据科学计算的核心库，提供了高性能的多维数组对象及处理数组的工具。

使用以下语句导入Numpy库：

In [1]:
import numpy as np

### Numpy数组

1维数组

2维数组【axis 1  axis 0】

3维数组【axis 2  axis 1  axis 0】

## 创建数组

### 初始化

In [3]:
a = np.array([1, 2, 3])

In [8]:
b = np.array([(1.5, 2, 3), (4, 5, 6)], dtype=float)

In [4]:
c = np.array([[(1.5, 2, 3), (4, 5, 6)], [(3, 2, 1), (4, 5, 6)]], dtype=float)

### 特殊数组

In [5]:
np.zeros((3, 4))  # 创建值为 0 数组

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [6]:
np.ones((2, 3, 4), dtype=np.int16)  # 创建值为 1 数组

array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]], dtype=int16)

In [7]:
d = np.arange(10, 25, 5)  # 创建均匀间隔的数组（步进值）

In [8]:
np.linspace(0, 2, 9)  # 创建均匀间隔的数组（样本数）

array([0.  , 0.25, 0.5 , 0.75, 1.  , 1.25, 1.5 , 1.75, 2.  ])

In [9]:
e = np.full((2, 2), 7)  # 创建常数数组

In [10]:
f = np.eye(2)  # 创建 2 x 2 单位矩阵

In [11]:
np.random.random((2, 2))  # 创建随机值的数组

array([[0.54217164, 0.25095821],
       [0.40964939, 0.45411324]])

In [12]:
np.empty((3, 2))  # 创建空数组

array([[0., 0.],
       [0., 0.],
       [0., 0.]])

## 输入/输出

### 保存与载入磁盘上的文件

In [13]:
np.save("../_tmp/np_save", a)

In [10]:
np.savez('../_tmp/np_savez.npz', a, b)

In [14]:
np.load('../_tmp/np_save.npy')

array([1, 2, 3])

In [15]:
np.savetxt("../_tmp/np_savetxt.txt", a, delimiter=" ")

### 保存与载入文本文件

In [16]:
np.loadtxt("../_tmp/np_savetxt.txt")

array([1., 2., 3.])

In [17]:
np.genfromtxt("../_tmp/np_savetxt.txt", delimiter=" ")

array([1., 2., 3.])

## 数据类型

**有以下的一些数据类型**

In [19]:
np.int64  # 带符号的 64 位整数

numpy.int64

In [20]:
np.float32  # 标准双精度浮点数

numpy.float32

In [21]:
np.complex128  # 显示为 128 位浮点数的复数

complex

In [22]:
np.bool_  # 布尔值：True 值和 False 值

bool

In [1]:
object  # Python 对象

object

In [None]:
np.bytes_

numpy.bytes_

In [None]:
np.str_

numpy.str_

## 数组信息

**查看数组的基本信息**

In [26]:
a.shape  # 数组形状，几行几列

(3,)

In [27]:
len(a)  # 数组长度

3

In [28]:
b.ndim  # 几维数组

2

In [29]:
e.size  # 数组有多少元素

4

In [30]:
b.dtype  # 数据类型

dtype('float64')

In [31]:
b.dtype.name  # 数据类型的名字

'float64'

In [32]:
b.astype(int)  # 数据类型转换

array([[1, 2, 3],
       [4, 5, 6]])

## 数组计算

### 算数运算

In [33]:
g = a - b  # 减法

In [37]:
g

array([[-0.5,  0. ,  0. ],
       [-3. , -3. , -3. ]])

In [38]:
np.subtract(a, b)  # 减法

array([[-0.5,  0. ,  0. ],
       [-3. , -3. , -3. ]])

In [39]:
b + a  # 加法

array([[2.5, 4. , 6. ],
       [5. , 7. , 9. ]])

In [40]:
np.add(b, a)  # 加法

array([[2.5, 4. , 6. ],
       [5. , 7. , 9. ]])

In [41]:
a / b  # 除法

array([[0.66666667, 1.        , 1.        ],
       [0.25      , 0.4       , 0.5       ]])

In [42]:
np.divide(a, b)  # 除法

array([[0.66666667, 1.        , 1.        ],
       [0.25      , 0.4       , 0.5       ]])

In [43]:
a * b  # 乘法

array([[ 1.5,  4. ,  9. ],
       [ 4. , 10. , 18. ]])

In [44]:
np.multiply(a, b)  # 乘法

array([[ 1.5,  4. ,  9. ],
       [ 4. , 10. , 18. ]])

In [45]:
np.exp(b)  # 幂

array([[  4.48168907,   7.3890561 ,  20.08553692],
       [ 54.59815003, 148.4131591 , 403.42879349]])

In [46]:
np.sqrt(b)  # 平方根

array([[1.22474487, 1.41421356, 1.73205081],
       [2.        , 2.23606798, 2.44948974]])

In [47]:
np.sin(a)  # 正弦

array([0.84147098, 0.90929743, 0.14112001])

In [48]:
np.cos(b)  # 余弦

array([[ 0.0707372 , -0.41614684, -0.9899925 ],
       [-0.65364362,  0.28366219,  0.96017029]])

In [49]:
np.log(a)  # 自然对数

array([0.        , 0.69314718, 1.09861229])

In [50]:
e.dot(f)  # 点积

array([[7., 7.],
       [7., 7.]])

### 比较

In [51]:
a == b  # 对比值

array([[False,  True,  True],
       [False, False, False]])

In [52]:
a < 2  # 对比值

array([ True, False, False])

In [53]:
np.array_equal(a, b)  # 对比数组

False

### 聚合函数

In [54]:
a.sum()  # 数组汇总

6

In [55]:
a.min()  # 数组最小值

1

In [56]:
b.max(axis=0)  # 数组最大值，按行

array([4., 5., 6.])

In [57]:
b.cumsum(axis=1)  # 数组元素的累加值

array([[ 1.5,  3.5,  6.5],
       [ 4. ,  9. , 15. ]])

In [58]:
a.mean()  # 平均数

2.0

In [61]:
np.median(b)  # 中位数

3.5

In [62]:
np.corrcoef(a, b)  # 相关系数

array([[1.        , 0.98198051, 1.        ],
       [0.98198051, 1.        , 0.98198051],
       [1.        , 0.98198051, 1.        ]])

In [63]:
np.std(b)  # 标准差

1.5920810978785667

## 数组复制

**可以通过 copy 复制数组**

In [64]:
h = a.view()  # 使用同一数据创建数组视图

In [65]:
np.copy(a)  # 创建数组的副本

array([1, 2, 3])

In [66]:
h = a.copy()  # 创建数组的深度拷贝

## 数组排序

**通过sort进行数组排序**

In [67]:
a.sort()  # 数组排序

In [68]:
c.sort(axis=0)  # 以轴为依据对数组排序

## 子集、切片、索引

### 子集

In [69]:
a[2]  # 选择索引 2 对应的值

3

In [70]:
b[1, 2]  # 选择行列 index 为 1 和 2 位置对应的值（等同于 b[1][2]）

6.0

### 切片

In [71]:
a[0:2]  # 选择索引为 0 与 1 对应的值

array([1, 2])

In [72]:
b[0:2, 1]  # 选择第 1 列中第 0 行、第 1 行的值

array([2., 5.])

In [73]:
b[:1]  # 选择第 0 行的所有值（等同于 b[0:1, :1]）

array([[1.5, 2. , 3. ]])

In [74]:
c[1, ...]  # 等同于 [1, :, :]

array([[3., 2., 3.],
       [4., 5., 6.]])

In [75]:
a[::-1]  # 反转数组 a

array([3, 2, 1])

In [76]:
a[a < 2]  # 选择数组 a 中所有小于 2 的值

array([1])

In [77]:
b[[1, 0, 1, 0], [0, 1, 2, 0]]  # 选择 (1, 0), (0, 1), (1, 2) 和 (0, 0) 所对应的值

array([4. , 2. , 6. , 1.5])

In [78]:
b[[1, 0, 1, 0]][:, [0, 1, 2, 0]]  # 选择矩阵的行列子集

array([[4. , 5. , 6. , 4. ],
       [1.5, 2. , 3. , 1.5],
       [4. , 5. , 6. , 4. ],
       [1.5, 2. , 3. , 1.5]])

## 数组操作

### 转置数组

In [79]:
i = np.transpose(b)  # 转置数组

In [80]:
i.T  # 转置数组

array([[1.5, 2. , 3. ],
       [4. , 5. , 6. ]])

### 改变数组形状

In [81]:
b.ravel()  # 拉平数组

array([1.5, 2. , 3. , 4. , 5. , 6. ])

In [82]:
g.reshape(3, -2)  # 改变数组形状，但不改变数据

array([[-0.5,  0. ],
       [ 0. , -3. ],
       [-3. , -3. ]])

### 添加或删除值

In [83]:
h.resize((2, 6))  # 返回形状为 (2, 6) 的新数组

In [84]:
np.append(h, g)  # 追加数据

array([ 1. ,  2. ,  3. ,  0. ,  0. ,  0. ,  0. ,  0. ,  0. ,  0. ,  0. ,
        0. , -0.5,  0. ,  0. , -3. , -3. , -3. ])

In [85]:
np.insert(a, 1, 5)  # 插入数据

array([1, 5, 2, 3])

In [86]:
np.delete(a, [1])  # 删除数据

array([1, 3])

### 合并数组

In [87]:
np.concatenate((a, d), axis=0)  # 拼接数组

array([ 1,  2,  3, 10, 15, 20])

In [89]:
np.vstack((a, b))  # 纵向以行的维度堆叠数组

array([[1. , 2. , 3. ],
       [1.5, 2. , 3. ],
       [4. , 5. , 6. ]])

In [90]:
np.r_[e, f]  # 纵向以行的维度堆叠数组

array([[7., 7.],
       [7., 7.],
       [1., 0.],
       [0., 1.]])

In [91]:
np.hstack((e, f))  # 横向以列的维度堆叠数组

array([[7., 7., 1., 0.],
       [7., 7., 0., 1.]])

In [92]:
np.column_stack((a, d))  # 以列的维度创建堆叠数组

array([[ 1, 10],
       [ 2, 15],
       [ 3, 20]])

In [93]:
np.c_[a, d]  # 以列的维度创建堆叠数组

array([[ 1, 10],
       [ 2, 15],
       [ 3, 20]])

### 分割数组

In [94]:
np.hsplit(a, 3)  # 纵向分割数组为 3 等份

[array([1]), array([2]), array([3])]

In [95]:
np.vsplit(c, 2)  # 横向分割数组为 2 等份

[array([[[1.5, 2. , 1. ],
         [4. , 5. , 6. ]]]),
 array([[[3., 2., 3.],
         [4., 5., 6.]]])]

## 调用帮助

**通过info函数调用帮助信息**

In [97]:
np.info(np.ndarray.dtype)

Data-type of the array's elements.

Parameters
----------
None

Returns
-------
d : numpy dtype object

See Also
--------
numpy.dtype

Examples
--------
>>> x
array([[0, 1],
       [2, 3]])
>>> x.dtype
dtype('int32')
>>> type(x.dtype)
<type 'numpy.dtype'>
