NumPy - 数组操作

NumPy - 数组操作

NumPy包中有几个例程用于处理ndarray对象中的元素。它们可以分为以下类型：

修改形状

序号	形状及描述
1.	`reshape` 不改变数据的条件下修改形状
2.	`flat` 数组上的一维迭代器
3.	`flatten` 返回折叠为一维的数组副本
4.	`ravel` 返回连续的展开数组

`numpy.reshape`

这个函数在不改变数据的条件下修改形状，它接受如下参数：

numpy.reshape(arr, newshape, order='C')

其中：

arr：要修改形状的数组
newshape：整数或者整数数组，新的形状应当兼容原有形状
order：'C'为 C 风格顺序，'F'为 F 风格顺序，'A'为保留原顺序。

例子

import numpy as np
a = np.arange(8)
print '原始数组：'
print a
print '\n'
b = a.reshape(4,2)
print '修改后的数组：'
print b

输出如下：

原始数组：
[0 1 2 3 4 5 6 7]
修改后的数组：
[[0 1]
 [2 3]
 [4 5]
 [6 7]]

`numpy.ndarray.flat`

该函数返回数组上的一维迭代器，行为类似 Python 内建的迭代器。

例子

import numpy as np
a = np.arange(8).reshape(2,4)
print '原始数组：'
print a
print '\n'
print '调用 flat 函数之后：'
# 返回展开数组中的下标的对应元素
print a.flat[5]

输出如下：

原始数组：
[[0 1 2 3]
 [4 5 6 7]]
调用 flat 函数之后：
5

`numpy.ndarray.flatten`

该函数返回折叠为一维的数组副本，函数接受下列参数：

ndarray.flatten(order='C')

其中：

order：'C' — 按行，'F' — 按列，'A' — 原顺序，'k' — 元素在内存中的出现顺序。

例子

import numpy as np
a = np.arange(8).reshape(2,4)
print '原数组：'
print a
print '\n'  
# default is column-major
print '展开的数组：'
print a.flatten()
print '\n'  
print '以 F 风格顺序展开的数组：'
print a.flatten(order = 'F')

输出如下：

原数组：
[[0 1 2 3]
 [4 5 6 7]]
展开的数组：
[0 1 2 3 4 5 6 7]
以 F 风格顺序展开的数组：
[0 4 1 5 2 6 3 7]

`numpy.ravel`

这个函数返回展开的一维数组，并且按需生成副本。返回的数组和输入数组拥有相同数据类型。这个函数接受两个参数。

numpy.ravel(a, order='C')

构造器接受下列参数：

order：'C' — 按行，'F' — 按列，'A' — 原顺序，'k' — 元素在内存中的出现顺序。

例子

import numpy as np
a = np.arange(8).reshape(2,4)
print '原数组：'
print a
print '\n'  
print '调用 ravel 函数之后：'
print a.ravel()  
print '\n'
print '以 F 风格顺序调用 ravel 函数之后：'
print a.ravel(order = 'F')

原数组：
[[0 1 2 3]
 [4 5 6 7]]
调用 ravel 函数之后：
[0 1 2 3 4 5 6 7]
以 F 风格顺序调用 ravel 函数之后：
[0 4 1 5 2 6 3 7]

翻转操作

序号	操作及描述
1.	`transpose` 翻转数组的维度
2.	`ndarray.T` 和`self.transpose()`相同
3.	`rollaxis` 向后滚动指定的轴
4.	`swapaxes` 互换数组的两个轴

`numpy.transpose`

这个函数翻转给定数组的维度。如果可能的话它会返回一个视图。函数接受下列参数：

numpy.transpose(arr, axes)

其中：

arr：要转置的数组
axes：整数的列表，对应维度，通常所有维度都会翻转。

例子

import numpy as np
a = np.arange(12).reshape(3,4)
print '原数组：'
print a  
print '\n'
print '转置数组：'
print np.transpose(a)

输出如下：

原数组：
[[ 0 1 2 3]
 [ 4 5 6 7]
 [ 8 9 10 11]]
转置数组：
[[ 0 4 8]
 [ 1 5 9]
 [ 2 6 10]
 [ 3 7 11]]

`numpy.ndarray.T`

该函数属于ndarray类，行为类似于numpy.transpose。

例子

import numpy as np
a = np.arange(12).reshape(3,4)
print '原数组：'
print a
print '\n'  
print '转置数组：'
print a.T

输出如下：

原数组：
[[ 0 1 2 3]
 [ 4 5 6 7]
 [ 8 9 10 11]]
转置数组：
[[ 0 4 8]
 [ 1 5 9]
 [ 2 6 10]
 [ 3 7 11]]

`numpy.rollaxis`

该函数向后滚动特定的轴，直到一个特定位置。这个函数接受三个参数：

numpy.rollaxis(arr, axis, start)

其中：

arr：输入数组
axis：要向后滚动的轴，其它轴的相对位置不会改变
start：默认为零，表示完整的滚动。会滚动到特定位置。

例子

# 创建了三维的 ndarray
import numpy as np
a = np.arange(8).reshape(2,2,2)
print '原数组：'
print a
print '\n'
# 将轴 2 滚动到轴 0（宽度到深度）
print '调用 rollaxis 函数：'
print np.rollaxis(a,2)  
# 将轴 0 滚动到轴 1：（宽度到高度）
print '\n'
print '调用 rollaxis 函数：'
print np.rollaxis(a,2,1)

输出如下：

原数组：
[[[0 1]
 [2 3]]
 [[4 5]
 [6 7]]]
调用 rollaxis 函数：
[[[0 2]
 [4 6]]
 [[1 3]
 [5 7]]]
调用 rollaxis 函数：
[[[0 2]
 [1 3]]
 [[4 6]
 [5 7]]]

`numpy.swapaxes`

该函数交换数组的两个轴。对于 1.10 之前的 NumPy 版本，会返回交换后数组的视图。这个函数接受下列参数：

numpy.swapaxes(arr, axis1, axis2)

arr：要交换其轴的输入数组
axis1：对应第一个轴的整数
axis2：对应第二个轴的整数

# 创建了三维的 ndarray
import numpy as np
a = np.arange(8).reshape(2,2,2)
print '原数组：'
print a
print '\n'  
# 现在交换轴 0（深度方向）到轴 2（宽度方向）
print '调用 swapaxes 函数后的数组：'
print np.swapaxes(a, 2, 0)

输出如下：

原数组：
[[[0 1]
 [2 3]]
 [[4 5]
  [6 7]]]
调用 swapaxes 函数后的数组：
[[[0 4]
 [2 6]]
 [[1 5]
  [3 7]]]

修改维度

序号	维度和描述
1.	`broadcast` 产生模仿广播的对象
2.	`broadcast_to` 将数组广播到新形状
3.	`expand_dims` 扩展数组的形状
4.	`squeeze` 从数组的形状中删除单维条目

`broadcast`

如前所述，NumPy 已经内置了对广播的支持。此功能模仿广播机制。它返回一个对象，该对象封装了将一个数组广播到另一个数组的结果。

该函数使用两个数组作为输入参数。下面的例子说明了它的用法。

import numpy as np
x = np.array([[1], [2], [3]])
y = np.array([4, 5, 6])  
# 对 y 广播 x
b = np.broadcast(x,y)  
# 它拥有 iterator 属性，基于自身组件的迭代器元组
print '对 y 广播 x：'
r,c = b.iters
print r.next(), c.next()
print r.next(), c.next()
print '\n'  
# shape 属性返回广播对象的形状
print '广播对象的形状：'
print b.shape
print '\n'  
# 手动使用 broadcast 将 x 与 y 相加
b = np.broadcast(x,y)
c = np.empty(b.shape)
print '手动使用 broadcast 将 x 与 y 相加：'
print c.shape
print '\n'  
c.flat = [u + v for (u,v) in b]
print '调用 flat 函数：'
print c
print '\n'  
# 获得了和 NumPy 内建的广播支持相同的结果
print 'x 与 y 的和：'
print x + y

输出如下：

对 y 广播 x：
1 4
1 5
广播对象的形状：
(3, 3)
手动使用 broadcast 将 x 与 y 相加：
(3, 3)
调用 flat 函数：
[[ 5. 6. 7.]
 [ 6. 7. 8.]
 [ 7. 8. 9.]]
x 与 y 的和：
[[5 6 7]
 [6 7 8]
 [7 8 9]]

`numpy.broadcast_to`

此函数将数组广播到新形状。它在原始数组上返回只读视图。它通常不连续。如果新形状不符合 NumPy 的广播规则，该函数可能会抛出ValueError。

注意 - 此功能可用于 1.10.0 及以后的版本。

该函数接受以下参数。

numpy.broadcast_to(array, shape, subok)

例子

import numpy as np
a = np.arange(4).reshape(1,4)
print '原数组：'
print a
print '\n'  
print '调用 broadcast_to 函数之后：'
print np.broadcast_to(a,(4,4))

输出如下：

[[0  1  2  3]
 [0  1  2  3]
 [0  1  2  3]
 [0  1  2  3]]

`numpy.expand_dims`

函数通过在指定位置插入新的轴来扩展数组形状。该函数需要两个参数：

numpy.expand_dims(arr, axis)

其中：

arr：输入数组
axis：新轴插入的位置

例子

import numpy as np
x = np.array(([1,2],[3,4]))
print '数组 x：'
print x
print '\n'  
y = np.expand_dims(x, axis = 0)
print '数组 y：'
print y
print '\n'
print '数组 x 和 y 的形状：'
print x.shape, y.shape
print '\n'  
# 在位置 1 插入轴
y = np.expand_dims(x, axis = 1)
print '在位置 1 插入轴之后的数组 y：'
print y
print '\n'  
print 'x.ndim 和 y.ndim：'
print x.ndim,y.ndim
print '\n'  
print 'x.shape 和 y.shape：'
print x.shape, y.shape

输出如下：

数组 x：
[[1 2]
 [3 4]]
数组 y：
[[[1 2]
 [3 4]]]
数组 x 和 y 的形状：
(2, 2) (1, 2, 2)
在位置 1 插入轴之后的数组 y：
[[[1 2]]
 [[3 4]]]
x.shape 和 y.shape：
2 3
x.shape and y.shape:
(2, 2) (2, 1, 2)

`numpy.squeeze`

函数从给定数组的形状中删除一维条目。此函数需要两个参数。

numpy.squeeze(arr, axis)

其中：

arr：输入数组
axis：整数或整数元组，用于选择形状中单一维度条目的子集

例子

import numpy as np  
x = np.arange(9).reshape(1,3,3)
print '数组 x：'
print x
print '\n'  
y = np.squeeze(x)
print '数组 y：'
print y
print '\n'  
print '数组 x 和 y 的形状：'
print x.shape, y.shape

输出如下：

数组 x：
[[[0 1 2]
 [3 4 5]
 [6 7 8]]]
数组 y：
[[0 1 2]
 [3 4 5]
 [6 7 8]]
数组 x 和 y 的形状：
(1, 3, 3) (3, 3)

数组的连接

序号	数组及描述
1.	`concatenate` 沿着现存的轴连接数据序列
2.	`stack` 沿着新轴连接数组序列
3.	`hstack` 水平堆叠序列中的数组（列方向）
4.	`vstack` 竖直堆叠序列中的数组（行方向）

`numpy.concatenate`

数组的连接是指连接。此函数用于沿指定轴连接相同形状的两个或多个数组。该函数接受以下参数。

numpy.concatenate((a1, a2, ...), axis)

其中：

a1, a2, ...：相同类型的数组序列
axis：沿着它连接数组的轴，默认为 0

例子

import numpy as np
a = np.array([[1,2],[3,4]])
print '第一个数组：'
print a
print '\n'  
b = np.array([[5,6],[7,8]])
print '第二个数组：'
print b
print '\n'  
# 两个数组的维度相同
print '沿轴 0 连接两个数组：'
print np.concatenate((a,b))
print '\n'  
print '沿轴 1 连接两个数组：'
print np.concatenate((a,b),axis = 1)

输出如下：

第一个数组：
[[1 2]
 [3 4]]
第二个数组：
[[5 6]
 [7 8]]
沿轴 0 连接两个数组：
[[1 2]
 [3 4]
 [5 6]
 [7 8]]
沿轴 1 连接两个数组：
[[1 2 5 6]
 [3 4 7 8]]

`numpy.stack`

此函数沿新轴连接数组序列。此功能添加自 NumPy 版本 1.10.0。需要提供以下参数。

numpy.stack(arrays, axis)

其中：

arrays：相同形状的数组序列
axis：返回数组中的轴，输入数组沿着它来堆叠

import numpy as np
a = np.array([[1,2],[3,4]])
print '第一个数组：'
print a
print '\n'
b = np.array([[5,6],[7,8]])
print '第二个数组：'
print b
print '\n'  
print '沿轴 0 堆叠两个数组：'
print np.stack((a,b),0)
print '\n'  
print '沿轴 1 堆叠两个数组：'
print np.stack((a,b),1)

输出如下：

第一个数组：
[[1 2]
 [3 4]]
第二个数组：
[[5 6]
 [7 8]]
沿轴 0 堆叠两个数组：
[[[1 2]
 [3 4]]
 [[5 6]
 [7 8]]]
沿轴 1 堆叠两个数组：
[[[1 2]
 [5 6]]
 [[3 4]
 [7 8]]]

`numpy.hstack`

numpy.stack函数的变体，通过堆叠来生成水平的单个数组。

例子

import numpy as np
a = np.array([[1,2],[3,4]])
print '第一个数组：'
print a
print '\n'  
b = np.array([[5,6],[7,8]])
print '第二个数组：'
print b
print '\n'  
print '水平堆叠：'
c = np.hstack((a,b))
print c
print '\n'

输出如下：

第一个数组：
[[1 2]
 [3 4]]
第二个数组：
[[5 6]
 [7 8]]
水平堆叠：
[[1 2 5 6]
 [3 4 7 8]]

`numpy.vstack`

numpy.stack函数的变体，通过堆叠来生成竖直的单个数组。

import numpy as np
a = np.array([[1,2],[3,4]])
print '第一个数组：'
print a
print '\n'  
b = np.array([[5,6],[7,8]])
print '第二个数组：'
print b
print '\n'
print '竖直堆叠：'
c = np.vstack((a,b))
print c

输出如下：

第一个数组：
[[1 2]
 [3 4]]
第二个数组：
[[5 6]
 [7 8]]
竖直堆叠：
[[1 2]
 [3 4]
 [5 6]
 [7 8]]

数组分割

序号	数组及操作
1.	`split` 将一个数组分割为多个子数组
2.	`hsplit` 将一个数组水平分割为多个子数组（按列）
3.	`vsplit` 将一个数组竖直分割为多个子数组（按行）

`numpy.split`

该函数沿特定的轴将数组分割为子数组。函数接受三个参数：

numpy.split(ary, indices_or_sections, axis)

其中：

ary：被分割的输入数组
indices_or_sections：可以是整数，表明要从输入数组创建的，等大小的子数组的数量。如果此参数是一维数组，则其元素表明要创建新子数组的点。
axis：默认为 0

例子

import numpy as np
a = np.arange(9)
print '第一个数组：'
print a
print '\n'  
print '将数组分为三个大小相等的子数组：'
b = np.split(a,3)
print b
print '\n'  
print '将数组在一维数组中表明的位置分割：'
b = np.split(a,[4,7])
print b

输出如下：

第一个数组：
[0 1 2 3 4 5 6 7 8]
将数组分为三个大小相等的子数组：
[array([0, 1, 2]), array([3, 4, 5]), array([6, 7, 8])]
将数组在一维数组中表明的位置分割：
[array([0, 1, 2, 3]), array([4, 5, 6]), array([7, 8])]

`numpy.hsplit`

numpy.hsplit是split()函数的特例，其中轴为 1 表示水平分割，无论输入数组的维度是什么。

import numpy as np
a = np.arange(16).reshape(4,4)
print '第一个数组：'
print a
print '\n'  
print '水平分割：'
b = np.hsplit(a,2)
print b
print '\n'

输出：

第一个数组：
[[ 0 1 2 3]
 [ 4 5 6 7]
 [ 8 9 10 11]
 [12 13 14 15]]
水平分割：                                                         
[array([[ 0,  1],                                                             
       [ 4,  5],                                                              
       [ 8,  9],                                                              
       [12, 13]]), array([[ 2,  3],                                           
       [ 6,  7],                                                              
       [10, 11],                                                              
       [14, 15]])]

`numpy.vsplit`

numpy.vsplit是split()函数的特例，其中轴为 0 表示竖直分割，无论输入数组的维度是什么。下面的例子使之更清楚。

import numpy as np
a = np.arange(16).reshape(4,4)
print '第一个数组：'
print a
print '\n'
print '竖直分割：'
b = np.vsplit(a,2)
print b

输出如下：

第一个数组：
[[ 0 1 2 3]
 [ 4 5 6 7]
 [ 8 9 10 11]
 [12 13 14 15]]
竖直分割：                                                           
[array([[0, 1, 2, 3],                                                         
       [4, 5, 6, 7]]), array([[ 8,  9, 10, 11],                               
       [12, 13, 14, 15]])]

添加/删除元素

序号	元素及描述
1.	`resize` 返回指定形状的新数组
2.	`append` 将值添加到数组末尾
3.	`insert` 沿指定轴将值插入到指定下标之前
4.	`delete` 返回删掉某个轴的子数组的新数组
5.	`unique` 寻找数组内的唯一元素

`numpy.resize`

此函数返回指定大小的新数组。如果新大小大于原始大小，则包含原始数组中的元素的重复副本。该函数接受以下参数。

numpy.resize(arr, shape)

其中：

arr：要修改大小的输入数组
shape：返回数组的新形状

例子

import numpy as np
a = np.array([[1,2,3],[4,5,6]])
print '第一个数组：'
print a
print '\n'
print '第一个数组的形状：'
print a.shape
print '\n'  
b = np.resize(a, (3,2))
print '第二个数组：'
print b
print '\n'  
print '第二个数组的形状：'
print b.shape
print '\n'  
# 要注意 a 的第一行在 b 中重复出现，因为尺寸变大了
print '修改第二个数组的大小：'
b = np.resize(a,(3,3))
print b

输出如下：

第一个数组：
[[1 2 3]
 [4 5 6]]
第一个数组的形状：
(2, 3)
第二个数组：
[[1 2]
 [3 4]
 [5 6]]
第二个数组的形状：
(3, 2)
修改第二个数组的大小：
[[1 2 3]
 [4 5 6]
 [1 2 3]]

`numpy.append`

此函数在输入数组的末尾添加值。附加操作不是原地的，而是分配新的数组。此外，输入数组的维度必须匹配否则将生成ValueError。

函数接受下列函数：

numpy.append(arr, values, axis)

其中：

arr：输入数组
values：要向arr添加的值，比如和arr形状相同（除了要添加的轴）
axis：沿着它完成操作的轴。如果没有提供，两个参数都会被展开。

例子

import numpy as np
a = np.array([[1,2,3],[4,5,6]])
print '第一个数组：'
print a
print '\n'  
print '向数组添加元素：'
print np.append(a, [7,8,9])
print '\n'  
print '沿轴 0 添加元素：'
print np.append(a, [[7,8,9]],axis = 0)
print '\n'  
print '沿轴 1 添加元素：'
print np.append(a, [[5,5,5],[7,8,9]],axis = 1)

输出如下：

第一个数组：
[[1 2 3]
 [4 5 6]]
向数组添加元素：
[1 2 3 4 5 6 7 8 9]
沿轴 0 添加元素：
[[1 2 3]
 [4 5 6]
 [7 8 9]]
沿轴 1 添加元素：
[[1 2 3 5 5 5]
 [4 5 6 7 8 9]]

`numpy.insert`

此函数在给定索引之前，沿给定轴在输入数组中插入值。如果值的类型转换为要插入，则它与输入数组不同。插入没有原地的，函数会返回一个新数组。此外，如果未提供轴，则输入数组会被展开。

insert()函数接受以下参数：

numpy.insert(arr, obj, values, axis)

其中：

arr：输入数组
obj：在其之前插入值的索引
values：要插入的值
axis：沿着它插入的轴，如果未提供，则输入数组会被展开

例子

import numpy as np
a = np.array([[1,2],[3,4],[5,6]])
print '第一个数组：'
print a
print '\n'  
print '未传递 Axis 参数。 在插入之前输入数组会被展开。'
print np.insert(a,3,[11,12])
print '\n'  
print '传递了 Axis 参数。 会广播值数组来配输入数组。'
print '沿轴 0 广播：'
print np.insert(a,1,[11],axis = 0)
print '\n'  
print '沿轴 1 广播：'
print np.insert(a,1,11,axis = 1)

输出如下：

第一个数组：
[[1 2]
 [3 4]
 [5 6]]
未传递 Axis 参数。 在插入之前输入数组会被展开。
[ 1  2  3 11 12  4  5  6]
传递了 Axis 参数。 会广播值数组来配输入数组。
沿轴 0 广播：
[[ 1  2]
 [11 11]
 [ 3  4]
 [ 5  6]]
沿轴 1 广播：
[[ 1 11  2]
 [ 3 11  4]
 [ 5 11  6]]

`numpy.delete`

此函数返回从输入数组中删除指定子数组的新数组。与insert()函数的情况一样，如果未提供轴参数，则输入数组将展开。该函数接受以下参数：

Numpy.delete(arr, obj, axis)

其中：

arr：输入数组
obj：可以被切片，整数或者整数数组，表明要从输入数组删除的子数组
axis：沿着它删除给定子数组的轴，如果未提供，则输入数组会被展开

例子

import numpy as np
a = np.arange(12).reshape(3,4)
print '第一个数组：'
print a
print '\n'  
print '未传递 Axis 参数。 在插入之前输入数组会被展开。'
print np.delete(a,5)
print '\n'  
print '删除第二列：'  
print np.delete(a,1,axis = 1)
print '\n'  
print '包含从数组中删除的替代值的切片：'
a = np.array([1,2,3,4,5,6,7,8,9,10])
print np.delete(a, np.s_[::2])

输出如下：

第一个数组：
[[ 0 1 2 3]
 [ 4 5 6 7]
 [ 8 9 10 11]]
未传递 Axis 参数。 在插入之前输入数组会被展开。
[ 0 1 2 3 4 6 7 8 9 10 11]
删除第二列：
[[ 0 2 3]
 [ 4 6 7]
 [ 8 10 11]]
包含从数组中删除的替代值的切片：
[ 2 4 6 8 10]

`numpy.unique`

此函数返回输入数组中的去重元素数组。该函数能够返回一个元组，包含去重数组和相关索引的数组。索引的性质取决于函数调用中返回参数的类型。

numpy.unique(arr, return_index, return_inverse, return_counts)

其中：

arr：输入数组，如果不是一维数组则会展开
return_index：如果为true，返回输入数组中的元素下标
return_inverse：如果为true，返回去重数组的下标，它可以用于重构输入数组
return_counts：如果为true，返回去重数组中的元素在原数组中的出现次数

例子

import numpy as np
a = np.array([5,2,6,2,7,5,6,8,2,9])
print '第一个数组：'
print a
print '\n'  
print '第一个数组的去重值：'
u = np.unique(a)
print u
print '\n'  
print '去重数组的索引数组：'
u,indices = np.unique(a, return_index = True)
print indices
print '\n'  
print '我们可以看到每个和原数组下标对应的数值：'
print a
print '\n'  
print '去重数组的下标：'
u,indices = np.unique(a,return_inverse = True)
print u
print '\n'
print '下标为：'
print indices
print '\n'  
print '使用下标重构原数组：'
print u[indices]
print '\n'  
print '返回去重元素的重复数量：'
u,indices = np.unique(a,return_counts = True)
print u
print indices

输出如下：

第一个数组：
[5 2 6 2 7 5 6 8 2 9]
第一个数组的去重值：
[2 5 6 7 8 9]
去重数组的索引数组：
[1 0 2 4 7 9]
我们可以看到每个和原数组下标对应的数值：
[5 2 6 2 7 5 6 8 2 9]
去重数组的下标：
[2 5 6 7 8 9]
下标为：
[1 0 2 0 3 1 2 4 0 5]
使用下标重构原数组：
[5 2 6 2 7 5 6 8 2 9]
返回唯一元素的重复数量：
[2 5 6 7 8 9]
 [3 2 2 1 1 1]