索引和分片

索引

对于一个有序序列,可以通过索引的方法来访问对应位置的值。字符串便是一个有序序列的例子,Python使用 [] 来对有序序列进行索引。

In [1]:

  1. s = "hello world"
  2. s[0]

Out[1]:

  1. 'h'

Python中索引是从 0 开始的,所以索引 0 对应与序列的第 1 个元素。为了得到第 5 个元素,需要使用索引值 4

In [2]:

  1. s[4]

Out[2]:

  1. 'o'

除了正向索引,Python还引入了负索引值的用法,即从后向前开始计数,例如,索引 -2 表示倒数第 2 个元素:

In [3]:

  1. s[-2]

Out[3]:

  1. 'l'

单个索引大于等于字符串的长度时,会报错:

In [4]:

  1. s[11]
  1. ---------------------------------------------------------------------------
  2. IndexError Traceback (most recent call last)
  3. <ipython-input-4-79ffc22473a3> in <module>()
  4. ----> 1 s[11]
  5.  
  6. IndexError: string index out of range

分片

分片用来从序列中提取出想要的子序列,其用法为:

  1. var[lower:upper:step]

其范围包括 lower ,但不包括 upper ,即 [lower, upper)step 表示取值间隔大小,如果没有默认为1

In [5]:

  1. s

Out[5]:

  1. 'hello world'

In [6]:

  1. s[1:3]

Out[6]:

  1. 'el'

分片中包含的元素的个数为 3-1=2

也可以使用负索引来指定分片的范围:

In [7]:

  1. s[1:-2]

Out[7]:

  1. 'ello wor'

包括索引 1 但是不包括索引 -2

lower和upper可以省略,省略lower意味着从开头开始分片,省略upper意味着一直分片到结尾。

In [8]:

  1. s[:3]

Out[8]:

  1. 'hel'

In [9]:

  1. s[-3:]

Out[9]:

  1. 'rld'

In [10]:

  1. s[:]

Out[10]:

  1. 'hello world'

每隔两个取一个值:

In [11]:

  1. s[::2]

Out[11]:

  1. 'hlowrd'

当step的值为负时,省略lower意味着从结尾开始分片,省略upper意味着一直分片到开头。

In [12]:

  1. s[::-1]

Out[12]:

  1. 'dlrow olleh'

当给定的upper超出字符串的长度(注意:因为不包含upper,所以可以等于)时,Python并不会报错,不过只会计算到结尾。

In [13]:

  1. s[:100]

Out[13]:

  1. 'hello world'

使用“0”作为索引开头的原因

使用[low, up)形式的原因

假设需要表示字符串 hello 中的内部子串 el

方式 [low, up) (low, up] (lower, upper) [lower, upper]
表示 [1,3) (0,2] (0,3) [1,2]
序列长度 up - low up - low up - low - 1 up - low + 1

对长度来说,前两种方式比较好,因为不需要烦人的加一减一。

现在只考虑前两种方法,假设要表示字符串hello中的从头开始的子串hel

方式 [low, up) (low, up]
表示 [0,3) (-1,2]
序列长度 up - low up - low

第二种表示方法从-1开始,不是很好,所以选择使用第一种[low, up)的形式。

使用0-base的形式

Just too beautiful to ignore.——Guido van Rossum

两种简单的情况:

  • 从头开始的n个元素;

    • 使用0-base:[0, n)
    • 使用1-base:[1, n+1)
  • i+1个元素到第i+n个元素。

    • 使用0-base:[i, n+i)
    • 使用1-base:[i+1, n+i+1) 1-base有个+1部分,所以不推荐。

综合这两种原因,Python使用0-base的方法来进行索引。

原文: https://nbviewer.jupyter.org/github/lijin-THU/notes-python/blob/master/02-python-essentials/02.05-indexing-and-slicing.ipynb