七、 字符串操作
通过
Series.map()
方法,所有字符串和正则表达式方法都能应用于各个值。但是如果存在NaN
就会报错。为了解决这个问题,pandas
提供了一些能够跳过NaN
值的字符串操作方法。Series.str
能够将Series
的值当作字符串处理,并且你可以通过Series.str.func
来应用某些函数。其中func
可以为:Series.str.capitalize()
Series.str.cat([others, sep, na_rep])
Series.str.center(width[, fillchar])
Series.str.contains(pat[, case=True, flags=0, na=nan, regex=True])
Series.str.count(pat[, flags])
Series.str.decode(encoding[, errors])
Series.str.encode(encoding[, errors])
Series.str.endswith(pat[, na])
Series.str.extract(pat[, flags, expand])
Series.str.extractall(pat[, flags])
Series.str.find(sub[, start, end])
Series.str.findall(pat[, flags])
Series.str.get(i)
Series.str.index(sub[, start, end])
Series.str.join(sep)
Series.str.len()
Series.str.ljust(width[, fillchar])
Series.str.lower()
Series.str.lstrip([to_strip])
Series.str.match(pat[, case=True, flags=0, na=nan, as_indexer=False])
Series.str.normalize(form)
Series.str.pad(width[, side, fillchar])
Series.str.partition([pat, expand])
Series.str.repeat(repeats)
Series.str.replace(pat, repl[, n, case, flags])
Series.str.rfind(sub[, start, end])
Series.str.rindex(sub[, start, end])
Series.str.rjust(width[, fillchar])
Series.str.rpartition([pat, expand])
Series.str.rstrip([to_strip])
Series.str.slice([start, stop, step])
Series.str.slice_replace([start, stop, repl])
Series.str.split([pat, n, expand])
Series.str.rsplit([pat, n, expand])
Series.str.startswith(pat[, na])
Series.str.strip([to_strip])
Series.str.swapcase()
Series.str.title()
Series.str.translate(table[, deletechars])
Series.str.upper()
Series.str.wrap(width, **kwargs)
Series.str.zfill(width)
Series.str.isalnum()
Series.str.isalpha()
Series.str.isdigit()
Series.str.isspace()
Series.str.islower()
Series.str.isupper()
Series.str.istitle()
Series.str.isnumeric()
Series.str.isdecimal()
Series.str.get_dummies([sep])
你也可以通过
Series.str[:3]
这种索引操作来进行子串截取。或者使用Series.str.get()
方法进行截取。