获取对象信息

当我们拿到一个对象的引用时,如何知道这个对象是什么类型、有哪些方法呢?

使用type()

首先,我们来判断对象类型,使用type()函数:

基本类型都可以用type()判断:

  1. >>> type(123)
  2. <type 'int'>
  3. >>> type('str')
  4. <type 'str'>
  5. >>> type(None)
  6. <type 'NoneType'>

如果一个变量指向函数或者类,也可以用type()判断:

  1. >>> type(abs)
  2. <type 'builtin_function_or_method'>
  3. >>> type(a)
  4. <class '__main__.Animal'>

但是type()函数返回的是什么类型呢?它返回type类型。如果我们要在if语句中判断,就需要比较两个变量的type类型是否相同:

  1. >>> type(123)==type(456)
  2. True
  3. >>> type('abc')==type('123')
  4. True
  5. >>> type('abc')==type(123)
  6. False

但是这种写法太麻烦,Python把每种type类型都定义好了常量,放在types模块里,使用之前,需要先导入:

  1. >>> import types
  2. >>> type('abc')==types.StringType
  3. True
  4. >>> type(u'abc')==types.UnicodeType
  5. True
  6. >>> type([])==types.ListType
  7. True
  8. >>> type(str)==types.TypeType
  9. True

最后注意到有一种类型就叫TypeType,所有类型本身的类型就是TypeType,比如:

  1. >>> type(int)==type(str)==types.TypeType
  2. True

使用isinstance()

对于class的继承关系来说,使用type()就很不方便。我们要判断class的类型,可以使用isinstance()函数。

我们回顾上次的例子,如果继承关系是:

  1. object -> Animal -> Dog -> Husky

那么,isinstance()就可以告诉我们,一个对象是否是某种类型。先创建3种类型的对象:

  1. >>> a = Animal()
  2. >>> d = Dog()
  3. >>> h = Husky()

然后,判断:

  1. >>> isinstance(h, Husky)
  2. True

没有问题,因为h变量指向的就是Husky对象。

再判断:

  1. >>> isinstance(h, Dog)
  2. True

h虽然自身是Husky类型,但由于Husky是从Dog继承下来的,所以,h也还是Dog类型。换句话说,isinstance()判断的是一个对象是否是该类型本身,或者位于该类型的父继承链上。

因此,我们可以确信,h还是Animal类型:

  1. >>> isinstance(h, Animal)
  2. True

同理,实际类型是Dog的d也是Animal类型:

  1. >>> isinstance(d, Dog) and isinstance(d, Animal)
  2. True

但是,d不是Husky类型:

  1. >>> isinstance(d, Husky)
  2. False

能用type()判断的基本类型也可以用isinstance()判断:

  1. >>> isinstance('a', str)
  2. True
  3. >>> isinstance(u'a', unicode)
  4. True
  5. >>> isinstance('a', unicode)
  6. False

并且还可以判断一个变量是否是某些类型中的一种,比如下面的代码就可以判断是否是str或者unicode:

  1. >>> isinstance('a', (str, unicode))
  2. True
  3. >>> isinstance(u'a', (str, unicode))
  4. True

由于strunicode都是从basestring继承下来的,所以,还可以把上面的代码简化为:

  1. >>> isinstance(u'a', basestring)
  2. True

使用dir()

如果要获得一个对象的所有属性和方法,可以使用dir()函数,它返回一个包含字符串的list,比如,获得一个str对象的所有属性和方法:

  1. >>> dir('ABC')
  2. ['__add__', '__class__', '__contains__', '__delattr__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__getslice__', '__gt__', '__hash__', '__init__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_formatter_field_name_split', '_formatter_parser', 'capitalize', 'center', 'count', 'decode', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'index', 'isalnum', 'isalpha', 'isdigit', 'islower', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']

类似xxx的属性和方法在Python中都是有特殊用途的,比如len方法返回长度。在Python中,如果你调用len()函数试图获取一个对象的长度,实际上,在len()函数内部,它自动去调用该对象的len()方法,所以,下面的代码是等价的:

  1. >>> len('ABC')
  2. 3
  3. >>> 'ABC'.__len__()
  4. 3

我们自己写的类,如果也想用len(myObj)的话,就自己写一个len()方法:

  1. >>> class MyObject(object):
  2. ... def __len__(self):
  3. ... return 100
  4. ...
  5. >>> obj = MyObject()
  6. >>> len(obj)
  7. 100

剩下的都是普通属性或方法,比如lower()返回小写的字符串:

  1. >>> 'ABC'.lower()
  2. 'abc'

仅仅把属性和方法列出来是不够的,配合getattr()setattr()以及hasattr(),我们可以直接操作一个对象的状态:

  1. >>> class MyObject(object):
  2. ... def __init__(self):
  3. ... self.x = 9
  4. ... def power(self):
  5. ... return self.x * self.x
  6. ...
  7. >>> obj = MyObject()

紧接着,可以测试该对象的属性:

  1. >>> hasattr(obj, 'x') # 有属性'x'吗?
  2. True
  3. >>> obj.x
  4. 9
  5. >>> hasattr(obj, 'y') # 有属性'y'吗?
  6. False
  7. >>> setattr(obj, 'y', 19) # 设置一个属性'y'
  8. >>> hasattr(obj, 'y') # 有属性'y'吗?
  9. True
  10. >>> getattr(obj, 'y') # 获取属性'y'
  11. 19
  12. >>> obj.y # 获取属性'y'
  13. 19

如果试图获取不存在的属性,会抛出AttributeError的错误:

  1. >>> getattr(obj, 'z') # 获取属性'z'
  2. Traceback (most recent call last):
  3. File "<stdin>", line 1, in <module>
  4. AttributeError: 'MyObject' object has no attribute 'z'

可以传入一个default参数,如果属性不存在,就返回默认值:

  1. >>> getattr(obj, 'z', 404) # 获取属性'z',如果不存在,返回默认值404
  2. 404

也可以获得对象的方法:

  1. >>> hasattr(obj, 'power') # 有属性'power'吗?
  2. True
  3. >>> getattr(obj, 'power') # 获取属性'power'
  4. <bound method MyObject.power of <__main__.MyObject object at 0x108ca35d0>>
  5. >>> fn = getattr(obj, 'power') # 获取属性'power'并赋值到变量fn
  6. >>> fn # fn指向obj.power
  7. <bound method MyObject.power of <__main__.MyObject object at 0x108ca35d0>>
  8. >>> fn() # 调用fn()与调用obj.power()是一样的
  9. 81

小结

通过内置的一系列函数,我们可以对任意一个Python对象进行剖析,拿到其内部的数据。要注意的是,只有在不知道对象信息的时候,我们才会去获取对象信息。如果可以直接写:

  1. sum = obj.x + obj.y

就不要写:

  1. sum = getattr(obj, 'x') + getattr(obj, 'y')

一个正确的用法的例子如下:

  1. def readImage(fp):
  2. if hasattr(fp, 'read'):
  3. return readData(fp)
  4. return None

假设我们希望从文件流fp中读取图像,我们首先要判断该fp对象是否存在read方法,如果存在,则该对象是一个流,如果不存在,则无法读取。hasattr()就派上了用场。

请注意,在Python这类动态语言中,有read()方法,不代表该fp对象就是一个文件流,它也可能是网络流,也可能是内存中的一个字节流,但只要read()方法返回的是有效的图像数据,就不影响读取图像的功能。

原文: https://wizardforcel.gitbooks.io/liaoxuefeng/content/py2/41.html