编写你自己的 Keras 层

对于简单、无状态的自定义操作,你也许可以通过 layers.core.Lambda 层来实现。但是对于那些包含了可训练权重的自定义层,你应该自己实现这种层。

这是一个 Keras2.0 中,Keras 层的骨架(如果你用的是旧的版本,请更新到新版)。你只需要实现三个方法即可:

  • build(input_shape): 这是你定义权重的地方。这个方法必须设 self.built = True,可以通过调用 super([Layer], self).build() 完成。
  • call(x): 这里是编写层的功能逻辑的地方。你只需要关注传入 call 的第一个参数:输入张量,除非你希望你的层支持masking。
  • compute_output_shape(input_shape): 如果你的层更改了输入张量的形状,你应该在这里定义形状变化的逻辑,这让Keras能够自动推断各层的形状。
  1. from keras import backend as K
  2. from keras.engine.topology import Layer
  3. class MyLayer(Layer):
  4. def __init__(self, output_dim, **kwargs):
  5. self.output_dim = output_dim
  6. super(MyLayer, self).__init__(**kwargs)
  7. def build(self, input_shape):
  8. # 为该层创建一个可训练的权重
  9. self.kernel = self.add_weight(name='kernel',
  10. shape=(input_shape[1], self.output_dim),
  11. initializer='uniform',
  12. trainable=True)
  13. super(MyLayer, self).build(input_shape) # 一定要在最后调用它
  14. def call(self, x):
  15. return K.dot(x, self.kernel)
  16. def compute_output_shape(self, input_shape):
  17. return (input_shape[0], self.output_dim)

还可以定义具有多个输入张量和多个输出张量的 Keras 层。为此,你应该假设方法 build(input_shape)call(x)compute_output_shape(input_shape) 的输入输出都是列表。这里是一个例子,与上面那个相似:

  1. from keras import backend as K
  2. from keras.engine.topology import Layer
  3. class MyLayer(Layer):
  4. def __init__(self, output_dim, **kwargs):
  5. self.output_dim = output_dim
  6. super(MyLayer, self).__init__(**kwargs)
  7. def build(self, input_shape):
  8. assert isinstance(input_shape, list)
  9. # 为该层创建一个可训练的权重
  10. self.kernel = self.add_weight(name='kernel',
  11. shape=(input_shape[0][1], self.output_dim),
  12. initializer='uniform',
  13. trainable=True)
  14. super(MyLayer, self).build(input_shape) # 一定要在最后调用它
  15. def call(self, x):
  16. assert isinstance(x, list)
  17. a, b = x
  18. return [K.dot(a, self.kernel) + b, K.mean(b, axis=-1)]
  19. def compute_output_shape(self, input_shape):
  20. assert isinstance(input_shape, list)
  21. shape_a, shape_b = input_shape
  22. return [(shape_a[0], self.output_dim), shape_b[:-1]]

已有的 Keras 层就是实现任何层的很好例子。不要犹豫阅读源码!