在许多地方都有修改原模型的需求,比如最简单和常见的例子就是修改模型最后的全链接层,来获得针对特定任务的输出结果。对于 PyTorch,可以通过多种方式来达到魔改模型的效果。
PyTorch 的模型是一个 torch.nn.Module
的某个子类的对象,那魔改模型实际就等价于修改某个类,对面向对象熟悉的同学都知道,对类做修改有两个经典的方法:组合和继承。
通过继承修改模型
首先创建自己需要的模型类,然后其父类指向需要被修改的模型,这时自己的模型则具有完备的父类行为,再在子类中实现魔改的逻辑。其大致的框架代码如下所示:
下面这个例子,我们将对 ResNet 进行魔改,把 ResNet 4 个 stage 输出的特征连起来,最后过一个全链接后输出一个标量。
通过组合修改模型
在面向对象编程中我们可能听说过「组合优于继承」,在模型修改的场景中其实也是这样,大多数情况下我们可能都适用组合而非继承。
首先依然需要创建模型的类,但这个类不再继承自魔改的类,而是直接继承 PyTorch 的模型基类 torch.nn.Module
,然后将需要魔改的类作为类变量融入到模型中,下面是大致的框架代码:
同样我们来实现跟上面同样的需求:
通过猴子补丁修改模型
最后再介绍一个最简单粗暴的方法:猴子补丁(Monkey Patch)。之所以叫猴子补丁,是因为这种方法在程序设计的角度上看,是具有破坏性的。我们尽可能得还是应该使用上面两种方法。
猴子补丁修改模型非常简单粗暴,直接使用需要修改的模型创建对象,然后直接对对象的属性做出修改,下面是把 ResNet34 的输出从 1000 改为 1 的例子:
此外这种方法也仅能实现一些简单的需求,对于复杂的需求还是推荐使用组合的方法来完成。