Python机器学习笔记(二十三 模型评估与改进-网格搜索)
上一次学习了评估一个模型的泛化能力,现在继续学习通过调参来提升模型的泛化性能。scikit-learn中许多算法的参数设置,在尝试调参之前,重要的是要理解参数的含义。找到一个模型的重要参数(提供最佳泛化性能的参数)的取值是一项棘手的任务,但对于几乎所有模型和数据集来说都是必要的。
scikit-learn 中有一些标准方法可以帮我们完成调参。最常用的方法就是网格搜索(grid search),它主要是指尝试我们关心的参数的所有可能组合。
例如:一个具有RBF(径向基函数)核的核SVM的例子,它在SVC类中实现。
它有2个重要参数:核宽度gamma和正则化参数C。假设我们希望尝试C的取值为0.001、0.01、0.1、1、10和100,gamma也取这6个值。由于我们想要尝试的C和gamma都有6个不同的取值,所以总共有36种参数组合。所有可能的组合组成了SVM的参数设置表