【应用机器学习】评估一个假设

检验是否过拟合

将数据分成训练集和测试集

通常用70%的数据作为训练集,用剩下30%的数据作为测试集。

很重要的一点是训练集和测试集均要含有各种类型的数据,通常我们要对数据进行洗牌,然后再分成训练集和测试集。

数据集分类

使用训练集对模型进行训练

可以得到一系列参数 theta

使用测试集对模型进行测试

使用测试集数据对模型进行测试,有两种方式计算误差

线性回归模型

利用测试集数据计算代价函数J

线性回归模型

逻辑回归模型

除前述方法,还可使用一种 错误分类(misclassification error)(也称0/1错误分类 zero one misclassification error) 的方法

逻辑回归模型_错误分类

Licensed under CC BY-NC-SA 4.0
comments powered by Disqus