【House Prices】程序改进1

发布时间 2023-10-09 20:19:00作者: byxiaobai

基本思路

我们第一次实现是选取了十个基本变量作为特征,训练集里NaN的值全都填了0。

仔细想想,可以多选取几个变量,这样或许能提高预测的正确率。

具体实现

首先,我输出了15个关系度比较大的变量,其中,"YearRemodAdd","Fireplaces","BsmtFinSF1"是三个有价值的变量,可以尝试加进去看看效果

结果与反思

喜提0.6分,还不如第一次

仔细想想,实际上我训练出的模型就是一个数学公式,增加这些0.3 0.4相关度的东西反而会导致计算不精确。也许下一次可以试试少一个变量