首页分享用sklearn做一个完整的机器学习工程——以波士顿房价预测为例（二、select a model and train it）

用sklearn做一个完整的机器学习工程——以波士顿房价预测为例（二、select a model and train it）

来源：花匠小妙招时间：2024-11-14 12:55

最新推荐文章于 2024-10-11 13:03:22 发布

PythonstartL 于 2018-10-11 10:32:53 发布

终于到了这一步了！你在前面限定了问题、获得了数据、探索了数据、采样了一个测试集、写了自动化的转换流水线来清理和为算法准备数据。现在，早就已经准备好选择并训练一个机器学习模型了。

那我们就从线性模型开始讲起吧！

普通的广义线性模型，都是拟合一个带有系数的线性模型，使得数据集实际观测数据和预测数据（估计值）之间的残差平方和最小。其数学表达式为：

，当然如果是做分类的话，请参照李航的logistic回归

在sklearn中广义线性模型也特别好实现

from sklearn.linear_model import LinearRegression

lin_reg = LinearRegression()

lin_reg.fit(housing_prepared,housing_labels)

#输出权重

lin_reg.coef_

#去前6行数据进行评估

some_data = housing_prepared[:6]

some_labels = housing_labels[:6]

lin_reg.predict(some_data)#得到：

array([ 203682.37379543, 326371.39370781, 204218.64588245,
58685.4770482 , 194213.06443039, 156914.96268363])

实际值为 [ 286600.0, 340600.0,196900.0, 46300.0,254500.0,127900.0]相差有的大概差个20%左右吧

普通最小二乘法的缺点

对于普通最小二乘的系数估计问题，其依赖于模型各项的相互独立性。当各项是相关的，且设计矩阵的各列近似线性相关&#

推荐分享

家庭养花风水知识家庭养花“五行说”

家庭养花知识大全家庭养花有什么好处

秋天养花，掌握这5点养花知识，正确管理花卉，让花健康生长

【花卉知识】养花须知：新手养花的选购技巧，不要当冤大头！

最新分享

蒜蓉炒西兰花

黑暗料理王蒜蓉炒时蔬有哪10种配方

花肉炒蒜苔怎么做野菜蒲公英的作用和副作用,野菜蒲公英怎么马兰头炒腊肉、蒲公英炒鸡蛋、蒜蓉豌豆苗…自带“青霉素”的5种菜，建议：春天经常吃自带“青霉素”的3种菜，建议：天冷经常吃【步骤图】蒜蓉胡萝卜炒双花的做法蒲公英怎么吃（蒲公英的吃法技巧）【步骤图】蒜蓉西蓝花（快手，超简单）的做

分享热点排名

分享热点

家庭养花知识大全(家

养花知识大全,养花技

怎么样在室内养花？养

教师节送什么花最合适

即时知识

精选专栏

君子兰什么品种最名贵十大名贵君子兰排名

丝瓜打顶时间及方法步骤(图解)

河北10个最好玉米品种

用sklearn做一个完整的机器学习工程——以波士顿房价预测为例（二、select a model and train it）

推荐分享

家庭养花风水知识 家庭养花“五行说”

家庭养花知识大全 家庭养花有什么好处

秋天养花，掌握这5点养花知识，正确管理花卉，让花健康生长

【花卉知识 】养花须知：新手养花的选购技巧，不要当冤大头！

家庭养花风水知识家庭养花“五行说”

家庭养花知识大全家庭养花有什么好处

【花卉知识】养花须知：新手养花的选购技巧，不要当冤大头！