python机器学习算法怎么学(用Python做科学计算工具篇)
python机器学习算法怎么学(用Python做科学计算工具篇)
2024-10-01 09:17:52  作者:鸽子情书  网址:https://m.xinb2b.cn/tech/knl145056.html


所需基本库

numpyscipymatplotlib全章目录【本节:监督学习:住房数据的回归】简介:问题设置使用 scikit-learn 进行机器学习的基本原理监督学习:手写数字的分类监督学习:住房数据的回归测量预测性能无监督学习:降维和可视化特征脸示例:链接 PCA 和 SVM特征脸示例:链接 PCA 和 SVM参数选择、验证和测试6.4.监督学习:住房数据的回归

在这里,我们将做一个回归问题的简短示例:从一组特征中学习一个连续值。

6.4.1. 快速浏览数据

我们将使用 scikit-learn 中提供的简单波士顿房价集。这记录了波士顿周围房地产市场的 13 个属性的测量值,以及中位数价格。问题是:你能根据新市场的属性预测其价格吗?

>>>

>>> from sklearn.datasets import load_boston>>> data = load_boston()>>> print(data.data.shape)(506, 13)>>> print(data.target.shape)(506,)

我们可以看到只有 500 多个数据点。

该DESCR变量对数据集有很长的描述:

>>>

>>> print(data.DESCR) Boston House Prices dataset===========================Notes------Data Set Characteristics: :Number of Instances: 506 :Number of Attributes: 13 numeric/categorical predictive :Median Value (attribute 14) is usually the target :Attribute Information (in order): - CRIM per capita crime rate by town - ZN proportion of residential land zoned for lots over 25,000 sq.ft. - INDUS proportion of non-retail business acres per town - CHAS Charles River dummy variable (= 1 if tract bounds river; 0 otherwise) - NOX nitric oxides concentration (parts per 10 million) - RM average number of rooms per dwelling - AGE proportion of owner-occupied units built prior to 1940 - DIS weighted distances to five Boston employment centres - RAD index of accessibility to radial highways - TAX full-value property-tax rate per $10,000 - PTRATIO pupil-teacher ratio by town - B 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town - LSTAT % lower status of the population - MEDV Median value of owner-occupied homes in $1000's...

它通常有助于使用直方图、散点图或其他绘图类型快速可视化数据片段。使用 matplotlib,让我们显示目标值的直方图:每个邻域的中位数价格:

>>>

>>> plt.hist(data.target) (array([...


让我们快速看一下某些特征是否比其他特征更适合我们的问题:

>>>

>>> for index, feature_name in enumerate(data.feature_names):... plt.figure()... plt.scatter(data.data[:, index], data.target) <Figure size...














有时,在机器学习中,使用特征选择来决定哪些特征对特定问题最有用是很有用的。现有的自动化方法可以量化这种选择信息量最大的特征的练习。

6.4.2. 预测房价:一个简单的线性回归

现在我们将使用scikit-learn对住房数据执行简单的线性回归。有许多使用回归量的可能性。一个特别简单的是LinearRegression:这基本上是一个普通最小二乘计算的包。

>>>

>>> from sklearn.model_selection import train_test_split>>> X_train, X_test, y_train, y_test = train_test_split(data.data, data.target)>>> from sklearn.linear_model import LinearRegression>>> clf = LinearRegression()>>> clf.fit(X_train, y_train)LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)>>> predicted = clf.predict(X_test)>>> expected = y_test>>> print("RMS: %s" % np.sqrt(np.mean((predicted - expected) ** 2))) RMS: 5.0059...


我们可以绘制误差:预期作为预测的函数:

>>>

>>> plt.scatter(expected, predicted) <matplotlib.collections.PathCollection object at ...>

尽管显然存在一些偏差,但该预测至少与真实价格相关。我们可以想象通过计算真实价格和预测价格之间的 RMS 残差来评估回归器的性能。然而,其中有一些微妙之处,我们将在后面的部分中介绍。

from sklearn.ensemble import GradientBoostingRegressor# Instantiate the model, fit the results, and scatter in vs. out

相关文章:用Python做科学计算(工具篇)——scikit-learn(机器学习)3用Python做科学计算(工具篇)——scikit-learn(机器学习)2用Python做科学计算(工具篇)——scikit-learn(机器学习)1用Python做科学计算——matplotlib绘图实例 用Python做科学计算(工具篇)——1.1. NumPy 数组对象用Python做科学计算(工具篇)——numpy1.2.数组的数值运算 用Python做科学计算(工具篇)——numpy1.3 更精细的数组用Python做科学计算(工具篇)——numpy1.4 高级操作用Python做科学计算(工具篇)——scipy 使用指南用Python做科学计算(工具篇)——sympy使用指南(符号运算),
  • 为什么晚上的天是黄色的
  • 2024-10-01为什么晚上的天是黄色的晚上天空变黄是因为空气中的水汽和尘埃较多,这些较大的粗粒子的散射和分子散射的性质大不相同,波长较长的黄橙光被散射的多一些,而总散射量也显著增长,所以天空呈黄色天空呈黄色时,预示可能出现降水有轻雾或有雾。
  • 杨贵妃为什么不生孩子(杨贵妃如此受宠)
  • 2024-10-01杨贵妃如此受宠杨贵妃如此受宠,为何终生没有生孩子?原因原来是这个,真的很简单杨贵妃可以说是历史上最具争议的妃子,据史料记载,杨贵妃虽然容貌倾国倾城,但身材肥胖,与现在影视剧中杨贵妃的身材并不相符,不过,不管杨贵妃的。
  • ios15.6.1 带wifi密码显示吗(苹果iOS16)
  • 2024-10-01苹果iOS16IT之家6月7日消息,苹果今日发布的iOS16更新包括一系列细节改进,其中一项微小的改进就是终于支持查看当前连接的WiFi网络密码了查看WiFi密码在安卓手机中并不稀奇,而苹果直到iOS15都没有上线。
  • 闯幽州任心才原文
  • 2024-10-01闯幽州任心才原文威威坐下我金刀令公众儿子披了甲威风齐整,赛过天将与天兵大郎儿披了甲威风凛,恰赛过黄飞虎智取五营二郎儿披了甲也有一比,恰赛过西凉的马超英雄三郎儿豹头环眼性勇猛,恰赛过张翼德当阳退兵四郎儿五郎子也有一比,。
  • 幼儿园小班开学寄语第一学期(幼儿园小班新学期寄语)
  • 2024-10-01幼儿园小班新学期寄语盛夏的燥热渐渐散去金桂的馨香飘逸悠远经过假期的休整又迎来了一个新的学年开始了新的学习生活新学期我们站在了一个特别的节点上,建国70周年这是我们的自豪也是我们的光荣更是我们一个全新的起点新学期,新目标潜。
  • 电工-电动机的工作原理是什么(电工-电动机的工作原理是什么)
  • 2024-10-01电工-电动机的工作原理是什么电动机是用电产生机械能的机器,他的工作原理是用电产生磁场,利用磁场的相互作用转动1、伺服系统是使物体的位置,方位状态等输出被控量能够跟随输入目标,的任意变化的自动控制系统,伺服主要靠脉冲来定位,基本上。
  • 水流急的黑鱼怎么钓(黑鱼只要按我说的钓)
  • 2024-10-01黑鱼只要按我说的钓经验丰富的钓鱼人都知道,秋季是垂钓大黑鱼最后的一个阶段,特别是刚一立秋之时,无论是池塘还是水库湖泊,里边的黑鱼都食欲大开,只要见到自己喜欢吃的食物,就立马狂咬不断,千真万确当然就我而言,每年这个时候,。
  • 炒组词二年级
  • 2024-10-01炒组词二年级炒读chǎo,组词造句:炒菜,炒作8.炒菜的锅具也很关键,使用好的锅可以提高炒菜的效率和口感9.姥姥经常炒一些家常菜,深得我们的喜爱,让我们感受到家的味道。
  • 老版本苹果建议升级最新系统吗(老版iOS系统不够安全)
  • 2024-10-01老版iOS系统不够安全对于为何热衷于使用iPhone这个问题,个人认为无非两个原因,一是经久耐用的硬件,而是相对安全的软件系统,刚开始更多人看中的是硬件,可如今看中软件的人却更多,而苹果在更新iOS系统方面也保持了良好传统。
  • 买的羽绒服有质量问题怎么处理(买羽绒服当心商家拿)
  • 2024-10-01买羽绒服当心商家拿今冬是羽绒服新国标4月份落地后的第一个销售季新国标最大亮点是把信息表里的“含绒量”修改为“绒子含量”北京青年报记者近日了解到,虽然很多线下羽绒棉服已经把吊牌换成了“绒子含量”,但是不少线上商家在介绍和。
  • 杭州菜用料(杭州人爱吃的那一口酱香美味上线了吗)
  • 2024-10-01杭州人爱吃的那一口酱香美味上线了吗钱江晚报·小时新闻见习记者肖暖暖四时风物,各有其味到了时令,吃上一份应景的美食,那滋味别提多美了今天(11月7日)是立冬,相信许多老杭州都开始牵挂起那份熟悉美味——冬日里大家爱吃的酱鸭酱肉上线了吗?今。