python机器学习算法怎么学(用Python做科学计算工具篇)
python机器学习算法怎么学(用Python做科学计算工具篇)
2024-11-08 12:26:21  作者:鸽子情书  网址:https://m.xinb2b.cn/know/knl145056.html


所需基本库

numpyscipymatplotlib全章目录【本节:监督学习:住房数据的回归】简介:问题设置使用 scikit-learn 进行机器学习的基本原理监督学习:手写数字的分类监督学习:住房数据的回归测量预测性能无监督学习:降维和可视化特征脸示例:链接 PCA 和 SVM特征脸示例:链接 PCA 和 SVM参数选择、验证和测试6.4.监督学习:住房数据的回归

在这里,我们将做一个回归问题的简短示例:从一组特征中学习一个连续值。

6.4.1. 快速浏览数据

我们将使用 scikit-learn 中提供的简单波士顿房价集。这记录了波士顿周围房地产市场的 13 个属性的测量值,以及中位数价格。问题是:你能根据新市场的属性预测其价格吗?

>>>

>>> from sklearn.datasets import load_boston>>> data = load_boston()>>> print(data.data.shape)(506, 13)>>> print(data.target.shape)(506,)

我们可以看到只有 500 多个数据点。

该DESCR变量对数据集有很长的描述:

>>>

>>> print(data.DESCR) Boston House Prices dataset===========================Notes------Data Set Characteristics: :Number of Instances: 506 :Number of Attributes: 13 numeric/categorical predictive :Median Value (attribute 14) is usually the target :Attribute Information (in order): - CRIM per capita crime rate by town - ZN proportion of residential land zoned for lots over 25,000 sq.ft. - INDUS proportion of non-retail business acres per town - CHAS Charles River dummy variable (= 1 if tract bounds river; 0 otherwise) - NOX nitric oxides concentration (parts per 10 million) - RM average number of rooms per dwelling - AGE proportion of owner-occupied units built prior to 1940 - DIS weighted distances to five Boston employment centres - RAD index of accessibility to radial highways - TAX full-value property-tax rate per $10,000 - PTRATIO pupil-teacher ratio by town - B 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town - LSTAT % lower status of the population - MEDV Median value of owner-occupied homes in $1000's...

它通常有助于使用直方图、散点图或其他绘图类型快速可视化数据片段。使用 matplotlib,让我们显示目标值的直方图:每个邻域的中位数价格:

>>>

>>> plt.hist(data.target) (array([...


让我们快速看一下某些特征是否比其他特征更适合我们的问题:

>>>

>>> for index, feature_name in enumerate(data.feature_names):... plt.figure()... plt.scatter(data.data[:, index], data.target) <Figure size...














有时,在机器学习中,使用特征选择来决定哪些特征对特定问题最有用是很有用的。现有的自动化方法可以量化这种选择信息量最大的特征的练习。

6.4.2. 预测房价:一个简单的线性回归

现在我们将使用scikit-learn对住房数据执行简单的线性回归。有许多使用回归量的可能性。一个特别简单的是LinearRegression:这基本上是一个普通最小二乘计算的包。

>>>

>>> from sklearn.model_selection import train_test_split>>> X_train, X_test, y_train, y_test = train_test_split(data.data, data.target)>>> from sklearn.linear_model import LinearRegression>>> clf = LinearRegression()>>> clf.fit(X_train, y_train)LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)>>> predicted = clf.predict(X_test)>>> expected = y_test>>> print("RMS: %s" % np.sqrt(np.mean((predicted - expected) ** 2))) RMS: 5.0059...


我们可以绘制误差:预期作为预测的函数:

>>>

>>> plt.scatter(expected, predicted) <matplotlib.collections.PathCollection object at ...>

尽管显然存在一些偏差,但该预测至少与真实价格相关。我们可以想象通过计算真实价格和预测价格之间的 RMS 残差来评估回归器的性能。然而,其中有一些微妙之处,我们将在后面的部分中介绍。

from sklearn.ensemble import GradientBoostingRegressor# Instantiate the model, fit the results, and scatter in vs. out

相关文章:用Python做科学计算(工具篇)——scikit-learn(机器学习)3用Python做科学计算(工具篇)——scikit-learn(机器学习)2用Python做科学计算(工具篇)——scikit-learn(机器学习)1用Python做科学计算——matplotlib绘图实例 用Python做科学计算(工具篇)——1.1. NumPy 数组对象用Python做科学计算(工具篇)——numpy1.2.数组的数值运算 用Python做科学计算(工具篇)——numpy1.3 更精细的数组用Python做科学计算(工具篇)——numpy1.4 高级操作用Python做科学计算(工具篇)——scipy 使用指南用Python做科学计算(工具篇)——sympy使用指南(符号运算),
  • 双十二2000左右质量最好的手机(目前好评最高的手机的十款手机)
  • 2024-11-08目前好评最高的手机的十款手机一款手机销量的好坏,反映的是在市场上受欢迎程度的高低,一款手机的好评率,则代表一款手机在屏幕、手感、使用体验、性价比等方面给用户的体验感受如何,而我们目前在选购一款手机时,也会将综合这两个方面来综合考。
  • 小学一至六年级奥数知识点汇总(最全小学1-6年级奥数资料)
  • 2024-11-08最全小学1-6年级奥数资料学好奥数对升学有绝对有很大的帮助,但奥数绝对不仅仅是做几道数学题这么简单,很家长反映孩子的学奥数学不好,但是报奥数课程特别昂贵这里免费的奥数课程来了!在家用手机就能陪孩子看课程!课程分类非常详细,一年。
  • 家里养什么花更好(适合养在家里的花)
  • 2024-11-08适合养在家里的花吊兰可以吸收空气中的有害气体如甲醛、一氧化碳、二氧化碳并且释放氧气一份吊兰在5-10平米的房间中与空气净化器的工作效率相当同时它易于养殖,能美化家居环境君子兰可以吸收烟尘,净化家居空气,在微弱的光线下。
  • 假体隆胸最新技术(中山一院许扬滨教授解惑)
  • 2024-11-08中山一院许扬滨教授解惑一、手感真实隆胸手术后手感会变差吗?其实现在最好的隆胸手术,不仅使患者在外形上和自然胸部别无二致,假体隆胸效果手感上也温热、柔软、富有弹性,和自体乳腺组织没有区别二、疤痕隐蔽隆胸的目的不但是塑造美丽曲。
  • 梵克雅宝官网三叶草(梵克雅宝注册四叶草立体商标失败)
  • 2024-11-08梵克雅宝注册四叶草立体商标失败财经网产经讯12月23日下午,财经网产经由北京法院审判信息网获悉,梵克雅宝公司申请注册“四叶草立体图形”商标的行动,在经历商评委、一二审法院三轮裁判后,仍宣告失败法院认为,梵克雅宝在珠宝首饰领域使用的。
  • 小数点十进制转换为二进制(十进制小数如何转换为二进制)
  • 2024-11-08十进制小数如何转换为二进制位运算在计算机编程中经常用到,所以掌握十进制和二进制间的转换十分重要十进制:由0~9十个数字组成二进制:由0和1两个数字组成1、整数转换十进制转二进制的原理:十进制的数除以2,直到商为0,最后反向取余。
  • 油炸臭豆腐做法(做油炸臭豆腐步骤)
  • 2024-11-08做油炸臭豆腐步骤将青矾(又名皂矾、绿矾、煅红者名绛矾或矾红)放入桶内,倒入沸水,用木棍搅动,然后将水豆腐压干水分放入,浸泡2小时,捞出平晾凉沥去水,再放入专用卤水中浸泡(春秋季浸泡3-5小时,夏季浸泡1-2小时,冬季。
  • 微信专项整顿几月到几月 微信微博发公告
  • 2024-11-08微信专项整顿几月到几月 微信微博发公告8月28日,微信、微博先后发布公告,宣布开展整治财经违规内容行动微信:进一步规范财经类自媒体帐号据“微信派”微信公众号8月28日消息,根据国家网信办2021年“清朗”系列专项行动要求,即日起至2021。
  • 不忘初心鼓干劲(柔水砺石之功鼓韵铿锵之美)
  • 2024-11-08柔水砺石之功鼓韵铿锵之美作者:孙福海近年,在王冠丽评戏演出后的谢幕时,出现一个戏曲舞台从来没有的现象──台下观众如醉如痴地呐喊:“唱一段京韵大鼓!”为什么有如此呼声呢?王冠丽是著名“白派(白玉霜)”评剧表演艺术家,嗓音条件好。
  • 漂亮的锁屏草原高清手机壁纸(精选手机绝美风景壁纸)
  • 2024-11-08精选手机绝美风景壁纸好看的皮囊千篇一律,有趣的灵魂万里挑一,手机同质化越来越小的今天,壁纸已经越来越成为了一个人个性的象征,壁纸体现一个人的个性,但是好看的手机壁纸却非常不好找,尤其是目前大热的全面屏手机,虽然全面屏手机。