python机器学习算法怎么学(用Python做科学计算工具篇)
python机器学习算法怎么学(用Python做科学计算工具篇)
2024-11-22 12:59:35  作者:鸽子情书  网址:https://m.xinb2b.cn/sport/knl145056.html


所需基本库

numpyscipymatplotlib全章目录【本节:监督学习:住房数据的回归】简介:问题设置使用 scikit-learn 进行机器学习的基本原理监督学习:手写数字的分类监督学习:住房数据的回归测量预测性能无监督学习:降维和可视化特征脸示例:链接 PCA 和 SVM特征脸示例:链接 PCA 和 SVM参数选择、验证和测试6.4.监督学习:住房数据的回归

在这里,我们将做一个回归问题的简短示例:从一组特征中学习一个连续值。

6.4.1. 快速浏览数据

我们将使用 scikit-learn 中提供的简单波士顿房价集。这记录了波士顿周围房地产市场的 13 个属性的测量值,以及中位数价格。问题是:你能根据新市场的属性预测其价格吗?

>>>

>>> from sklearn.datasets import load_boston>>> data = load_boston()>>> print(data.data.shape)(506, 13)>>> print(data.target.shape)(506,)

我们可以看到只有 500 多个数据点。

该DESCR变量对数据集有很长的描述:

>>>

>>> print(data.DESCR) Boston House Prices dataset===========================Notes------Data Set Characteristics: :Number of Instances: 506 :Number of Attributes: 13 numeric/categorical predictive :Median Value (attribute 14) is usually the target :Attribute Information (in order): - CRIM per capita crime rate by town - ZN proportion of residential land zoned for lots over 25,000 sq.ft. - INDUS proportion of non-retail business acres per town - CHAS Charles River dummy variable (= 1 if tract bounds river; 0 otherwise) - NOX nitric oxides concentration (parts per 10 million) - RM average number of rooms per dwelling - AGE proportion of owner-occupied units built prior to 1940 - DIS weighted distances to five Boston employment centres - RAD index of accessibility to radial highways - TAX full-value property-tax rate per $10,000 - PTRATIO pupil-teacher ratio by town - B 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town - LSTAT % lower status of the population - MEDV Median value of owner-occupied homes in $1000's...

它通常有助于使用直方图、散点图或其他绘图类型快速可视化数据片段。使用 matplotlib,让我们显示目标值的直方图:每个邻域的中位数价格:

>>>

>>> plt.hist(data.target) (array([...


让我们快速看一下某些特征是否比其他特征更适合我们的问题:

>>>

>>> for index, feature_name in enumerate(data.feature_names):... plt.figure()... plt.scatter(data.data[:, index], data.target) <Figure size...














有时,在机器学习中,使用特征选择来决定哪些特征对特定问题最有用是很有用的。现有的自动化方法可以量化这种选择信息量最大的特征的练习。

6.4.2. 预测房价:一个简单的线性回归

现在我们将使用scikit-learn对住房数据执行简单的线性回归。有许多使用回归量的可能性。一个特别简单的是LinearRegression:这基本上是一个普通最小二乘计算的包。

>>>

>>> from sklearn.model_selection import train_test_split>>> X_train, X_test, y_train, y_test = train_test_split(data.data, data.target)>>> from sklearn.linear_model import LinearRegression>>> clf = LinearRegression()>>> clf.fit(X_train, y_train)LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)>>> predicted = clf.predict(X_test)>>> expected = y_test>>> print("RMS: %s" % np.sqrt(np.mean((predicted - expected) ** 2))) RMS: 5.0059...


我们可以绘制误差:预期作为预测的函数:

>>>

>>> plt.scatter(expected, predicted) <matplotlib.collections.PathCollection object at ...>

尽管显然存在一些偏差,但该预测至少与真实价格相关。我们可以想象通过计算真实价格和预测价格之间的 RMS 残差来评估回归器的性能。然而,其中有一些微妙之处,我们将在后面的部分中介绍。

from sklearn.ensemble import GradientBoostingRegressor# Instantiate the model, fit the results, and scatter in vs. out

相关文章:用Python做科学计算(工具篇)——scikit-learn(机器学习)3用Python做科学计算(工具篇)——scikit-learn(机器学习)2用Python做科学计算(工具篇)——scikit-learn(机器学习)1用Python做科学计算——matplotlib绘图实例 用Python做科学计算(工具篇)——1.1. NumPy 数组对象用Python做科学计算(工具篇)——numpy1.2.数组的数值运算 用Python做科学计算(工具篇)——numpy1.3 更精细的数组用Python做科学计算(工具篇)——numpy1.4 高级操作用Python做科学计算(工具篇)——scipy 使用指南用Python做科学计算(工具篇)——sympy使用指南(符号运算),
  • 电焊的基本理论知识(每日一题关于电焊的那些事儿)
  • 2024-11-22每日一题关于电焊的那些事儿今日挑战在电焊施工时,旁边是否可以放置废旧纸箱?A、可以B、不可以✦✦本期答案B相关案例2021年8月14日,江西赣州章贡区文清路上,一栋两层的居民楼突发火灾,火光冲天,黑烟滚滚事故起因为一名工人,在。
  • 元宇宙概念爆火后 科技巨头跑步入场
  • 2024-11-22元宇宙概念爆火后 科技巨头跑步入场新华社北京10月21日电(记者彭茜张晓茹)美国社交媒体脸书公司日前宣布,5年内拟在欧盟国家雇用1万名高技能人才打造“元宇宙”,这是世界科技巨头布局“元宇宙”的最新一步什么是“元宇宙”?它如何从科幻小说。
  • 简爱读后感3000字左右(简爱的爱情观)
  • 2024-11-22简爱的爱情观以影评书评结合的方式谈谈简爱的爱情观爱就全心全意毫无保留简爱眼里,爱情是纯粹热烈不掺杂利益的圣约翰以为完成宗教事业为目的追求简爱,将爱情视作完成事业的工具时被简爱严词拒绝当罗切斯特身份地位远高于自己时。
  • 造价员必须掌握的数据(一个造价人员应该掌握的数据)
  • 2024-11-22一个造价人员应该掌握的数据以下数据是我长期从事预算行业,自己统计出来的大概指标,欢迎大家留言交流一个造价人员应该熟练掌握的数据:一、框架结构的数据指标1.一般的框架结构中的混凝土用量可以按“建筑面积*0.22”得出,即一个标准。
  • 掉头路口压双黄线怎么处罚(压双黄线怎么处罚)
  • 2024-11-22压双黄线怎么处罚压双黄实线怎么处罚压双黄实线属于不按照规定车道行驶,会罚款200元并扣3分处理,如果压线后还逆行的就会多扣3分双黄线有分双黄实线、双黄虚线、一实线一虚线对于此类问题可以总结为实线一方不可跨越,虚线的一。
  • 大虾的最简单十种做法
  • 2024-11-22大虾的最简单十种做法克、香芹50克、油炸花生米80克、红尖椒100克、干辣椒20克、姜片10克、香葱20克、大蒜片20克、熟芝麻2汤匙(30ml)生抽2汤匙(30ml)、香油1汤匙(15ml)、料酒1汤匙(15ml)、糖。
  • 怎么样对付老赖最有效(用这些办法对付老赖)
  • 2024-11-22用这些办法对付老赖为什么这几年失信人员越来越多?疫情肆虐经济下行,导致越来越多的人入不敷出最终走向了成为老赖的不归路!不管处于什么原因,一个被执行人的出现背后涉及了多少金额,又伤害了多少家庭!我想如果可以谁都不愿意成为。
  • 羽翼未丰是什么意思(羽翼未丰的含义)
  • 2024-11-22羽翼未丰的含义意思是比喻年纪轻,经历少,不成熟或力量还不够强大字面意思是鸟的翅膀还没有长好羽毛不能飞行,一般比喻人的思想阅历或者能力还不够成熟,不能独立羽翼未丰是一个汉语成语,读音yǔyiwèifēng出处:西汉·。
  • 七月婴儿可以剪头发吗(宝宝5月不能剪头发吗)
  • 2024-11-22宝宝5月不能剪头发吗今天刚给儿子剪了头发,结果晚上回她奶奶家就让给叨叨了,说什么小孩5月不能剪头发,不早减之类的,你说你要知道你不早说,减完了说什么说,再说这么热的天不减不热死了!我婆婆也是个奇葩,我儿子吃喝拉撒又不问,。
  • 荣耀手机摄影获奖名单(金鸡手机电影计划奖项出炉)
  • 2024-11-22金鸡手机电影计划奖项出炉说到「电影」这个词,相信不少人脑中已经开始浮现各种专业设备,像是超大块头的摄影机、各类专业的技术人员和道具等等,认为电影这种表达自我的创作方式与自己无缘不过值得庆幸的是,随着手机光学素质不断的提高,加。
  • 夏季花束包装(花束包装千万种)
  • 2024-11-22花束包装千万种小小的冰激凌花束,小巧可爱,送给最爱的她!记忆的梗上,谁不有两三朵娉婷,披着情绪的花我有无数金色的梦,遗失在生活的路上,。