PCA实现鸢尾花数据集降维可视化
基于《Python机器学习》——北京理工大学 学习笔记
PCA实现高维数据可视化
数据来源
http://archive.ics.uci.edu/ml/datasets/Iris
主成分分析(Principal Component Analysis,PCA)是最常用的一种降维方法,通常用于高维数据集的探索与可视化,还可以用作数据压缩和预处PCA可以把具有相关性的高维变量合成为线性无关的低维变量,称为主成分。主成分能够尽可能保留原始数据的信息。
目标 :已知鸢尾花数据是4维的,共三类样本。使用PCA实现对鸢尾花数据进行降维,实现在二维平面上的可视化。
原理 :矩阵的主成分就是其协方差矩阵对应的特征向量,按照对应的特征值大小进行排序,最大的特征值就是第一主成分,其次是第二主成分,以此类推。
import matplotlib.pyplot as plt #导入相关工程包 from sklearn.decomposition import PCA from sklearn.datasets import load_iris data = load_iris() #加载鸢尾花数据 y = data.target #使用Y表示数据集中的标签 X = data.data #使用X表示数据集中的属性数据 pca = PCA(n_components=2) #加载PCA算法,设置降维后主成分数为2 reduced_X = pca.fit_transform(X) #对原始数据进行降维并保存在reduced_X中 red_x, red_y = [], [] #第一类数据点 blue_x, blue_y = [], [] #第二类数据点 green_x, green_y = [], [] #第三类数据点 for i in range(len(reduced_X)): #利用for语句按类别把鸢尾花数据保存在不同列表中 if y[i] == 0: red_x.append(reduced_X[i][0]) red_y.append(reduced_X[i][1]) elif y[i] == 1: blue_x.append(reduced_X[i][0]) blue_y.append(reduced_X[i][1]) else: green_x.append(reduced_X[i][0]) green_y.append(reduced_X[i][1]) plt.scatter(red_x, red_y, c='r', marker='x') #降维后数据点的可视化 plt.scatter(blue_x, blue_y, c='b', marker='D') plt.scatter(green_x, green_y, c='g', marker='.') plt.show()
1234567891011121314151617181920212223242526272829主要参数
n_components:指定主成分的个数,即降维后数据的维度。svd_solver :设置特征值分解的方法,默认为‘auto’,其他可选有‘full’, ‘arpack’, ‘randomized’。plt.scatter()用法:
函数的原型:
matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, *, data=None, **kwargs)
参数的解释:
x,y:表示的是大小为(n,)的数组,也就是我们即将绘制散点图的数据点
s:是一个实数或者是一个数组大小为(n,),这个是一个可选的参数。
c:表示的是颜色,也是一个可选项。默认是蓝色’b’,表示的是标记的颜色,或者可以是一个表示颜色的字符,或者是一个长度为n的表示颜色的序列等等,感觉还没用到过现在不解释了。但是c不可以是一个单独的RGB数字,也不可以是一个RGBA的序列。可以是他们的2维数组(只有一行)。
marker:表示的是标记的样式,默认的是’o’。
原文链接:https://blog.csdn.net/m0_37393514/article/details/81298503
1
相关知识
PCA实现鸢尾花数据集降维可视化
鸢尾花数据集降维可视化
基于PCA的数据降维(鸢尾花(iris)数据集)
鸢尾花数据集降维后高维数据可视化
基于PCA与LDA的数据降维实践
利用PCA(主成分分析法)实现鸢尾花数据集的分类
机器学习(三)降维之PCA及鸢尾花降维
LDA算法实现鸢尾花数据集降维
鸢尾花数据可视化,PCA降到两维后,对数据标准化、归一化
机器学习利用PCA完成鸢尾花数据集的降维与分类
网址: PCA实现鸢尾花数据集降维可视化 https://www.huajiangbk.com/newsview1947010.html
上一篇: python 鸢尾花数据集报表展 |
下一篇: 用鸢尾花数据集为例展示数据分析的 |
推荐分享

- 1君子兰什么品种最名贵 十大名 4012
- 2世界上最名贵的10种兰花图片 3364
- 3花圈挽联怎么写? 3286
- 4迷信说家里不能放假花 家里摆 1878
- 5香山红叶什么时候红 1493
- 6花的意思,花的解释,花的拼音 1210
- 7教师节送什么花最合适 1167
- 8勿忘我花图片 1103
- 9橄榄枝的象征意义 1093
- 10洛阳的市花 1039