数据可视化——鸢尾花数据集的分析与散点图的绘制
**
数据可视化——鸢尾花数据集的分析及散点图的绘制
话不多说,直接上代码。
我们先来看一下鸢尾花数据集。
#读取鸢尾花卉数据集,绘制“花瓣长度”和“花瓣宽度”特征之间的散点图。
在导入如下几个库之前,请首先检查pip list,即个人PC是否已经安装了对应的第三方库。
安装命令:pip install
如果遇到安装超时的情况,可以使用清华的源:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple
更换为要下载的第三方库
import numpy as np
import pandas as pd
from sklearn.cluster import KMeans#K-means算法
import matplotlib.pyplot as plt
plt.rcParams[‘font.sans-serif’]=[‘SimHei’]#用来正常显示中文
iris_data=pd.read_csv(r’./iris.csv’)
X=iris_data[[‘petal_length’,‘petal_width’]]
print(X.shape)#这里看一下有没有数据缺失
#绘制数据分布图
estimator=KMeans(n_clusters=3)#构造聚类器
estimator.fit(X)#聚类
label_pred=estimator.labels_#获取聚类标签
#开始绘制K-means结果
x0=X[label_pred==0]#对应setosa
x1=X[label_pred==1]#对应vigincia
x2=X[label_pred==2]#对应versicolor
#这里使用了df.values,因为操作的是一个dataframe类型,所以应该转换成ndarry
plt.scatter(x0.values[:,0],x0.values[:,1],c=‘r’,marker=‘o’,label=‘setosa(山鸢尾)’)
plt.scatter(x1.values[:,0],x1.values[:,1],c=‘g’,marker=‘o’,label=‘virgincia(维吉尼亚鸢尾)’)
plt.scatter(x2.values[:,0],x2.values[:,1],c=‘blue’,marker=‘o’,label=‘versicolor(变色鸢尾)’)
plt.xlabel(‘petal_length(花瓣长度)’)
plt.ylabel(‘petal_width(花瓣宽度)’)
plt.title(‘花瓣长度和花瓣宽度特征之间的散点图’)
plt.legend(loc=2)#把图例放到左上角
plt.show()
#读取鸢尾花卉数据集,绘制“花萼长度”和“花萼宽度”特征之间的散点图。
import numpy as np
import pandas as pd
from sklearn.cluster import KMeans#K-means算法
import matplotlib.pyplot as plt
plt.rcParams[‘font.sans-serif’]=[‘SimHei’]#用来正常显示中文
iris_data=pd.read_csv(r’./iris.csv’)
X=iris_data[[‘sepal_length’,‘sepal_width’]]
print(X.shape)#这里查看一下有没有数据缺失
#绘制数据分布图
estimator=KMeans(n_clusters=3)#构造聚类器
estimator.fit(X)#聚类
label_pred=estimator.labels_#获取聚类标签
#开始绘制K-means结果
x0=X[label_pred==0]#对应setosa
x1=X[label_pred==1]#对应vigincia
x2=X[label_pred==2]#对应versicolor
#这里使用了df.values,因为操作的是一个dataframe类型,所以应该转换成ndarry
plt.scatter(x0.values[:,0],x0.values[:,1],c=‘r’,marker=‘o’,label=‘setosa(山鸢尾)’)
plt.scatter(x1.values[:,0],x1.values[:,1],c=‘g’,marker=‘o’,label=‘virgincia(维吉尼亚鸢尾)’)
plt.scatter(x2.values[:,0],x2.values[:,1],c=‘blue’,marker=‘o’,label=‘versicolor(变色鸢尾)’)
plt.xlabel(‘sepal_length(花萼长度)’)
plt.ylabel(‘sepal_width(花萼宽度)’)
plt.title(‘花萼长度和花萼宽度特征之间的散点图’)
plt.legend(loc=2)#把图例放到左上角
plt.show()

就是这么多了,不会的可以私聊。
祝大家学习愉快。
相关知识
鸢尾花分类与直方图、散点图的绘制及可视化决策树
分析鸢尾花数据集
《机器学习》分析鸢尾花数据集
鸢尾花数据集可视化分析
基于Echarts的鸢尾花数据可视化
【机器学习】经典数据集鸢尾花的分类识别
python鸢尾花数据集的分类问题 -- 逻辑回归问题研究
3.4 数据可视化
Python中的数据可视化:Matplotlib基础与高级技巧
使用pandas绘制两列csv的直方图
原文链接: 数据可视化——鸢尾花数据集的分析与散点图的绘制 https://www.huajiangbk.com/newsview545970.html
| 上一篇: 用r语言中的鸢尾花数据集做一个l... | 下一篇: 读取iris数据集中的花萼长度数... |
推荐分享

- 1明日花キララ:明日花绮罗年度... 22551
- 2明日花キララ(明日花绮罗)经... 13233
- 3兰花叶子扭的是什么兰 8618
- 4家庭养花知识大全 家庭养花有... 8572
- 5家庭养花风水知识 家庭养花“... 8293
- 6君子兰什么品种最名贵 十大名... 7805
- 7十大致癌花卉排行榜,哪些花卉... 7523
- 8五月天婷婷开心六月丁香:音乐... 7157
- 9秋天养花,掌握这5点养花知识... 6894
- 10李晓明工笔牡丹(魏紫)《牡丹... 6712





