跟着Iris案例学Seaborn之Histplot
2024-09-28 293 发布于浙江
版权
举报
版权声明:
本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《 阿里云开发者社区用户服务协议》和 《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写 侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
本期,我们继续学习Seaborn中的第三种图形——Histograms(直方图),对应在Seaborn中的函数为histplot。Histograms直方图是数据集分布的图形表示。它们可以揭示数据的重要特征,例如:数据是否服从正态分布、偏向一侧或具有多个峰值。它们显示数据的不同区间或“区间”内的观测值频率或计数。直方图的 x 轴表示数据集中的值范围,分为等距的间隔或分箱;y轴表示落在每个条形框内的观测值的频率或计数。直方图中每个条形的高度对应于该区间中的观测值数。一、iris数据集简介
Iris数据集是一个非常著名的多变量数据集,由英国统计学家和生物学家罗纳德·费舍尔(Ronald Fisher)在1936年引入。它通常用于展示分类算法和聚类分析。Iris数据集包含了150个样本,每个样本有4个特征:萼片长度、萼片宽度、花瓣长度和花瓣宽度。这些样本分别属于3个不同的鸢尾花种类(Iris setosa、Iris virginica 和 Iris versicolor),每个种类各有50个样本。数据集的特征1.萼片长度 (Sepal Length): 以厘米为单位测量的花萼的长度。2.萼片宽度 (Sepal Width): 以厘米为单位测量的花萼的宽度。3.花瓣长度 (Petal Length): 以厘米为单位测量的花瓣的长度。4.花瓣宽度 (Petal Width): 以厘米为单位测量的花瓣的宽度。5.种类 (Species): 样本所属的鸢尾花种类。
具体数据集的链接如下:
通过百度网盘分享的文件:iris.csv
链接:https://pan.baidu.com/s/1we5Zb80xXecqY5Rhdqs8gA
提取码:6666
二、跟着iris数据集学histplot
2.1 导入数据集
import pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt # 设置中文字体plt.rcParams['font.family'] = 'SimHei' df=pd.read_csv('iris.csv') df
AI 代码解读
一个150行、5列的数据集,无缺失数据。
2.2 简单的直方图我们用Seaborn中的histplot对sepal_width这一列简单做个直方图,看一下萼片宽度的大致分布。
# Histogram with KDEsns.histplot(data=df, x='sepal_width', kde=True)plt.title('Histogram with KDE')plt.tight_layout()plt.show()
AI 代码解读
这里,我们也用kde做了直方图的加窗平滑,运行结果为:
从图中,我们可以看到萼片宽度从2到4.5的简单分布。KDE曲线也证实它非常接近正态分布。
2.3 多柱直方图
#多柱直方图sns.histplot(data=df)
AI 代码解读
多柱直方图显示了不同颜色的萼片宽度、萼片长度、花瓣宽度和花瓣长度的分布。可以看到,histplot直接过滤掉了最后一列:Species,因为这一列没有数值 。
2.3 重叠直方图
sns.histplot(data=df, x='petal_length', hue='species')
AI 代码解读
从重叠直方图中可以看到,Virginica植物的花瓣长度要比setosa和versicolor植物大得多。
2.4 堆叠直方图
#堆叠直方图sns.histplot(df, x='sepal_length', hue='species', multiple='stack',linewidth=0.5)
AI 代码解读
堆叠直方图显示了不同花种萼片长度的差异。virginica植物的萼片长度比setosa植物大得多。
三、小结
本期,我们介绍了有关Seaborn中绘制直方图的工具函数histplot,当然,Seaborn的histplot函数也提供了许多定制选项,比如:可以轻松地添加核密度估计(通过设置kde=True,参加2.1),改变直方图的颜色和样式等,你可以根据自己的需求调整这些参数来优化你的图表。
当然,想要了解更多关于histplot的功能,可以参见官方文档:
https://seaborn.pydata.org/generated/seaborn.histplot.html
通过使用Seaborn的histplot函数,我们可以快速而有效地创建出既美观又信息丰富的直方图,这不仅有助于我们更好地理解数据,还能在报告和展示中提供直观的视觉支持。下期见
相关知识
如何利用 Seaborn 实现高级统计图表
案例:鸢尾花种类预测
在Python中用Seaborn美化图表的3个示例
Python数据分析项目实例2:使用seaborn分析鸢尾花(Iris)数据集
鸢尾花(iris)数据集
Pandas入门篇(三)
R语言数据分析案例:鸢尾花(IRIS)
数据分析经典案例
鸢尾花(Iris)数据集入门
鸢尾花(iris)数据集分析
网址: 跟着Iris案例学Seaborn之Histplot https://www.huajiangbk.com/newsview1950372.html
上一篇: 深度学习:花朵图像生成模型训练数 |
下一篇: 机器学习——Day 3 KNN实 |
推荐分享

- 1君子兰什么品种最名贵 十大名 4012
- 2世界上最名贵的10种兰花图片 3364
- 3花圈挽联怎么写? 3286
- 4迷信说家里不能放假花 家里摆 1878
- 5香山红叶什么时候红 1493
- 6花的意思,花的解释,花的拼音 1210
- 7教师节送什么花最合适 1167
- 8勿忘我花图片 1103
- 9橄榄枝的象征意义 1093
- 10洛阳的市花 1039