原创
©著作权归作者所有:来自51CTO博客作者mob64ca12d9b014的原创作品,请联系作者获取转载授权,否则将追究法律责任
现在的通义灵码不但全面支持 Qwen3,还支持配置自己的 MCP 工具,还没体验过的小伙伴,马上配置起来啦~
https://click.aliyun.com/m/1000403618/
鸢尾花数据与Seaborn可视化
鸢尾花(Iris)数据集是一个经典的数据集,用于分类算法的教学和测试。这一数据集由著名统计学家和生物学家Ronald A. Fisher于1936年提出,通常用于机器学习算法的入门演示。本文将通过Python中的Seaborn库对鸢尾花数据集进行可视化分析,并帮助大家理解如何使用这种方法来探索数据。
鸢尾花数据集简介
鸢尾花数据集包含150个样本,分为3个不同的鸢尾花种类:Setosa、Versicolor和Virginica。每种花的特征包括:
花萼长度(sepal length) 花萼宽度(sepal width) 花瓣长度(petal length) 花瓣宽度(petal width)每个特征都是数值型的,这使得鸢尾花数据集非常适合用于数据可视化与分析。
Seaborn库介绍
Seaborn是基于Matplotlib的一个Python数据可视化库,它提供了更高级的接口来绘制统计图形。Seaborn使得图形的美化和图表的构建变得更为简单。为了使用Seaborn,首先需要确保已经安装该库:
pip install seaborn 1.
在运行下面的示例代码之前,请确保你已经安装了必要的库:pandas、matplotlib和seaborn。
加载数据集
使用Seaborn可以方便地加载鸢尾花数据集。可以通过以下代码实现:
import seaborn as sns import pandas as pd import matplotlib.pyplot as plt # 加载鸢尾花数据集 iris = sns.load_dataset('iris') # 显示前五条数据 print(iris.head()) 1.2.3.4.5.6.7.8.9.
运行后,你会看到类似下面的输出:
sepal_length sepal_width petal_length petal_width species 0 5.1 3.5 1.4 0.2 setosa 1 4.9 3.0 1.4 0.2 setosa 2 4.7 3.2 1.3 0.2 setosa 3 4.6 3.1 1.5 0.2 setosa 4 5.0 3.6 1.4 0.2 setosa 1.2.3.4.5.6.
数据可视化
1. 散点图散点图是探索变量之间关系的常见方法。在鸢尾花数据集中,我们可以绘制花萼长度和花瓣长度的散点图,并用不同颜色标识不同种类的鸢尾花:
plt.figure(figsize=(10, 6)) sns.scatterplot(data=iris, x='sepal_length', y='petal_length', hue='species', style='species', s=100) plt.title('鸢尾花花萼长度与花瓣长度的散点图') plt.xlabel('花萼长度 (cm)') plt.ylabel('花瓣长度 (cm)') plt.legend(title='种类') plt.show() 1.2.3.4.5.6.7. 2. 盒须图
盒须图能够很好地描述数据的分布情况,包括中位数、四分位数和异常值。我们可以使用盒须图来观察不同种类鸢尾花的花瓣宽度。
plt.figure(figsize=(10, 6)) sns.boxplot(data=iris, x='species', y='petal_width') plt.title('不同种类鸢尾花的花瓣宽度盒须图') plt.xlabel('种类') plt.ylabel('花瓣宽度 (cm)') plt.show() 1.2.3.4.5.6. 3. 配对图
配对图展示了所有变量之间的关系,非常直观。我们可以通过以下代码快速绘制配对图:
sns.pairplot(iris, hue='species') plt.title('鸢尾花数据集配对图') plt.show() 1.2.3. 状态图
在分析的过程中,我们可以用mermaid语法绘制一个状态图,以更清晰地描述数据可视化的工作流。
加载数据集绘制散点图绘制盒须图绘制配对图
结论通过对鸢尾花数据集进行可视化分析,我们能够直观地观察到各特征之间的关系,并且能够很容易地区分不同的鸢尾花种类。Seaborn库为数据分析与可视化提供了强大的支持,简化了代码量和绘图过程。
在今后的数据分析工作中,我们可以继续探索更多的可视化技术,结合不同的数据集,为决策提供更直观、更具说服力的支持。通过数据可视化,我们可以更好地理解数据背后的故事,从而更有效地作出决策。希望这篇文章对你了解鸢尾花数据集及数据可视化有所帮助!
现在的通义灵码不但全面支持 Qwen3,还支持配置自己的 MCP 工具,还没体验过的小伙伴,马上配置起来啦~
https://click.aliyun.com/m/1000403618/
赞 收藏 评论 举报相关文章