首页 分享 python绘制鸢尾花数据集散点图

python绘制鸢尾花数据集散点图

来源:花匠小妙招 时间:2025-05-13 18:24

现在的通义灵码不但全面支持 Qwen3,还支持配置自己的 MCP 工具,还没体验过的小伙伴,马上配置起来啦~

 https://click.aliyun.com/m/1000403618/

用Python绘制鸢尾花数据集散点图

鸢尾花(Iris)数据集是机器学习和数据科学领域中最著名的数据集之一,它广泛用于分类算法的测试和评估。该数据集包含150个样本,分别属于三个不同的鸢尾花品种:Setosa、Versicolor和Virginica。每个样本都有四个特征,分别是花萼长度、花萼宽度、花瓣长度和花瓣宽度。本文将通过Python绘制鸢尾花数据集的散点图,以帮助读者更好地理解数据集的特征和分布情况。

1. 数据加载

我们首先需要加载鸢尾花数据集。Python的sklearn库提供了方便的接口来获取此数据集。我们将使用pandas库来处理数据并进行可视化。

import pandas as pd from sklearn.datasets import load_iris # 加载数据集 iris = load_iris() # 将数据集转换为DataFrame iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names) # 添加标签列 iris_df['species'] = iris.target # 将数字标签转换为品种名称 iris_df['species'] = iris_df['species'].replace({0: 'setosa', 1: 'versicolor', 2: 'virginica'}) 1.2.3.4.5.6.7.8.9.10.11.

2. 数据概览

在加载数据后,我们可以使用head()方法查看数据的前几行:

print(iris_df.head()) 1.

这将输出类似于下面的内容:

sepal length (cm) sepal width (cm) petal length (cm) petal width (cm) species 5.1 3.5 1.4 0.2 setosa 4.9 3.0 1.4 0.2 setosa 4.7 3.2 1.3 0.2 setosa 4.6 3.1 1.5 0.2 setosa 5.0 3.6 1.4 0.2 setosa

3. 绘制散点图

为了更直观地展示鸢尾花数据集中的各个类别,我们可以绘制散点图。在这里,我们将选择花萼长度和花瓣长度进行绘制。

首先,我们需要使用matplotlib库来绘图。

import matplotlib.pyplot as plt import seaborn as sns # 设置画布大小 plt.figure(figsize=(10, 6)) # 使用Seaborn绘制散点图 sns.scatterplot(data=iris_df, x='sepal length (cm)', y='petal length (cm)', hue='species', style='species', s=100, palette='deep') # 设置标题和标签 plt.title('Iris Dataset Scatter Plot') plt.xlabel('Sepal Length (cm)') plt.ylabel('Petal Length (cm)') # 显示图例 plt.legend(title='Species') # 显示图形 plt.show() 1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.

运行上述代码后,我们将得到以下的散点图,直观展示了不同鸢尾花品种在花萼长度和花瓣长度上的分布情况。

4. 数据分布分析

在散点图中,我们可以观察到:

Setosa品种的花瓣长度相对较短,且与其他种类明显分开,很容易被识别。 VersicolorVirginica的重叠区域较多,相对来说比较难以区分。

通过这些可视化,我们能够快速了解数据集的特征,从而为后续的机器学习算法提供有效的依据。

4.1 数据特征分项

为了进一步分析,可以绘制一个饼状图来展示三种鸢尾花的比例。

# 计算各品种数量 species_counts = iris_df['species'].value_counts() # 绘制饼状图 plt.figure(figsize=(8, 8)) plt.pie(species_counts, labels=species_counts.index, autopct='%1.1f%%', startangle=140) plt.title('Iris Species Distribution') plt.show() 1.2.3.4.5.6.7.8.

运行代码后将显示一个饼状图,展示各个鸢尾花种类的数量分布。

5. 数据图示示例

以下是使用mermaid语法表示的描述数据关系和分布的图示:

5.1 关系图

IRISstringsepal_lengthstringsepal_widthstringpetal_lengthstringpetal_widthstringspecies

5.2 饼状图

Iris Species Distribution

33%33%33%Iris Species DistributionSetosaVersicolorVirginica

结论

通过本文的讲解,我们学习了如何用Python中的pandas, matplotlib和seaborn库对鸢尾花数据集进行加载、处理和可视化。绘制的散点图和饼状图帮助我们深入理解了数据集的结构和各个物种的分布情况。这些可视化技术在数据科学中是非常重要的,它让我们更直观地更好地理解数据内在的规律。希望这篇文章能对你在数据分析的学习和应用中提供一些帮助!

现在的通义灵码不但全面支持 Qwen3,还支持配置自己的 MCP 工具,还没体验过的小伙伴,马上配置起来啦~

 https://click.aliyun.com/m/1000403618/

相关知识

python 鸢尾花数据集下载
鸢尾花数据集如何可视化
Python数据分析项目实例3:使用matplotlib散点图分析鸢尾花(Iris)数据集
python鸢尾花数据集机器学习
数据可视化——鸢尾花数据集的分析与散点图的绘制
python库提供的鸢尾花数据集下载
鸢尾花Python数据分析
在python中如何调用鸢尾花数据集 – PingCode
python 怎么加载鸢尾花数据
python根据品种散点图鸢尾花

网址: python绘制鸢尾花数据集散点图 https://www.huajiangbk.com/newsview1947033.html

所属分类:花卉
上一篇: 【数据挖掘】数据预处理——以鸢尾
下一篇: 针对鸢尾花数据集进行处理并实现二

推荐分享