首页 分享 Pandas入门篇(三)

Pandas入门篇(三)

来源:花匠小妙招 时间:2025-05-13 17:55
目录 概述 一、语法 二、常用单变量绘图 1. 直方图(histplot) 2. 核密度预估图(kdeplot) 3. 计数柱状图(countplot) 三、常用多变量绘图 1.散点图 (1) scatterplot (2)regplot 散点图+拟合回归线 (3)jointplot 散点图+直方图 2.蜂巢图 3. 2D KDE图 4.箱线图(boxplot) 5.小提琴图(violinplot) 四、Seaborn主题和样式 结语

概述

Seaborn是一个基于Matplotlib的Python数据可视化库,它提供了一种简单而美观的界面,帮助初学者轻松创建各种统计图表和数据可视化效果。

Seaborn的设计哲学以美学为中心,致力于创建最佳的数据可视化,同时也保持着与Python生态系统的高度兼容性,可以轻松集成到Python数据分析以及机器学习的工作流程中。Seaborn拥有丰富的可视化函数,能够创建多种类型的图表,包括折线图、柱状图、散点图、核密度图、热力图等等。

相比Matplotlib而言,Seaborn的绘图接口更为集成,通过少量参数设置就能实现大量封装绘图。多数图表具有统计学含义,例如分布、关系、统计、回归等。此外,它对Pandas和Numpy数据类型支持非常友好,风格设置也更为多样,包括风格、绘图环境和颜色配置等。

在进行EDA(Exploratory Data Analysis,探索性数据分析)过程中,Seaborn往往更为高效。然而,需要注意的是,Seaborn与Matplotlib的关系是互为补充而非替代,多数场合中Seaborn是绘图首选,而在某些特定场景下则仍需用Matplotlib进行更为细致的个性化定制。

总的来说,Seaborn是一个功能强大且易于使用的数据可视化库,无论是初学者还是有一定经验的数据分析师,都可以从中获得帮助,更好地理解和展示数据。

一、语法

import seaborn as sns sns.图表类型plot(data=Dataframe, x='列1',y='列2',hue='类别型' ) 12

参数解释:

x, y:
x:指定用于柱状图横坐标的变量名(类别型数据)。
y:指定用于柱状图纵坐标的变量名(数值型数据),即每个类别的值。 data:
指定绘图所需的数据集,通常是一个 pandas DataFrame。 hue:
用于将数据进行分组的变量名。这个变量将决定每个柱子中的不同颜色分段,用于表示另一个分类维度的信息。

二、常用单变量绘图

1. 直方图(histplot)

语法:

sns.histplot(data=Dataframe,x=列,y=列,bins=n,kda=False,hue='分类变量') 1

参数:

data:
要绘制直方图的数据集,通常是一个 pandas DataFrame 或 Series,也可以是其他可以被转换为数组的数据类型。

x, y:
x 和 y 用于指定要绘制直方图的数据列。对于单变量直方图,通常只需要指定 x 参数。如果指定了 y 参数,则绘制的是二维直方图(或称为热图)。

bins:
指定直方图的区间数量。可以是整数(表示区间数量)或区间边界的序列。

kde
是否使用 Kernel Density Estimation (KDE) 来绘制数据的概率密度曲线(核密度预估图)。

hue:
指定用于分组绘制直方图的分类变量。不同组的直方图会以不同的颜色显示。(用于多变量时)

sns.histplot(data=tip,x='total_bill',bins= 10,kde= True) 1

在这里插入图片描述

2. 核密度预估图(kdeplot)

sns.kdeplot(data=tip,x='total_bill') 1

图表展示:
在这里插入图片描述

3. 计数柱状图(countplot)

相关知识

Pandas系列教程(三)
兰花养护(入门篇)
插花基础知识入门篇
兰花的养殖方法(超详细入门篇)
Pandas入门与进阶
电磁兼容(EMC)入门篇之基础知识(一)
【Python】—— pandas 数据分析
五种Pandas图表美化样式汇总
5种Pandas图表美化样式汇总!
关于植物施肥的一些问题,植物小白入门篇

网址: Pandas入门篇(三) https://www.huajiangbk.com/newsview1946813.html

所属分类:花卉
上一篇: 从零开始学习React
下一篇: 鸢尾花分类实践:数据科学作业解析

推荐分享