数据分析经典案例
鸢尾花(iris)数据集分析
Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例。数据集内包含 3 类共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度,可以通过这4个特征预测鸢尾花卉属于(iris-setosa, iris-versicolour, iris-virginica)中的哪一品种。
据说在现实中,这三种花的基本判别依据其实是种子(因为花瓣非常容易枯萎)。
0 准备数据
下面对 iris 进行探索性分析,首先导入相关包和数据集:
import numpy as np
import pandas as pd from pandas import plotting %matplotlib inline import matplotlib.pyplot as plt plt.style.use('seaborn') import seaborn as sns sns.set_style("whitegrid") from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split from sklearn.preprocessing import LabelEncoder from sklearn.neighbors import KNeighborsClassifier from sklearn import svm from sklearn import metrics from sklearn.tree import DecisionTreeClassifier
iris = pd.read_csv('F:pydatadatasetkaggleiris.csv', usecols=[1, 2, 3, 4, 5])
查看数据集信息:
iris.info()
<class 'pandas.core.frame.DataFrame'> RangeIndex: 150 entries, 0 to 149 Data columns (total 5 columns): SepalLengthCm 150 non-null float64 SepalWidthCm 150 non-null float64 PetalLengthCm 150 non-null float64 PetalWidthCm 150 non-null float64 Species 150 non-null object dtypes: float64(4), object(1) memory usage: 5.9+ KB
查看数据集的头 5 条记录:
iris.head()

1 探索性分析
先查看数据集各特征列的摘要统计信息:
iris.describe()

通过Violinplot 和 Pointplot,分别从数据分布和斜率,观察各特征与品种之间的关系:
相关知识
R语言数据分析案例:鸢尾花(IRIS)
农业大数据应用经典案例
全球十大农业大数据经典案例
文化营销经典案例范例6篇
Java十大经典案例源码解析与实战应用
花卉市场数据分析怎么写的
涉农企业经营管理案例分析1篇
庭院造景经典案例之庭院绿荫。庭院绿荫经典案例欣赏!
花海经典设计案例
微博营销案例分析
原文链接: 数据分析经典案例 https://www.huajiangbk.com/newsview546423.html
| 上一篇: 利用 ChiMerge 分析鸢尾... | 下一篇: 15 鸢尾花(iris)数据集分... |
推荐分享

- 1明日花キララ:明日花绮罗年度... 23331
- 2明日花キララ(明日花绮罗)经... 13661
- 3家庭养花知识大全 家庭养花有... 9072
- 4家庭养花风水知识 家庭养花“... 8788
- 5兰花叶子扭的是什么兰 8721
- 6君子兰什么品种最名贵 十大名... 8007
- 7五月天婷婷开心六月丁香:音乐... 7703
- 8十大致癌花卉排行榜,哪些花卉... 7671
- 9秋天养花,掌握这5点养花知识... 7357
- 10【花卉知识 】养花须知:新手... 6959




