首页分享机器学习（1）机器学习基础 && 鸢尾花数据集

机器学习（1）机器学习基础 && 鸢尾花数据集

来源：花匠小妙招时间：2024-12-31 21:21

最新推荐文章于 2024-10-20 21:33:37 发布

_(*^▽^*)_ 于 2021-09-07 19:48:10 发布

一、机器学习基础理论

1、机器学习过程

2、机器学习分类

3、数据集返回值介绍

二、鸢尾花数据集（实战）

1、首先是获取数据集

2、显示数据集信息（可以不要）

三、数据集划分

1、数据集划分API

2、代码及效果

总代码

一、机器学习基础理论

1、机器学习过程

获取数据数据处理特征工程（特征值、目标值）(包括标准化)算法训练 -> 得到模型模型评估

2、机器学习分类（有监督/无监督）

学习阶段可用数据集：

sklearn、kaggle、UCI

3、数据集返回值介绍

load返回小数据集，fetch返回大数据集。

返回datasets.base.Bunch数据类型（字典格式）

标签（target）：目标值

特征（data）：特征值

返回方式1：dict['key']

返回方式2：dict.key

二、鸢尾花数据集（实战）

以上三种鸢尾花，分别为鸢尾花的三个标签。

1、首先是获取数据集

iris = load_iris()

2、显示数据集信息（可以不要）

Show_Data()

def Show_Data():

print('鸢尾花数据集nn', iris)

三、数据集划分

为了给后面的模型评估留下数据，这里只能选取一部分数据进行模型训练。

1、数据集划分API

sklearn.model_selection.train_test_split

返回：训练集特征值、测试集特征值、训练集目标值、测试集目标值。

2、代码及效果

def Data_Split():

train_data, test_data, train_target, test_target = train_test_split(iris.data, iris.target, test_size=0.2)

print('训练集特征值：', train_data.shape)

print('测试集特征值：', test_data.shape)

print('训练集目标值：', train_target.shape)

print('测试集目标值：', test_target.shape)

总代码

import cv2

from sklearn.datasets import load_iris

from sklearn.model_selection import train_test_split

def Show_Data():

print('鸢尾花数据集nn', iris)

def Data_Split():

train_data, test_data, train_target, test_target = train_test_split(iris.data, iris.target, test_size=0.2)

print('训练集特征值：', train_data.shape)

print('测试集特征值：', test_data.shape)

print('训练集目标值：', train_target.shape)

print('测试集目标值：', test_target.shape)

if __name__ == '__main__':

iris = load_iris()

Data_Split()

推荐分享

家庭养花风水知识家庭养花“五行说”

家庭养花知识大全家庭养花有什么好处

秋天养花，掌握这5点养花知识，正确管理花卉，让花健康生长

【花卉知识】养花须知：新手养花的选购技巧，不要当冤大头！

【花卉知识】养花须知：新手...

秋天养花，掌握这5点养花知识...

家庭养花知识大全家庭养花有...

家庭养花风水知识家庭养花“...

即时知识

精选专栏

君子兰什么品种最名贵十大名...

丝瓜打顶时间及方法步骤(图解...

河北10个最好玉米品种