首页 分享 基于朴素贝叶斯网络的iris鸢尾花数据集分类到新闻分类

基于朴素贝叶斯网络的iris鸢尾花数据集分类到新闻分类

来源:花匠小妙招 时间:2025-05-13 18:23

最新推荐文章于 2024-10-12 22:54:16 发布

小小小小U 于 2020-04-26 01:41:22 发布

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

本文通过python实现朴素贝叶斯网络,首先用iris鸢尾花数据集进行预实验,揭示数据量对模型预测的影响。随后,文章介绍如何对新闻文本进行预处理,利用TF模型进行向量化,并应用朴素贝叶斯进行分类,对比TF-IDF向量化的预测效果。实验结果显示,朴素贝叶斯在离散数据上的表现优于连续数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本篇文章是对最简单的朴素贝叶斯网络的运用进行python实践,先对iris鸢尾花数据集做一个分类预实验,再对实际新闻进行分类预测
有关贝叶斯网络原理可以查看这篇文章 :贝叶斯网络基础

一、iris鸢尾花数据集分类
1、开头先导入相关模块:

import matplotlib.pyplot as plt # 绘图 from sklearn.datasets import load_iris #导入鸢尾花集 from sklearn.model_selection import train_test_split #对数据集进行切分 from sklearn.naive_bayes import MultinomialNB # 朴素贝叶斯网络模型 1234

2、导入鸢尾花数据集:

X = load_iris().data # 数据集 Y = load_iris().target # 相应类别标签 12

鸢尾花数据集一共有150行,每一行代表一个鸢尾花的一些属性,比如花瓣长度、花瓣宽度等;数据集中一共有3类,所有标签类别为0 1 2

数据集data(没有展现完)
在这里插入图片描述
类别标签:
在这里插入图片描述
3、鸢尾花数据集分类

X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.2, random_state=0) #将数据集按照 训练集比测试集为8:2的比例随机拆分数据集 clf = MultinomialNB() # 建立朴素贝叶斯网络 clf.fit(X_train, y_train) # 带入训练集训练模型 pre = clf.predict(X_test) # 预测测试集中特征矩阵所属的类别 print('预测集标签') print(y_test) print('预测结果') print(pre) 12345678910

打印出来看看,预测标签和预测结果有很多不吻合的
在这里插入图片描述
4、计算预测结果

N = len

相关知识

基于朴素贝叶斯的鸢尾花数据集分类
朴素贝叶斯算法对鸢尾花分类
朴素贝叶斯对鸢尾花数据集进行分类
鸢尾花数据集分类(决策树,朴素贝叶斯,人工神经网络)
机器学习实验:朴素贝叶斯算法实现对iris鸢尾花数据集的分类
朴素贝叶斯分类(鸢尾花数据集)
R语言朴素贝叶斯Naive Bayes分类Iris鸢尾花和HairEyeColor学生性别和眼睛头发颜色数据
贝叶斯算法实战:从原理到鸢尾花数据集分类
高斯朴素贝叶斯方法进行鸢尾花分类
基于机器学习的鸢尾花数据集的三分类算法的实现 C++

网址: 基于朴素贝叶斯网络的iris鸢尾花数据集分类到新闻分类 https://www.huajiangbk.com/newsview1947022.html

所属分类:花卉
上一篇: 人工智能之数据预处理(以Iris
下一篇: python导入鸢尾花数据集

推荐分享