首页 分享 Kaggle

Kaggle

来源:花匠小妙招 时间:2024-11-03 13:31

花朵分类任务-1

1. 图像数据的获取和转换

1.1 文件

文件格式:

Input/flowers/category_name[ ]/image ------------------------------------ data/train/category_name[ ]/image data/test/category_name[ ]/image data/valid/category_name[ ]/image 12345 原始图片存在Input,再建一个data文件夹 category_name[ ]意思是分别创建5个类别文件夹 1.2 数据集的划分 具体思路为:先读取Input中某一类图片的地址images[ ],再打乱顺序random.shuffle,划分好数据集train_valid_test
得到train_images, valid_images, test_images,再将其送入data中对应的某一类的文件夹中 categories = [‘daisy’, ‘dandelion’, ‘rose’, ‘sunflower’, ‘tulip’] # 为类别标签str total_images = [769, 1052, 784, 734, 984] # 五类图片数量 代码如下:

total_images = [] for category in categories: #对某一类 images = os.listdir("{}/{}".format(base_dir, category)) #返回某一类的图片地址 list random.shuffle(images) #打乱顺序 filtered_images = [image for image in images if image not in ['flickr.py', 'flickr.pyc', 'run_me.py']] #过滤出某一类所有纯图片 total_images.append(len(filtered_images)) #list,每一类图片的数量 #从原始文件夹flowers拷贝到data,并且根据比例划分 train_images, valid_images, test_images = train_valid_test(filtered_images) #拷贝图片 copy_files(train_images, "{}/{}".format(base_dir, category), "./data/train/{}".format(category)) copy_files(valid_images, "{}/{}".format(base_dir, category), "./data/valid/{}".format(category)) copy_files(test_images, "{}/{}".format(base_dir, category), "./data/test/{}".format(category)) plot_images(category, images[:5]) #显示前五张,每次都是随机的 123456789101112131415 说实话,这种图片划分方式有点乱,没有第二个任务来的清楚 第一种:先将图片打乱,按照所属的文件夹分好,再转换格式 第二种:直接顺序读取,再利用函数划分数据集 1.3 可视化每类图片的数量

#绘制条形图 y_pos = np.arange(len(categories)) plt.bar(y_pos, height=total_images, width=0.2,color='b',align='center') #x轴的label plt.xticks(y_pos, categories) #y轴的label plt.ylabel("Image count") plt.title("Image count in different categories") #显示 plt.show() 12345678910

直方图

1.3 数据的编码

此时还是图片形式躺在文件夹中

使用load_dataset()得到每一类的图片地址(如:train_files)和标签的编码 再将train_files(此时元素还是图片地址)变为4D-tensor 代码如下:

#将一张图片转换成4维的tensor 1

相关知识

如何在Kaggle上打比赛,带你进行一次完整流程体验
【深度学习TPU+Keras+Tensorflow+EfficientNetB7】kaggle竞赛 使用TPU对104种花朵进行分类 第十八次尝试 99.9%准确率
从0上手Kaggle图像分类挑战:冠军解决方案详解
植物病害识别数据集
Flowers102花分类的数据下载和处理
二十、农作物病虫害识别模型
物种灭绝的原因
利用VGG16做花数据集的识别
Kaggle时间序列(Time Series)教程 3
基于YOLO的植物病害识别系统:从训练到部署全攻略

网址: Kaggle https://www.huajiangbk.com/newsview343157.html

所属分类:花卉
上一篇: 使用K
下一篇: Knn算法实现鸢尾花分类

推荐分享