作物病虫害识别数据集资源合集
朋友们,今天分享一些公开的农作物病虫害识别数据集。病虫害是病害和虫害的并称,常对农、林、牧业等造成不良影响。本文介绍分为病害数据集和虫害数据集两部分。这些数据集用于图像分类系统。
1 病害识别数据集1.1 农业病虫害研究图库(IDADP)1.1.1 介绍1.1.2 论文1.1.3 数据获取1.2 AI Challenger 2018 病虫害分类数据集1.2.1 介绍1.2.2 数据获取1.3 Plant-Village数据集1.3.1 介绍1.3.2 论文1.3.3 数据获取1.4 苹果叶片病理数据集1.4.1 介绍1.4.2 论文1.4.3 数据获取1.5 水稻叶片病害数据集 Rice Leaf Disease Image Samples1.5.2 论文1.5.3 数据获取1.6 LWDCD 2020 小麦病害数据集1.6.1 介绍1.6.2 论文1.6.3 数据获取1.7 小麦叶片数据集 Wheat Leaf Dataset1.7.1 介绍1.7.2 数据获取1.8 CGIAR 小麦病害数据集1.8.1 介绍1.8.2 数据获取2 虫害识别数据集2.1 IDADP农业病虫害研究图库(IDADP)2.2 IP102数据集2.2.1 介绍2.2.2 论文2.2.3 数据获取3 结束语1 病害识别数据集
1.1 农业病虫害研究图库(IDADP)
1.1.1 介绍
农业病虫害研究图库(IDADP)http://www.icgroupcas.cn/website_bchtk/index.html 由中国科学院合肥智能机械研究所牵头、联合亚热带农业生态研究所、遥感与数字地球研究所建设,整合了大量的农业病虫害图像样本资源,每种病虫害具有几百到几千张高质量图像,可为病虫害图像识别研究提供机器学习建模所需的样本 。
面向农业图像理解的机器学习数据集是以农业病虫害研究图库(IDADP)为基础建设而成的综合数据库。整合了大量的农业本体和病虫害高质量图像/文本/视频样本资源,为农业本体/病虫害认知研究提供机器学习建模所需的样本数据,形成面向农业图像理解关键技术研究的基础资源。
据我所知,该数据集数量最大,作物类别、病虫害类别最齐全,数据量超过200G。囊括了水稻、小麦、玉米、大豆、棉花、黄瓜、番茄、葡萄、猕猴桃、梨树、豇豆、西瓜、甜瓜等作物。以水稻为例,提供了水稻白叶枯病、水稻稻曲病、水稻稻瘟病、水稻胡麻斑病、水稻纹枯病、水稻细菌性条斑病等病害,东方蝼蛄、盾蝽、稻飞虱、稻蝗、稻棘缘蝽、稻绿蝽、稻纵卷叶螟、二化螟、二星蝽、麻皮蝽、水稻大螟、甜菜白带野螟、中华剑角蝗等十几种虫害的数据。
1.1.2 论文
大田作物病害识别研究图像数据集 http://www.csdata.org/p/290/1/
1.1.3 数据获取
IDADP数据官网http://www.icgroupcas.cn/website_bchtk/index.html。
虽然该数据集发表了论文,但是我没有发现该论文的数据集的下载方式,如需获取数据,需要在IDADP官网联系作者。
另外IDADP官网提供了部分样例数据下载。
1.2 AI Challenger 2018 病虫害分类数据集
1.2.1 介绍
这个数据集是AI Challenger 2018竞赛的数据,是农作物叶子图像的数据集,标注图片5万张,包含10种植物(苹果、樱桃、葡萄、柑桔、桃、草莓、番茄、辣椒、玉米、马铃薯)的27种病害,合计61个分类(按“物种-病害-程度”分)。具体分类见下表。
Label IDLabel Name0apple healthy(苹果健康)1Apple_Scab general(苹果黑星病一般)2Apple_Scab serious(苹果黑星病严重)3Apple Frogeye Spot(苹果灰斑病)4Cedar Apple Rust general(苹果雪松锈病一般)5Cedar Apple Rust serious(苹果雪松锈病严重)6Cherry healthy(樱桃健康)7Cherry_Powdery Mildew general(樱桃白粉病一般)8Cherry_Powdery Mildew serious(樱桃白粉病严重)9Corn healthy(玉米健康)10Cercospora zeaemaydis Tehon and Daniels general(玉米灰斑病一般)11Cercospora zeaemaydis Tehon and Daniels serious(玉米灰斑病严重)12Puccinia polysora general(玉米锈病一般)13Puccinia polysora serious(玉米锈病严重)14Corn Curvularia leaf spot fungus general(玉米叶斑病一般)15Corn Curvularia leaf spot fungus serious(玉米叶斑病严重)16Maize dwarf mosaic virus(玉米花叶病毒病)17Grape heathy(葡萄健康)18Grape Black Rot Fungus general(葡萄黑腐病一般)19Grape Black Rot Fungus serious(葡萄黑腐病严重)20Grape Black Measles Fungus general(葡萄轮斑病一般)21Grape Black Measles Fungus serious(葡萄轮斑病严重)22Grape Leaf Blight Fungus general(葡萄褐斑病一般)23Grape Leaf Blight Fungus serious(葡萄褐斑病严重)24Citrus healthy(柑桔健康)25Citrus Greening June general(柑桔黄龙病一般)26Citrus Greening June serious(柑桔黄龙病严重)27Peach healthy(桃健康)28Peach_Bacterial Spot general(桃疮痂病一般)29Peach_Bacterial Spot serious(桃疮痂病严重)30Pepper healthy(辣椒健康)31Pepper scab general(辣椒疮痂病一般)32Pepper scab serious(辣椒疮痂病严重)33Potato healthy(马铃薯健康)34Potato_Early Blight Fungus general(马铃薯早疫病一般)35Potato_Early Blight Fungus serious(马铃薯早疫病严重)36Potato_Late Blight Fungus general(马铃薯晚疫病一般)37Potato_Late Blight Fungus serious(马铃薯晚疫病严重)38Strawberry healthy(草莓健康)39Strawberry_Scorch general(草莓叶枯病一般)40Strawberry_Scorch serious(草莓叶枯病严重)41Tomato healthy(番茄健康)42tomato powdery mildew general(番茄白粉病一般)43tomato powdery mildew serious(番茄白粉病严重)44Tomato Bacterial Spot Bacteria general(番茄疮痂病一般)45Tomato Bacterial Spot Bacteria serious(番茄疮痂病严重)46Tomato_Early Blight Fungus general(番茄早疫病一般)47Tomato_Early Blight Fungus serious(番茄早疫病严重)48Tomato_Late Blight Water Mold general(番茄晚疫病菌一般)49Tomato_Late Blight Water Mold serious(番茄晚疫病菌严重)50Tomato_Leaf Mold Fungus general(番茄叶霉病一般)51Tomato_Leaf Mold Fungus serious(番茄叶霉病严重)52Tomato Target Spot Bacteria general(番茄斑点病一般)53Tomato Target Spot Bacteria serious(番茄斑点病严重)54Tomato_Septoria Leaf Spot Fungus general(番茄斑枯病一般)55Tomato_Septoria Leaf Spot Fungus serious(番茄斑枯病严重)56Tomato Spider Mite Damage general(番茄红蜘蛛损伤一般)57Tomato Spider Mite Damage serious(番茄红蜘蛛损伤严重)58Tomato YLCV Virus general(番茄黄化曲叶病毒病一般)59Tomato YLCV Virus serious(番茄黄化曲叶病毒病严重)60Tomato Tomv(番茄花叶病毒病)部分数据截图如下。
1.2.2 数据获取
该数据可在AI Studio上直接下载,链接
https://aistudio.baidu.com/aistudio/datasetdetail/76075
1.3 Plant-Village数据集
1.3.1 介绍
PlantVillage 数据集包括 54303张健康和病害图片,分为38个类别。听说AI Challenger2018数据集是在此数据集的基础上制作的。
Label IDLabel Name1Apple_scab2Apple_black_rot3Apple_cedar_apple_rust4Apple_healthy5Background_without_leaves6Blueberry_healthy7Cherry_powdery_mildew8Cherry_healthy9Corn_gray_leaf_spot10Corn_common_rust11Corn_northern_leaf_blight12Corn_healthy13Grape_black_rot14Grape_black_measles15Grape_leaf_blight16Grape_healthy17Orange_haunglongbing18Peach_bacterial_spot19Peach_healthy20Pepper_bacterial_spot21Pepper_healthy22Potato_early_blight23Potato_healthy24Potato_late_blight25Raspberry_healthy26Soybean_healthy27Squash_powdery_mildew28Strawberry_healthy29Strawberry_leaf_scorch30Tomato_bacterial_spot31Tomato_early_blight32Tomato_healthy33Tomato_late_blight34Tomato_leaf_mold35Tomato_septoria_leaf_spot36Tomato_spider_mites_two-spotted_spider_mite37Tomato_target_spot38Tomato_mosaic_virus39Tomato_yellow_leaf_curl_virus1.3.2 论文
该数据集论文链接 https://arxiv.org/abs/1511.08060.
1.3.3 数据获取
(1)mendeley下载:https://data.mendeley.com/datasets/tywbtsjrjv/1
(2)github下载: https://github.com/spMohanty/PlantVillage-Dataset
1.4 苹果叶片病理数据集
1.4.1 介绍
此数据集只针对苹果叶片。
苹果叶片病理数据集数据集由西北农林科技大学制作,分别在西北农林科技大学白水苹果试验站、洛川苹果试验站和庆城苹果试验站进行的采集。 数据集主要在晴天光线良好的条件下获取, 部分图像在阴雨天进行采集,不同的采集条件进一步增强了数据集的多样性。 数据集包括斑点落叶病、褐斑病、花叶病、灰斑病以及锈病等五种常见的苹果叶面病理图像数据,数量分别为: 斑点落叶病 5343 张,褐斑病5655 张, 灰斑病 4810 张,花叶病 4875 张, 锈病 5694 张,共有20000余张图像。
该数据集是在经过翻转、对比度等12种数据增强的基础上建立的,所以数据量比较大,而原始图片应该是1591张,如果我没有算错的话(20683 / 13)。
1.4.2 论文
[1]周敏敏. 基于迁移学习的苹果叶面病害Android检测系统研究[D].西北农林科技大学,2019.
1.4.3 数据获取
该数据可在AI Studio上直接下载,链接https://aistudio.baidu.com/aistudio/datasetdetail/11591
1.5 水稻叶片病害数据集 Rice Leaf Disease Image Samples
包含 5932张图片,4类水稻叶片病害,包括白叶枯病、稻瘟病、东格鲁病、褐斑病。
1.5.2 论文
Sethy, P. K., Barpanda, N. K., Rath, A. K., & Behera, S. K. (2020). Deep feature based rice leaf disease identification using support vector machine. Computers and Electronics in Agriculture, 175, 105527. doi:10.1016/j.compag.2020.105527.
1.5.3 数据获取
https://data.mendeley.com/datasets/fwcj7stb8r/1
1.6 LWDCD 2020 小麦病害数据集
1.6.1 介绍
Large Wheat Disease Classification Dataset (LWDCD) 小麦病害分类数据集,包含12000张照片,其中9个病害类别和1个健康类别。
小麦病害类别图片数量Karnal bunt1150Black Chaff1100Crown and Root Rot1040Fusarium Head Blight1270Healthy Wheat1280Leaf Rust1620Powdery Mildew1230Tan Spot1220Wheat Loose Smut1100Wheat Streak Mosaic11501.6.2 论文
名称:Leaf and spike wheat disease detection & classification using an improved deep convolutional architecture
链接:https://www.sciencedirect.com/science/article/pii/S2352914821001313
1.6.3 数据获取
论文没有直接提供数据集下载链接。但是在网上只搜到了一部分的数据集,只包含4500张照片,四个类别,分别是Healthy Wheat、Leaf Rust、Crown and Root Rot、Wheat Loose Smut。谷歌云盘下载链接:
https://drive.google.com/drive/folders/1OHKtwD1UrdmhqxrpQEeF_X_pqKotxRGD
1.7 小麦叶片数据集 Wheat Leaf Dataset
1.7.1 介绍
小麦叶片数据集,包含102张健康叶片、208张条锈病、97张Septoria Disease。这个数据不管从类别数量还是图片数量来说都比较少,可以作为其他数据的一个补充。
1.7.2 数据获取
mendeley下载:https://data.mendeley.com/datasets/wgd66f8n6h/1
1.8 CGIAR 小麦病害数据集
1.8.1 介绍
CGIAR Computer Vision for Crop Disease是kaggle比赛的一个数据集,只包含三类,分别是healthy, stem rust, leaf rust,共876张照片。该数据集比较小,可以作为其他数据的一个补充。
1.8.2 数据获取
kaggle链接:https://www.kaggle.com/shadabhussain/cgiar-computer-vision-for-crop-disease
2 虫害识别数据集
2.1 IDADP农业病虫害研究图库(IDADP)
农业病虫害研究图库(IDADP)http://www.icgroupcas.cn/website_bchtk/index.html。该数据在1.1章节介绍过,这里不再赘述。
2.2 IP102数据集
2.2.1 介绍
IP102 是一个用于目标分类与检测任务的农作物病虫害数据集。 102指102个虫害类别。
它包含了水稻、玉米、小麦、甜菜、苜蓿、葡萄、柑橘 、芒果共8种作物的75000 多幅图像,这些图像呈现出自然的长尾分布(long-tailed distribution)。此外,为大约19000 幅图像添加了用于对象检测的边界框。 前五种作物为大田作物(FC, field crops),后三种为经济作物(EC,economic crops)。
数据收集与注释分为分类系统建立、图像采集、初步数据过滤、专业数据注释四大步骤,这些介绍来自(https://blog.csdn.net/qq_43723025/article/details/115900568)
(1)分类系统建立:IP102数据集有一个层次分类系统。它们呈现出如图4所示的分层结构。根据遭受虫害的作物,给每种虫害分配一个高级别类别(在下文中称为超类)。换句话说,每种害虫都是某个超类的一个下级类(在下文中表示为子类)。比如稻秆蛆这种害虫损害了水稻这种作物,水稻属于大田作物。因此,在IP102的分类系统中,稻秆蛆亚类具有水稻和大田作物的超类。
(2)图像采集:利用互联网广泛收集数据,如:ImageNet、COCO等;第一步,依靠常见的图像搜索引擎,包括Google、Flickr、Bing等,使用每个子类的英文名称和对应的同义词作为查询关键字,每个关键字只保留2000个结果;第二步,从几个专业的农业和昆虫科学网站上搜索;除了图像形式,还收集了包含害虫内容的视频剪辑,从视频剪辑中,我们以每秒5帧的速度捕捉图像。因此,为IP102数据集收集了300,000多幅候选图像。
(3)初步数据过滤:我们组织了6名志愿者手动过滤候选图像。在数据过滤之前,他们接受三部分培训内容,即:1)农业专家对害虫的常识,2)IP102的分类系统,3)不同形式的害虫。例如,图2显示了四种形式的害虫,包括卵、幼虫、蛹和成虫。即使它们处于生命周期的不同阶段,但它们都会对农产品造成不同程度的损害。在初步数据过滤的过程中,志愿者删除不包含或包含一个以上虫害类别的图像,如图2所示。然后,我们将过滤后的图像格式转换为JPEG格式,并删除重复或损坏的图像。最后,我们有大约120,000个带有查询关键字弱标签的图像。超类的标签是根据IP102数据集的分类系统分配的。
(4)专业数据注释:数据注释:第一阶段是独立注释,每个专家注释一个超类;第二阶段是协同注释,每个专家对每一个子类都进行注释,最后协同起来,若一个图像样本得到了5个或者5个以上的专家统一注释,那么这个图像就属于某个类别,否则将会被删除。
类别代码和名称如下表。 (害虫中文由本人友情翻译,可能会不准确,建议以英文为主)
论文的数据集图片示例,由于原图可能会引起部分观众的不适,这里做了一些模糊处理。 详情参考论文。
2.2.2 论文
名称:IP102: A Large-Scale Benchmark Dataset for Insect Pest Recognition
链接:https://ieeexplore.ieee.org/document/8954351
2.2.3 数据获取
论文作者的github上会给出链接https://github.com/xpwu95/IP102,谷歌云盘下载地址:https://drive.google.com/drive/folders/1svFSy2Da3cVMvekBwe13mzyx38XZ9xWo
3 结束语
好朋友们,以上就是本次分享的全部内容了,更多数据集可参考一篇综述论文:https://www.researchgate.net/publication/349572585_Plant_diseases_and_pests_detection_based_on_deep_learning_a_review
您的支持使我在寒冬里倍感温暖,欢迎转载、分享、点赞。
相关知识
深度学习植物叶子病虫害数据集:助力农业智能化的强大资源
【果树林木病虫害数据集】 果树病虫害检测 林木叶片病虫害识别 计算机视觉(含数据集)
YOLO识别病虫害数据集
助力农业智能化:YOLO病虫害识别数据集推荐
深度学习——植物、农作物图像数据集大合集(二)
作物病虫害识别监测的方法有哪些
高效农作物病虫害识别:Python项目源码及数据集教程
深度学习花卉识别:Python数据集解析
flower花朵识别数据集
六项作物病虫害识别监测农研最新进展
网址: 作物病虫害识别数据集资源合集 https://www.huajiangbk.com/newsview394882.html
上一篇: CLARINS 娇韵诗 兰花面部 |
下一篇: 基于CNN的番茄叶片病虫害识别技 |
推荐分享

- 1君子兰什么品种最名贵 十大名 4012
- 2世界上最名贵的10种兰花图片 3364
- 3花圈挽联怎么写? 3286
- 4迷信说家里不能放假花 家里摆 1878
- 5香山红叶什么时候红 1493
- 6花的意思,花的解释,花的拼音 1210
- 7教师节送什么花最合适 1167
- 8勿忘我花图片 1103
- 9橄榄枝的象征意义 1093
- 10洛阳的市花 1039