苏州画廊网站建设,服饰网站建设规划书,学设计师学费要多少钱,做网站什么服务器好来源#xff1a;投稿 作者#xff1a;LSC 编辑#xff1a;学姐 比赛官网:
https://www.dataglobal.cn/cmpt/signUpInfo200.html
任务描述
请参赛者设计智慧农业病虫害检测系统#xff0c;给出一体化问题解决方案#xff0c;鼓励参赛选手结合某一果园/农作物实际情况建立… 来源投稿 作者LSC 编辑学姐 比赛官网:
https://www.dataglobal.cn/cmpt/signUpInfo200.html
任务描述
请参赛者设计智慧农业病虫害检测系统给出一体化问题解决方案鼓励参赛选手结合某一果园/农作物实际情况建立自身方案。
基于主办方或公开数据集提供的农作物叶子图像数据构建病虫害辨识模型准确辨识农作物及病虫害种类为农户积极防御病虫害提供合理化建议解决智慧果园病虫害辨识问题。
任务目标 (1)智慧农业病虫害精准辨识方法必要 (2)智慧农业病虫害检测系统必要 (3)模型测试验证结果加分项 (4)配套代码注释与必要的文档说明加分项。 赛题是一个图像分类问题数据集分布类似下图(原数据集找不到了赛后没有保存官网也没有了): 每个文件夹里面包含每个类别的图像
总体方案
针对智慧农业病虫害精准辨识方案一般通过数据挖掘、计算机视觉等技术采用特定的算法和数据模型对农业病虫害的图像进行广泛挖掘和深度匹配以获得准确有效的数据特征。因此我们主要选择先进的深度学习图像分类模型框架共计三种分类模型实现病虫害辨识分别为Paddle的专门图像分类套件Paddlex和Paddleclas实现和人工智能深度学习框架Pytorch图像分类套件MMClassification。
方案流程主要包括图片数据预处理、模型选择、模型训练及测试、指标评估等流程反复观察实验结果经过多次调参及预训练最终模型分类精度可以达到100%本次方案流程图如下。为了使得图片智能识别更精准我们需要大量的农作物虫害病症的图片样本采集。 图片数据预处理
1针对本次智慧农业病虫害数据集图片总共分为3类对应命名分类标签经观察发现每种类别数量均衡且都是400多张。另外本次图片数据集分辨率高像素清晰容易辨别。因此无需更多数据增强操作应用大部分经典模型都能取得不错的效果。
2由于在服务器上跑模型的时候是基于ubuntu系统所以解压题目数据后用zip压缩文件并重新命名agri_pest.zip。
3数据操作: 统一随机打乱数据集并且按照按9:1划分训练集和验证集。
模型选择
使用Paddlex 官网链接: https://github.com/PaddlePaddle/PaddleX
Paddlex是一个集成图像分类、目标检测、实例分割、语义分割的套件使用简便封装了很多训练方法和会自动加载经典的预训练模型权重。
首先对图片进行预处理操作并随机打乱数据。
其次考虑实验精度及速度本次模型选择带有知识蒸馏的ResNet101_vd_ssld模型结合使用标签平滑、早停等训练技巧。
最后经过多次实验尝试对原始的学习率进行修改及调整学习率衰减策略实验以准确率为评价指标最终准确率达到100%。
每张图片文件对应分类结果其中0为Healthy、1为Powdery、 2为Rust将结果导出result.txt下同。
第一轮验证集准确率就达到98%第二轮训练集的准确率达到100%如下图所示: 第三轮验证集准确率达100%如下图所示: 本次实验将最好的模型权重已经保存在百度网盘上代码文件及说明见main.ipynb、数据文件、结果文件result.txt见附件Paddlex文件夹。
使用Paddleclas
PaddleClas图像分类套件包括模型开发、训练、压缩、部署全流程助力开发者更好的开发和应用图像分类模型。PaddleClas同时提供服务器端模型与端侧轻量化模型来支撑不同的应用场景为确保最终识别精度选择PaddleClas提供的SWinTransformer模型。
1官网下载套件: https://github.com/PaddlePaddle/PaddleClas 根据文档 https://github.com/PaddlePaddle/PaddleClas/blob/release/2.5/docs/zh_CN/models/ImageNet1k/model_list.md#ViTDeiT
选择在imagenet上精确度最高的CSWinTransformer_large_384网络。
2修改配置文件CSWinTransformer_large_384.yaml修改相关参数数据集路径、训练轮数、预训练模型权重等参数与结果如附件所示。
3由于数据量比较少模型强大为了节约时间、算力和避免过拟合提前终止训练流程。训练3个epoch后验证集准确率高达100%如下图所示: 部分测试集推理结果如下: 全部测试集推理结果如result.txt所示。代码main.ipynb、数据处理文件、配置文件见附件PaddleClas文件夹。
使用MMClassification
第三种方案使用MMClassification它是一款基于 PyTorch 的开源图像分类工具箱, 集成了常用的图像分类网络将数据加载模型骨架训练调参流程等封装为模块调用便于在模型间进行转换和比较高效简洁的实现了参数调整。
同上述两种方案本方案最新最强大的中的swin_transformer模型由于模型权重大及环境限制保存结果占据空间比较多本次实验只训练20轮其中模型效果最好的是第19轮最终在验证集效果达到87.2%如下图所示 由于训练时间及服务器环境限制本模型没有进一步调优后续如果有幸能进入决赛会进一步优化。
代码train.ipynb、测试集结果result.json等在附件MMClassification中。
代码都保存在code.zip文件中。
模型总结和后期优化
本系统基于提供的农作物叶子图像数据集构建病虫害辨识模型最终通过三种深度学习分类模型实现最终验证集准确度达到100%以下是模型总结和优化方向。
(1) 本次数据集都是按9:1划分训练集和验证集结合交叉验证的方法训练也可以用全部的数据进行训练模型但是容易过拟合可以使用focal loss、label smooth等策略尽力避免。
(2) 可以使用模型融合、模型投票的策略但是会加大模型权重考虑部署起来不方便。
(3) 在保证数据质量的前提下采集更多的数据集对数据进行增广。增强模型泛化能力。
(4) 针对后期移动端部署可以选择轻量化模型mobilenet等进行训练由于数据量比较少用权重大的模型效果不一定很好网络可能得不到充分的训练。
后续可以对模型进行部署做成一个专门的图像分类检测系统。
本文模型权重数据资料
关注下方卡片《学姐带你玩AI》
回复“模型权重”即可领取
码字不易欢迎大家点赞评论收藏