如何构建一个 CNN 模型,以从图像中对幼苗的种类进行分类?
介绍本文将学习和构建一个 CNN 模型,以从图像中对幼苗的种类进行分类。该数据集有12组图像,我们的最终目的是从图像中对植物物种进行分类。
我们将执行多个步骤,例如导入库和模块、读取图像并调整它们的大小、图像清理、图像预处理、模型构建、模型训练、减少过度拟合,最后对测试数据集进行预测。
目录
问题陈述
导入库
获取数据并调整图像大小
清理图像并去除背景
将标签转换为数字
定义我们的模型并拆分数据集
防止过拟合
定义卷积神经网络
将 CNN 拟合到数据上
混淆矩阵
获得预测
问题陈述
该数据集由奥尔胡斯大学信号处理小组提供。这是一个典型的图像识别问题陈述。我们提供了一个图像数据集,其中包含处于不同生长阶段的植物照片。每张照片都有其唯一的 ID 和文件名。
该数据集包含来自 12 个植物物种的 960 种独特植物。最终目标是构建一个能够从照片中确定植物种类的分类器。
物种列表
Black-grass
Charlock
Cleavers
Common Chickweed
Common wheat
Fat Hen
Loose Silky-bent
Maize
Scentless Mayweed
Shepherds Purse
Small-flowered Cranesbill
Sugar beet
导入库
首先导入所有必要的库以供我们进一步分析。我们将使用 NumPy、Pandas、matplotlib、OpenCV、Keras 和 sci-kit-learn。
检查以下命令以导入所有必需的库
import numpy as np # MATRIX OPERATIONS
import pandas as pd # EFFICIENT DATA STRUCTURES
import matplotlib.pyplot as plt # GRAPHING AND VISUALIZATIONS
import math # MATHEMATICAL OPERATIONS
import cv2 # IMAGE PROCESSING - OPENCV
from glob import glob # FILE OPERATIONS
import itertools
# KERAS AND SKLEARN MODULES
from keras.utils import np_utils
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.layers import Flatten
from keras.layers.convolutional import Conv2D
from keras.layers.convolutional import MaxPooling2D
from keras.layers import BatchNormalization
from keras.callbacks import ModelCheckpoint,ReduceLROnPlateau,CSVLogger
from sklearn import preprocessing
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix
# GLOBAL VARIABLES
scale = 70
seed = 7
获取数据并调整图像大小
为了训练我们的模型,我们需要先读取数据。我们的数据集有不同大小的图像,因此我们将调整图像的大小。读取数据并调整其大小只需一步即可完成。查看以下代码以获取有关如何执行不同操作的完整信息。path_to_images = 'plant-seedlings-classification/train/png'
images = glob(path_to_images)
trainingset = []
traininglabels = []
num = len(images)
count = 1
#READING IMAGES AND RESIZING THEM
for i in images:
print(str(count)+'/'+str(num),end='r')
trainingset.append(cv2.resize(cv2.imread(i),(scale,scale)))
traininglabels.append(i.split('/')[-2])
count=count+1
trainingset = np.asarray(trainingset)
traininglabels = pd.DataFrame(traininglabels)
清理图像并去除背景
这是执行清理的一个非常重要的步骤。清理图像是一项艰巨的任务。我们将执行以下步骤以清理图像
将 RGB 图像转换为 HSV
为了去除噪声,我们将不得不模糊图像
为了删除背景,我们将不得不创建一个遮罩。new_train = []
sets = []; getEx = True
for i in trainingset:
blurr = cv2.GaussianBlur(i,(5,5),0)
hsv = cv2.cvtColor(blurr,cv2.COLOR_BGR2HSV)
#GREEN PARAMETERS
lower = (25,40,50)
upper = (75,255,255)
mask = cv2.inRange(hsv,lower,upper)
struc = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(11,11))
mask = cv2.morphologyEx(mask,cv2.MORPH_CLOSE,struc)
boolean = mask>0
new = np.zeros_like(i,np.uint8)
new[boolean] = i[boolean]
new_train.append(new)
if getEx:
plt.subplot(2,3,1);plt.imshow(i) # ORIGINAL
plt.subplot(2,3,2);plt.imshow(blurr) # BLURRED
plt.subplot(2,3,3);plt.imshow(hsv) # HSV CONVERTED
plt.subplot(2,3,4);plt.imshow(mask) # MASKED
plt.subplot(2,3,5);plt.imshow(boolean) # BOOLEAN MASKED
plt.subplot(2,3,6);plt.imshow(new) # NEW PROCESSED IMAGE
plt.show()
getEx = False
最新活动更多
-
11月28日立即报名>>> 2024工程师系列—工业电子技术在线会议
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
即日-12.26火热报名中>> OFweek2024中国智造CIO在线峰会
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
-
精彩回顾立即查看>> 2024 智能家居出海论坛
-
精彩回顾立即查看>> 【在线会议】多物理场仿真助跑新能源汽车
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论