一文教你使用python+Keras检测年龄和性别
目标
本文的主要目的是通过给定的数据集检测年龄和性别。我们将使用简单的 python 和 Keras 方法来检测年龄和性别。
介绍
将摄像头、卫星、飞机以及日常生活中所拍摄的图像进行升级,称为图像处理。
基于分析的图像处理经历了许多不同的技术和计算。
图片中可获取信息的位置是非常必要的信息。图像包含的信息将被更改和调整以用于发现目的。
在面部识别策略中:面部包含的关节包含大量数据。当一个人与另一个人产生联系时,就会产生大量的想法。
思想的演变有助于确定某些界限。年龄评估是一个多层次的问题。不同年龄的人有不同的面部特征,因此很难将这些图像组合起来。
要确定几个人脸的年龄和性别的程序,后面有几种方法。从神经网络中,特征由卷积网络获取。根据准备好的模型,将图像处理为其中一个年龄段。框架的准备工作将进一步进行。
数据集
UTK 数据集包含 .csv 格式的年龄、性别、图像和像素。根据图像的年龄和性别检测已经研究了很长时间。多年来,人们采用不同的方法来处理这个问题。现在我们开始使用 Python 编程语言识别年龄和性别。
Keras 是 TensorFlow 库的接口。如果你需要一个允许简单快速的原型制作(通过易用性、隐蔽性和可扩展性)的深度学习库,请使用 Keras。Keras支持卷积网络和重复组织,可以在 CPU 和 GPU 上完美运行。
代码
#Import libraries
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df=pd.read_csv("age_gender.csv")
df1= pd.DataFrame(df)
plt.xlabel = 'Gender (1= Female, 0-Male)'
plt.figure(figsize=(10,7))
ax=df1.gender.value_counts().plot.bar(x='Gender (1= Female, 0-Male)', y='Count', title='Gender', legend = (1,0, ('Female', 'Male')))
plt.figure(figsize=(10,7))
labels =['White','Black','Indian','Asian','Hispanic']
ax=df1.ethnicity.value_counts().plot.bar()
ax.set_xticklabels(labels)
ax.set_title('Ethinicity')
## Converting pixels into numpy array
df1['pixels'] = df1['pixels'].apply(lambda x: np.reshape(np.array(x.split(), dtype="float32"), (48,48)))
df1.head()
def plot_data(rows, cols, lower_value, upper_value):
fig = plt.figure(figsize=(cols*3,rows*4))
for i in range(1, cols*rows + 1):
k = np.random.randint(lower_value,upper_value)
fig.add_subplot(rows, cols, i) # adding sub plot
gender = gender_values_to_labels[df.gender[k]]
ethnicity = eth_values_to_labels[df.ethnicity[k]]
age = df.age[k]
im = df.pixels[k]
plt.imshow(im, cmap='gray')
plt.axis('off')
plt.title(f'Gender:{gender}nAge:{age}nEthnicity:{ethnicity}')
plt.tight_layout()
plt.show()
图 1 通过简单的 Python 进行年龄和性别检测
Keras
Keras 是一个开源的神经网络库。它是用 Python 编写的,非常适合在由 Google 工程师 Francois Chollet 开发的 Theano、TensorFlow 或 CNTK 上运行。它易于理解、可扩展,特别适合于对复杂的神经组织进行更快的实验。
首先,我们将上传数据集所需的所有库。我们将使用 np.array 将所有列转换为数组,并转换为 dtype float。然后我们将数据集拆分为 xTrain、yTrain、yTest 和 xtest。最后,我们将依次应用模型并测试预测。
具体来说,首先,我们使用pandas、read_csv函数读取包含年龄、种族、性别、图像名称和像素五列的CSV文件。前五行是通过使用 DataFrame.head() 方法获得的。我们使用 NumPy 库将列名像素转换为数组,并使用 lambda 函数将它们重塑为 48、48 维。我们还通过相同的 lambda 函数转换了浮点数中的值。
我们将这些值进一步除以 255。
我们分配变量名以获取像素列的第一行。我们通过使用 matplotlib 进一步检查图像是否被看到。
导入库
import keras
import json
import sys
import tensorflow as tf
from keras.layers import Input
import numpy as np
import argparse
from keras_applications.resnext import ResNeXt50
from keras.utils.data_utils import get_file
import face_recognition
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import cv2
from PIL import Image
df=pd.read_csv("age_gender.csv")df.head()df1= pd.DataFrame(df)
df1['pixels'] = df1.pixels.apply(lambda x: np.reshape(np.array(x.split(' '),dtype='float32'),(48,48)))
df1['pixels']= df1['pixels']/255
im = df1['pixels'][0]
im
plt.imshow(im, cmap='gray')
plt.axis('off')
图2 重塑后的图像
要将所有值转换为浮点数并对其进行重塑,我们使用了函数 for 和 NumPy。为了将年龄和性别存储在列表中,我们将使用另一个变量 labels_f。
稍后的模型将用于拟合数据并对其进行验证。
#收集所有图像并重塑它们,检查dtype。
X = np.zeros(shape=(23705,48,48))
for i in range(len(df1["pixels"])):
X[i] = df1["pixels"][i]
X.dtype
Output - dtype('float64')
#Age
ag = df1['age']
ag=ag.astype(float)
ag= np.array(ag)
ag.shape
输出 - (23705,)
#性别
g= df1['gender']
g=np.array(g)
g.shape
(23705,)
labels_f =[]
i=0
while i
label.append([a[i]])
label.append([g[i]])
labels_f.append(label)
i+=1
Both age and gender are combined and stored in labels_f, we will further convert the list into array.
labels_f =np.array(labels_f)
labels_f.shape
(23705, 2, 1)
使用最常用的机器学习库 sklearn,将数据拆分为训练和测试。
#Splitting the data taking data set
import tensorflow as tf
from sklearn.model_selection import train_test_split
X_train, X_test, Y_train, Y_test= train_test_split(X,a,test_size=0.25)
print(X_test.shape)
print(X_train.shape)
print(Y_test.shape)
print(Y_train.shape)
图 3 X_train、X_test、Y_train 和 Y_test 的形状输出
Y_train_2=[Y_train[:,1],Y_train[:,0]]
Y_test_2=[Y_test[:,1],Y_test[:,0]]
#模型
from tensorflow.keras.layers import Dropout
from tensorflow.keras.layers import Flatten,BatchNormalization
from tensorflow.keras.layers import Dense, MaxPooling2D,Conv2D
from tensorflow.keras.layers import Input,Activation,Add
from tensorflow.keras.models import Model
from tensorflow.keras.regularizers import l2
from tensorflow.keras.optimizers import Adam
import tensorflow as tf
def Convolution(input_tensor,filters):
x = Conv2D(filters=filters,kernel_size=(3, 3),padding = 'same',strides=(1, 1),kernel_regularizer=l2(0.001))(input_tensor)
x = Dropout(0.1)(x)
x= Activation('relu')(x)
return x
def model(input_shape):
inputs = Input((input_shape))
conv_1= Convolution(inputs,32)
maxp_1 = MaxPooling2D(pool_size = (2,2)) (conv_1)
conv_2 = Convolution(maxp_1,64)
maxp_2 = MaxPooling2D(pool_size = (2, 2)) (conv_2)
conv_3 = Convolution(maxp_2,128)
maxp_3 = MaxPooling2D(pool_size = (2, 2)) (conv_3)
conv_4 = Convolution(maxp_3,256)
maxp_4 = MaxPooling2D(pool_size = (2, 2)) (conv_4)
flatten= Flatten() (maxp_4)
dense_1= Dense(64,activation='relu')(flatten)
dense_2= Dense(64,activation='relu')(flatten)
drop_1=Dropout(0.2)(dense_1)
drop_2=Dropout(0.2)(dense_2)
output_1= Dense(1,activation="sigmoid",name='sex_out')(drop_1)
output_2= Dense(1,activation="relu",name='age_out')(drop_2)
model = Model(inputs=[inputs], outputs=[output_1,output_2])
model.compile(loss=["binary_crossentropy","mae"], optimizer="Adam",
metrics=["accuracy"])
return model
Model=model((48,48,1))
Model.summary()
图 4 详细模型汇总
History=Model.fit(X_train,Y_train_2,batch_size=64,validation_data=(X_test,Y_test_2),epochs=5,callbacks=[callback_list])
Model.evaluate(X_test,Y_test_2)
pred=Model.predict(X_test)
pred[1]
#绘制图像
def test_image(ind,X,Model):
plt.imshow(X[ind])
image_test=X[ind]
pred_1=Model.predict(np.array([image_test]))
sex_f=['Female','Male']
age=int(np.round(pred_1[1][0]))
sex=int(np.round(pred_1[0][0]))
print("Predicted Age: "+ str(age))
print("Predicted Sex: "+ sex_f[sex])
test_image(1980,X, Model)
图 5 模型的年龄和性别检测。
结论
识别年龄和性别的任务是一个麻烦问题,比许多其他视觉任务更是如此。
这个问题漏洞的根本在于准备这些类型的框架所需的信息。虽然一般的文章发现通常可以处理数千甚至大量的图片以供准备,但具有年龄和性别名称的数据集要广泛得多,通常在大量或最好的情况下,数千Python获取的图像,模型在准确率上做得并不好,模型算法有待改进。
最新活动更多
-
即日-11.13立即报名>>> 【在线会议】多物理场仿真助跑新能源汽车
-
11月28日立即报名>>> 2024工程师系列—工业电子技术在线会议
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
即日-12.26火热报名中>> OFweek2024中国智造CIO在线峰会
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
-
精彩回顾立即查看>> 【限时免费下载】TE暖通空调系统高效可靠的组件解决方案
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论