CNN 模型在 MNIST 数据集上的性能不佳

问题描述 投票:0回答:1

我目前是一名计算机科学专业的学生,在我的机器学习课程中,我被分配了一个项目。我选择使用 CNN 模型,并且正在使用 MNIST 数据集。然而,我面临的问题是模型的性能出乎意料地低 - 我得到的准确度仅为 0.0664。

以下是我的模型的代码:

model = Sequential()
model.add(Conv2D(32, kernel_size=(5, 5), strides=(1, 1), padding="same", kernel_initializer='glorot_uniform', input_shape=(64, 64, 1), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2), padding="same"))
model.add(Flatten())
model.add(Dense(1024, activation='relu'))
model.add(Dense(num_classes, activation='softmax'))
model.compile(optimizer = Adam(learning_rate = 0.01), loss = 'categorical_crossentropy', metrics = ['accuracy'])
print(model.summary())
model1 = model.fit(x_train, y_train,batch_size=128, epochs=20)

我感谢任何关于如何提高性能的建议或见解。预先感谢!

tensorflow keras deep-learning conv-neural-network
1个回答
0
投票

减小密集层的大小可能会带来潜在的改进。尝试将密集层中的单元数量最小化为 64 而不是 1024。使用以下方法更新模型:

model.add(Dense(64, activation='relu'))
© www.soinside.com 2019 - 2024. All rights reserved.