CNN 模型在 MNIST 数据集上的性能不佳

Question

我目前是一名计算机科学专业的学生，在我的机器学习课程中，我被分配了一个项目。我选择使用 CNN 模型，并且正在使用 MNIST 数据集。然而，我面临的问题是模型的性能出乎意料地低 - 我得到的准确度仅为 0.0664。

以下是我的模型的代码：

model = Sequential()
model.add(Conv2D(32, kernel_size=(5, 5), strides=(1, 1), padding="same", kernel_initializer='glorot_uniform', input_shape=(64, 64, 1), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2), padding="same"))
model.add(Flatten())
model.add(Dense(1024, activation='relu'))
model.add(Dense(num_classes, activation='softmax'))
model.compile(optimizer = Adam(learning_rate = 0.01), loss = 'categorical_crossentropy', metrics = ['accuracy'])
print(model.summary())
model1 = model.fit(x_train, y_train,batch_size=128, epochs=20)

我感谢任何关于如何提高性能的建议或见解。预先感谢！

Answer 1

减小密集层的大小可能会带来潜在的改进。尝试将密集层中的单元数量最小化为 64 而不是 1024。使用以下方法更新模型：

model.add(Dense(64, activation='relu'))

CNN 模型在 MNIST 数据集上的性能不佳

问题描述投票：0回答：1

1个回答

最新问题

CNN 模型在 MNIST 数据集上的性能不佳

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1