深度学习是一个机器学习领域,其目标是使用“深层”(由多层组成)的特殊神经网络架构来学习复杂的功能。此标记应用于有关深度学习体系结构实现的问题。一般机器学习问题应标记为“机器学习”。包括相关软件库的标签(例如,“keras”或“tensorflow”)是有帮助的。
我需要在 model.compile 中定义指标以便以后使用它们吗?
我正在尝试训练一个模型,训练后,我想查看 TP TN FP FN、召回率、精度和灵敏度。 问题 1:当我像这样编译模型时,是否需要定义所有这些指标...
Uber Ludwig Toolbox:将生成的模型导出到 Google 平台 ML Engine
在 Uber Ludwig 工具箱中,从头开始的训练生成了以下 10 个文件: 检查站 model_hyperparameters.json model_weights.data-00000-of-00001 model_weights.index model_weights.meta
我什么时候应该使用.eval()?我知道它应该让我“评估我的模型”。如何在训练时将其关闭? 使用 .eval() 的示例训练代码。
如何优化 SLURM 脚本,以便为大型预训练网络和使用 PyTorch 的模型使用更多 GPU?
我们学校有一台带有多个 GPU 的 HPC,我正在尝试找出如何利用更多 GPU 来更快地运行我的代码,但是我在批量大小 128 时不断遇到此错误: 追溯(最推荐...
如何在 PyTorch 训练期间正确标准化权重而不绕过 Autograd?
我正在 PyTorch 中实现一个神经网络,需要在前向传递过程中标准化某些层的权重。具体来说,我想通过 L2 范数对一些外行的权重进行标准化......
我正在使用 LayoutLM 读取收据并从发票中获取文本。我正在使用 HuggingFace“philschmid/lilt-en-funsd”中的模型。下面给出的是代码片段: def run_inference(
summary() 函数在 cnn 中不起作用(ValueError:不支持未定义的形状。)
我正在尝试创建一个分类网络,用于从 cifar10 数据集中识别图片。 当我尝试使用summary()函数时,我不断收到此错误。 值错误
如何在 PyTorch 中创建 14 种疾病类别的多标签混淆矩阵?
我正在研究 14 种不同疾病类别的多标签分类任务。我已经训练了我的模型,我想生成一个多标签混淆矩阵,其中 x 轴和 y 轴
如何在深度神经网络中进行交叉验证?我知道要执行交叉验证,将在除一个折叠之外的所有折叠上对其进行训练,并在排除的折叠上进行测试。然后对 k f 执行此操作...
在 Theano、Lenet5 中 Pickle 多层 CNN
我正在使用 Theano 进行图像识别,我想使用经过训练的模型创建一个预测系统。 我参考了LeNet5卷积神经网络(LeNet)并训练了自己的数据,现在我想要...
我正在研究实现 CNN 的可能性,以便将图像分类为“好”或“坏”,但我对当前的架构不太满意。 特点是...
深度学习因将图像分类为不同类别而闻名。然而,我有兴趣使用任何其他能够对图像进行分类的机器学习模型。这些图像是...
我想将我的 CNN 深度特征提供给传统分类器,即随机森林。我不想使用 MLP(多层感知器)来对我的问题进行分类,但需要其他分类器。我有我的数据...
我正在尝试对顺序数据进行多类分类,以根据源的累积读取来了解某些事件的来源。 我正在使用带有 64 个的简单 LSTM 层...
在 python 上使用 TensorRT .engine 文件进行推理
我使用Nvidia的迁移学习工具包(TLT)进行训练,然后使用tlt-converter将.etlt模型转换为.engine文件。 我想使用这个 .engine 文件在 python 中进行推理。但是
OSError: [WinError 126] 找不到指定的模块?
首先抱歉,我的语法可能不好。如果我在这里错过了任何解决方案,您可以给我网址,但我没有找到适合这种情况的任何解决方案。 我正在学习深度学习课程,他们
使用 Keras 迁移学习的边界框回归给出 0% 的准确率。 Sigmoid 激活的输出层仅输出 0 或 1
我正在尝试创建一个对象定位模型来检测汽车图像中的车牌。我使用 VGG16 模型并排除顶层以添加我自己的密集层,最后一层有......
添加我自己的密集层后,vgg16 模型的可训练参数发生了变化
vgg16_model = tf.keras.applications.vgg16.VGG16() 模型=顺序() 对于 vgg16_model.layers[:-1] 中的图层: 模型.添加(层) model.summary() #去掉最后一个密集层
我正在从事一个计算机视觉项目,我想处理商场中网络摄像机捕获的视频。为了做到这一点! 一种可能的方法是访问 IP 摄像机的实时流并处理
我使用了coqui的开源存储库来构建语音克隆模型。它利用使用 LJSpeech 数据集训练的不同 tts_model。我使用多语言模型来使用我...