deep-learning 相关问题

深度学习是一个机器学习领域,其目标是使用“深层”(由多层组成)的特殊神经网络架构来学习复杂的功能。此标记应用于有关深度学习体系结构实现的问题。一般机器学习问题应标记为“机器学习”。包括相关软件库的标签(例如,“keras”或“tensorflow”)是有帮助的。

Tensoflow2 LSTM - 未使用参数input_shape?

所以我用下面的代码建立了神经网络: import tensorflow as tf tf_model = tf.keras.Sequential() tf_model.add(tf.keras.layer.LSTM(50, activation='relu')) tf_model.add(tf.keras.layer.LSTM(50, activation='relu'))。

回答 1 投票 0

与训练集的损失不同,开发集的损失总是在增加的

我设计了一个文本分类问题的网络。为了做到这一点,我使用的是huggingface transformet的BERT模型,上面还有一个线性层进行微调。我的问题是,损失在 ...

回答 1 投票 0

word2vec:以不区分大小写的方式找到相似的词。

我可以获得我感兴趣的文本语料库上的单词向量。现在,我面临的问题是,这些向量是大小写敏感的,例如 "Him "和 "him "不同,"... "也不同。

回答 2 投票 3

无效参数。ValueError.输入包含NaN、无穷大或对dtype('float32')来说太大的值。输入包含NaN、无穷大或一个对dtype('float32')来说太大的值。

我试图在我的数据集上使用AUC作为度量标准来训练一个LSTM模型,我将这个度量标准定义为使用SKLearn的rocc_auc_score函数。我将这个度量定义为一个函数,使用SKLearn的rocc_auc_score函数。以下是我的代码:从......

回答 1 投票 0

在Flux中使用回调进行训练时的记录损失。

我想为Flux中的train!函数写一个回调。我的代码是: cb_loss = x -> push!(x, loss(x_train, y_train)) loss_vector = Vector{Float32}() Flux.train!(loss, ps, train_data, opt, ...)

回答 1 投票 1

多项式与argmax评价准确率的意义是什么?

使用多项式而不是直接使用argmax来评估预测精度的目的是什么? probs_Y = torch.softmax(model(test_batch, feature_1, feature_2), 1) sampled_Y = torch......。

回答 1 投票 1

在CT图像上识别小血管的非et化功能

我们试图利用CT图像生成3D肺血管树。我们使用VGG-16作为编码器,相同的层(不转移权重)作为解码器。由于CT ...

回答 1 投票 1

如何将Onnx模型(.onnx)转换为tensorflow(.pb)模型?

我试图将.onxx模型转换为.pb模型。我已经写了代码,但我得到的错误。@tf_func(tif.ceil)AttributeError: module 'tensorflow' has no attribute 'ceil' import onnx from ...。

回答 1 投票 0

在BIG数据集上训练模型的最佳实践是什么?

我需要在一个数据集上训练一个模型,这个数据集所需的内存比我的GPU还要多。

回答 1 投票 1

变压器模型中位置编码的实现细节?

这个位置编码到底是怎么计算的呢?我们假设一个机器翻译的场景,这些都是输入句子,english_text = [this is good, this is bad] german_text = [das ...。

回答 1 投票 0

使用TensorFlow对不平衡数据进行训练

情况是这样的。我想知道当我的训练数据在2个标签之间的标签分布不平衡时,如何优化使用TensorFlow。例如,假设MNIST教程简化为......。

回答 4 投票 28

PyTorch - 模型参数权重的意外形状

我在Pytorch中创建了一个全连接网络,输入层为形状(1,784),第一隐藏层为形状(1,256)。简而言之:nn.Linear(in_features=784, out_features=256, bias=True) ....

回答 1 投票 0

验证损失减少,然后增加,然后再减少

我有以下我正在训练的一个深度CNN分类器的交叉熵损失作为迭代函数的演变。蓝色的曲线是训练集,橙色的曲线是 ...

回答 1 投票 -3

Keras在训练过程中得到最后一层的输出。

我们的目标是在训练阶段恢复变量自动编码器最后一层的输出,作为另一个算法的训练数据。附上的是模型变分自动编码器 ...

回答 1 投票 0

LSTM Keras对X和Y输入维度进行排序。

我正试图建立一个LSTM,但对塑造我的数据的最佳方式感到困惑。我有一个数据框架,看起来像这样:df.head(5) data ...

回答 1 投票 0

RuntimeError: size mismatch, m1: [5 x 10],m2: 在pytorchatensrcTHgenericTHTensorMath.cpp处,[5 x 32] 。

我需要你的帮助 运行下面的代码会抛出。RuntimeError: size mismatch, m1: [5 x 10], m2: 在pytorchatensrcTHgenericTHTensorMath.cpp处的[5 x 32],我看了类似的问题,但它们是...

回答 1 投票 0

理解神经网络模型的预测。

基本上,我有一组图片。基于给定的标签,比如说 "狗 "和 "狗以外的任何东西",我训练了一个卷积神经网模型。我将 "狗 "编码为1,所有其他标签编码为0,然而,...

回答 1 投票 0

使用AlexeyAB暗网训练自定义yolov_3时出现的问题。

我正在使用谷歌Colab上的darknet创建一个Yolov_3模型,我已经做了所有正确的事情,并得到了预训练的权重,给训练一个良好的开端,但在结束时初始化训练......

回答 1 投票 0

pointnet中输入和特征变换的区别?

pointnet architechture 我目前正在看这篇论文,其中原始点云坐标正在进行两次变换,输入变换和特征变换,变换本身是...

回答 1 投票 1

(CRNN OCR)训练时出错! Invalid Argument: sequence_length(0) <= 18 node ctcCTCLoss

我在OCR上使用CRNN(CNN + RNN + CTC Loss)的模型。我使用的是Tensorflow Keras,以下是我的代码[来自CTC Loss]: labels = Input(name='the_labels', shape=[max_label_len], dtype='float32')......

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.