deep-learning 相关问题

深度学习是一个机器学习领域，其目标是使用“深层”（由多层组成）的特殊神经网络架构来学习复杂的功能。此标记应用于有关深度学习体系结构实现的问题。一般机器学习问题应标记为“机器学习”。包括相关软件库的标签（例如，“keras”或“tensorflow”）是有帮助的。

反向标签编码器不适用于神经网络？

我的数据框中有一个分类变量（A、B、C）。然后，我使用 Label Encoder 对其进行编码，以将其传递给使用 Keras 的神经网络。通常我会在其他算法上反转这种转换......

python keras deep-learning

回答 2 投票 0

Pytorch 在保持纵横比的同时调整特定维度的大小

我有图像，其中一些高度> =宽度，而其他高度我有图像，其中一些高度> =宽度，而其他高度Documentation），但是，我遇到了一个问题，我不知道如何使用库函数解决。我有两种可能性，我可以提供两个整数，表示输出的大小，或者一个整数，表示调整大小后输出图像最小边的大小。例如：image1 为 64x200 (HxW)，而 image2 为 200x64。使用 resize(32, ..)(image) 调整大小将产生大小为 32x100 的 out_image1 和大小为 100x32 的 out_image2。但是，我希望第二张图片为 32x10。那么我如何指定一个特定的维度，它要缩放到我指定的大小，而另一个总是隐式重新缩放同时保持纵横比？编辑：所以我基本上解决了它，它需要我创建一个新的 Resize 实例，给它两个整数并要求我手动计算新的宽度。如果已经实施了更优雅的解决方案，我仍然很想知道。必须反复实例化 Resize 禁止我将我的 Dataset 类作为组合进行转换。相反，我必须直接在数据集getitem函数中实现调整大小转换，这使得它不太灵活，只需将我的数据集直接交给组合转换。您可以使用自定义变换，根据图像的纵横比调整图像的大小。此转换采用固定高度值并调整输入图像的大小。这是你应该如何进行的粗略模式。 import math from torchvision.transforms import functional as F class FixedHeightResize: def __init__(self, size): self.size = size def __call__(self, img): w, h = img.size aspect_ratio = float(h) / float(w) new_w = math.ceil(self.size / aspect_ratio) return F.resize(img, (self.size, new_w)) 接下来，您可以使用它调整输入图像的大小，使其具有固定的 32 高度，同时保持纵横比。 img = Image.open("image.jpg") transform = transforms.Compose([ FixedHeightResize(32) ]) out_img = transform(img)

deep-learning pytorch neural-network transformation torchvision

回答 1 投票 0

微调对象检测的少量数据时克服类不平衡？

我想在我自己的交通场景数据（1k 图像）上微调在 KITTI 数据（7.4k 图像）上预训练的对象检测器 (YOLOv5)。 KITTI 对象类仅包含动态对象，而...

deep-learning object-detection transfer-learning imbalanced-data

回答 0 投票 0

DeepLabV3+ MeanIoU 指标的混淆矩阵形状 ValueError

我是 DeepLab 的新手，想在 model.compile() 函数中将指标从“准确度”更改为“MeanIoU”，但我得到了这个 ValueError：两种形状中的维度 0 必须相等...

python deep-learning metrics semantic-segmentation deeplab

回答 1 投票 0

ImportError：无法从 google colab 中的“tensorboard.compat”导入名称“notf”

我正在尝试在 google colab 中导入一个 python 脚本以合并到我的代码中。我的代码是用pytorch写的。我在运行代码时收到此错误消息：从 torch.utils.tensorboard 导入

deep-learning pytorch google-colaboratory tensorboard

回答 0 投票 0

使用深度学习训练自己的最佳语音转文本模型是什么

我是语音识别领域的新手，我学习了一些基础知识。现在使用我自己的数据训练语音到文本模型。有人可以帮我吗？

deep-learning lstm speech-to-text

回答 0 投票 0

Target Y-label ValueError: assignment destination is read-only

从 keras.datasets 导入 fashion_mnist (x_train, y_train), (x_test, y_test) = fashion_mnist.load_data() # 将原始训练数据拆分成验证集 x_train, x_val, y_train, y_val =

keras deep-learning mnist ml poison

回答 0 投票 0

标准化不完整的时间序列

这是我的问题：我正在训练一个网络来使用自动编码器重建多变量时间序列。为此，我将我的时间序列分割成更小的固定大小的窗口。我标准化我的输入时间

machine-learning deep-learning scaling data-preprocessing

回答 0 投票 0

ImportError：无法从“扩散器”导入名称“StableDiffusionPipeline”

ImportError : Traceback (最近调用最后一次) Input In [96], 在() 1个进口手电筒 2 从 torch 导入 autocast ----> 3 从扩散器导入 StableDiffusionPipeline 进口电子...

python deep-learning

回答 2 投票 0

YOLOV5 尽管有足够的 vram，我得到 RuntimeError: CUDA error: out of memory error 即使没有足够的 vram

我正在为我的重要项目训练 YOLOV5“L6”模型。我有一个包含无人机和无人机图像的庞大数据集，我需要具有巨大输入维度的火车（几个月前我训练 &q...

python deep-learning pytorch nvidia yolov5

回答 3 投票 0

我可以在 Pytorch 中使用 one-hot 编码输出进行分割，具有焦点和骰子损失吗？

我知道对于使用神经网络和交叉熵损失的分类，我们需要单热编码输出，但在 PyTorch 中，交叉熵损失不接受单热编码目标，我们应该...

machine-learning deep-learning pytorch computer-vision image-segmentation

回答 1 投票 0

使用 model.eval() 导致不正确的预测

我已经通过 pytorch 训练了一个模型，并且该模型在训练期间在训练、验证和测试集上表现良好，但是当我读取保存的模型参数以在那里可视化测试集时...

python deep-learning pytorch eval

回答 0 投票 0

如何在 transformer 编码器中发送注意掩码“掩码”矩阵以及我在 pytorch 的 nn.TransformerEncoder 中的潜在值？

我有一个 transformer_encoder 在 pytorch 中初始化为： transformer_encoder = nn.TransformerEncoder(nn.TransformerEncoderLayer(d_model=input_dim, nhead=num_heads), num_layers=num_layers) 现在我有...

python machine-learning deep-learning pytorch transformer-model

回答 1 投票 0

使用 CNN 和 Transfomers 将图像序列进行二进制分类

我正在尝试开发一种模型，可以预测给定图像序列的正面或负面。我计划首先将图像序列提供给 CNN 模型，然后再提供给 Transformer。是...

deep-learning architecture conv-neural-network sequence transformer-model

回答 0 投票 0

IndexError: Dimension out of range（预期在 [-1, 0] 范围内，但得到 -3）

我使用的训练代码在此处输入图像描述但是，我遇到了一个错误；在此处输入图像描述对我有什么意见吗……？实际上，它在一年前使用相同的代码运行良好，但是

deep-learning torch

回答 0 投票 0

YOLOv5 SKU-110 预训练权重

我想用Yolov5标注一个包含超市货架上商品的视频文件。有一个巨大的数据集（超过 12GiB）SKU-110K，在 CVPR 2019 中引入，包括许多