deep-learning 相关问题

深度学习是一个机器学习领域,其目标是使用“深层”(由多层组成)的特殊神经网络架构来学习复杂的功能。此标记应用于有关深度学习体系结构实现的问题。一般机器学习问题应标记为“机器学习”。包括相关软件库的标签(例如,“keras”或“tensorflow”)是有帮助的。

反向标签编码器不适用于神经网络?

我的数据框中有一个分类变量(A、B、C)。然后,我使用 Label Encoder 对其进行编码,以将其传递给使用 Keras 的神经网络。通常我会在其他算法上反转这种转换......

回答 2 投票 0

Pytorch 在保持纵横比的同时调整特定维度的大小

我有图像,其中一些高度> =宽度,而其他高度 我有图像,其中一些高度> =宽度,而其他高度Documentation),但是,我遇到了一个问题,我不知道如何使用库函数解决。 我有两种可能性,我可以提供两个整数,表示输出的大小,或者一个整数,表示调整大小后输出图像最小边的大小。 例如:image1 为 64x200 (HxW),而 image2 为 200x64。使用 resize(32, ..)(image) 调整大小将产生大小为 32x100 的 out_image1 和大小为 100x32 的 out_image2。但是,我希望第二张图片为 32x10。 那么我如何指定一个特定的维度,它要缩放到我指定的大小,而另一个总是隐式重新缩放同时保持纵横比? 编辑:所以我基本上解决了它,它需要我创建一个新的 Resize 实例,给它两个整数并要求我手动计算新的宽度。如果已经实施了更优雅的解决方案,我仍然很想知道。必须反复实例化 Resize 禁止我将我的 Dataset 类作为组合进行转换。相反,我必须直接在数据集getitem函数中实现调整大小转换,这使得它不太灵活,只需将我的数据集直接交给组合转换。 您可以使用自定义变换,根据图像的纵横比调整图像的大小。此转换采用固定高度值并调整输入图像的大小。这是你应该如何进行的粗略模式。 import math from torchvision.transforms import functional as F class FixedHeightResize: def __init__(self, size): self.size = size def __call__(self, img): w, h = img.size aspect_ratio = float(h) / float(w) new_w = math.ceil(self.size / aspect_ratio) return F.resize(img, (self.size, new_w)) 接下来,您可以使用它调整输入图像的大小,使其具有固定的 32 高度,同时保持纵横比。 img = Image.open("image.jpg") transform = transforms.Compose([ FixedHeightResize(32) ]) out_img = transform(img)

回答 1 投票 0

微调对象检测的少量数据时克服类不平衡?

我想在我自己的交通场景数据(1k 图像)上微调在 KITTI 数据(7.4k 图像)上预训练的对象检测器 (YOLOv5)。 KITTI 对象类仅包含动态对象,而...

回答 0 投票 0

DeepLabV3+ MeanIoU 指标的混淆矩阵形状 ValueError

我是 DeepLab 的新手,想在 model.compile() 函数中将指标从“准确度”更改为“MeanIoU”,但我得到了这个 ValueError: 两种形状中的维度 0 必须相等...

回答 1 投票 0

ImportError:无法从 google colab 中的“tensorboard.compat”导入名称“notf”

我正在尝试在 google colab 中导入一个 python 脚本以合并到我的代码中。我的代码是用pytorch写的。我在运行代码时收到此错误消息: 从 torch.utils.tensorboard 导入

回答 0 投票 0

使用深度学习训练自己的最佳语音转文本模型是什么

我是语音识别领域的新手,我学习了一些基础知识。现在使用我自己的数据训练语音到文本模型。有人可以帮我吗?

回答 0 投票 0

Target Y-label ValueError: assignment destination is read-only

从 keras.datasets 导入 fashion_mnist (x_train, y_train), (x_test, y_test) = fashion_mnist.load_data() # 将原始训练数据拆分成验证集 x_train, x_val, y_train, y_val =

回答 0 投票 0

标准化不完整的时间序列

这是我的问题: 我正在训练一个网络来使用自动编码器重建多变量时间序列。为此,我将我的时间序列分割成更小的固定大小的窗口。 我标准化我的输入时间

回答 0 投票 0

ImportError:无法从“扩散器”导入名称“StableDiffusionPipeline”

ImportError : Traceback (最近调用最后一次) Input In [96], 在() 1个进口手电筒 2 从 torch 导入 autocast ----> 3 从扩散器导入 StableDiffusionPipeline 进口电子...

回答 2 投票 0

YOLOV5 尽管有足够的 vram,我得到 RuntimeError: CUDA error: out of memory error 即使没有足够的 vram

我正在为我的重要项目训练 YOLOV5“L6”模型。我有一个包含无人机和无人机图像的庞大数据集,我需要具有巨大输入维度的火车(几个月前我训练 &q...

回答 3 投票 0

我可以在 Pytorch 中使用 one-hot 编码输出进行分割,具有焦点和骰子损失吗?

我知道对于使用神经网络和交叉熵损失的分类,我们需要单热编码输出,但在 PyTorch 中,交叉熵损失不接受单热编码目标,我们应该...

回答 1 投票 0

使用 model.eval() 导致不正确的预测

我已经通过 pytorch 训练了一个模型,并且该模型在训练期间在训练、验证和测试集上表现良好,但是当我读取保存的模型参数以在那里可视化测试集时...

回答 0 投票 0

如何在 transformer 编码器中发送注意掩码“掩码”矩阵以及我在 pytorch 的 nn.TransformerEncoder 中的潜在值?

我有一个 transformer_encoder 在 pytorch 中初始化为: transformer_encoder = nn.TransformerEncoder(nn.TransformerEncoderLayer(d_model=input_dim, nhead=num_heads), num_layers=num_layers) 现在我有...

回答 1 投票 0

使用 CNN 和 Transfomers 将图像序列进行二进制分类

我正在尝试开发一种模型,可以预测给定图像序列的正面或负面。我计划首先将图像序列提供给 CNN 模型,然后再提供给 Transformer。是...

回答 0 投票 0

IndexError: Dimension out of range(预期在 [-1, 0] 范围内,但得到 -3)

我使用的训练代码 在此处输入图像描述 但是,我遇到了一个错误; 在此处输入图像描述 对我有什么意见吗……? 实际上,它在一年前使用相同的代码运行良好,但是

回答 0 投票 0

YOLOv5 SKU-110 预训练权重

我想用Yolov5标注一个包含超市货架上商品的视频文件。有一个巨大的数据集(超过 12GiB)SKU-110K,在 CVPR 2019 中引入,包括许多

回答 1 投票 0

如何训练yolov5 int8模型

这里我正在构建一个猴子检测系统,我将在 raspberry pi 4 中部署它,具有 8gb ram,我在 yolov4-tiny 和原始 yolov5 上训练模型,但我想使用 yolov5 int8,w。 ..

回答 0 投票 0

是否有可能:通过输入一维向量使用扩散模型(或 GAN,如果需要)生成 3D 模型? 1D 到 3D 扩散模型

据我所知,到目前为止,我只看到扩散模型与图像一起使用——接收 2D 噪声或图像数据并输出 2D 图像。但是如果问题设置完全不同怎么办:只有一个

回答 0 投票 0

为 LSTM 添加另一个数组到 padded_sequence

我是制作 RNN 的新手。我正在制作一个 LSTM 模型,它需要接受 Twitter 帖子作为文本和情绪。我对如何为模型准备预处理数据有疑问。 我在用

回答 1 投票 0

一维卷积神经网络 ResourceExhaustedError

在为 1D CNN 设置 1 通道 ECG 数据输入大小时,我遇到了很大的困惑。 为了简单起见,数据结构如下: 我有 500 个细分 每个部分都有相应的...

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.