deep-learning 相关问题

深度学习是一个机器学习领域,其目标是使用“深层”(由多层组成)的特殊神经网络架构来学习复杂的功能。此标记应用于有关深度学习体系结构实现的问题。一般机器学习问题应标记为“机器学习”。包括相关软件库的标签(例如,“keras”或“tensorflow”)是有帮助的。

如何分别提取每个类的ImageNet-1K数据集的文件?

我已经从 https://huggingface.co/datasets/imagenet-1k/tree/main/data 下载了 ImageNet1K 数据。但是,tar 文件包含文件名为 ILSVRC2012_val_00000009_n03794056.JP 的图像...

回答 1 投票 0

用trl的DPOTrainer训练后,使用AutoPeftModelForCausalLM时保存、加载错误

用trl的DPOTrainer训练后,如下保存到本地,然后用AutoPeftModelForCausalLM加载,就报错了。 当我加载使用 SFTranier 本地存储的检查点时,我...

回答 1 投票 0

pytorch 出现 OSError:[Errno 12] 无法分配内存

我正在尝试训练我的深度学习模型,但在第二个纪元开始时出现错误: 回溯(最近一次调用最后一次): 文件“train.py”,第 61 行,位于 火车...

回答 1 投票 0

PyTorch内存爆炸|RuntimeError:CUDA内存不足。如何解决问题?

有时候,当PyTorch运行时,GPU显存已满,会报错: 运行时错误:CUDA 内存不足。尝试分配 916.00 MiB(GPU 0;6.00 GiB 总容量;4.47 GiB 已经...

回答 1 投票 0

ValueError:“生成器”层的输入 1 与该层不兼容:预期形状=(无,128),发现形状=(32, 20)

我正在尝试使用我自己的数据运行一个程序,其中包含 4 个特征和 11599 行。 我收到此错误:ValueError:层“生成器”的输入 1 与层不兼容:预期...

回答 1 投票 0

为什么在训练过程中多次缩小参数将有助于渐进式 GAN 中所有权重的学习速度相同?

均衡学习率是NVIDIA团队论文Progressive Gan中的一个特别之处。通过使用这种方法,他们介绍了 我们的方法确保了动态范围,因此...

回答 2 投票 0

调用duckduckgo api时出现Http错误

我目前正在学习机器学习课程:来自 fast.ai 网站的课程。 该课程是一个视频,但它链接到 kaggle 上的 jupyter 笔记本 (https://www.kaggle.com/code/

回答 1 投票 0

PyTorch 的 BCEWithLogitsLoss 类具体是如何实现的?

根据 PyTorch 文档,BCEWithLogitsLoss() 类的优点是可以使用 用于数值稳定性的 log-sum-exp 技巧。 如果我们使用类 BCEWithLogitsLoss() w...

回答 4 投票 0

我的模型在训练后预测完全相反的值。 (即将圆的内部值预测为外部,将外部值预测为内部)

制作数据集 从 sklearn.datasets 导入 make_circles n_样本=1000 x, y = make_circles(n_samples, 噪声=0.03, random_state=42) X = torch.from_numpy(x).type(torch.float) Y = torch.from_numpy(y...

回答 1 投票 0

运行脚本遇到问题!!!问题:“omegaconf.errors.ConfigAttributeError:键“io”不在结构中”

通过配置(https://github.com/Sachini/niloc)中提到的设置,我在运行脚本(测试/训练)时遇到问题。它给了我以下错误 文件“/home/omer/anaconda3/envs/

回答 2 投票 0

处理神经网络中的分类目标(深度学习)

我需要使用顺序神经网络来预测诊断(目标),这是一个有 5 个类别(普通感冒、流感、骨折、头痛、其他)的分类特征。 我尝试做...

回答 1 投票 0

keras LSTM 中的训练损失为 nan

我已在 google colab 中使用 GPU 调整此代码来创建多层 LSTM。它用于时间序列预测。 从 keras.models 导入顺序 从 keras.layers 导入密集 来自 keras.layers imp...

回答 2 投票 0

如何在我的kaggle笔记本中激活GPU?它使用 CPU 100%,GPU 0%。我的深度学习项目需要 GPU 加速器

在kaggle中,我在创建笔记本时选择GPU加速器。然后,它还显示 CPU 使用率 100%,GPU 使用率 0%。因此,我的代码需要 8 小时执行时间。 我该如何解决这个问题...

回答 1 投票 0

尝试从 inceptionv3 架构中提取特征时出现图形断开错误

我正在尝试从架构中间提取一些特征并将其用于另一个模型。 base_model = InceptionV3(weights='imagenet', include_top=False) 输入张量=输入(形状=(29...

回答 1 投票 0

如何在tensorflow中的不同位置裁剪一批图像?

我有一批形状为[batchsize,h,w,channel]的图像。以及一批形状为 [batchsize,2] 的左上角点。 我需要用边界框裁剪每个图像(假设大小为 [10,10]),...

回答 1 投票 0

MediaPipe 静态存储视频人脸地标检测

我一直在尝试让媒体管道来检测静态(存储)视频中的面部标志,但所有在线指南和教程都使用实时摄像头源。在 python 中很容易,但我必须在

回答 1 投票 0

我的自动编码器没有学习预测值

我正在尝试在 Keras 中构建一个变分自动编码器,输入形状为 X= (1,50) 和 Y= (1,20)。 我做了 1 个输入,我想在输入和输出之间建立关系。 (d...

回答 1 投票 0

Resnet34第一层7x7或3x3

我一直在尝试使用 pytorch 实现 Resnet34,但在查看其他实现时,我发现其中一些具有 3x3 卷积层 + bn + relu 作为第一层。然而,在

回答 1 投票 0

Pytorch 模型输出形状问题

我正在尝试在 Pytorch 中使用 D-Linear 模型的实现。 这是模型架构 从重新导入X 进口火炬 将 torch.nn 导入为 nn 导入 torch.nn.function 作为 F 导入numpy...

回答 1 投票 0

卷积神经网络不学习

我正在尝试在包含 1500 张图像(15 个类别)的训练集上训练用于图像识别的卷积神经网络。有人告诉我,这种架构和初始权重来自

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.