deep-learning 相关问题

深度学习是一个机器学习领域,其目标是使用“深层”(由多层组成)的特殊神经网络架构来学习复杂的功能。此标记应用于有关深度学习体系结构实现的问题。一般机器学习问题应标记为“机器学习”。包括相关软件库的标签(例如,“keras”或“tensorflow”)是有帮助的。

通过保存的 RT-DETR 模型权重进行推理时,KeyError: 263

我已经训练了用于物体检测任务的 RT-DETR 模型(取自 ultralytics)。我使用以下内容通过保存的权重进行推理: `从 ultralytics 导入 YOLO 导入CV2 加载你训练过的

回答 1 投票 0

从稀疏 3D 点云中检测静态和动态行人

我想用点云来检测静态和动态的人。然而,我使用VLP-16,很明显点云在垂直方向上会非常稀疏。 我有学习相关文献...

回答 1 投票 0

Flutter:在登录状态下打开本机 Outlook 应用程序(深层链接)

我正在开发一个 Flutter 应用程序,该应用程序的仪表板带有 Outlook 图标。当用户单击 Outlook 图标时,我会获得一个登录 URL,该 URL 成功在浏览器中打开并登录到用户的 Outl...

回答 1 投票 0

我想消除学习循环过程中内存使用的积累

在以下代码的学习循环中,内存将被淹没。每个循环都打开变量并通过loss.backward打开计算图,我认为没有什么可以

回答 1 投票 0

检查点的 Peft 模型导致尺寸不匹配

我训练了peft模型并将其保存在huggingface中。不,我想将它与基本模型合并。 我使用了以下代码。 从 peft 导入 PeftModel、PeftConfig、AutoPeftModelForCausalLM 来自传输...

回答 1 投票 0

如何从有限列表中传递元素作为输入?

我有“石头剪刀布”游戏的状态列表。 我计划对这些类别进行编码,如下所示: [1, 0, 0] - 摇滚 [0, 1, 0] - 纸 [0, 0, 1] - 剪刀 有转换吗...

回答 1 投票 0

libtorch/Pytorch:用 C++ 从 Tensor 中切片通道

我有一个用于分割任务的神经网络,它产生形状为 [1, 2, 416, 416] 的输出张量。第一个索引是批量大小,第二个索引是输出通道。我可以摆脱

回答 1 投票 0

我们可以通过仅省略 pbtxt 标签映射文件中的标签来忽略 Tensorflow 对象检测 API 中不必要的类吗?

我正在尝试使用 Tensorflow 对象检测 API 创建用于对象检测的自定义数据集。在使用开源数据集时,我遇到的注释文件为 PASCAL VOC xm...

回答 1 投票 0

torch.autograd.grad 在计算时间导数时返回“None”

我有一个 LSTM 模型,它采用 3 个温度数据序列并输出下一个序列。 输入=> [数组([0.20408163, 0.40816327, 0.6122449 ]), 数组([0.40816327, 0.6122449, 0.

回答 1 投票 0

在 iOS 框架中使用 Google MLKit

我有一个 swift 框架,在该框架中我使用 GoogleMLKit/SegmentationSelfie。因为 MLKit 只能通过 cocoa pods 获得,所以我必须将我的项目转换为 pods 项目,并且我...

回答 1 投票 0

MLKit:使用 MLKSegmentationMask 从视频捕获中删除背景

我正在使用适用于 iOS 的 MLKit 进行自拍分割。在他们的示例项目中,他们使用彩色蒙版来识别背景。我需要使用 MLKSegmentationMask 和 f...

回答 1 投票 0

MediaPipe 自拍分段:尝试从画布捕获流时出现错误

我正在尝试对网络摄像头的图像使用自拍分割。为此,我使用 MediaPipe 库。 这是我的代码 const selfieSegmentation = new SelfieSegmentation({locateFile: (文件) =>...

回答 1 投票 0

如何实现SwiGLU激活?为什么 SwiGLU 接受两个张量?

https://arxiv.org/pdf/2002.05202 中引入的 SwiGLU 变体简直就是“神圣的仁慈”,而 Flash-Attention 的实现则开箱即用 https://github.com/Dao...

回答 1 投票 0

特定任务和类别的COCO数据集下载

如何下载特定类别和任务的 COCO 数据集?我还想将下载限制为特定数量的图像。我之前尝试使用注释文件提供来执行此操作...

回答 1 投票 0

如何解释 CNN 中的 model.summary() 输出?

我是深度学习和 CNN 的新手。如果如屏幕截图所示创建了 CNN,那么如何解释 model.summary() 所描述的输出。我无法理解输出

回答 4 投票 0

神经网络的准确率没有改变

全连接神经网络的代码(我知道什么是更好的卷积,我会进一步做),它确定 MNIST 数据集中的数字。启用后,精度根本不会改变。什么

回答 1 投票 0

在 PyTorch 中使用 KL 散度的哪种方法是正确的?如果分布为零怎么办?

我正在尝试用 KL 散度将分布 p 拟合到分布 q 。 进口火炬 p = torch.Tensor([0.1, 0.2, 0.7]) q = torch.Tensor([0.333, 0.334, 0.333]) 所以我自己计算kl散度...

回答 1 投票 0

如何停止张量流中张量的某些条目的梯度

我正在尝试实现嵌入层。嵌入将使用预先训练的手套嵌入来初始化。对于可以在手套中找到的单词,它将被修复。对于那些话...

回答 4 投票 0

神经网络的输入数据中的特征应该是行还是列?

我已经实现了一个神经网络,并且有一个关于处理输入矩阵数据形状的正确方法的问题。具体来说,我想知道输入数据 X 是否应该有关于......的示例

回答 1 投票 0

Keras 模型中的自定义编码器和解码器层显示为未构建

我有一个带有自定义层的子类tensorflow.keras.Model Seq2Seq模型。但是,当我尝试运行测试脚本来构建和编译模型时,运行 model.summary() 会给出: 型号:“

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.