深度学习是一个机器学习领域,其目标是使用“深层”(由多层组成)的特殊神经网络架构来学习复杂的功能。此标记应用于有关深度学习体系结构实现的问题。一般机器学习问题应标记为“机器学习”。包括相关软件库的标签(例如,“keras”或“tensorflow”)是有帮助的。
如何下载特定类别和任务的 COCO 数据集?我还想将下载限制为特定数量的图像。我之前尝试使用注释文件提供来执行此操作...
如何解释 CNN 中的 model.summary() 输出?
我是深度学习和 CNN 的新手。如果如屏幕截图所示创建了 CNN,那么如何解释 model.summary() 所描述的输出。我无法理解输出
全连接神经网络的代码(我知道什么是更好的卷积,我会进一步做),它确定 MNIST 数据集中的数字。启用后,精度根本不会改变。什么
在 PyTorch 中使用 KL 散度的哪种方法是正确的?如果分布为零怎么办?
我正在尝试用 KL 散度将分布 p 拟合到分布 q 。 进口火炬 p = torch.Tensor([0.1, 0.2, 0.7]) q = torch.Tensor([0.333, 0.334, 0.333]) 所以我自己计算kl散度...
我正在尝试实现嵌入层。嵌入将使用预先训练的手套嵌入来初始化。对于可以在手套中找到的单词,它将被修复。对于那些话...
我已经实现了一个神经网络,并且有一个关于处理输入矩阵数据形状的正确方法的问题。具体来说,我想知道输入数据 X 是否应该有关于......的示例
我有一个带有自定义层的子类tensorflow.keras.Model Seq2Seq模型。但是,当我尝试运行测试脚本来构建和编译模型时,运行 model.summary() 会给出: 型号:“
如何使用 PSO 等自然启发算法作为 keras 模型中的优化器?
我正在研究 keras 模型(分层注意力网络)来将文本分类为各种类别。我目前使用的是 Adam 优化器。我希望使用受自然启发的算法,如 PSO、Cuc...
我已经开始尝试训练机器学习模型,并在训练过程中遇到了一些关于纪元和步骤概念的困惑。在网上研究时,我发现...
我正在尝试使用 Yolov8 进行分类,但我的数据集不包含任何标签文件夹。我仍然可以使用 yolov8 还是应该尝试其他模型? 我想对心脏ct进行分类。我的数据集...
使用 tf.keras.Model.save() 时,子类 Keras 模型 HDF5 (.keras) 格式保存错误 - TypeError: 不支持的整数大小 (0)
问题 我有一个带有自定义层的子类tensorflow.keras.Model Seq2Seq模型,当我尝试通过tensorflow.keras.Model.save()保存时,该模型抛出以下错误: 追溯(最近的...
多头自注意力中的爆炸梯度(NaN 训练损失和验证损失) - Vision Transformer
这个多头自注意力代码导致训练损失和验证损失变成NaN,但是当我删除这部分时,一切都恢复正常。我知道当训练损失和
fairseq 和 fairseq2 有什么区别? github页面的引用不是很清楚 Fairseq(-py) 是一个序列建模工具包,允许研究人员 和开发人员培训c...
我正在使用tensorflow lite框架来创建实验的量化模型。我想在我的 Raspberry Pi 上部署这个模型,但似乎使用预训练模型进行量化......
我只有来自实验的“正”类图像数据,任务是使用深度学习网络来训练它们。任何与上述类别稍有不同的东西都应该属于类别......
番茄项目 该模型正在构建,但拒绝训练。它说输入形状的格式不正确,我已经尝试了我所知道的一切可能的方法。模型误差为 纪元...
DGL 包安装中 libdgl.dll 出现 FileNotFoundError
我在尝试在 Python 中导入深度图库 (DGL) 包时遇到 FileNotFoundError。错误消息特别提到无法找到模块 'D:\Anaconda nvs...
Optuna Hyperband 算法不遵循预期的模型训练方案
我在 Optuna 中使用 Hyperband 算法时发现了一个问题。根据 Hyperband 算法,当 min_resources = 5、max_resources = 20、reduction_factor = 2 时,搜索应该...
Huggingface Pretrained 中 device_map = "auto" 的替代方案
我有一个使用以下代码从 Huggingface 读取的模型: 从变压器导入 AutoTokenizer、AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained(model_path) 模式...
我尝试从链接运行此模型: https://www.kaggle.com/code/alexfordna/garbage-classification-mobilenetv2-92-accuracy/notebook 当我在 colab 上用类似的数据集(但更小......