深度学习是一个机器学习领域,其目标是使用“深层”(由多层组成)的特殊神经网络架构来学习复杂的功能。此标记应用于有关深度学习体系结构实现的问题。一般机器学习问题应标记为“机器学习”。包括相关软件库的标签(例如,“keras”或“tensorflow”)是有帮助的。
如何使用 PSO 等自然启发算法作为 keras 模型中的优化器?
我正在研究 keras 模型(分层注意力网络)来将文本分类为各种类别。我目前使用的是 Adam 优化器。我希望使用受自然启发的算法,如 PSO、Cuc...
我已经开始尝试训练机器学习模型,并在训练过程中遇到了一些关于纪元和步骤概念的困惑。在网上研究时,我发现...
我正在尝试使用 Yolov8 进行分类,但我的数据集不包含任何标签文件夹。我仍然可以使用 yolov8 还是应该尝试其他模型? 我想对心脏ct进行分类。我的数据集...
使用 tf.keras.Model.save() 时,子类 Keras 模型 HDF5 (.keras) 格式保存错误 - TypeError: 不支持的整数大小 (0)
问题 我有一个带有自定义层的子类tensorflow.keras.Model Seq2Seq模型,当我尝试通过tensorflow.keras.Model.save()保存时,该模型抛出以下错误: 追溯(最近的...
多头自注意力中的爆炸梯度(NaN 训练损失和验证损失) - Vision Transformer
这个多头自注意力代码导致训练损失和验证损失变成NaN,但是当我删除这部分时,一切都恢复正常。我知道当训练损失和
fairseq 和 fairseq2 有什么区别? github页面的引用不是很清楚 Fairseq(-py) 是一个序列建模工具包,允许研究人员 和开发人员培训c...
我正在使用tensorflow lite框架来创建实验的量化模型。我想在我的 Raspberry Pi 上部署这个模型,但似乎使用预训练模型进行量化......
我只有来自实验的“正”类图像数据,任务是使用深度学习网络来训练它们。任何与上述类别稍有不同的东西都应该属于类别......
番茄项目 该模型正在构建,但拒绝训练。它说输入形状的格式不正确,我已经尝试了我所知道的一切可能的方法。模型误差为 纪元...
DGL 包安装中 libdgl.dll 出现 FileNotFoundError
我在尝试在 Python 中导入深度图库 (DGL) 包时遇到 FileNotFoundError。错误消息特别提到无法找到模块 'D:\Anaconda nvs...
Optuna Hyperband 算法不遵循预期的模型训练方案
我在 Optuna 中使用 Hyperband 算法时发现了一个问题。根据 Hyperband 算法,当 min_resources = 5、max_resources = 20、reduction_factor = 2 时,搜索应该...
Huggingface Pretrained 中 device_map = "auto" 的替代方案
我有一个使用以下代码从 Huggingface 读取的模型: 从变压器导入 AutoTokenizer、AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained(model_path) 模式...
我尝试从链接运行此模型: https://www.kaggle.com/code/alexfordna/garbage-classification-mobilenetv2-92-accuracy/notebook 当我在 colab 上用类似的数据集(但更小......
设置 我在 M3 MacBook Air 上进行了图像分类器训练,使用的代码与我今天在 Google Colab 中运行的代码完全相同。 Google 给了我一个 T4 GPU,不包括上传/下载数据,Colab sc...
我正在尝试在 h2o 包中实现深度学习功能,并获得持续错误,尽管(似乎)遵循该包文档中给出的示例: https://...
我是深度学习领域的新手,在确定两个图像是否具有均匀的颜色和纹理时遇到问题。例如,我有一个 主图- 现在,关于这张图片我...
我有一个问题,当我实现以下代码时,在对可训练变量应用掩码后,x 的梯度变为无。移除掩模后,就可以计算梯度了。我赢了...
我正在测试名为 LaBSE 的 nlu 模型。我想知道运行它时需要多少 GPU 内存。以下是如何在句子上运行它并将其转换为嵌入的示例: 来自句子_变形金刚...
Tensorflow keras 错误 AttributeError: 'tuple' 对象没有属性 'lower'
我有代码: 将张量流导入为 tf 从tensorflow.keras.preprocessing.text导入Tokenizer 从tensorflow.keras.preprocessing.sequence导入pad_sequences 从tensorflow.keras.models导入
在MONAI平台中使用未加权骰子和交叉熵损失训练医学图像分割模型时,epoch损失突然下降,如下图所示。我从来没有见过这样的亏损趋势。 ...