深度学习是一个机器学习领域,其目标是使用“深层”(由多层组成)的特殊神经网络架构来学习复杂的功能。此标记应用于有关深度学习体系结构实现的问题。一般机器学习问题应标记为“机器学习”。包括相关软件库的标签(例如,“keras”或“tensorflow”)是有帮助的。
我安装并更新了 python(路径集)和 Tensorflow,但 Tensorflow 不导入
虽然我已经在vs code中安装并更新了python和tensorflow,但我仍然收到此错误: "message": "无法解析导入\"tensorflow\"", 这是
如果未指定验证数据集,Tensorflow.js fitDataset() 的默认行为是什么?
Tensorflow 如何计算拟合损失?如果未指定validationData,它根据什么计算拟合损失?它是一个可选参数,即使您不指定它也会运行拟合,这是
我有两个模型, model_A 和 model_B 。 我想对这两个模型进行元素明智加法,并将结果用作 model_C 的输入。 所以,我有这个代码: 从tensorflow.keras.layers导入...
关键点:数据集太大了,我几乎无法将其存储在硬件中。 (拍字节) 假设我的数据集中有数万亿行。该数据集太大,无法存储在内存中...
对于 NLP 和视觉语言问题中的各种神经网络架构来说,将初始词嵌入层的权重与输出 softmax 的权重联系起来是很常见的。通常这会产生...
Keras LSTM - 验证损失从 Epoch #1 开始增加
我目前正在进行我的第一个“真正的”深度学习项目(令人惊讶)预测股票走势。我知道我以 1000:1 的比例去创造任何有用的东西,但我很享受它并希望看到它完成,我已经...
我正在用我的数据训练我的CNN模型,在我做了一些调整之后(我将卷积上的sigmoid激活更改为relu并添加了学习率衰减函数)我得到了NAN损失和NAN mae
我有一个大小为 (4000000,3,90) 的张量,400 万行,3 列,每个单元格中有一个 90 的暗向量。 我想计算连续每 2 个向量的欧几里得距离,然后...
我想对 MarianMT 模型进行批量推理。这是代码: 从变压器导入 MarianTokenizer tokenizer = MarianTokenizer.from_pretrained('赫尔辛基-NLP/opus-mt-en-de') src_texts = [ &qu...
我正在寻找一种使用人工智能来发现两个图像之间差异的方法。 这是我的大学项目,我的教授要求我创建一个程序来检测和发现两对中的差异......
在Python中实现15%的CIFAR10标签完全打乱的最有效方法是什么?
我正在使用深度神经网络进行实验,我需要通过向标签添加 15% 的标签噪声来训练模型来检查模型的稳健性。 我要达到彻底的疯狂...
在将输出图像放入 PyTorch 的线性层之前如何知道输出图像形状?
类网络(nn.Module): def __init__(自身, l1=120, l2=84): 超级(网络,自我).__init__() self.conv1 = nn.Conv2d(3, 6, 5) self.pool = nn.MaxPool2d(2, 2) self.conv2 = nn.
我在 PyTorch 中实现了一些模型,它们的性能在自定义平台上进行评估(围绕 Pytorch 进行包装,保持整体界面)。 然而这真的很慢:测试 10k
由于某种原因,我的训练集没有显示为 matplotlib 图,我正在使用 torchvision 数据集 MNIST。抱歉,如果我的代码不是最有效的,只是启动 pytorch。 代码正在运行
考虑以下定义深度神经网络的类。 神经网络类(nn.Module): def __init__(自身, 输入大小, 输出大小): 超级(神经网络,自我).__init__()
我想训练一个卷积神经网络来检测图像的正确方向。仅 4 度(0、90、180 和 270)。 困难在于:图像将包含不同的对象 - 单个
我正在研究神经网络,或更具体地说,目前正在研究图像分类。当我阅读时,我想知道以下内容是否已经完成/可行。如果有人能指点我...
我想问为什么前向传递通过MLP模型的时间取决于输入数据的大小(在采样和创建较小的批次之前)。 例如,如果我选择 10(批量大小)...
我想知道为什么它有效(查找注释“#这是输出层,这就是我正在谈论的”): model = Sequential() # 不讲这个 模型.add(密集(32,
我正在研究约鲁巴语的变音项目。这是尼日利亚语言。 我正在使用 HuggingFace 代码库来执行我的工作。训练、评估和预测阶段有效......