网络结构受到生物神经元(脑细胞)简化模型的启发。训练神经网络以通过有监督和无监督技术“学习”,并且可以用于解决优化问题,近似问题,分类模式及其组合。
如何在张量流中制作自定义损失函数,它将模型的输入、模型的预测和模型的权重作为参数
我正在尝试建立一个求解偏微分方程(PDE)的模型。问题是,它需要一个 make 损失函数,其参数为: 给予模型的输入 预测...
Numpy 神经网络无法学习(停留在 10% 的准确度)- Python
所以我尝试使用 numpy 构建一个基本的 ANN。问题是我的预测准确率一直在 10% 左右,但我不明白为什么会这样。这是所有代码。 将 numpy 导入为 np 导入
我正在训练 LSTM 神经网络来预测期货合约的未来价格。我的输入是 100 个持仓量值和 100 个收盘价值,输出是 100 个后续收盘价
为什么我们在带有交叉熵损失的Softmax反向传递中除以batch_size?
在SoftmaxWithLoss层的实现中,我注意到后向传递中的梯度除以batch_size。这是供参考的代码: SoftmaxWithLoss 类: def __init__...
我正在尝试使用 Pytorch 定义 NN 模型,但是当我想将 y-train 转换为 y-train-tensor 时出现类型错误,我应该如何修复它?
这是我的代码。我将威斯康星州乳腺癌数据库从 kaggle 导入到 vscode。所有数据集变量均为数字和浮点 64。存在此类型错误(发生异常:TypeError 不能骗...
再次调用model.fit方法是否会重新初始化已经训练好的权重?
我正在使用 Keras 来训练网络。假设在 20 个 epoch 后,我想停止训练以检查是否一切正常,然后从第 21 个 epoch 继续。是否调用 model.fit 方法...
如何修复错误 ValueError: Expected input batch_size (49) to match target batch_size (64)
我一直在修改数据加载器端,但它仍然显示该错误。 这是预处理代码: 进口火炬 从 torch.utils.data 导入数据集,DataLoader 从 torchvision 导入转换...
为什么 BF16 模型在 Mac M 系列芯片上的推理速度比 F16 模型慢?
我在https://github.com/huggingface/smollm/tree/main/smol_tools(镜像1)上读到: 所有模型均量化为 16 位浮点 (F16),以实现高效推理。训练是在 BF16 上完成的,但是在...
levenberg marquardt 在 matlab 问题代码中的实现不收敛
我正在尝试在matlab中实现levenberg marquardt算法,但是我的代码没有收敛,并且在第一次迭代后错误不断变得越来越大。我检查了雅可比表,反函数...
我想识别图像中的框。我有一个这些盒子的数据库,存储它们的 ocr 和图像。我进行搜索并使用 ocr 对脸部进行粗略转换。大部分时间都工作得很好...
我正在尝试将卷积层转换为全连接层。 例如,有一个 3×3 输入和 2x2 内核的示例: 相当于向量矩阵乘法, 有没有...
为什么我们在keras model.fit()中需要y变量?
我正在使用手写数字数据集。数据加载如下: (X_train, y_train), (X_test, y_test) = keras.datasets.mnist.load_data() 这是神经网络创建的代码...
在 PyTorch 中执行 CrossEntropyLoss() 时出错
我的数据集包含形状为 [3,28,28] 的图像。我编写了以下代码: ConvNet 类(nn.Module): def __init__(自身): super(ConvNet, self).__init__() self.layer1 = nn.
如何在ML.NET中使用CenterFace?模型期望形状 (10, 3, 32, 32)
我尝试在 ML.NET 中使用 CenterFace ONNX,但不断收到各种错误,主要与输入大小有关。 CenterFace 元数据指出它应该有一个输入 10, 3, 32, 32,这已经使得......
我正在尝试制作我的第一个张量流模型,但是我遇到了一些问题。看起来它使火车正确,但是当它进行预测时,它只返回(几乎)总是相同的值。哈...
在使用MATLAB进行图像数字识别的过程中,由于任务要求,需要使用BP神经网络。我生成了 500 张从 0 到 9 的数字图像,并设置了一个两层神经网络
我有一个 90×8 的数据集,我从 90 个字符图像(即数字 1-9)中提取特征(通过对每个 10×10 单元格中的 1 求和)。每一行代表一个图像。 我正在尝试使用以下代码来...
我想知道卷积神经网络中权重和输入的值范围是多少。我的理解如下: 如果输入是灰度图像,则输入值为...
ValueError:检查输入时出错:预期 conv2d_1_input 有 4 个维度,但得到形状为 (120, 1) 的数组
当我打印(inp_shape)时,我得到(288, 512, 3)。但是我仍然得到 ValueError:检查输入时出错:预期 conv2d_1_input 有 4 尺寸,但得到形状为 (120, 1) 的数组 我不
我有一个聊天机器人模型,我使用数据集对其进行了训练,以提供“标准”对话,例如你好,你好吗等等。现在我想用