对于神经网络,有很多不同的工具,有些人可能以前听过。一个不完整的列表包括,例如,
tensorflow(我个人喜欢),
Keras
optimizer.zero_grad()
loss.backward()
optimizer.step()
原始化optimizer
和loss
也很容易做到,您可以获得很多不同的选择。
,但是,提出一个良好的网络很难
即使只是一些高级的理解,也知道卷积是什么,anderred误差与跨熵损失有何不同(仅在这里抛弃一些单词)会使生活变得更加轻松。
您网络根本无法正常工作的原因可能只是代码中非常小的细节,而与经典编码不同,计算机不会真正告诉您故障的原因是什么。这使得很难进行调试,尤其是如果您缺乏对基本概念的理解。你怎么能开始当然,您可以从创建一个简单的神经网络开始,甚至不需要太多的理解。许多列出的工具包提供了自己的教程部分,以使您在该地区开始。 尤其是目前所有围绕神经网络的炒作,那里有很多(或多或少的经验丰富)的人创建jupyter笔记本,github页面,博客条目等,充满了宝贵的例子。
与计算机科学中的所有内容一样,实践变得完美,您将慢慢地开始了解越来越多的基本概念。 dave已经指出,那里也有一些非常轻松的解释,更多地关注理论。目前,许多人正在尝试从完全不同的领域转向AI/ML,因此对您的主题和您一样多。可悲的是,在了解其背后的“基本数学”之后,我从这个话题开始,因此我不能推荐任何特定的书/教程/作者要阅读。
可能并不令人兴奋,但我强烈建议您尝试与Perceptrons合作。它们是对神经网的好介绍。而且,如果您真的打算与MLP合作,那么您就可以专注于学习梯度下降的概念和功能变化率