我想学习预测未来事件,比如......能够使用过去二十年的飞机失事数据预测2018年飞机失事的数量......或者......预测有多少T恤衫与justin beibers面对面将在2018年出售,取决于粉丝基数从previuos数据..........或如果他们决定在相同的确切日期推出多少iphone 8和samsungs s9将被出售。 ...预测一些准确的整个销售市场.....这样的东西....请建议一本书...我真的很喜欢头部第一系列....是否适合我的头数据分析? ....我不知道我是否可以提出除了编程以外的其他问题.....但我在这里.....顺便说一下大数据与此有什么关系?
这一切都属于数据科学(大数据和数据分析)。您需要预测和此类内容的一些机器学习方法,您可以访问或可以访问您想要预测的内容。
我推荐这个最新的系列文章:https://medium.com/machine-learning-for-humans/why-machine-learning-matters-6164faf1df12
除了非常好的介绍,你会发现很多资源,可以在那里进一步学习。
另外,我强烈推荐您在Coursera上找到的斯坦福大学的deeplearning.ai和机器学习课程。
干杯!
我认为您提出的大多数情景都是监督学习的情况,这是一种机器学习,其中您有先前的数据来训练您的机器学习模型的输入和输出值,并且一旦您训练了模型,您就喂养了新的输入值,它为您提供预测输出。
我强烈推荐Andrew NG的以下机器学习课程,其中课程涵盖ML的所有基础知识,包括监督和无监督学习。
https://www.coursera.org/learn/machine-learning
至于书籍,来自Analytics Vidya的以下链接是一个很好的起点,您可以阅读这些书籍,因为它们可以为您提供一些很好的统计和数据科学基础知识。
至于数据科学,数据分析和大数据之间的差异。数据科学和数据分析在某种意义上是相似的,它们都试图在数据中找到模式,并根据这些模式得出一些见解。
另一方面,大数据基本上是分布在多台机器上的巨大数据,因此您可以同时并行地存储和计算大量数据。
所以你可能会问大数据和机器学习是如何相关的?答案在于机器学习模型的训练,因为预测的准确性在一定程度上取决于你训练它的数据量。因此,更多的训练数据更好地预测和数量大数据方式领先于其他人,因此关系。