好的,所以我几天前开始使用Python。我主要将它用于DataScience,因为我是一名本科化学专业的学生。好吧,现在我手上有一个小问题,因为我必须推断一个功能。我知道如何制作简单的图表和图表,所以请尽量解释它对我来说很容易。我从以下开始:
from matplotlib import pyplot as plt
from matplotlib import style
style.use('classic')
x = [0.632455532, 0.178885438, 0.050596443, 0.014310835, 0.004047715]
y = [114.75, 127.5, 139.0625, 147.9492188, 153.8085938]
x2 = [0.707, 0.2, 0.057, 0.016, 0.00453]
y2 = [2.086, 7.525, 26.59375,87.03125, 375.9765625]
所以有了这些值,我必须找出一种方法来推断,以便在我的x = 0时获得y(或y2)值。我知道如何以数学方式做到这一点,但我想知道python是否可以做到这一点以及如何在Python中执行它。有一个简单的方法吗?你能给我一个我给定值的例子吗?谢谢
快速浏览一下您的数据,
from matplotlib import pyplot as plt
from matplotlib import style
style.use('classic')
x1 = [0.632455532, 0.178885438, 0.050596443, 0.014310835, 0.004047715]
y1 = [114.75, 127.5, 139.0625, 147.9492188, 153.8085938]
plt.plot(x1, y1)
x2 = [0.707, 0.2, 0.057, 0.016, 0.00453]
y2 = [2.086, 7.525, 26.59375,87.03125, 375.9765625]
plt.plot(x2, y2)
这绝对不是线性的。如果您知道这是什么类型的函数,您可能需要使用scipy's curve fitting来获得最适合的函数,然后您可以使用它。
编辑:
如果我们将图转换为log-log,
import numpy as np
plt.plot(np.log(x1), np.log(y1))
plt.plot(np.log(x2), np.log(y2))
它们看起来非常线性(如果你稍微眯一下)。找到最合适的线,
np.polyfit(np.log(x1), np.log(y1), 1)
# array([-0.05817402, 4.73809081])
np.polyfit(np.log(x2), np.log(y2), 1)
# array([-1.01664659, 0.36759068])
我们可以转换回功能,
# f1:
# log(y) = -0.05817402 * log(x) + 4.73809081
# so
# y = (e ** 4.73809081) * x ** (-0.05817402)
def f1(x):
return np.e ** 4.73809081 * x ** (-0.05817402)
xs = np.linspace(0.01, 0.8, 100)
plt.plot(x1, y1, xs, f1(xs))
# f2:
# log(y) = -1.01664659 * log(x) + 0.36759068
# so
# y = (e ** 0.36759068) * x ** (-1.01664659)
def f2(x):
return np.e ** 0.36759068 * x ** (-1.01664659)
plt.plot(x2, y2, xs, f2(xs))
第二个看起来很不错;第一个仍然需要一些改进(即找到更具代表性的功能并曲线拟合)。但你应该对这个过程有很好的了解;-)
下面是一些示例代码,可以帮助您开始构建用于您的目的的线性模型。
import numpy as np
from sklearn.linear_model import LinearRegression
from matplotlib import pyplot as plt
# sample data
x = [0.632455532, 0.178885438, 0.050596443, 0.014310835, 0.004047715]
y = [114.75, 127.5, 139.0625, 147.9492188, 153.8085938]
# linear model
lm = LinearRegression()
lm.fit(np.array(x).reshape(-1, 1), y)
test_x = np.linspace(0.01, 0.7, 100)
test_y = [lm.predict(xx) for xx in test_x]
## try linear model with log(x)
lm2 = LinearRegression()
lm2.fit(np.log(np.array(x)).reshape(-1, 1), y)
test_y2 = [lm2.predict(np.log(xx)) for xx in test_x]
# plot
plt.figure()
plt.plot(x, y, label='Given Data')
plt.plot(test_x, test_y, label='Linear Model')
plt.plot(test_x, test_y2, label='Log-Linear Model')
plt.legend()
产生以下内容:
正如@Hugh Bothwell所示,你给出的价值没有线性关系。但是,取x的对数似乎可以产生更好的拟合。