情节:如何使用情节表达来显示时间序列数据的趋势线?

问题描述 投票:1回答:1

首先使用内置的“ tips”数据框以绘图方式表达,我首先创建了一个日期时间列。

import plotly.express as px
import pandas as pd
from datetime import datetime

df_tips = px.data.tips()
datelist = pd.date_range(datetime.today(), periods=df_tips.shape[0]).tolist()
df_tips['date'] = datelist

使用一列日期时间作为x轴会出现错误:

px.scatter(df_tips,x='date',y='tip',trendline='ols')    
...
TypeError: cannot astype a datetimelike from [datetime64[ns]] to [int32]

不使用任何其他列。有什么好方法吗?

pandas plotly
1个回答
0
投票

最安全的方法是对日期的序列化表示进行回归,然后将x轴设置为向上显示为字符串。所谓序列化表示,是指Ben.T在其评论中建议的方法,或Plot best fit line with plotly。然后,您可以使用以下方法设置x轴的布局:

fig.update_xaxes(tickangle=45,
                 tickmode = 'array',
                 tickvals = df_tips['date'][0::40],
                 ticktext= [d.strftime('%Y-%m-%d') for d in datelist[0::40]])

df_tips['date'][0::40]部分确保每个刻度线之间都有一些空间。

图1:

enter image description here

如果您想使用数据集的其他维度,例如,fig = px.scatter(df_tips,x='date',y='tip', color = 'sex', trendline='ols'):],此方法甚至可以很好地工作。

图2:

enter image description here

完整代码:

import plotly.express as px
import pandas as pd
from datetime import datetime

df_tips = px.data.tips()
df_tips['date'] = df_tips.index
datelist = pd.date_range(datetime.today(), periods=df_tips.shape[0]).tolist()

fig = px.scatter(df_tips,x='date',y='tip', trendline='ols')
fig = px.scatter(df_tips,x='date',y='tip', color = 'sex', trendline='ols')  

fig.update_xaxes(tickangle=45,
                 tickmode = 'array',
                 tickvals = df_tips['date'][0::40],
                 ticktext= [d.strftime('%Y-%m-%d') for d in datelist])

fig.show()
© www.soinside.com 2019 - 2024. All rights reserved.