首先使用内置的“ tips”数据框以绘图方式表达,我首先创建了一个日期时间列。
import plotly.express as px
import pandas as pd
from datetime import datetime
df_tips = px.data.tips()
datelist = pd.date_range(datetime.today(), periods=df_tips.shape[0]).tolist()
df_tips['date'] = datelist
使用一列日期时间作为x轴会出现错误:
px.scatter(df_tips,x='date',y='tip',trendline='ols')
...
TypeError: cannot astype a datetimelike from [datetime64[ns]] to [int32]
不使用任何其他列。有什么好方法吗?
最安全的方法是对日期的序列化表示进行回归,然后将x轴设置为向上显示为字符串。所谓序列化表示,是指Ben.T在其评论中建议的方法,或Plot best fit line with plotly。然后,您可以使用以下方法设置x轴的布局:
fig.update_xaxes(tickangle=45,
tickmode = 'array',
tickvals = df_tips['date'][0::40],
ticktext= [d.strftime('%Y-%m-%d') for d in datelist[0::40]])
df_tips['date'][0::40]
部分确保每个刻度线之间都有一些空间。
图1:
如果您想使用数据集的其他维度,例如,fig = px.scatter(df_tips,x='date',y='tip', color = 'sex', trendline='ols')
:],此方法甚至可以很好地工作。
图2:
完整代码:
import plotly.express as px
import pandas as pd
from datetime import datetime
df_tips = px.data.tips()
df_tips['date'] = df_tips.index
datelist = pd.date_range(datetime.today(), periods=df_tips.shape[0]).tolist()
fig = px.scatter(df_tips,x='date',y='tip', trendline='ols')
fig = px.scatter(df_tips,x='date',y='tip', color = 'sex', trendline='ols')
fig.update_xaxes(tickangle=45,
tickmode = 'array',
tickvals = df_tips['date'][0::40],
ticktext= [d.strftime('%Y-%m-%d') for d in datelist])
fig.show()