以下失败:
def round_in_tz(epoch_sec: int, tz_name: str, freq_spec: str):
"""Round the given epoch timestamp to the nearest pandas time frequency spec in the given timezone."""
return pd.to_datetime(epoch_sec, unit='s', utc=True).tz_convert(tz_name).floor(freq_spec)
print(round_in_tz(1730610000, "US/Eastern", freq_spec="86400s")) # works OK
# raises pytz.exceptions.AmbiguousTimeError: Cannot infer dst time from 2024-11-03 01:00:00, try using the 'ambiguous' argument
print(round_in_tz(1730610000, "US/Eastern", freq_spec="300s"))
def round_in_tz(epoch_sec: int, tz_name: str, freq_spec: str):
"""Round the given epoch timestamp to the nearest pandas time frequency spec in the given timezone."""
t = pd.to_datetime(epoch_sec, unit='s', utc=True).tz_convert(tz_name)
is_dst = bool(t.timetuple().tm_isdst)
return t.floor(freq_spec, ambiguous=is_dst)
注意:我们不能使用
.floor(freq_spec).tz_convert(tz_name)
,因为它会改变 freq_spec="86400s" 时的行为。 (我想要美国/东部午夜,而不是 UTC 午夜。)
我之前发现了几个关于 DST 模糊性的问题,但它们都涉及真正模糊的情况(例如在双重出现的 DST 小时内从字符串解析时间戳。)相比之下,这个问题使用纪元时间戳 1730610000,我不会指望有歧义。
欢迎来到 DST 兔子洞之旅,很多人都到了这里。
- 这里真的有任何歧义吗?我知道夏令时,但使用纪元时间可以避免任何歧义,对吧?这是 Pandas 中的错误吗?
是的,纪元时间本身在技术上是明确的,但是一旦您想将其转换为当地时间,就会出现歧义。 在您的情况下,这是由
round_in_tz()
函数中处理 (DST) 转换的方式引起的:
1730610000
2024 年 11 月 3 日,时钟移回凌晨 1:00,这意味着一天中有两次凌晨 1:00 "86400s"
),这种歧义就会消除,因为floor
向下舍入到明确设置的一天的开始"300s"
),歧义仍然存在,因为不清楚您指的是 1:00 AM 的哪个实例您可以测试自己,您对
round_in_tz
的呼叫是否可以在“足够高”的频率下工作,例如:
# works just fine
print(round_in_tz(1730610000, "US/Eastern", freq_spec="43200s"))
- 重写它的最佳方法是什么?我将以下内容组合在一起:
你的黑客基本上是正确的。最好的处理方法是简单地定义代码在遇到不明确的时间转换时应如何表现。正如您所做的那样,这可以通过
ambiguous
方法的
floor()
参数来完成。像你一样使用 tm_isdst
是完全没问题的。或者,如果您需要/想要,您可以设置 ambiguous=True
或 ambiguous=False
,这将分别将不明确的时间作为 DST 或标准时间。
如果您有兴趣进一步阅读,这篇短文提供了一些纪元时间限制的不错的总结,包括转换为当地时间时的歧义。
希望有帮助