我有一个非常复杂的结构,我挑选很好但有问题unpickling。
粗略地说,我挑选了一个Grid类的对象,它有一个Cell(一个单元格的字典)。物体履带包括一个单元,一个单元具有一个履带列表。是的,它循环。
酸洗un酸洗可以正常,直到插入标记为“添加此代码导致问题”的代码。
在这种情况下,我收到此错误:
Traceback (most recent call last):
File "./issue.py", line 84, in <module>
main()
File "./issue.py", line 79, in main
grid2 = pickle.load(handle2)
File "./issue.py", line 25, in __hash__
return hash(self._position)
AttributeError: 'Cell' object has no attribute '_position'
我知道问题来自循环和散列,但我需要两者。
仔细阅读堆栈溢出问题后,我试着玩:
object.__getstate__()
object.__setstate__(state)
完全没有变化。
=>我怎样才能让我的对象变成pickle / unpickle?
谢谢您的帮助 !
我尽可能地简化了我的代码以达到目的。
代码下方。
#!/usr/bin/env python3
import typing
import pickle
class Cell:
def __init__(self, position: int):
self._position = position
self._possible_occupants = set() # type: typing.Set['Caterpillar']
@property
def position(self) -> int:
return self._position
@property
def possible_occupants(self) -> typing.Set['Caterpillar']:
return self._possible_occupants
@possible_occupants.setter
def possible_occupants(self, possible_occupants: typing.Set['Caterpillar']) -> None:
self._possible_occupants = possible_occupants
def __hash__(self) -> int:
return hash(self._position)
def __eq__(self, other: 'Cell') -> bool: #type: ignore
return self._position == other.position
class Caterpillar:
def __init__(self, cell: typing.Optional[Cell] = None):
self._cells = frozenset([cell]) if cell else frozenset([])
class Grid:
def __init__(self, file_name: str):
self._cell_table = dict() # type: typing.Dict[int, Cell]
# create a cell
cell = Cell(0)
# put in grid
self._cell_table[0] = cell
# create caterpillar
caterpillar = Caterpillar(cell)
# put back link cell -> caterpillar
# ADDING THIS CODE CAUSES THE PROBLEM !!!
cell.possible_occupants.add(caterpillar)
@property
def cell_table(self) -> int:
""" property """
return self._cell_table
def __eq__(self, other):
return self._cell_table == other.cell_table
def main() -> None:
input_file = 'tiny_grid.csv'
pickle_file = input_file + ".pickle"
grid = Grid(input_file)
with open(pickle_file, 'wb') as handle:
pickle.dump(grid, handle, protocol=pickle.HIGHEST_PROTOCOL)
with open(pickle_file, 'rb') as handle2:
grid2 = pickle.load(handle2)
print(f"are equal : {grid2 == grid}")
if __name__ == '__main__':
main()
好吧,我最终设法解决了这个问题。 (无论如何,谢谢Maks)
你似乎(任何人都可以纠正我,如果我错了)你不能发痒(实际上是unpickle)一个对象 - 或一个包含对象的对象 - 具有用户定义的哈希函数(来自这种体验)
对象在一个集合中,因此需要有一个哈希值。但是,我已经为对象定义了一个eq。似乎eq驱散了原生哈希,所以我不得不把自己的哈希,所以...我不能腌制......我发布在这里。
我通过删除eq和hash解决了这个问题,所以相等是身份(地址)并更改了代码来处理它(通过显式测试按值的相等性)
注意,定义相等性,不仅强制定义散列(下面带来不便),而且还通过引入新层来降低性能。
顺便说一下,我真正的问题不是关于酸洗,而是关于多重处理。由于我有一个工作池,多处理库似乎腌制我的数据以传递其他(或更可能回来)。我在这里提交了酸洗问题以减少问题。
获得的经验:如果你发脾气,不要哈希!
(小方注意:因为“哈希”听起来像药物和“泡菜”听起来像喝酒),所以用法语制作一个漂亮的双关语