我已从 openaddresses.io 下载了美国西部地理定位数据(邮政地址)。数据集中的某些地址不完整,即其中一些没有邮政编码等信息。有办法找回还是数据不完整?
我尝试搜索其他文件,希望找到任何相关信息。完整的数据集不包含任何与之相关的信息。亚利桑那州梅萨市有多个邮政编码,因此很难为该地址分配一个邮政编码。有什么办法可以解决这个问题吗?
LON,LAT,NUMBER,STREET,UNIT,CITY,DISTRICT,REGION,POSTCODE,ID,HASH
-111.8747353,33.456605,790,N DOBSON RD,,SRPMIC,,,,,dc0c53196298eb8d
-111.8886227,33.4295194,2630,W RIO SALADO PKWY,,MESA,,,,,c38b700309e1e9ce
-111.8867018,33.4290795,2401,E RIO SALADO PKWY,,TEMPE,,,,,9b912eb2b1300a27
-111.8832045,33.4232903,700,S EVERGREEN RD,,TEMPE,,,,,3435b99ab3f4f828
-111.8761202,33.4296416,2100,W RIO SALADO PKWY,,MESA,,,,,b74349c833f7ee18
-111.8775844,33.4347782,1102,N RIVERVIEW,,MESA,,,,,17d0cf1542c66083
简短回答:数据不完整。
OpenAddresses.io 中的数据仅与其提取的数据源一样完整。 OpenAddresses 只是公开可用数据集的聚合。 提供数据的政府机构之间并不存在真正的一致性。 因此,OpenAddresses 数据集的其他部分可能有城市名称或邮政编码,但通常会缺少某些内容。
如果您想要填补缺失的数据,请查看 Pelias 等项目如何使用多个数据源来补充缺失的数据。
就我个人而言,我最终总是会回到 OpenStreetMaps (OSM)。 有人可能会说 OpenAddresses 的质量更好,因为它来自官方来源,并且不会尝试使用近似值来填充数据,但缺失数据的巨大差距使其实用性大大降低,至少就其本身而言是这样。