bert.parser('FLAT ABC 7-9 TEDWORTH SQUARE LONDON SW3 4DU')
它将以高精度返回解析的令牌
('BuildingName', '7-9'),
('StreetName', 'TEDWORTH SQUARE'),
('TownName', 'LONDON'),
('Postcode', 'SW3 4DU')])
我已经审查了advellsNet,Usaddress,DeepMatcher和中文地址(bert)Https://huggingface.co/cola/Chinese-Chinese-address-ner
我正在寻找这个问题的英语(RNN,LSTM)。
ner是匹配地址的选项之一,但是您必须准备数据集来训练BERT模型,例如BuildingName,StreetName,Tewinname和Postode。 BERT基本模型没有知识来识别它。您必须通过数据喂食。 fyi。https://medium.com/analytics-vidhya/creating-wound-name-enme-enme-rendity-recognition-using-bert-bert-spacy-tourism-data-set-set-c5ee1c2955a2
Besides,地址是一个有趣的话题,当人们搜索地址时,他们可能会使用知识或自由文本搜索甚至错字。语义搜索具有余弦相似性可能会有所帮助。在Github上使用BERT进行地址匹配的一个示例称为
Georoberta