我必须从随机文本中识别国家/地区名称。我有国家名单。
我正在努力寻找一种可以在国家/地区列表上训练模型的解决方案,当我向该模型提供随机文本作为输入时,它会将国家/地区名称标识为输出。
例如:-
在这种情况下,您似乎正在匹配文本。为什么需要模型?好像有点过分了。
如果您有国家/地区列表,则应该规范文本
https://www.geeksforgeeks.org/normalizing-textual-data-with-python/
然后你可以搜索文本中的国家。
https://www.dummies.com/programming/python/how-to-search-within-a-string-in-python/
您可以使用某些技术进行匹配,例如levestein距离,但我认为有必要为此建立一个模型。