NLP - 特定文本提取

问题描述 投票:0回答:1

我必须从随机文本中识别国家/地区名称。我有国家名单。

我正在努力寻找一种可以在国家/地区列表上训练模型的解决方案,当我向该模型提供随机文本作为输入时,它会将国家/地区名称标识为输出。

例如:-

  • “我住在印度”会给“印度”
  • “伦敦是英国的首都”就会给出“英国”
nlp text-extraction
1个回答
0
投票

在这种情况下,您似乎正在匹配文本。为什么需要模型?好像有点过分了。

如果您有国家/地区列表,则应该规范文本

https://www.geeksforgeeks.org/normalizing-textual-data-with-python/

然后你可以搜索文本中的国家。

https://www.dummies.com/programming/python/how-to-search-within-a-string-in-python/

您可以使用某些技术进行匹配,例如levestein距离,但我认为有必要为此建立一个模型。

© www.soinside.com 2019 - 2024. All rights reserved.