400个职业如何匹配10000个职位空缺?我有两个文件:一个包含职业名称及其所属部门,第二个文件是 hh.kz 的 10,000 个职位空缺,包含职位名称及其描述。我需要将这400个职业分配给合适的职位,例如将“高级前端开发人员”与“Web开发人员”进行匹配,将“UI/UX设计师”与“Web设计师”进行匹配等。我已经对这些职业进行了清理和归一化。数据,使用了词嵌入,但这效果不佳。我还能尝试什么?
我尝试使用关键字,但不适合我
也许你可以搜索一下这些方法,我相信其中一个会起作用。
来自 fuzzywuzzy 导入模糊 来自 fuzzywuzzy 导入过程
从 Transformers 导入 BertTokenizer、BertModel 从 sklearn.metrics.pairwise 导入 cosine_similarity