我们的系统可以根据用户的行为收集有关用户查询和域点击的数据。我们的目标是通过预测与用户查询对应的域来增强该系统。例如,如果用户输入的查询不包含在我们的列表中,例如“xoilac tv”,我们将预测用户可能点击的域列表,例如 [xoilac.tv, 'youtube']
来自日志的示例数据集
data = [
("Lỗi Office 2013 không mở được file", "tainhanh.site"),
("yoko onsen", "www.klook.com"),
("bamboo", "www.bambooairways.com"),
("xoilac tv", "xoilac.tv"),
("xoilac tv", "youtube.tv"),
("hộp mực máy in 226dw", "toanphat.com"),
]
given q: 'xoi lac'
the output is the list of domain with highest probability :
[ {xoilac.tv, 0.99}, {'youtube.tv', 0.90},..]
是否有可能作为序列建模问题来处理,特别是 Seq2Seq?其中输入是查询,输出是用户可能访问的网站域。谁能帮忙?