自然语言处理(NLP)是人工智能的子领域,涉及从自然语言数据转换或提取有用信息。方法包括机器学习和基于规则的方法。
我目前正在使用 GPT-3,我正在尝试将其功能与我的硕士论文的相关语言模型进行比较。 不幸的是,GPT-3 是一个基于 API 的应用程序,所以我真的无法...
我已经无计可施了…… T5.omnx - ML.Net 实现尝试深入文本摘要...... 拥有此文本线束 - 其内容如下 - 线束是组件可用性的简单证明....
我想使用 Sklearn 的 CountVectorizer 打印出语料库中每个文档的单词列表(即词袋)及其各自的术语频率(以文本格式)。我怎么会痛...
我有一个 pandas 数据框,其中有一列文本值(文档)。 我想使用 pandas apply 函数通过 spacy 库对这些值应用词形还原。 我已经定义了我的 to_lemma
我正在尝试从 PDF 格式的研究论文中提取标题、标题和副标题。我尝试了各种方法,但未能获得准确的结果。这是我采取的步骤...
假设我们有一个这样的模板句子: “____房子是我们见面的地方。” 我们有一个形容词列表来填补空白,例如: “黄色的” “大的” ...
我使用了coqui的开源存储库来构建语音克隆模型。它利用使用 LJSpeech 数据集训练的不同 tts_model。我使用多语言模型来使用我...
我想打印文件中所有带有形态标签的标记。到目前为止,我编写了如下所示的代码。 def 索引(文件路径,字符串): 进口再 模式=重新编译(r'...
Apertium + Python:词性标注器不提供表面形式
我正在尝试使用 Apertium 的标记器对意大利语中的一些句子进行词性标记。 虽然根据 Apertium GitHub 页面,除了形态之外,我还应该得到表面形式作为输出......
我如何获得单词的所有形态形式? 例如,搜索关键字为: 跑步者 结果应该是: 跑步,跑步...等等
我正在尝试在 NLTK 中添加一些阿拉伯语功能, 但有些任务(例如词干提取)需要词法分析。有没有办法定义特定语言的形态特征,例如......
我需要为自然语言创建特殊的形态词汇。每个单词应该包含一组特征。 PostgreSQL 9.* 在这种情况下有帮助吗?我的意思是:我应该创建表格...
我在使搜索输出对最终用户更实用方面遇到问题。问题与算法和方法有关,然后与要使用的确切技术或框架有关。 在...
我有一个像这样的csv: 约会,我,吃,鸡,你,鱼,香蕉 2014-9-14, 1, 2, 1, 1, 1, 0 2014-10-15, 1, 1, 1, 0, 0, 0 2014-11-13, 0, 1, 0, 1, 0, 1 忘记大小写和词干...
使用 *.dic *.aff 通过 Python 进行形态文本分析
我有 2 个 hunspell 格式的乌克兰语文件(.dic 和 .aff)。我的程序必须获取输入单词的基本形式。因此,它可以使用 .dic 文件中的单词形式和 .aff 文件中的 affices。我确实...
我可以使用词干分析器、过滤器等。没问题。 但是这种情况呢,例如源文本包含短语: 狐狸跳了起来。 用户已输入:fox AND make 结果 = 0; 曲...
我有一些数据: 一个 AXNHJNEHWXNOECMEJK DNFJNXYEEQWhsdbchjsxs XMJQWsdsEOJdfsKMDJE .... 每一行都是数组,每个字母都是对象。我有比较器函数,可以说字母 A 等于...
我发现是否可以在pytorch中的嵌入层中仅冻结某些嵌入权重?一种仅冻结嵌入层的某些索引的好方法。 然而,虽然将其包含在...
如何将Stanza导出为ONNX格式? 仅仅简单地训练模型似乎是不可能的。
我试图了解循环神经网络 (RNN)(例如 LSTM 或 GRU 模型或只是一个简单的 RNN)如何处理情感分析中的否定。具体来说,我很好奇这些模型如何