stanford pos tagger中的xml格式

Question

我标记了20个句子，这是我的代码：

public class myTag {

public static void main(String[] args) {

    Properties props = new Properties();

    try {
        props.load(new FileReader("D:/tagger/english-bidirectional-distsim.tagger.props"));
    } catch (FileNotFoundException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

    MaxentTagger tagger = new MaxentTagger("D:/tagger/english-bidirectional-distsim.tagger",props);

    //==================================================================================================
    try (BufferedReader br = new BufferedReader(new FileReader("C:/Users/chelsea/Desktop/EN/EN.txt")))
    {

        String sCurrentLine;

        while ((sCurrentLine = br.readLine()) != null) {

            String tagged = tagger.tagString(sCurrentLine);
            System.out.println(tagged);
        }

    } catch (IOException e) {
        e.printStackTrace();
    }

}

}

这是输出：

正如您在句子节点中看到的那样，它具有Id属性，在这里它经常为0，而不应该是0。我期望值是0、1、2、3、4，...我不明白我的代码有什么问题。

Answer 1

因此，如果要使用正确的ID，请先创建整个文本，然后将其传递给tagger。但是，如果您的输入文本已经被句子分割了，那么最好将它们保持原样（并在需要时自行在循环中生成ID）。

stanford pos tagger中的xml格式

问题描述投票：0回答：1

1个回答

最新问题

stanford pos tagger中的xml格式

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1