我应该在json和html解析器上阅读什么以自己构建一个?

问题描述 投票:0回答:1

我想创建一个json和html解析器以加深我对它们的了解(正如您想的那样,我不想将其重新发明为“更有效”)。我应该读什么才能成功?

P.S:我知道解析法则,但是在json上找不到。

P.P.S:C ++实现是我的目标。

html json parsing documentation implementation
1个回答
0
投票

JSON在RFC 8259(使用EBNF)和ECMA-404(使用铁路图)中指定。由于它们都定义了相同的语法,因此您所使用的二者中的哪一个不重要;去找一个你容易找到的东西。

JSON解析非常简单。另一方面,HTML是一个庞大的项目,由于缺少版本化的权威性标准而变得更加复杂,这使它成为了一个移动的目标。

"living standard"当前定义的HTML解析是一个可能无法封装在无上下文语法中的过程。尽管有可能至少提取一个词法语法,但是如果您忽略了处理词法错误处理的部分,则没有真正尝试使用标准中的语法描述。

当然,您可以为行为良好的子集编写一个解析器,但是该解析器可能无法很好地应对您要处理的许多“ HTML”文档。就个人而言,出于学习目的,我建议您尝试XML。 (另请参见[XML命名空间](https://www.w3.org/TR/xml-names/)]

© www.soinside.com 2019 - 2024. All rights reserved.