XML、HTML 和 XHTML 文档的有效内容类型

问题描述 投票:0回答:1

XML、HTML 和 XHTML 文档的正确内容类型是什么?

我需要编写一个简单的爬虫,只获取这些类型的文件。

现在 http://example.net/index.html 可以通过 mod_rewrite 提供 JPEG 文件等服务,因此我需要检查响应标头中的内容类型,并将其与允许的内容类型列表进行比较。

我可以从哪里获得这样的列表?

html xml http xhtml web-standards
1个回答
302
投票
  • HTML
    text/html
    ,句号。
  • XHTML
    application/xhtml+xml
    ,或者仅在遵循 HTML 兼容性准则时,
    text/html
    。请参阅 W3 媒体类型注释
  • XML
    text/xml
    application/xml
    RFC 2376)。

还有许多其他基于 XML 的媒体类型,例如

application/rss+xml
image/svg+xml
。可以肯定的是,任何无法识别但已注册以
+xml
结尾的内容都是基于 XML 的。请参阅 IANA 列表,了解以
+xml
结尾的已注册媒体类型。

(对于未注册的

x-
类型,所有赌注都已取消,但您希望
+xml
会受到尊重。)

© www.soinside.com 2019 - 2024. All rights reserved.