sitemap 相关问题

站点地图是网站管理员向搜索引擎通知其网站上可用于抓取的网页的简便方法。站点地图协议格式在http://www.sitemaps.org/protocol.html中定义

Yoast SEO 站点地图限制

Wordpress 查询: 我正在处理我的客户 woocommerce 网站,其中包含 130 万种产品(数字服务) 使用 Yoast SEO 高级插件。该插件将整个产品 URL 拆分为 1...

回答 2 投票 0

我需要 Django “sites”框架来为单站点 django 项目构建站点地图吗?

根据 Django 站点地图框架文档,为了能够使用站点地图框架,您需要: 确保您已经安装了站点框架。 但是,“站点”框架文档...

回答 1 投票 0

提交 2 个不同网站但内容相同的站点地图

我有两个域在同一台服务器上运行,具有相同的IP(相同的内容)。 例如:在 sitemap.xml 中,example1.com 是一个网站,而 method1.com、method2.com 等许多页面都会

回答 2 投票 0

Google Search Console:无法读取站点地图

我有以下站点地图,位于:https://techjobs.xyz/sitemap.xml 我本周早些时候在 Google Search Console 中将其提交给 Google,但它仍然显示无法读取站点地图。 我找到了一些...

回答 1 投票 0

Gatsby 的插件生成的 sitemap.xml 返回 404 错误

说明 我正在使用 gatsby-plugin-sitemap 为 Gatsby 站点生成 sitemap.xml,但是,由于某种我找不到的原因,每当我尝试访问它时,它都会返回 404 错误。 例子 我创造...

回答 3 投票 0

如何让谷歌机器人使用动态网址抓取我的React网站并在谷歌中显示它们

我有这个网站,我们可以创建新问题。每当创建新问题时,都会生成新的网址,我希望每次添加新问题时谷歌都会抓取我的网站并将其显示在

回答 4 投票 0

在 Google 搜索控制台上提交站点地图后出现错误,状态显示无法获取(HTTP 错误 403)

考虑: 我在 Google 搜索控制台上收到站点地图错误,而之前提交后,它并不是站点地图无法获取的错误。我删除了站点地图并再次提交,但是

回答 2 投票 0

Next 14 应用程序路由器 - 基本站点地图 404 未找到

只需定义一个基本的 app/sitemap.ts 即可: 返回 [ { 网址:“https://acme.com”, 最后修改:新日期(), 更改频率:“每年”, 优先级:1, ...

回答 1 投票 0

sitemap_generator + 移动性

我不知道问题出在哪里。 我将 systemmap_generator gems 与mobility 和Friendly_id 结合使用。 这是 sitemmap.rb 文件: SitemapGenerator::Sitemap.default_host = "

回答 1 投票 0

使用 django rest_framework 和 nextjs 生成站点地图的最佳方法是什么?

我正在为我的网站创建一个 XML 站点地图,该网站具有 Django-Rest-Framework 后端和 Next.js 前端。我正在考虑两种选择: 在

回答 1 投票 0

在laravel中添加站点地图文件和路线

我的视图文件夹中有一个 sitemap.xml 文件,这是路线: 路线::get('sitemap.xml',function() { 返回响应()->视图('站点地图') -> header('内容类型', 'xml'); }); 但当我看到...

回答 5 投票 0

如何从 WordPress 站点地图中删除特定页面?

我想从站点地图页面中删除一些链接和文章。我尝试过使用名为“WordPress Simple HTML Sitemap”的插件,甚至在 WordPress 本身中尝试过,但还没有

回答 1 投票 0

使用 Zend_Navigation 的图像站点地图

我使用 Zend_Navigation 生成站点地图,我想将图像添加到此站点地图,现在我不知道如何完成此操作,我使用以下(工作)代码来生成站点地图 foreach($

回答 1 投票 0

为 Next.js 生成视频站点地图

我目前正在开发一个能够成功生成站点地图的项目。我创建了几个站点地图,其中之一名为“视频”。经过一番研究,我发现...

回答 1 投票 0

迭代所有站点地图 XML 节点以获取网站 URL

如果我有一个包含 URL 或其他站点地图的站点地图 xml 文件,那么获取所有网站 URL 的最佳 C# 代码是什么? 我还需要检查文件架构以进行迭代吗? 站点地图如: 如果我有一个包含 URL 或其他站点地图的站点地图 xml 文件,那么获取所有网站 URL 的最佳 C# 代码是什么? 我还需要检查文件架构以进行迭代吗? 站点地图喜欢: <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" generatedBy="ANY"> <sitemap> <loc>https://www.example.com/forum-categories-sitemap.xml</loc> <lastmod>2022-11-04</lastmod> </sitemap> <sitemap> <loc>https://www.example.com/forum-posts-sitemap.xml</loc> <lastmod>2022-11-04</lastmod> </sitemap> <sitemap> <loc>https://www.example.com/blog-posts-sitemap.xml</loc> <lastmod>2022-11-04</lastmod> </sitemap> <sitemap> <loc>https://www.example.com/blog-categories-sitemap.xml</loc> <lastmod>2022-11-04</lastmod> </sitemap> <sitemap> <loc>https://www.example.com/pages-sitemap.xml</loc> <lastmod>2022-11-03</lastmod> </sitemap> <url> <loc>https://www.example.com/post/somelink</loc> <lastmod>2022-09-15</lastmod> </url> <url> <loc>https://www.example.com/post/otherlink</loc> <lastmod>2022-09-05</lastmod> </url> </sitemapindex> 我通过使用httpclient而不是XElement.Load加载站点地图来解决问题,然后如果节点是另一个站点地图,它将加载子站点地图。我一直在寻找一种更简单的方法,但这是我能做到的最好的方法。 public async static Task<HttpResponseMessage> getresponseMessage(string link) { var httpClient = new HttpClient(new HttpClientHandler { AllowAutoRedirect = false }); httpClient.DefaultRequestHeaders.Add("User-Agent", "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36"); var responseMessage = await httpClient.GetAsync(link); return responseMessage; } public async static Task<List<string>> getsitemapurls(string link) { List<string> res = new List<string>(); var responseMessage = await getresponseMessage(link); string responseContent = await responseMessage.Content.ReadAsStringAsync(); XmlDocument doc = new XmlDocument(); doc.LoadXml(responseContent); var urls = doc.GetElementsByTagName("loc"); foreach (XmlElement loc in urls) { string ParentNodeName = loc.ParentNode!.Name.ToString(); if (ParentNodeName.ToLower() == "sitemap") { if (loc.InnerText is not null) { List<string> ress = await getsitemapurls(loc.InnerText.ToString()); res.AddRange(ress); } } else if (ParentNodeName.ToLower() == "url") { if (loc.InnerText is not null) res.Add(loc.InnerText.ToString()); } } return res; } 根据您的用途,您有多种选择, 使用 XMLDocument。 XmlDocument doc = new XmlDocument(); doc.Load("<your site map URL>"); //or you can doc.LoadXml("xml sitemap string") var urls = doc.GetElementsByTagName("loc"); foreach (XmlElement loc in urls) { Console.WriteLine(loc.InnerText); } 使用 XElement 和 LINQ(必须包含命名空间才能正常工作)。 XElement root = XElement.Load("<Your sitemap URL>"); //or you can XElement.Parse("xml sitemap string") XNamespace ns = "http://www.sitemaps.org/schemas/sitemap/0.9"; var urls = from urlTag in root.Descendants(ns + "loc") select urlTag.Value; foreach (var loc in urls) { Console.WriteLine(loc); } 希望这有帮助。 这是我在爬虫项目中使用的示例解决方案,它将从多个子站点地图文件中检索所有 URL。 public sealed class SitemapParser { public async Task<List<string>> GetSitemapUrlsAsync(string baseUrl) { var url = baseUrl.EndsWith(".xml") ? new Uri(baseUrl) : new Uri(new Uri(baseUrl), "sitemap.xml"); var sitemapUrls = new List<string>(); using (var client = new HttpClient()) { var content = await client.GetStringAsync(url); var doc = XDocument.Parse(content); var ns = (XNamespace)"http://www.sitemaps.org/schemas/sitemap/0.9"; foreach (var element in doc.Descendants()) { if (element.Name == ns + "sitemap") { var locElement = element.Element(ns + "loc"); if (locElement != null) { var nestedSitemapUrls = await GetSitemapUrlsAsync(locElement.Value); sitemapUrls.AddRange(nestedSitemapUrls); } } else if (element.Name == ns + "url") { var locElement = element.Element(ns + "loc"); if (locElement != null) sitemapUrls.Add(locElement.Value); } } } return sitemapUrls; } } 用途: var sitemapUrls = await GetSitemapUrlsAsync("https://www.thelawyermag.com/sitemap.xml");

回答 3 投票 0

用于构建站点地图的软件

如果我必须为没有站点地图的网站创建内容清单,并且我无权修改该网站,但该网站非常大。我怎样才能建立一个站点地图......

回答 4 投票 0

如果我的排名数学站点地图中缺少一些重要的网址,我该怎么办?

我的一些产品网址未显示在站点地图上。我检查过它们没有设置为 noindex,并且我已经清除了我的站点缓存。我还检查了我的排名数学设置,但我仍然没有...

回答 1 投票 0

使用@nuxtjs/sitemap动态生成站点地图

我使用@nuxtjs/sitemap作为我的站点地图生成器,一些路线是由ajax给出的。 每当有人访问 /sitemap.xml 时,我都需要它拥有最新的 api 数据,是否可以用这个 li 来做到这一点...

回答 1 投票 0

带有 Google XML 站点地图插件的 WordPress 站点地图

我安装了该插件,正如预期的那样,站点地图应该在domainname.com/sitemap.xml 上可见。它是可见的,但如图所示。我没有帖子,只有页面。页面列表...

回答 4 投票 0

公共目录中的 React sitemap.xml 文件在构建后未显示

我有一个脚本可以在公共目录中生成 sitemap.xml 文件。开发时可以在 localhost:3000/sitemap.xml 中访问它。但是当它进行构建时,我无法访问该文件......

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.