考虑标签wikipedia-api(或更一般的mediawiki-api)和mediawiki。问题应与编程有关。
我在 mirehaze 中遇到脚本错误,我想尝试索引字段“wikibase”(空值)
我已将 es.Wikipedia Módulo:Ficha 导入到我的 Mirehaze 网站,但出现此错误: 第 567 行上的 Lua 错误:尝试索引字段“wikibase”(零值)。 反向跟踪: 模块:文件:567:在 &
我正在尝试使用python从维基百科上的“海战列表”中抓取所有战斗链接。问题是我不知道如何导出包含该词的所有链接...
我目前正在尝试将 bs4 方法应用于维基百科页面:结果不存储在 df 中 由于维基百科上的抓取是一种非常非常常见的技术 - 我们可以使用适当的...
我正在寻找在维基百科代码中设置变量的机会。 像这样的东西 年 1 =“2002 年” 然后只写year1而不是2002。因为如果我想改变2002 t...
如何将 Wikipedia XML 转储导入 MongoDB?
我使用了这个PHP代码: https://github.com/kodekrash/wikipedia.org-xmldump-mongodb 通过以下方式获取数据集: wget -c http://wikipedia.c3sl.ufpr.br/enwiki/20150901/enwiki-20150901-pages-articles.xml.bz2 我...
我正在开发一个图形项目,我想要一种有效的方法来从特定的英语维基百科文章中获取其他英语维基百科文章的所有链接。 目前,我正在使用 bs4 和 Pyth...
有没有一种简单的方法可以导出维基百科的翻译标题以获得这样的集合: Russian_title -> english_title? 我试图从 ruwiki-latest-pages-meta-current.xml.bz2 和 ruwiki-
我想找到一种方法来获取特定日期的维基百科文章的内容。例如,我想查看 2022 年 1 月 1 日版本的一篇文章。 要手动或使用屏幕执行此操作...
我正在尝试整理门户网站下所有文章的列表:水 (例如 json "url": "https://en.wikipedia.org/wiki/Heavy_water", "title": "重水&quo...
在 Flutter 中使用 Wikipedia API 获取图片不起作用
这是我的数据: 活动( 名称:“时代广场”, ContinentType: ContinentType.northAmerica, 描述: “纽约市充满活力的十字路口和旅游目的地。”,
在 Open Refine 中与 Wikidata 协调后获取 Wikipedia 页面 ID 而不是 Wikilink
我知道如何在与 Wikidata 协调后在 Open Refine 中下载 wikipedia 附加链接。 我使用“从协调列添加列...”并使用“SPARQL:Senwiki”作为属性...
当请求缺少用户代理时,Wikipedia API 会给出 HTTP 403
我在使用维基百科 API 时遇到问题。我使用这个 PHP 脚本, 加载(“http://en.wikipedia.org/w/api.php?action=query&prop=revisions&tit...
如何将维基百科英文页面标题导入到 postgresql 表中?
我从以下位置下载了这些标题: https://dumps.wikimedia.org/enwiki/20240420/enwiki-20240420-all-titles-in-ns0.gz 并提取它们是一个换行符分隔的文本文件。 在 postgresql 中我创建了一个表
我想在单个 SPARQL 查询中从维基数据查询服务的维基数据 ID 获取维基百科页面 ID。 第一个 SPARQL 查询从标题页获取维基数据 ID (wd:Q3131):“Alpes-de-Haute-Provenc...
是否有解析器/方法可用于使用Python解析维基百科转储文件?
我有一个项目,我收集属于特定类别的所有维基百科文章,从维基百科中取出转储,并将其放入我们的数据库中。 所以我应该解析维基百科转储......
我正在尝试复制这篇论文,其中使用了 2010 年 9 月 9 日至 2011 年 2 月 14 日之间制作的用户帐户的随机样本。我如何使用维基百科 API 来获取此数据? 我不能
使用 A 标签从 Wikipedia 上的 Div 文本中从链接中抓取到列表 DataFrame BeautifulSoup
我正处于编码的初级阶段...尝试使用“a”标签从 div 中的歌曲链接中抓取文本。然而,我只能得到alp中每个字母的第一首歌......
我正在尝试使用wikipeida的官方API从wikipeida获取包含所有图像的html内容。目前,我使用的 api 仅返回 html 内容 这就是我正在使用的 https://en.wikipedia.org/w/a...
使用 Beautiful Soup 抓取维基百科表,但没有返回 'None'
一般来说,是网络抓取和编码的新手。对于更有经验的人来说,这可能是一个简单的问题......也许不是......这里是: 尝试从维基百科网络抓取表格。我已经找到了...
使用 get_main_image 函数从维基媒体检索最高质量的图像很困难
我在 Python 脚本中遇到了 get_main_image 函数的问题,该脚本旨在从维基媒体中抓取图像。问题在于该函数下载较小图像的行为......