考虑标签wikipedia-api(或更一般的mediawiki-api)和mediawiki。问题应与编程有关。
我尝试显示页面坐标,但是有些页面没有坐标,API 的行为很有趣。 为了: 从维基百科导入维基百科,消歧错误 尝试: 页面=维基百科...
我正在尝试获取所有维基百科标题的列表,而无需重定向。 他们说他们有大约 6,410k 篇文章。我试图通过 https://dumps.wikimedia.org/enwiki/latest/ 和文件来获取列表
我需要获取任何电影的信息框的内容。我知道电影的名字。一种方法是获取维基百科页面的完整内容,然后对其进行解析,直到找到 {{Infobox and then get ...
中有这个精美的信息框。我如何获得 的值?
我想使用 AutoWikiBrowser(一个处理正则表达式的自动编辑器)删除维基百科上的引用,但我面临着标签的新手问题。 例如,我想删除所有引用
Okawix 有一个适用于 Android 的应用程序。我有一个 12 GB 纯文本维基百科转储,但它太大,无法放入 SD 卡。 有没有办法从这个 Okawix 转储中创建一个新的转储,仅选择计算机或 IT-
我正在尝试创建一个Python脚本,它可以从维基百科页面的边表中收集信息。有关示例,请参阅此页面。沿着页面的右侧,有 3 个垂直的
bool is_even(unsigned int n) { 如果(n==0) 返回真; 别的 返回 is_odd(n - 1); } bool is_odd(无符号整数n) { 如果(n==0) 返回假; 别的 重新...
我正在使用 pywikibot api 来获取维基百科信息框属性。我想提取的很少有人口密度、人口、海拔等。对于某些城市,例如(https://en.wikipedia.org/wiki/
所以我为我的不和谐机器人创建了一个命令来基于字符串研究维基百科页面: 导入请求 导入 json 导入不和谐 从日期时间导入日期时间、时区 def getWiki(搜索):
我正在使用dbpedia的extraction_framework(ImageExtractor#getImageUrl)来 获取图片的url(前两个字符的md5) val md = MessageDigest.getInstance("MD5") val 消息摘要 = md.
我是新来的。我有一个项目,我必须下载并使用维基百科进行 NLP。我面临的问题如下: 我的 RAM 只有 12 GB,但英文 wiki 转储超过 15 GB
我开发了一个使用 Pywikibot 的 Python 脚本。 这些脚本在 Windows 11 上运行良好,但我需要在带有 CentOS 7 的 Linux 服务器上运行它。 但是,存在一个涉及名为
所以我正在查看有关 Prim 算法的维基百科条目: 1. 与图的每个顶点 v 关联一个数字 C[v](连接到 v 的最便宜成本)和一条边 E[v](提供 t...
使用 wget 以 xml 格式从维基百科下载一篇标题为 unicode 的文章
我目前正在从维基百科下载个别文章的 XML。为此,我将 wget 与以下调用格式一起使用 https://de.wiktionary.org/wiki/Special:Export/?title=Special:Export&...
使用维基数据 SPARQL 从原始 URL 获取重定向的维基百科 URL
我有维基百科 URL 的列表,例如 “https://en.wikipedia.org/wiki/Peninsular_War” “https://en.wikipedia.org/wiki/Napoleon_I_of_France” ETC。 其中一些直接重定向到...
httpError using mwclient with local MediaWiki
我尝试使用带有本地 MediaWiki 的 mwclient 创建一个页面。 使用 wikipedia.org 一切正常。 在我的本地 MediaWiki 中,我输入以下命令: 导入 mwclient site = mwclient.Site("192.1...
针对 https://dbpedia.org/sparql/ 的 SPARQL 查询 - 如何编辑 *source* 数据?
我是 SPARQL 和 RDF 等的新手。 我有以下查询:目的是在维基百科上找到与另一个人有某种联系的人。 前缀 rdf: 前缀 rdfs: 前缀模式: 选择 *...
使用 WikiText 标记语言编写的表格的三个例子是什么,没有任何附加文档?
假设我们想在维基百科这样的网站上创建一个表格 什么源代码会产生如下所示的表格?: 水果 非水果蔬菜 黄瓜水果 菠菜叶和蒸...
我想获取 Messier 目录的名称和维基百科的页面我得到的名称在每个单元格中都有一个我不想获取的参考编号,这是我的代码: url1 = "https://dr1...