Beautiful Soup是一个用于解析HTML / XML的Python包。此软件包的最新版本是版本4,导入为bs4。
NameError:使用请求和 BeautifulSoup 的 Python Web 抓取脚本中未定义“HTTPConnectionPool”
我正在按照 YouTube 教程使用 Python 从 CoinGecko 抓取加密货币数据。我根据教程编写了以下脚本: 导入请求 从 bs4 导入 BeautifulSoup 我...
无法使用 Selenium 和 BeautifulSoup 定位单元格内容
一般来说,是网络抓取和 selenium/beautifulsoup 的新手。我一直在尝试从这个网站抓取数据,但 beautifulsoup 似乎找不到我想要的文本。我只想要 f 的日期...
我有这个html: 3.75 21 我有这个html: <html lang="en" class="no-js"> <div> <p class="price "> 3.75 </p> <p>21</p> </div> </html> 我想上这个课 问题是每次他来时都没有空间,我会做什么来尝试得到它。 current_element.get('class')... 甚至 str(current_element) 也是这样的: '<p class="price">3.75</p>' 如何获取原始课程文本?或类似的东西? 所有 html 的正则表达式不是一个选项,因为我可以有 11k 行甚至更多的 html 谢谢! HTML 中的类名称中不能有空格。当为一个元素分配多个类时,文档中会使用空格来分隔类。在这种情况下,没有任何进一步类的尾随空格将由单个类赋值处理。 任何 HTML 解析器都必须以这种方式解释它,浏览器和库都一样,因为空格不是名称的一部分,库或 DOM JS 函数不会返回它。这是预期的行为。 如果你真的想要获得这个空间,你需要使用其他方法来解析HTML,一些库不理解HTML,因此它不会解释它。
我正在尝试抓取此亚马逊列表的标题。我编写的代码适用于其他一些亚马逊列表,但不适用于下面代码中提到的网址。 这是蟒蛇鳕鱼...
使用Python与Selenium和BeautifulSoup4在Javascript加载页面上的所有元素后如何获取数据?
我正在尝试从沙箱网站抓取数据,只是为了练习并开始使用 python 抓取网络数据。 我已经成功地使用基础知识提取了大量数据,但是我发现了一个元素......
对文件夹进行更改后通过 os.scandir() 访问文件夹
我试图遍历一个包含 html 文件的文件夹,根据它们是否包含字符串形式的关键字来过滤它们。我通过 wget 和 Beautifu 将它们下载到文件夹中...
我如何从下面的 HTML 代码中提取文本。我正在使用 Python requests 和 BeautifulSoup。 前大灯 - 左 我期待着得到名字。 当前代码 ...
使用 Beautiful Soup 解析 HTML 时,有时子标签不存在
使用 Beautiful Soup,我正在开发一个非常标准的程序,它可以解析 HTML 并根据 CSS 元素检索数据。我遇到的问题是,当我检索 CSS 标签时...
我的网站编码有问题。我制作了一个程序来抓取网站,但我没有成功地更改读取内容的编码。我的代码是: 导入 sys,os,glob,re,datetime,op...
无法使用BeautifulSoup,ModuleNotFoundError但“需求已满足”
我已经使用pip和pip3安装了beautifulsoup4。当我运行 Python shell 时,我得到: 导入bs4 打印(bs4) 我已经使用 pip 和 pip3 安装了 beautifulsoup4。当我运行 Python shell 时,我得到: 导入bs4 打印(bs4) init.py'> 但是当我在 IDE (Sublime) 中尝试同样的事情时,我得到: ModuleNotFoundError: No module named 'bs4' 我被难住了,我立即下载了 pandas,它在我的 IDE 中运行得很好。有什么建议可以解决这个问题吗?或者我只是尝试另一个网络抓取工具? 这表明您使用的是不同的解释器。你可以做的就是在导入之前将 beautifulsoup4 的 path append 放入你的工作环境中。 import sys sys.path.append("/Users/jimmyfl0/Desktop/Dev/mine/the_venv/lib/python3.10/site-packages") import bs4 如果 sys.path.append 不起作用,请在运行脚本之前在终端中尝试此操作: 导出 PYTHONPATH=/path/to/venv/lib/python3.11/site-packages 当然要确保你的venv路径和python版本是准确的
如何在Python中抓取thomasnet网站以获取供应商信息
我想从 https://www.thomasnet.com/ 提取特定地点的供应商信息,例如供应商名称、位置、年收入、成立年份、员工人数、产品描述等...
我正在使用下面的代码来抓取网站并将数据导出到 CSV。它运行良好,只是标题和摘要字段在 CSV 中未正确编码。撇号显示为“...
为什么我会收到 AttributeError: 'NoneType' object has no attribute 'get_text'?
有时这有效,有时则无效。标签是正确的。 URL = 'https://www.amazon.com/Bose-QuietComfort-Cancelling-Headphones-Bluetooth/dp/B0CCZ26B5V/ref=sr_1_3?crid=2491RYA872DT3&...
“你好,你能帮我吗?当尝试从网页中提取 JSON 文件时,它适用于同一页面中的某些 URL,但对于其他 URL,我收到 403 错误。URL 是:” 好的:https://www.
我正在尝试从网站上抓取一些文本,问题在于其 HTML 格式。 我正在尝试从网站上抓取一些文本,问题在于其 HTML 格式。 <div class="coptic-text html"> <div class="htmlvis"><t class="translation" title="The book of the genealogy of Jesus Christ, the son of David, the son of Abraham."><div class="verse" verse="1"><span class="word"><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲡ' target='_new'>ⲡ</a></span><!-- --><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ϫⲱⲱⲙⲉ' target='_new'>ϫⲱⲱⲙⲉ</a></span></span><!-- --><span class="word"><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲛ' target='_new'>ⲙ</a></span><!-- --><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲡ' target='_new'>ⲡⲉ</a></span><!-- --><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ϫⲡⲟ' target='_new'>ϫⲡⲟ</a></span></span><!-- --><span class="word"><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲛ' target='_new'>ⲛ</a></span><!-- --><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲓⲏⲥⲟⲩⲥ' target='_new'>ⲓⲏⲥⲟⲩⲥ</a></span></span><!-- --><span class="word"><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲡ' target='_new'>ⲡⲉ</a></span><!-- --><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲭⲣⲓⲥⲧⲟⲥ' target='_new'>ⲭⲣⲓⲥⲧⲟⲥ</a></span></span><!-- --><span class="word"><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲡ' target='_new'>ⲡ</a></span><!-- --><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ϣⲏⲣⲉ' target='_new'>ϣⲏⲣⲉ</a></span></span><!-- --><span class="word"><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲛ' target='_new'>ⲛ</a></span><!-- --><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲇⲁⲩⲉⲓⲇ' target='_new'>ⲇⲁⲩⲉⲓⲇ</a></span></span><!-- --><span class="word"><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲡ' target='_new'>ⲡ</a></span><!-- --><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ϣⲏⲣⲉ' target='_new'>ϣⲏⲣⲉ</a></span></span><!-- --><span class="word"><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲛ' target='_new'>ⲛ</a></span><!-- --><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=ⲁⲃⲣⲁϩⲁⲙ' target='_new'>ⲁⲃⲣⲁϩⲁⲙ</a></span></span><!-- --><span class="word"><span class="norm"><a href='https://coptic-dictionary.org/results.cgi?quick_search=.' target='_new'>.</a></span></span></div></t><!-- --></span></div></t></div> 我想要的输出: 1: ⲡϫⲱⲱⲙⲉ ⲙⲡⲉϫⲡⲟ ⲛⲓⲏⲥⲟⲩⲥ ⲡⲉⲭⲣⲓⲥⲧⲟⲥ ⲡϣⲏⲣⲉ ⲛⲇⲁⲩⲉⲓⲇ ⲡϣⲏⲣⲉ ⲛⲁⲃⲣⲁϩⲁⲙ. 我的输出: ⲡϫⲱⲱⲙⲉⲙⲡⲉϫⲡⲟⲛⲓ ⲏⲥⲟⲩⲥⲡⲉⲭⲣⲓ ⲥⲧⲟⲥⲡϣⲏⲣⲉⲛⲇⲁⲩⲉⲓ ⲇⲡϣⲏⲣⲉⲛⲁⲃⲣⲁϩⲁⲙ. 到目前为止我的代码: #coding: utf-8 import requests from bs4 import BeautifulSoup import signal import sys import os.path signal.signal(signal.SIGINT, lambda x, y: sys.exit(0)) if len(sys.argv) != 4: print("Usage: %s <book name> <first chapter> <last chapter>" % os.path.basename(__file__)) quit() book_name = sys.argv[1] start = int(sys.argv[2]) stop = int(sys.argv[3]) while start <= stop: out_file = open(f"./{book_name}_{str(start)}.txt", "a") try: response = requests.get(f'https://data.copticscriptorium.org/texts/new-testament/{book_name}_{str(start)}/sahidica') soup = BeautifulSoup(response.text, "lxml") content_list = soup.find_all("span", class_="norm") text = [] print(f"[{str(start)}/{str(stop)}] https://data.copticscriptorium.org/texts/new-testament/{book_name}_{str(start)}/sahidica") for element in content_list: text.append(element.get_text()) text = ''.join(text).strip() out_file.write("%s\n" % text) except: print("Error") start += 1 附注语言是古科普特语。 编辑: 我认为问题是格式是用CSS制作的,可以以某种方式将CSS样式与BeautiFulsoup一起使用吗? .word{ white-space: inherit; } .word:after{content: " ";} div.verse{display: block; padding-top: 6px; padding-bottom: 6px; text-indent: -15px; padding-left: 15px; } div.verse:before{content: attr(verse)": "; font-weight:bold} .norm a{text-decoration: none !important; color:inherit} .norm a:hover{text-decoration: underline !important; color: blue} 编辑: 似乎content_list = soup.find_all("span", class_="word")输出了想要的结果,但仍然无法输出诗句编号。 我自己找到了答案。我必须首先选择 div 类 verse,然后迭代它以获取选择标签 span 类 word 的文本。 from bs4 import BeautifulSoup import requests r = requests.get("https://data.copticscriptorium.org/texts/new-testament/40_matthew_1/sahidica") soup = BeautifulSoup(r.content, "html.parser") select_verse = soup.find_all("div", class_="verse") verse_no = 1 for verse in select_verse: text = [] content = verse.find_all("span", class_="word") for element in content: text.append(element.get_text()) text = ' '.join(text).strip() print(f"{str(verse_no)}: {text}") verse_no += 1 输出: 1: ⲡϫⲱⲱⲙⲉ ⲙⲡⲉϫⲡⲟ ⲛⲓⲏⲥⲟⲩⲥ ⲡⲉⲭⲣⲓⲥⲧⲟⲥ ⲡϣⲏⲣⲉ ⲛⲇⲁⲩⲉⲓⲇ ⲡϣⲏⲣⲉ ⲛⲁⲃⲣⲁϩⲁⲙ . 2: ⲁⲃⲣⲁϩⲁⲙ ⲁϥϫⲡⲟ ⲛⲓⲥⲁⲁⲕ ⲓⲥⲁⲁⲕ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲓⲁⲕⲱⲃ ⲓⲁⲕⲱⲃ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲓⲟⲩⲇⲁⲥ ⲙⲛⲛⲉϥⲥⲛⲏⲩ . 3: ⲓⲟⲩⲇⲁⲥ ⲇⲉ ⲁϥϫⲡⲟ ⲙⲫⲁⲣⲉⲥ ⲙⲛⲍⲁⲣⲁ ⲉⲃⲟⲗ ϩⲛⲑⲁⲙⲁⲣ ⲫⲁⲣⲉⲥ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲉⲥⲣⲱⲙ . ⲉⲥⲣⲱⲙ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲁⲣⲁⲙ . 4: ⲁⲣⲁⲙ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲁⲙⲓⲛⲁⲇⲁⲃ . ⲁⲙⲓⲛⲁⲇⲁⲃ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲛⲁⲁⲥⲥⲱⲛ ⲛⲁⲁⲥⲥⲱⲛ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲥⲁⲗⲙⲱⲛ . 5: ⲥⲁⲗⲙⲱⲛ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲃⲟⲉⲥ ⲉⲃⲟⲗ ϩⲛϩⲣⲁⲭⲁⲃ . ⲃⲟⲉⲥ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲓⲱⲃⲏⲇ ⲉⲃⲟⲗ ϩⲛϩⲣⲟⲩⲑ . ⲓⲱⲃⲏⲇ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲓⲉⲥⲥⲁⲓ . 6: ⲓⲉⲥⲥⲁⲓ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲇⲁⲩⲉⲓⲇ ⲡⲣⲣⲟ . ⲇⲁⲩⲉⲓⲇ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲥⲟⲗⲟⲙⲱⲛ ⲉⲃⲟⲗ ϩⲛⲧϩⲓⲙⲉ ⲛⲟⲩⲣⲓⲁⲥ . 7: ⲥⲟⲗⲟⲙⲱⲛ ⲇⲉ ⲁϥϫⲡⲟ ⲛϩⲣⲟⲃⲟⲁⲙ ϩⲣⲟⲃⲟⲁⲙ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲁⲃⲓⲁ ⲁⲃⲓⲁⲥ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲁⲥⲁⲫ . 8: ⲁⲥⲁⲫ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲓⲱⲥⲁⲫⲁⲧ ⲓⲱⲥⲁⲫⲁⲧ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲓⲱⲣⲁⲙ ⲓⲱⲣⲁⲙ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲟⲍⲉⲓⲁⲥ . 9: ⲟⲍⲉⲓⲁⲥ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲓⲱⲁⲑⲁⲙ . ⲓⲱⲛⲁⲑⲁⲙ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲁⲭⲁⲍ ⲁⲭⲁⲍ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲉⲍⲉⲕⲉⲓⲁⲥ . 10: ⲉⲍⲉⲕⲉⲓⲁⲥ ⲇⲉ ⲁϥϫⲡⲟ ⲙⲙⲁⲛⲁⲥⲥⲏ ⲙⲁⲛⲁⲥⲥⲏ ⲇⲉ ⲁϥϫⲡⲟ ⲛϩⲁⲙⲱⲥ . ϩⲁⲙⲱⲥ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲓⲱⲥⲓⲁⲥ . 11: ⲓⲱⲥⲓⲁⲥ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲓⲉⲭⲟⲛⲓⲁⲥ ⲙⲛⲛⲉϥⲥⲛⲏⲩ ϩⲓⲡⲡⲱⲱⲛⲉ ⲉⲃⲟⲗ ⲛⲧⲃⲁⲃⲩⲗⲱⲛ . 12: ⲙⲛⲛⲥⲁⲡⲡⲱⲱⲛⲉ ⲇⲉ ⲉⲃⲟⲗ ⲛⲧⲃⲁⲃⲩⲗⲱⲛ ⲓⲉⲭⲟⲛⲓⲁⲥ ⲁϥϫⲡⲟ ⲛⲥⲁⲗⲁⲑⲓⲏⲗ ⲥⲁⲗⲁⲑⲓⲏⲗ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲍⲟⲣⲟⲃⲁⲃⲉⲗ . 13: ⲍⲟⲣⲟⲃⲁⲃⲉⲗ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲁⲃⲓⲟⲩⲇ ⲁⲃⲓⲟⲩⲇ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲉⲗⲓⲁⲕⲓⲙ . ⲉⲗⲓⲁⲕⲓⲙ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲁⲍⲱⲣⲁ . 14: ⲁⲍⲱⲣⲁⲥ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲥⲁⲇⲱⲕ ⲥⲁⲇⲱⲕ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲁⲭⲉⲓⲙ ⲁⲭⲉⲓⲙ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲉⲗⲓⲟⲩⲇ . 15: ⲉⲗⲓⲟⲩⲇ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲉⲗⲉⲁⲍⲁⲣ ⲉⲗⲉⲁⲍⲁⲣ ⲇⲉ ⲁϥϫⲡⲟ ⲙⲙⲁⲧⲑⲁⲙ ⲙⲁⲧⲑⲁⲙ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲓⲁⲕⲱⲃ . 16: ⲓⲁⲕⲱⲃ ⲇⲉ ⲁϥϫⲡⲟ ⲛⲓⲱⲥⲏⲫ ⲡϩⲁⲓ ⲙⲙⲁⲣⲓⲁ . ⲧⲁⲓ ⲛⲧⲁⲩϫⲡⲉ ⲓⲏⲥⲟⲩⲥ ⲉⲃⲟⲗ ⲛϩⲏⲧⲥ . ⲡⲁⲓ ⲛϣⲁⲩⲙⲟⲩⲧⲉ ⲉⲣⲟϥ ϫⲉⲡⲉⲭⲣⲓⲥⲧⲟⲥ . 17: ⲅⲉⲛⲉⲁ ϭⲉ ⲛⲓⲙ ϫⲓⲛⲁⲃⲣⲁϩⲁⲙ ϣⲁⲉϩⲣⲁⲓ ⲉⲇⲁⲩⲉⲓⲇ ⲙⲛⲧⲁϥⲧⲉ ⲛⲅⲉⲛⲉⲁ . ⲁⲩⲱ ϫⲓⲛⲇⲁⲩⲉⲓⲇ ϣⲁⲉϩⲣⲁⲓ ⲉⲡⲡⲱⲱⲛⲉ ⲉⲃⲟⲗ ⲛⲧⲃⲁⲃⲩⲗⲱⲛ ⲙⲛⲧⲁϥⲧⲉ ⲛⲅⲉⲛⲉⲁ . ⲁⲩⲱ ϫⲓⲛⲉⲡⲡⲱⲱⲛⲉ ⲉⲃⲟⲗ ⲛⲧⲃⲁⲃⲩⲗⲱⲛ ϣⲁⲉϩⲣⲁⲓ ⲉⲡⲉⲭⲣⲓⲥⲧⲟⲥ ⲙⲛⲧⲁϥⲧⲉ ⲛⲅⲉⲛⲉⲁ . 18: ⲡⲉϫⲡⲟ ⲇⲉ ⲛⲓⲏⲥⲟⲩⲥ ⲡⲉⲭⲣⲓⲥⲧⲟⲥ ⲛⲉⲩⲧⲉⲓϩⲉ ⲡⲉ ⲛⲧⲉⲣⲟⲩϣⲡ ⲧⲟⲟⲧⲥ ⲛⲧⲉϥⲙⲁⲁⲩ ⲙⲁⲣⲓⲁ ⲛⲓⲱⲥⲏⲫ ⲉⲙⲡⲁⲧⲟⲩⲃⲱⲕ ⲉϩⲟⲩⲛ ϣⲁⲛⲉⲩⲉⲣⲏⲩ ⲁⲩϩⲉ ⲉⲣⲟⲥ ⲉⲥⲉⲉⲧ ⲉⲃⲟⲗ ϩⲛⲟⲩⲡⲛⲉⲩⲙⲁ ⲉϥⲟⲩⲁⲁⲃ . 19: ⲓⲱⲥⲏⲫ ⲇⲉ ⲡⲉⲥϩⲁⲓ ⲉⲛⲉⲩⲇⲓⲕⲁⲓⲟⲥ ⲡⲉ . ⲁⲩⲱ ⲛⲉϥⲟⲩⲱϣ ⲁⲛ ⲉϯ ⲙⲡⲉⲥⲥⲟⲉⲓⲧ ⲁϥⲟⲩⲱϣ ⲉⲛⲟϫⲥ ⲉⲃⲟⲗ ⲛϫⲓⲟⲩⲉ . 20: ⲛⲁⲓ ⲇⲉ ⲛⲧⲉⲣⲉϥⲙⲉⲉⲩⲉ ⲉⲣⲟⲟⲩ ⲉⲓⲥ ⲡⲁⲅⲅⲉⲗⲟⲥ ⲙⲡϫⲟⲉⲓⲥ ⲁϥⲟⲩⲱⲛϩ ⲛⲁϥ ⲉⲃⲟⲗ ϩⲛⲟⲩⲣⲁⲥⲟⲩ ⲉϥϫⲱ ⲙⲙⲟⲥ ϫⲉⲓⲱⲥⲏⲫ ⲡϣⲏⲣⲉ ⲛⲇⲁⲩⲉⲓⲇ ⲙⲡⲣⲣⲟ ϩⲟⲧⲉ ⲉϫⲓ ⲙⲙⲁⲣⲓⲁ ⲧⲉⲕⲥϩⲓⲙⲉ . ⲡⲉⲧⲟⲩⲛⲁϫⲡⲟϥ ⲅⲁⲣ ⲉⲃⲟⲗ ⲛϩⲏⲧⲥ ⲟⲩⲉⲃⲟⲗ ϩⲛⲟⲩⲡⲛⲉⲩⲙⲁ ⲉϥⲟⲩⲁⲁⲃ ⲡⲉ . 21: ⲥⲛⲁϫⲡⲟ ⲇⲉ ⲛⲟⲩϣⲏⲣⲉ . ⲛⲅⲙⲟⲩⲧⲉ ⲉⲡⲉϥⲣⲁⲛ ϫⲉⲓⲏⲥⲟⲩⲥ . ⲛⲧⲟϥ ⲅⲁⲣ ⲡⲉⲧⲛⲁⲧⲟⲩϫⲟ ⲙⲡⲉϥⲗⲁⲟⲥ ⲉⲃⲟⲗ ϩⲛⲛⲉⲩⲛⲟⲃⲉ . 22: ⲡⲁⲓ ⲇⲉ ⲧⲏⲣϥ ⲛⲧⲁϥϣⲱⲡⲉ ϫⲉⲕⲁⲁⲥ ⲉϥⲉϫⲱⲕ ⲉⲃⲟⲗ ⲛϭⲓⲡⲉⲛⲧⲁⲡϫⲟⲉⲓⲥ ϫⲟⲟϥ ϩⲓⲧⲙⲡⲉⲡⲣⲟⲫⲏⲧⲏⲥ ⲉϥϫⲱ ⲙⲙⲟⲥ . 23: ϫⲉⲉⲓⲥⲧⲡⲁⲣⲑⲉⲛⲟⲥ ⲛⲁⲱ ⲛⲥϫⲡⲟ ⲛⲟⲩϣⲏⲣⲉ ⲛⲥⲉⲙⲟⲩⲧⲉ ⲉⲡⲉϥⲣⲁⲛ ϫⲉⲉⲙⲙⲁⲛⲟⲩⲏⲗ ⲉⲧⲉⲡⲁⲓ ⲡⲉ ⲛϣⲁⲩⲟⲩⲁϩⲙⲉϥ ϫⲉⲡⲛⲟⲩⲧⲉ ⲛⲙⲙⲁⲛ . 24: ⲁϥⲧⲱⲟⲩⲛ ⲇⲉ ⲛϭⲓⲓⲱⲥⲏⲫ ⲉϥⲛⲕⲟⲧⲕ ⲁϥⲉⲓⲣⲉ ⲕⲁⲧⲁⲧϩⲉ ⲛⲧⲁϥϩⲱⲛ ⲉⲧⲟⲟⲧϥ ⲛϭⲓⲡⲁⲅⲅⲉⲗⲟⲥ ⲙⲡϫⲟⲉⲓⲥ . ⲁϥϫⲓ ⲙⲙⲁⲣⲓⲁ ⲧⲉϥⲥϩⲓⲙⲉ . 25: ⲙⲡⲉϥⲥⲟⲩⲱⲛⲥ ϣⲁⲛⲧⲉⲥϫⲡⲟ ⲙⲡⲉⲥϣⲏⲣⲉ . ⲁϥⲙⲟⲩⲧⲉ ⲉⲡⲉϥⲣⲁⲛ ϫⲉⲓⲏⲥⲟⲩⲥ .
我正在使用 smtplib 通过 python 发送一些自动报告。我正在使用 MIMEText 附加这些报告的 HTML 格式,但问题是,如果报告太长,Gmail 会像往常一样显示...
从 HTML 标头中抓取值并在 Python 中保存为 CSV 文件
全部, 我刚刚开始使用 Python(v 2.7.1),我的第一个程序之一是尝试使用标准库和 BeautifulSoup 从包含电站数据的网站中抓取信息...
Ebay 的 Python Webscraper 无法获取多个链接的结果
代码如下: 导入时间 从 bs4 导入 BeautifulSoup 导入请求 导入 csv def get_page(url): 响应 = requests.get(url) 如果没有响应。确定: print("服务器响应...
我正在尝试抓取此页面,直到“加载更多按钮”为止。当您单击“加载更多”按钮时,URL 不会更改,并且 selenium 对我不起作用。 任何人谁...
我正在为 MyAnimeList 制作一个 python web scrapper 基本上,如果您访问该网站,并将鼠标悬停在动漫的标题上。它将弹出一个悬停窗口,其中给出了...