我在下面有此算法:
from bs4 import BeautifulSoup
import requests
import time
soup=BeautifulSoup(html,'html.parser')
for link in soup.select('div.sg-actions-list__hole > a[href*="/tarefa"]'):
ref=link.get('href')
rt = ('https://brainly.com.br'+str(ref))
p.append(rt)
print(p)
for url in p:
r = requests.get(url).text
time.sleep(10)
print(r)
基本上会印制页面的源代码。
我的问题不是关于算法,而是关于IDLE,因为当您打印页面源代码时,它太大了,以致HTML
的某些部分最终消失了,我的问题是对此是否有解决方案。
我猜不出“拒绝”是什么意思。无论如何,请指定您的操作系统和操作系统版本,以及您要打印的字符和行数('len(p),count(另外,请尝试重现该问题而不涉及第三者模块的漂亮内容,在程序中生成文本。
例如,在带有3.9.0a1的Windows 10上,我可以打印100000行文本。
>>> def f(n):
nl = '\n'
s=('a'*60 + nl)*n
print(f"s has {len(s)} chars, {s.count(nl)} lines")
print(s)
>>> f(100000)
s has 6100000 chars, 100000 lines
[Squeezed text (100000 lines).] # Reverse text box after about 1/2 minute.
在2018年末推出了挤压大产量的产品。它可以防止长线的冻结效应。如IDLE文档中所述,可以将压缩后的文本复制到剪贴板,在单独的窗口中查看或在shell中展开。