getText()vs text()vs get_text()

问题描述 投票:1回答:1

我有一大块用bs4提取的html如下

<div class="a-section a-spacing-small" id="productDescription">
<!-- show up to 2 reviews by default -->
<p>Satin Smooth Universal Protective Wax Pot Collars by Satin Smooth</p>
</div>

要提取文本,我使用的是text.strip()

output.text()

它给了我输出"TypeError: 'str' object is not callable"

当我使用output.get_text()output.getText()时,我得到了所需的文字

这3个有什么区别?为什么get_text()和getText()给出相同的输出?

python python-3.x beautifulsoup
1个回答
2
投票

它们非常相似:

  • .get_text是一个函数,它将标记的文本作为字符串返回
  • .text是一个叫get_text的财产(所以它是相同的,除了你不使用parantheses)
  • .getTextget_text的别名

我会尽可能使用.text,并在需要传递自定义参数时使用.get_text(...)(例如foo.get_text(strip=True, seperator='\n'))。

© www.soinside.com 2019 - 2024. All rights reserved.