我有一大块用bs4提取的html如下
<div class="a-section a-spacing-small" id="productDescription">
<!-- show up to 2 reviews by default -->
<p>Satin Smooth Universal Protective Wax Pot Collars by Satin Smooth</p>
</div>
要提取文本,我使用的是text.strip()
output.text()
它给了我输出"TypeError: 'str' object is not callable"
当我使用output.get_text()
和output.getText()
时,我得到了所需的文字
这3个有什么区别?为什么get_text()和getText()给出相同的输出?
它们非常相似:
.get_text
是一个函数,它将标记的文本作为字符串返回.text
是一个叫get_text
的财产(所以它是相同的,除了你不使用parantheses).getText
是get_text
的别名我会尽可能使用.text
,并在需要传递自定义参数时使用.get_text(...)
(例如foo.get_text(strip=True, seperator='\n')
)。