以下正则表达式看起来是一个很好的起点:
<p[^>]*?>[a-z]
从那里我不确定你想捕捉什么,但它会起作用。是的,当然你应该为此使用一个 HTMLParser,但是对于像这样简单的事情,我不明白为什么正则表达式是一个问题(只要你知道输入,它就不能在通用的 html 输入上工作)。