Jsoup是一个Java HTML解析器,用于提取和操作HTML数据,使用最好的DOM,CSS和类似jQuery的方法。
使用 jpackage 创建 .EXE 时出现问题 - 当 EXE 调用程序时,jsoup 出现问题,但在 Intellij 中正常
我使用 Intellij 创建了一个使用 Javafx、Lucene、JDOM 和其他库的应用程序。在 Intellij 上,一切都编译并成功运行。现在我要为 Windows 创建一个运行时映像
我正在尝试抓取位于此处的 RSS 提要。 目前我只是想了解 JSoup,所以下面的代码只是概念证明(或者至少是一种尝试)。 噗...
我正在尝试从网站上抓取一些内容,但您必须登录才能查看特定内容。我想使用用户 ID 和密码登录并保留会话 cookie:m.amway.com i
从 cookiesyncmanager 进行 Jsoup cookie 身份验证以从 https 站点抓取
我有一个使用WebView的Android应用程序,用户必须使用用户名和密码登录,然后才能重定向到我想用jsoup刮掉数据的页面。自从js...
我有一个 HTML 字符串,其中包含一个包含多行内容的文本区域,如下所示: *这是1号线 *这是2号线 *这是线...</desc> <question vote="0"> <p>我有一个 HTML 字符串,其中包含一个具有多行内容的文本区域,如下所示:</p> <pre><code><textarea id="textbox" name="textbox">*This is line 1 *This is line 2 *This is line 3 </textarea> </code></pre> <p>我正在尝试使用 Jsoup 解析 html 字符串,并返回此文本区域的内容并保留换行符。</p> <p>根据 <a href="https://www.baeldung.com/jsoup-line-breaks#:%7E:text=Jsoup%20removes%20the%20newline%20character,Jsoup%20and%20disable%20pretty%2Dprint" rel="nofollow noreferrer">https://www.baeldung.com/jsoup-line-breaks#:~:text=Jsoup%20removes%20the%20newline%20character,Jsoup%20and%20disable%20pretty%2Dprint</a>,我正在禁用 Pretty打印以确保换行符不会被空格替换。</p> <p>但是,当我尝试运行下面的方法时:</p> <pre><code>private void printTextbox(String htmlStr){ final Document doc = Jsoup.parse(htmlStr, "UTF-8"); doc.outputSettings().prettyPrint(false); System.out.println(doc.select("#textbox").val()); } </code></pre> <p>我仍然收到返回的单行字符串:</p> <p><pre><code>*This is line 1*This is line 2*This is line 3</code></pre></p> <p>如何保留换行符?</p> </question> <answer tick="false" vote="0"> <p>这实际上是由我的 HTTP 请求库的实现引起的,该库在处理包含 HTML 字符串的响应正文时没有保留换行符。</p> <p>切换后</p> <pre><code>public String processResponseBody(HttpURLConnection con) throws IOException { BufferedReader in = new BufferedReader(new InputStreamReader(con.getInputStream())); String inputLine; StringBuffer content = new StringBuffer(); while ((inputLine = in.readLine()) != null) { content.append(inputLine); } in.close(); return ontent.toString(); } </code></pre> <p>到</p> <pre><code>public String processResponseBody(HttpURLConnection con) throws IOException { BufferedReader in = new BufferedReader(new InputStreamReader(con.getInputStream())); String inputLine; StringBuffer content = new StringBuffer(); while ((inputLine = in.readLine()) != null) { content.append(inputLine).append("\n"); } in.close(); return ontent.toString(); } </code></pre> <p>换行符保留在 Jsoup 处理的 HTML 字符串中。也不需要修改输出设置,因此可以从早期代码中删除<pre><code>doc.outputSettings().prettyPrint(false);</code></pre></p> </answer> </body></html>
我已经为Chrome扩展生成了cookie文件,我需要将其加载到Java中的HashMap<String,String>中
我有 cookie txt 文件,其中包含 Chrome 扩展生成的数据,如下所示: # Netscape HTTP Cookie 文件 # http://curl.haxx.se/rfc/cookie_spec.html # 这是一个生成的文件! 不要编辑。 .
我在创建 HTTP 连接时遇到以下异常。 2017-08-07 17:07:43,219 错误 au.com.scraper.sites.ScraperSite - 解析类别时出现异常:无法通过代理建立隧道。
我想从网站获取元素值以显示在我的 Android 应用程序中。我可以获取其他值,但是当我尝试获取 p 元素值时,我没有得到任何结果。我该如何解决这个问题? 在此先感谢...
使用 Jsoup for Java 获取 HTML 内容错误
我正在构建一个以字符串形式接收 HTML 内容的应用程序。我需要验证这些 HTML 字符串的格式是否正确,这意味着我想解析它们并检测有错误的行。 在我重新...
Java (HttpsURLConnection) url.openConnection() 对于某些有效的 URL 返回 403
我需要从第一个网站页面(如 pubs.acs.org)读取 HTML 作为测试或流,我有下面的代码适用于许多 URL,但对于其中一些它返回 403 错误,我在浏览器中测试此 URL ...
我正在使用 Jsoup 制作 Android 应用程序。我的代码如下。 字符串 URL =“http://www.example.com/queryDFSRSS.jsp?zone=” 字符串zone_1 =“001”; 字符串zone_2 =“002”; 字符串zone_3 =“003”; 文件d...
为什么我的 jsoup.connect(url) 无法使用某些 url?
我正在尝试从 http://tv.atmovies.com.tw/tv/attv.cfm?action=channeltime&channel_id=CH06 获取标题 这是我的源代码的一部分: 文档 doc = Jsoup.connect( 上面的 url ).get...
我正在尝试从我的网络服务器上的动态 php 页面获取 html 表。 Web 服务器是 Zabbix 前端。 这是我的示例代码: doc = Jsoup.connect("http://192.168.209.178/zabbix/index.php").
jsoup.connect().get()返回缓存的Document吗?
我使用jsoup和以下代码来获取网站Document doc = Jsoup.connect(this.getUrl()).get();的HTML内容。 我可以获得网站的缓存版本吗?是否可以要求非...
我正在尝试使用 jsoup 在 Spring boot 中抓取 Facebook 页面。 下面的方法返回一个空的 JSON: @GetMapping("/test-json") public String scrapeFacebookPageJson() 抛出 IOExcepti...
如何使用java验证html?使用 jsoup 库时遇到问题
我需要使用java验证HTML。所以我尝试使用 jsoup 库。但我的一些测试用例失败了。 例如,这是我的 html 内容。我对此内容没有任何控制权。我明白了...
我有一个 HTML,想将其转换为内存中的 pdf,但找不到好的库来将 HTML 转换为 PDF。 我已经尝试使用 ITextRenderer 和 Jsoup 但抛出异常无法加载...
为什么在 Android API 级别 21 上最新版本的 jsoup 中找不到 StringUtil?
使用当前最新版本的jsoup(1.17.2),尝试运行以下代码: Jsoup.connect(urlToParse).get() 在 API 级别为 21 的 Android 设备上,执行会导致 NoClassDefFoundError: java.
我想用 JSOUP 从文本中仅删除 html 标签。我使用了这里的解决方案(我之前关于 JSOUP 的问题) 但经过一番检查后我发现 JSOUP 出现 JAVA 堆异常:
Spring Boot Jsoup 从网站获取值(通过 javascript(动态加载)加载值) - 有时 500 错误,有时 200 Ok
我创建了一个 Spring Boot Web API 来从网站获取地震值。 我在 getEarthQuakeDataFromAfad 方法中遇到问题。向 http://localhost:8080/api/v1/earthquakes/... 发送请求后