jsoup 相关问题

Jsoup是一个Java HTML解析器,用于提取和操作HTML数据,使用最好的DOM,CSS和类似jQuery的方法。

使用 jpackage 创建 .EXE 时出现问题 - 当 EXE 调用程序时,jsoup 出现问题,但在 Intellij 中正常

我使用 Intellij 创建了一个使用 Javafx、Lucene、JDOM 和其他库的应用程序。在 Intellij 上,一切都编译并成功运行。现在我要为 Windows 创建一个运行时映像

回答 2 投票 0

使用 JSoup 抓取 XML

我正在尝试抓取位于此处的 RSS 提要。 目前我只是想了解 JSoup,所以下面的代码只是概念证明(或者至少是一种尝试)。 噗...

回答 1 投票 0

网站登录并保留会话cookie

我正在尝试从网站上抓取一些内容,但您必须登录才能查看特定内容。我想使用用户 ID 和密码登录并保留会话 cookie:m.amway.com i

回答 1 投票 0

从 cookiesyncmanager 进行 Jsoup cookie 身份验证以从 https 站点抓取

我有一个使用WebView的Android应用程序,用户必须使用用户名和密码登录,然后才能重定向到我想用jsoup刮掉数据的页面。自从js...

回答 1 投票 0

使用 Jsoup 保留文本区域换行符

我有一个 HTML 字符串,其中包含一个包含多行内容的文本区域,如下所示: *这是1号线 *这是2号线 *这是线...</desc> <question vote="0"> <p>我有一个 HTML 字符串,其中包含一个具有多行内容的文本区域,如下所示:</p> <pre><code><textarea id="textbox" name="textbox">*This is line 1 *This is line 2 *This is line 3 </textarea> </code></pre> <p>我正在尝试使用 Jsoup 解析 html 字符串,并返回此文本区域的内容并保留换行符。</p> <p>根据 <a href="https://www.baeldung.com/jsoup-line-breaks#:%7E:text=Jsoup%20removes%20the%20newline%20character,Jsoup%20and%20disable%20pretty%2Dprint" rel="nofollow noreferrer">https://www.baeldung.com/jsoup-line-breaks#:~:text=Jsoup%20removes%20the%20newline%20character,Jsoup%20and%20disable%20pretty%2Dprint</a>,我正在禁用 Pretty打印以确保换行符不会被空格替换。</p> <p>但是,当我尝试运行下面的方法时:</p> <pre><code>private void printTextbox(String htmlStr){ final Document doc = Jsoup.parse(htmlStr, "UTF-8"); doc.outputSettings().prettyPrint(false); System.out.println(doc.select("#textbox").val()); } </code></pre> <p>我仍然收到返回的单行字符串:</p> <p><pre><code>*This is line 1*This is line 2*This is line 3</code></pre></p> <p>如何保留换行符?</p> </question> <answer tick="false" vote="0"> <p>这实际上是由我的 HTTP 请求库的实现引起的,该库在处理包含 HTML 字符串的响应正文时没有保留换行符。</p> <p>切换后</p> <pre><code>public String processResponseBody(HttpURLConnection con) throws IOException { BufferedReader in = new BufferedReader(new InputStreamReader(con.getInputStream())); String inputLine; StringBuffer content = new StringBuffer(); while ((inputLine = in.readLine()) != null) { content.append(inputLine); } in.close(); return ontent.toString(); } </code></pre> <p>到</p> <pre><code>public String processResponseBody(HttpURLConnection con) throws IOException { BufferedReader in = new BufferedReader(new InputStreamReader(con.getInputStream())); String inputLine; StringBuffer content = new StringBuffer(); while ((inputLine = in.readLine()) != null) { content.append(inputLine).append("\n"); } in.close(); return ontent.toString(); } </code></pre> <p>换行符保留在 Jsoup 处理的 HTML 字符串中。也不需要修改输出设置,因此可以从早期代码中删除<pre><code>doc.outputSettings().prettyPrint(false);</code></pre></p> </answer> </body></html>

回答 0 投票 0

我已经为Chrome扩展生成了cookie文件,我需要将其加载到Java中的HashMap<String,String>中

我有 cookie txt 文件,其中包含 Chrome 扩展生成的数据,如下所示: # Netscape HTTP Cookie 文件 # http://curl.haxx.se/rfc/cookie_spec.html # 这是一个生成的文件! 不要编辑。 .

回答 2 投票 0

无法通过代理隧道 - Jsoup

我在创建 HTTP 连接时遇到以下异常。 2017-08-07 17:07:43,219 错误 au.com.scraper.sites.ScraperSite - 解析类别时出现异常:无法通过代理建立隧道。

回答 1 投票 0

如何在Android应用程序中使用Jsoup库获取p元素值

我想从网站获取元素值以显示在我的 Android 应用程序中。我可以获取其他值,但是当我尝试获取 p 元素值时,我没有得到任何结果。我该如何解决这个问题? 在此先感谢...

回答 1 投票 0

使用 Jsoup for Java 获取 HTML 内容错误

我正在构建一个以字符串形式接收 HTML 内容的应用程序。我需要验证这些 HTML 字符串的格式是否正确,这意味着我想解析它们并检测有错误的行。 在我重新...

回答 1 投票 0

Java (HttpsURLConnection) url.openConnection() 对于某些有效的 URL 返回 403

我需要从第一个网站页面(如 pubs.acs.org)读取 HTML 作为测试或流,我有下面的代码适用于许多 URL,但对于其中一些它返回 403 错误,我在浏览器中测试此 URL ...

回答 1 投票 0

J汤。如何在没有多个连接的情况下进行多个网页查询?

我正在使用 Jsoup 制作 Android 应用程序。我的代码如下。 字符串 URL =“http://www.example.com/queryDFSRSS.jsp?zone=” 字符串zone_1 =“001”; 字符串zone_2 =“002”; 字符串zone_3 =“003”; 文件d...

回答 1 投票 0

为什么我的 jsoup.connect(url) 无法使用某些 url?

我正在尝试从 http://tv.atmovies.com.tw/tv/attv.cfm?action=channeltime&channel_id=CH06 获取标题 这是我的源代码的一部分: 文档 doc = Jsoup.connect( 上面的 url ).get...

回答 2 投票 0

连接用户jsoup重定向错误

我正在尝试从我的网络服务器上的动态 php 页面获取 html 表。 Web 服务器是 Zabbix 前端。 这是我的示例代码: doc = Jsoup.connect("http://192.168.209.178/zabbix/index.php").

回答 1 投票 0

jsoup.connect().get()返回缓存的Document吗?

我使用jsoup和以下代码来获取网站Document doc = Jsoup.connect(this.getUrl()).get();的HTML内容。 我可以获得网站的缓存版本吗?是否可以要求非...

回答 1 投票 0

如何使用 jsoup 抓取 Facebook 页面帖子?

我正在尝试使用 jsoup 在 Spring boot 中抓取 Facebook 页面。 下面的方法返回一个空的 JSON: @GetMapping("/test-json") public String scrapeFacebookPageJson() 抛出 IOExcepti...

回答 1 投票 0

如何使用java验证html?使用 jsoup 库时遇到问题

我需要使用java验证HTML。所以我尝试使用 jsoup 库。但我的一些测试用例失败了。 例如,这是我的 html 内容。我对此内容没有任何控制权。我明白了...

回答 2 投票 0

使用 Java 将 HTML 转换为 PDF

我有一个 HTML,想将其转换为内存中的 pdf,但找不到好的库来将 HTML 转换为 PDF。 我已经尝试使用 ITextRenderer 和 Jsoup 但抛出异常无法加载...

回答 4 投票 0

为什么在 Android API 级别 21 上最新版本的 jsoup 中找不到 StringUtil?

使用当前最新版本的jsoup(1.17.2),尝试运行以下代码: Jsoup.connect(urlToParse).get() 在 API 级别为 21 的 Android 设备上,执行会导致 NoClassDefFoundError: java.

回答 1 投票 0

如何使用 Jsoup 仅删除文本中的 html 标签?

我想用 JSOUP 从文本中仅删除 html 标签。我使用了这里的解决方案(我之前关于 JSOUP 的问题) 但经过一番检查后我发现 JSOUP 出现 JAVA 堆异常:

回答 6 投票 0

Spring Boot Jsoup 从网站获取值(通过 javascript(动态加载)加载值) - 有时 500 错误,有时 200 Ok

我创建了一个 Spring Boot Web API 来从网站获取地震值。 我在 getEarthQuakeDataFromAfad 方法中遇到问题。向 http://localhost:8080/api/v1/earthquakes/... 发送请求后

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.