如何在使用 XPath 解析时获取表格单元格值,并且单元格包含类似 <19.00 OR >23.99

问题描述 投票:0回答:1

实际上我需要解析一个 HTML 表格,并且该表格包含 HTML 字符,您可以在图像中看到。

我还需要带有该特殊字符的每个单元格数据。现在,当我使用 XPath 解析表格时,它会忽略该单元格并将该单元格值返回为空。

两张图片都附在此处。Main Table Parsed DOM Object

$table_head = $summary_nodes->childNodes->item(0);
$table_body = $summary_nodes->childNodes->item(1);
$head = [];
$body = [];
// print_r($table_head);
foreach($table_head->childNodes as $h_index => $h_node){
    $head_temp = [];
    foreach($h_node->childNodes as $cell_index => $cell){
        $head_temp[] = trim($cell->nodeValue);
    }
    $head[] = $head_temp;
}
foreach($table_body->childNodes as $b_index => $b_node){
    $body_temp = [];
    // print_r($b_node);
    foreach($b_node->childNodes as $cell_index => $cell){
        print_r($cell);
        $body_temp[] = trim($cell->nodeValue);
    }
    $body[] = $body_temp;
}
return ['table_ready'=>array_merge([$head[count($head)-1]], $body), 'headers'=> $head];
php html xpath domparser
1个回答
0
投票

你好,朋友们,我得到了这个问题的答案,实际上发生了什么,我们在真实数据中添加了 HTML 实体,这就是为什么在传递它时它与 HTML 内容冲突,并且在解析解析器时自动删除该 HTML 实体,所以我们必须确保我们的真实数据确实如此没有任何 HTML 实体,如果我们正在使用或者如果我们需要任何类似于 HTML 实体的实体,请尝试使用它们是 HTML 实体代码。

© www.soinside.com 2019 - 2024. All rights reserved.