实际上我需要解析一个 HTML 表格,并且该表格包含 HTML 字符,您可以在图像中看到。
我还需要带有该特殊字符的每个单元格数据。现在,当我使用 XPath 解析表格时,它会忽略该单元格并将该单元格值返回为空。
$table_head = $summary_nodes->childNodes->item(0);
$table_body = $summary_nodes->childNodes->item(1);
$head = [];
$body = [];
// print_r($table_head);
foreach($table_head->childNodes as $h_index => $h_node){
$head_temp = [];
foreach($h_node->childNodes as $cell_index => $cell){
$head_temp[] = trim($cell->nodeValue);
}
$head[] = $head_temp;
}
foreach($table_body->childNodes as $b_index => $b_node){
$body_temp = [];
// print_r($b_node);
foreach($b_node->childNodes as $cell_index => $cell){
print_r($cell);
$body_temp[] = trim($cell->nodeValue);
}
$body[] = $body_temp;
}
return ['table_ready'=>array_merge([$head[count($head)-1]], $body), 'headers'=> $head];
你好,朋友们,我得到了这个问题的答案,实际上发生了什么,我们在真实数据中添加了 HTML 实体,这就是为什么在传递它时它与 HTML 内容冲突,并且在解析解析器时自动删除该 HTML 实体,所以我们必须确保我们的真实数据确实如此没有任何 HTML 实体,如果我们正在使用或者如果我们需要任何类似于 HTML 实体的实体,请尝试使用它们是 HTML 实体代码。