如何使用php从这样的html响应中选择元素?

问题描述 投票:1回答:2

我刚刚用Facebook做卷毛请求我遇到了一个问题,如果我可以解决这个问题我可以轻松地继续一切。

我的卷曲代码

function curl($url, $data=null, $ua=null, $cookie=null){
    $c = curl_init();
    curl_setopt($c, CURLOPT_URL, $url);
    if($data != null){
        curl_setopt($c, CURLOPT_POST, true);
        curl_setopt($c, CURLOPT_POSTFIELDS, $data);
    }
    curl_setopt($c, CURLOPT_FOLLOWLOCATION, true);
    curl_setopt($c, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($c, CURLOPT_SSL_VERIFYPEER, false);
    if($cookie != null){
        curl_setopt($c, CURLOPT_COOKIE, $cookie);
    }
    if($ua != null){
        curl_setopt($c, CURLOPT_USERAGENT, $ua);
    }
    $hmm = curl_exec($c);
    curl_close($c);
    return $hmm;
}
$ua = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:62.0) Gecko/20100101 Firefox/62.0';
$data = curl('https://facebook.com/', 0, $ua, 0,); //$data stores the html response of Facebook.com
print_r($data);

所以从这段代码我们得到facebook.com的html响应我遇到的问题是从html响应获取一些值我需要获取值输入字段你可以在这里看到视图源: - view-source:https://www.facebook.com So请帮我从第一个表单中获取输入字段的值(表单id =“login_form”action =“https://www.facebook.com/login/device-based/regular/login/?login_attempt=1&lwv=111” method =“post”novalidate =“1”onsubmit =“”)示例: - 我需要从此字段获取(输入类型=“隐藏”名称=“jazoest”value =“2691”autocomplete =“off”/)名称和值,所以我需要回应jazoest,2691和其他输入字段,我已经尝试了preg_match它没有按预期工作,我有一个例子与Dom做同样的事情

将此代码与curl函数一起使用

$ua = 'Mozilla/4.0 (compatible; MSIE 5.0; S60/3.0 NokiaN73-1/2.0(2.0617.0.0.7) Profile/MIDP-2.0 Configuration/CLDC-1.1)';
$data = curl('https://m.facebook.com/', 0, $ua, 0,); //$data stores the html response of Facebook.com
print_r($data);

这是Facebook的移动网址和这里使用的useragent在Dom的帮助下,我们可以使用下面的代码获取输入字段

function parse_inputs($html) {
    $dom = new DOMDocument;
    @$dom->loadxml($html);
    $inputs = $dom->getElementsByTagName('input');
    return($inputs);
}

$inputs = parse_inputs($data);
    $post_params = "";
    foreach ($inputs as $input) {
                $post_params .= $input->getAttribute('name') . '=' . urlencode($input->getAttribute('value')) . '&';
        }
print_r($post_params);

从这段代码我可以得到m.facebook.com的输入字段,但不是www.facebook.com请帮助我这个,另一个有用的例子在这里请检查: - https://github.com/jerry-riady/Script-auto-like-face/blob/master/update.php提前感谢所有的答案。

php html dom
2个回答
1
投票

使用loadHTML而不是loadXML应该工作(在本地测试):

更换:

@$dom->loadxml($html);

有:

$dom->loadHTML($html);

此外,我建议使用以下行(在你的@函数之外),而不是与parse_inputs(很少是一个好主意)完全混淆错误:

libxml_use_internal_errors(true);

这是一种更合适的方法来静音错误输出(它们仍然可以通过libxml_get_last_error()和/或libxml_get_errors()source)获得。


0
投票

用户代理

Mozilla/4.0 (compatible; MSIE 5.0; S60/3.0 NokiaN73-1/2.0(2.0617.0.0.7) Profile/MIDP-2.0 Configuration/CLDC-1.1)

让facebook相信你是一个(诺基亚)手机,并试图将你重定向到m.facebook.com,即使你的请求是https://www.facebook.com ..要解决这个问题,请改用桌面用户代理,例如

Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0

这段代码:

<?php
declare(strict_types=1);
$ch=curl_init();
curl_setopt_array($ch,array(
    CURLOPT_URL=>'https://www.facebook.com',
    CURLOPT_USERAGENT=>'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0',//'libcurl/'.(curl_version()['version']).' PHP/'.PHP_VERSION,
    CURLOPT_RETURNTRANSFER=>1,
));
$html=curl_exec($ch);
$domd=@DOMDocument::loadHTML($html);
$inputs=[];
foreach($domd->getElementsByTagName("input") as $input){
    $inputs[$input->getAttribute("name")]=$input->getAttribute("value");
}
print_r($inputs);

给出这个输出:

$ php wtf4.php
Array
(
    [jazoest] => 2747
    [lsd] => AVpUepnL
    [email] =>
    [pass] =>
    [] => Logg inn
    [timezone] =>
    [lgndim] =>
    [lgnrnd] => 171046_tirL
    [lgnjs] => n
    [ab_test_data] =>
    [locale] => nb_NO
    [next] => https://www.facebook.com/
    [login_source] => login_bluebar
    [prefill_contact_point] =>
    [prefill_source] =>
    [prefill_type] =>
    [firstname] =>
    [lastname] =>
    [reg_email__] =>
    [reg_email_confirmation__] =>
    [reg_second_contactpoint__] =>
    [reg_passwd__] =>
    [sex] => 2
    [referrer] =>
    [asked_to_login] => 0
    [terms] => on
    [ns] => 0
    [ri] => a78c3ab6-0e06-e414-b463-452c92229760
    [action_dialog_shown] =>
    [contactpoint_label] => email_or_phone
    [ignore] => reg_email_confirmation__|reg_second_contactpoint__
    [reg_instance] => BrW7XFdd5CvG1L4FidZcVijt
    [captcha_persist_data] => AZl2s6wFOpoQEyjGUhIQJW23Say7yoZA6QdqOYGsPdq52J_eXFWd6lVUIwsHSDDPDyK2dOdsaN8uh2HCO7nKrZawq0lN16Nq0w4qrl-IzIFK9QHic9uSo5kaElwzPLgLnLvRmswIUI_cfils5_0qrhOcCAghdy-wzJmamAi015ksnMSe6ZP3OQHf9l8Hcx1PqIbSK-vlKu9PWDUbSbtXT7o4NFM5jd3gAwPH2fVYhxtsc17DrOE5ABeZ_49j-WBNJNHEiiibndcI2iTVRt1QEMlzVDf5SNfSA0Ht7cbV9cA-u7DjTT8S40Wfw7xdmZ65dVpMR338xQuKuDZ2_sKKNousie9nKdono7COI51BFoHFFaKTq5ntNbaqNNxF3h1YBxE
    [captcha_response] =>
)
  • 顺便说一句,你可能会发现这个项目很有趣:https://github.com/divinity76/msgme 命令行工具向Facebook发送消息,它确实登录到facebook来实现。
© www.soinside.com 2019 - 2024. All rights reserved.