如何使用cheerio和axios选择图像url

问题描述 投票:0回答:2
const express = require("express");
const cheerio = require("cheerio");
const axios = require("axios");
const cors = require("cors");
const app = express();

async function getSearchResults(searchFor) {
    const url = `https://www.bol.com/be/nl/s/?searchtext=airpods+pro`;
    const respone = await axios.get(url);
    const $=cheerio.load(respone.data);

    // verwreken van het resultaat in een array
    const ul = $('.product-list');
    ul.find('li .product-item__image .h-o-hidden a .skeleton-image').each((i, element) => {
        const $element = $(element);
        const a = $element.find('img').attr('src');
        console.log(a);   
    });
}

我还提供了我要抓取的网站的 HTML

到目前为止,它识别出确实有大约 20 张图片,但它给出了一个未定义的值......

javascript web-scraping axios cheerio
2个回答
0
投票

您的问题是该 div 内的第一个 img 没有

src
属性。

这是工作代码:

const ul = $('.product-list');
ul.find('li .product-item__image .h-o-hidden a .skeleton-image')
  .each((i, element) => {
    const $element = $(element);
    const a = $element.find('img').attr('data-src');
    console.log(a);   
 });

工作证明截图


0
投票

您需要引用实际的图像标签,这是另一个级别。

尝试以下操作:

ul.find('li .product-item__image .h-o-hidden a .skeleton-image').each((i, element) => {
const $element = $(element);
        const a = $element.find('.skeleton-image__container').find('img').attr('src');
    });

或者,如果

skeleton-image
类下只有一个 div:

ul.find('li .product-item__image .h-o-hidden a .skeleton-image').each((i, element) => {
const $element = $(element);
        const a = $element.find('div').find('img').attr('src');
    });

希望这有帮助。

© www.soinside.com 2019 - 2024. All rights reserved.