如何在 Ruby 中迭代和抓取数据?

问题描述 投票:0回答:1

我对编程还很陌生,需要一些关于我的代码的帮助/反馈。 我的目标是抓取运行良好的数据,然后以编号列表的形式向用户显示该数据。我只是很难显示这些数据。我没有收到任何错误,我的程序只是完全跳过我的方法。预先感谢您的任何帮助/反馈!

class BestPlaces::Places
  attr_accessor :name, :population, :places
    @@places = []

  def self.list_places
    # puts "this is inside list places"
    self.scrape_places
  end

      def self.scrape_places
        doc = Nokogiri::HTML(open("https://nomadlist.com/best-cities-to-live"))
            places = doc.search("div.text h2.itemName").text
            rank = doc.search("div.rank").text

            places.collect{|e| e.text.strip}
              puts "you are now in title"
              @@places << self.scrape_places
              puts "#{rank}. #{places}"
            end
          end
        end

CLI Page:
class BestPlaces::CLI

  def list_places
    puts "Welcome to the best places on Earth!"
    puts @places = BestPlaces::Places.list_places
  end

  def call
    list_places
    menu
    goodbye
  end
end
arrays ruby web-scraping iteration
1个回答
0
投票

此代码中可以解决一些问题,但让我们首先看一下修改:

require 'nokogiri'
require 'open-uri'

module BestPlaces

  class Places
    attr_accessor :name, :population, :places

    def initialize
      @places = []
    end

    def scrape_places
      doc = Nokogiri::HTML(open("https://nomadlist.com/best-cities-to-live"))
      places = doc.search("div.text h2.itemName")
      ranks = doc.search("div.rank")
      places.each{|e| @places << e.text.strip}
      puts "you are now in title"
      @places.each do |place|
        i = @places.index(place)
        puts "#{ranks[i].text}. #{place}"
      end
   end

 end

 class CLI

   def list_places
     puts "Welcome to the best places on Earth!"
     BestPlaces::Places.scrape_places
   end

   def call
     list_places
     menu
     goodbye
   end

 end

end

您的模块/类设置看起来不完整。人们可以像这样调用上面的内容:

bp = BestPlaces::Places.new
bp.scrape_places

@@places 变量是不必要的,我们可以使用 @places 来保存需要在 Places 类中访问的值。此外,在搜索结果上使用 .text 方法时,nokogiri 返回一个字符串对象,这意味着您无法像数组一样迭代它们。我希望这有帮助。

© www.soinside.com 2019 - 2024. All rights reserved.