folder_to_analyze = ARGV.first
folder_path = File.join(Dir.pwd, folder_to_analyze)
unless File.directory?(folder_path)
puts "Error: #{folder_path} no es un folder valido."
exit
end
def get_csv_file_paths(path)
files = []
Dir.glob(path + '/**/*.csv').each do |f|
files << f
end
return files
end
def get_xlsx_file_path(path)
files = []
Dir.glob(path + '/**/*.xls').each do |f|
files << f
end
return files
end
files_to_process = []
files_to_process << get_csv_file_paths(folder_path)
files_to_process << get_xlsx_file_path(folder_path)
puts files_to_process[1].length # Not what I want, I want:
# puts files_to_process.length
我正在尝试在Ruby中创建一个简单的脚本,允许我从命令行调用它,如ruby counter.rb mailing_list1
,它将转到该文件夹并计算所有.csv和.xls文件。
我打算对每个文件进行操作,获取行数等。
目前files_to_process
数组实际上是一个数组数组 - 我不希望这样。我想要一个.csv和.xls文件的单个数组。
由于我不知道如何从Dir.glob
调用中产生,我将它们添加到数组并返回。
如何使用单个阵列完成此操作?
好吧,屈服很简单。只是yield
。
def get_csv_file_paths(path)
Dir.glob(path + '/**/*.csv').each do |f|
yield f
end
end
def get_xlsx_file_path(path)
Dir.glob(path + '/**/*.xls').each do |f|
yield f
end
end
files_to_process = []
get_csv_file_paths(folder_path) {|f| files_to_process << f }
get_xlsx_file_path(folder_path) {|f| files_to_process << f }
puts files_to_process.length
ruby中的每个方法都可以传递一个块。并且yield
关键字将数据发送到该块。如果可能提供或不提供块,yield
通常与block_given?
一起使用。
yield f if block_given?
通过将块直接传递给glob.each
可以进一步简化代码:
def get_csv_file_paths(path, &block)
Dir.glob(path + '/**/*.txt').each(&block)
end
def get_xlsx_file_path(path, &block)
Dir.glob(path + '/**/*.xls').each(&block)
end
虽然这个块/ proc转换是一个有点高级的主题。
只需将文件扩展名粘贴到一个组中:
Dir[path + "/**/*.{csv,xls}"]
def get_folder_paths(root_path)
Dir.glob('**/*.csv') + Dir.glob('**/*.xls')
end
folder_path = File.join(Dir.pwd, ARGV.first || '')
raise "#{folder_path} is not a valid folder" unless File.directory?(folder_path)
puts get_folder_paths(folder_path).length
get_folder_paths
方法返回CSV和XLS文件的数组。构建一个文件名数组可能不是你真正想要的,特别是如果有很多文件名。如果您不首先需要文件计数,那么使用Dir.glob返回的Enumerator的方法更适合。