从FTP服务器检索文件的修改日期

问题描述 投票:0回答:1

基于此问题(Retrieve modified DateTime of a file from an FTP Server),很清楚如何获取日期修改值。但是,即使可以从FTP站点看到完整日期,也不会返回完整日期。

这显示了如何获取ftp://ftp.FreeBSD.org/pub/FreeBSD/处文件的日期修改值>

library(curl)
library(stringr)

con <- curl("ftp://ftp.FreeBSD.org/pub/FreeBSD/")
dat <- readLines(con)
close(con)

no_dirs <- grep("^d", dat, value=TRUE, invert=TRUE)
date_and_name <- sub("^[[:alnum:][:punct:][:blank:]]{43}", "", no_dirs)
dates <- sub('\\s[[:alpha:][:punct:][:alpha:]]+$', '', date_and_name)
dates
## [1]  "May 07  2015" "Apr 22 15:15" "Apr 22 10:00"

某些日期采用月/日/年/年格式,其他日期采用月/日/小时/分钟的格式。

查看FTP站点,所有日期都以月/日/年小时/分钟/秒的格式显示。

enter image description here

我假设它与Unix格式标准(在FTP details command doesn't seem to return the year the file was modified, is there a way around this?中解释)有关。获取完整的日期将是很好的。

基于此问题(从FTP服务器检索文件的修改后的DateTime),很清楚如何获取修改后的日期值。但是,即使显示完整日期也不会返回...

r web-scraping ftp
1个回答
0
投票

您在浏览器上看到的日期字符串似乎是因为您以漂亮的格式被转发到该网站的http版本。您可以尝试直接转到此处并抓取日期字符串:

© www.soinside.com 2019 - 2024. All rights reserved.