我想在数百个单词中加上引号(用空格包围),并用逗号分隔它们。优选地,仅使用一个或几个功能以避免由于时间上的花费而进行人工替换。
示例问题:单词
输出应为:“巴黎”,“米兰”,“柏林”
我已经尝试过gsub()和str_extract(),但是没有得到理想的结果。
提前感谢!
可能有几种方法。这是其中之一:
library(tokenizers)
words <- c("Paris Milan Berlin")
tokenize_words(words, simplify =TRUE)
> tokenize_words(words, simplify =TRUE)
[1] "paris" "milan" "berlin"
gsub("[[:blank:]]+", ",", gsub('(\\b[[:alnum:]]+\\b)', '"\\1"', words))
#[1] "\"Paris\",\"Milan\",\"Berlin\""