我需要使用 R 将文本数据(例如段落)转换为数据框(以另存为 csv 文件)。具体需求是将每个段落中的每个单词放在列中的单独单元格中。以下代码将文本转换为表格,但它将每行中的单词放入单个单元格中。您可以帮助创建一个单列数据集,其中每个单词都位于单独的单元格中吗?
merchant <- read.delim("merchant.txt")
write.table(merchant,file="merchant.csv",sep=",",col.names=FALSE,row.names=FALSE)
这是我基于 tidyverse 的尝试。不要以表格的形式读入,只需以字符串的形式读入,然后分成单个单词的向量:
library(tidyverse)
## Read in text file as string
merchant <- read_file("merchant.txt") %>%
## Remove all punctuation
gsub('[[:punct:] ]+',' ',.) %>%
## Split individual words into list vector
strsplit(" ")
## Set column equal to the vector of individual words
para <- merchant[[1]]
将其转换为数据框:
para <- as.data.frame(para)
时间 | 活动 | 放松选择 | 励志名言 |
---|---|---|---|
早上6:00 | 醒来 | - | “每天早晨我们都会重生。我们今天所做的事情最重要。” |
早上6点30分 | 瑜伽 | - | “瑜伽是自我的旅程,通过自我,到达自我。” - 薄伽梵歌 |
上午7点30分 | 早餐 | - | “照顾好你的身体。这是你唯一可以居住的地方。” - 吉姆·罗恩 |
上午8:00 | 放松 | 睡觉、听音乐、看书 | “放松、充电和反思。有时什么都不做也没关系。” |
上午8点30分 | 学习课程1 | - | “成功是日复一日重复的小努力的总和。” - 罗伯特·科利尔 |
上午11点30分 | 午休时间 | - | “照顾好你的身体。这是你唯一可以居住的地方。” - 吉姆·罗恩 |
12:30 下午 | 学习2 | - | “做好工作的唯一方法就是热爱你所做的事情。” - 史蒂夫·乔布斯 |
下午2点30分 | 放松 | 睡觉、听音乐、冥想 | “在运动和混乱之中,保持内心的宁静。” - 迪帕克·乔普拉 |
下午3:30 | 学习课程3 | - | “任何事情的专家都曾经是初学者。” - 海伦·海耶斯 |
下午5:30 | 放松 | 散步,练习深呼吸 | “放松是生产力的关键。休息一下,充电。” |
下午6:00 | 晚餐 | - | “如果一个人没有吃好饭,就无法好好思考、好好爱、好好睡觉。” - 弗吉尼亚·伍尔夫 |
7:00 下午 | 环聊 | 与朋友/家人共度时光,从事一项爱好 | “让自己周围都是积极的人,他们会激励你、激励你。” |
晚上8:00 | 学习课程4 | - | “实现明天的唯一限制是我们今天的疑虑。” - 富兰克林·D·罗斯福 |
晚上9点30分 | 皮肤护理和冥想 | 练习正念,进行日常护肤 | “照顾好你的身体,这是你唯一可以居住的地方。” - 吉姆·罗恩 |
晚上10点30分 | 就寝时间 | - | “睡眠是最好的冥想。” - 达赖喇嘛 |