我试图通读~100张幻灯片并阅读每张幻灯片的注释部分。我会做一些文本争论并在事后写入csv,但需要先以可行的格式获取注释。
我现在正在使用officer
包,read_pptx
函数,但我愿意接受所需的任何包。它似乎没有记录,但我可能只是看着这个错误。
显示我尝试过的一点 - >
library(officer)
ppt_var <- read_pptx('test_presentation.pptx')
view(ppt_var)
理想情况下,我可以将每个音符幻灯片的文本添加到单个变量中以写入csv。我相信,一旦我读完笔记,我就可以处理操作,但似乎无法让这部分失效。
感谢您的任何指示或支持!
如何在这里的代码中显示:https://github.com/davidgohel/officer/issues/117。
以下是基于该代码:
library(magrittr)
library(officer)
library(xml2)
p <- read_pptx("mypresentation.pptx")
notes_dir <- file.path(p$package_dir, "ppt", "notesSlides")
files <- list.files(pattern = ".xml$", path = notes_dir, full.names = TRUE)
Notes <- lapply(files,
. %>%
read_xml %>%
xml_find_all("//a:t") %>%
xml_text
)