这可以在TERR数据功能中完成。我不知道你将Spotfire与TERR集成在一起有多舒服,例如这里有一个介绍视频(演示从大约7分钟开始):
https://www.youtube.com/watch?v=ZtVltmmKWQs
考虑到这一点,我编写了脚本而没有加载任何库,所以它非常详细和明确,但希望更简单地一步一步地遵循。我确信有一种更优雅的方式,并且有更好的方法使列名更灵活,但这是一个开始。
您的输入将是数据表(dt,原始数据)并输出新数据表(dt.out,转换后的数据)。所有列名称(和一些值)都在脚本中明确地解决(因此,如果您更改它们将无效)。
#remove the []
dt$Values=gsub('\\[|\\]','',dt$Values)
#separate into two different data frames, one for time and one for temperature
dt.time=dt[dt$Description=='time',]
dt.temperature=dt[dt$Description=='temperature',]
#split the columns we want to separate into a list of vectors
dt2.time=strsplit(as.character(dt.time$Values),',')
dt2.temperature=strsplit(as.character(dt.temperature$Values),',')
#rearrange times
names(dt2.time)=dt.time$object
dt2.time=stack(dt2.time) #stack vectors
dt2.time$id=c(1:nrow(dt2.time)) #assign running id for merging later
colnames(dt2.time)[colnames(dt2.time)=='values']='time'
#rearrange temperatures
names(dt2.temperature)=dt.temperature$object
dt2.temperature=stack(dt2.temperature) #stack vectors
dt2.temperature$id=c(1:nrow(dt2.temperature)) #assign running id for merging later
colnames(dt2.temperature)[colnames(dt2.temperature)=='values']='temperature'
#merge time and temperature
dt.out=merge(dt2.time,dt2.temperature,by=c('id','ind'))
colnames(dt.out)[colnames(dt.out)=='ind']='object'
dt.out$time=as.numeric(dt.out$time)
dt.out$temperature=as.numeric(dt.out$temperature)
盖亚
因为您在此处显示的所有示例行都包含四个列表项而您没有另外指定,我将假设所有数据都符合此格式。
有了这个假设,使用RXReplace()
表达式函数将值拆分成列就变得非常微不足道了,尽管有点混乱。
您可以创建四个计算列,每个列的表达式如下:
Int(RXReplace([values],"\\[([\\d\\-]+),([\\d\\-]+),([\\d\\-]+),([\\d\\-]+)]","\\1",""))
第三个参数"\\1"
确定要提取的列表中的哪个数字。根据RXReplace()
函数的要求,反斜杠加倍(“转义”)。
请注意,此示例假定数字都是整数。如果你有小数,你需要将正则表达式的每个“短语”调整为([\\d\\-\\.]+)
,你需要将表达式包装在Real()
而不是Int()
中(如果你将这部分保留下来,结果将是一个字符串在处理数据时可能会导致混淆的类型)。
一旦有了四列,您就可以轻松取消数据以轻松获取数据。