计算和绘制r中的内核密度分布差异

问题描述 投票:1回答:1

我正在使用R,我想计算x轴上每个点的两个内核密度分布之间的差异,并绘制该差异,但遇到了一些麻烦。我可以执行某些功能或方式吗?就上下文而言,我使用的是血压数据,并且我想计算男女之间血压各个点的差异。

我的分布代码(不是差异)看起来像这样(SBP =收缩压):

km <- density(data$SBP[data$GENDER==0], bw="nrd0", adjust = 1, kernel = c("gaussian"), window = kernel, n=512, cut=3, give.Rkern = FALSE, na.rm=FALSE)
kf <- density(data$SBP[data$GENDER==1], bw="nrd0", adjust = 1, kernel = c("gaussian"), window = kernel, n=512, cut=3, give.Rkern = FALSE, na.rm=FALSE)

plot(km, xlab="SBP", main="SBP Distribution of Men & Women", col="blue")
lines(kf, col="green")

我对这一切完全陌生!我敢肯定,在这里也没有提出我的确切问题,但是请带我到其他可能有用的资源。谢谢。

r kernel distribution difference kernel-density
1个回答
0
投票

density对象具有元素xy元素,它们分别存储x轴和分布函数值。如果对两个from调用使用相同的todensity()争论,则计算的x值应相同。

将两个密度的x-y值存储在一个数据框中,然后在x上将它们合并/合并,然后您可以计算差值并绘制它们:

x <- rnorm(1000,0,1)
y <- rnorm(1000,1,1)
fx <- density(x,from = -5,to=5)
fy <- density(y,from = -5,to=5)
plot(fx,col='blue',main="SBP Distribution of Men & Women")
lines(fy, col="green")

dfx <- data.frame(x=fx$x,
                  fx=fx$y)

dfy <- data.frame(x=fy$x,
                  fy=fy$y)

library(dplyr)
#> 
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#> 
#>     filter, lag
#> The following objects are masked from 'package:base':
#> 
#>     intersect, setdiff, setequal, union
library(ggplot2)

“”

inner_join(dfx,dfy,on='x') %>% 
  mutate(diff=fx-fy) %>% 
  ggplot()+
  geom_line(aes(x=x,y=diff))
#> Joining, by = "x"

<< img src =“ https://image.soinside.com/eyJ1cmwiOiAiaHR0cHM6Ly9pLmltZ3VyLmNvbS90OXlXZzZFLnBuZyJ9” alt =“”>

reprex package(v0.3.0)在2020-03-10创建

© www.soinside.com 2019 - 2024. All rights reserved.