尝试对使用 csv 导入的数据执行 ttest。
数据如下:
具有 99 个基因的“正常”病例和“癌症”病例值。
我如何设置代码来统计比较“正常”和“癌症”值(每个类别 n=20) 分别为每一列?
这将是双边 t 检验,因此结果将显示: 基因1、基因2.....基因99的正常值和癌症值之间的统计差异。
我希望避免为每个单独的列查找均值、标准差等,并希望对我的数据进行集体测试。
我曾经在 R 基础上编写过一个函数来做到这一点。该函数在github上。
remotes::install_github('oonyambu/SLR')
SLR::multiple_tests(. ~ category, df)
例如
t.test
对于 iris
数据集:
SLR::multiple_tests(.~Species, iris)