使用带有dbplyr的sample_n()随机采样数据库

问题描述 投票:1回答:2

是否可以使用dplyr :: sample_n()之类的函数从数据库中选择随机(或伪随机)子集,但是在dbplyr或运行SQL查询的另一个R包中?

目的是在从数据库运行时间密集型数据之前测试小批量的查询。

sql r dbplyr
2个回答
1
投票

这似乎适用于我们的MySQL服务器:

dbGetQuery(con, 
"SELECT * 
FROM data_table_name 
ORDER BY RAND() 
LIMIT 500;")

0
投票

对于SQLite,您可以尝试这样做:

DBI::dbGetQuery(con, "SELECT * FROM table ORDER BY RANDOM() LIMIT 1;")
© www.soinside.com 2019 - 2024. All rights reserved.