生成随机字符串

问题描述 投票:18回答:5

我想用以下方式生成随机字符串:ABCDE1234E,即每个字符串包含5个字符,4个数字,然后是1个字符。

我想出了一种使用以下代码创建它的方法。

library(random)
string_5 <- as.vector(randomStrings(n=5000, len=5, digits=FALSE, upperalpha=TRUE,
                        loweralpha=FALSE, unique=TRUE, check=TRUE))
number_4 <- as.vector(randomNumbers(n=5000, min=1111, max=9999, col=5, base=10, check=TRUE))
string_1 <- as.vector(randomStrings(n=5000, len=1, digits=FALSE, upperalpha=TRUE,
                         loweralpha=FALSE, unique=FALSE, check=TRUE))
PAN.Number <- paste(string_5,number_4,string_1,sep = "")

但这些功能需要很长时间,而random库需要网络连接。

> system.time(string_5 <- as.vector(randomStrings(n=5000, len=5, digits=FALSE, upperalpha=TRUE,
+                                                 loweralpha=FALSE, unique=TRUE, check=TRUE)))
   user  system elapsed 
   0.07    0.00    3.18 

有什么方法可以尝试减少执行时间吗?我也尝试过使用sample(),但我无法理解。

r random
5个回答
25
投票

使用@akrun建议的“stringi”会更快,但以下内容也非常快,不需要任何额外的包:

myFun <- function(n = 5000) {
  a <- do.call(paste0, replicate(5, sample(LETTERS, n, TRUE), FALSE))
  paste0(a, sprintf("%04d", sample(9999, n, TRUE)), sample(LETTERS, n, TRUE))
}

示例输出:

myFun(10)
##  [1] "BZHOF3737P" "EPOWI0674X" "YYWEB2825M" "HQIXJ5187K" "IYIMB2578R"
##  [6] "YSGBG6609I" "OBLBL6409Q" "PUMAL5632D" "ABRAT4481L" "FNVEN7870Q"

19
投票

我们可以使用stri_rand_stringsstringi

library(stringi)
sprintf("%s%s%s", stri_rand_strings(5, 5, '[A-Z]'),
      stri_rand_strings(5, 4, '[0-9]'), stri_rand_strings(5, 1, '[A-Z]'))

或者更紧凑

do.call(paste0, Map(stri_rand_strings, n=5, length=c(5, 4, 1),
            pattern = c('[A-Z]', '[0-9]', '[A-Z]')))

Benchmarks

system.time({
    do.call(paste0, Map(stri_rand_strings, n=5000, length=c(5, 4, 1),
            pattern = c('[A-Z]', '[0-9]', '[A-Z]')))
    })
#  user  system elapsed 
#   0      0      0

使用OP的方法,即使对于预期输出的一部分,也能够重现时序

system.time(string_5 <- as.vector(randomStrings(n=5000, len=5, digits=FALSE, upperalpha=TRUE,
                                              loweralpha=FALSE, unique=TRUE, check=TRUE)))
#  user  system elapsed 
#   0.86    0.24    5.52 

5
投票

您可以直接执行您想要的操作:样本随机5个大写字母样本4位数样本1个随机大写字母

digits = 0:9
createRandString<- function() {
  v = c(sample(LETTERS, 5, replace = TRUE),
        sample(digits, 4, replace = TRUE),
        sample(LETTERS, 1, replace = TRUE))
  return(paste0(v,collapse = ""))
}

这将更容易控制,并且不会花费太长时间。


2
投票

你的性能问题来自于首先使用random软件包:可以理解你可以在互联网搜索中找到random::randomStrings()函数,并认为这是生成随机字符串以便在程序中使用的好方法,但random包不是用于通用编程。它的工作原理是查询RANDOM.ORG服务器,它本质上比R的内置伪随机数生成器慢。

来自其中一个vignettes from the random package

在许多情况下,希望使用非确定性确定的随机数。例子包括 - 使用真正独立的种子在不同节点上播种分布式计算; - 获取不依赖于特定操作系统或硬件功能的RNG的可移植初始化; - 使用非确定性随机数验证模拟结果; - 提供用于彩票图画或游戏的不确定种子......

请注意,大多数这些示例都是关于种子或初始化(这些是同义词)R的内置伪随机数生成器,而不是替换它们......


0
投票

如果有人来这里寻找生成随机文件名的方法,这就是我使用的。我喜欢它的优雅

library(dplyr)
runif(1, 1000000000000, 9999999999999) %>% round %>% as.character %>% paste0("/tmp/", ., ".png") 

注意:您可以通过将1中的runif()更改为您想要的数字,轻松更改它生成的随机字符串数量

© www.soinside.com 2019 - 2024. All rights reserved.