假设我有绳子
"[1,2,[3,4,[5,6]],7]"
我如何将其解析到数组中
[1,2,[3,4,[5,6]],7]
?
在我的使用案例中,嵌套结构和模式是完全任意的。
我当前的临时解决方案包括在每个句点后添加一个空格并使用
YAML.load
,但如果可能的话,我希望有一个更干净的解决方案。
(如果可能的话不需要外部库)
正在使用
JSON
正确解析该特定示例:
s = "[1,2,[3,4,[5,6]],7]"
#=> "[1,2,[3,4,[5,6]],7]"
require 'json'
#=> true
JSON.parse s
#=> [1, 2, [3, 4, [5, 6]], 7]
eval
运行字符串,但您必须确保没有传递任何实际的ruby代码,因为eval
可以用作注入漏洞。
编辑:这是一个简单的递归、基于正则表达式的解析器,没有验证,未经测试,不用于生产用途等:
def my_scan s
res = []
s.scan(/((\d+)|(\[(.+)\]))/) do |match|
if match[1]
res << match[1].to_i
elsif match[3]
res << my_scan(match[3])
end
end
res
end
s = "[1,2,[3,4,[5,6]],7]"
p my_scan(s).first #=> [1, 2, [3, 4, [5, 6]], 7]
YAML
,如下所示:
require 'yaml'
s = "[1,2,[3,4,[5,6]],7]"
YAML.load(s)
# => [1, 2, [3, 4, [5, 6]], 7]
“显然”最好的解决方案是编写自己的解析器。 [如果您喜欢编写解析器,但以前从未这样做过并且想要学习新的东西,或者想要控制确切的语法]
require 'parslet'
class Parser < Parslet::Parser
rule(:space) { str(' ') }
rule(:space?) { space.repeat(0) }
rule(:openbrace_) { str('[').as(:op) >> space? }
rule(:closebrace_) { str(']').as(:cl) >> space? }
rule(:comma_) { str(',') >> space? }
rule(:integer) { match['0-9'].repeat(1).as(:int) }
rule(:value) { (array | integer) >> space? }
rule(:list) { value >> ( comma_ >> value ).repeat(0) }
rule(:array) { (openbrace_ >> list.maybe.as(:list) >> closebrace_ )}
rule(:nest) { space? >> array.maybe }
root(:nest)
end
class Arr
def initialize(args)
@val = args
end
def val
@val.map{|v| v.is_a?(Arr) ? v.val : v}
end
end
class MyTransform < Parslet::Transform
rule(:int => simple(:x)) { Integer(x) }
rule(:op => '[', :cl => ']') { Arr.new([]) }
rule(:op => '[', :list => simple(:x), :cl => ']') { Arr.new([x]) }
rule(:op => '[', :list => sequence(:x), :cl => ']') { Arr.new(x) }
end
def parse(s)
MyTransform.new.apply(Parser.new.parse(s)).val
end
parse " [ 1 , 2 , [ 3 , 4 , [ 5 , 6 , [ ]] ] , 7 ] "
Parslet 转换会将单个值匹配为“简单”,但如果该值返回一个数组,您很快就会得到数组的数组,然后您必须开始使用子树。然而,返回对象很好,因为它们在转换上面的层时代表单个值......所以序列会很好地匹配。
将返回裸数组的麻烦与 Array([x]) 和 Array(x) 给你同样的东西的问题结合起来......你会得到非常混乱的结果。
为了避免这种情况,我创建了一个名为 Arr 的辅助类,它表示一个项目数组。 然后我可以决定我传递给它的内容。然后我可以让解析器保留所有括号,即使你有@MateuszFryc 调用的示例:)(感谢@MateuszFryc)
使用评估
array = eval("[1,2,[3,4,[5,6]],7]")