我们在我们的一个模块中使用垂直条|
(|
)字符作为字段分隔符。因此用户不应在标题中使用此字符。
如果他们确实使用它,我想用类似的角色替换它。
是否有Unicode替代品?我找到的唯一一个与它相似的角色是垂直条纹¦
(¦
)。
我不明白你真正需要什么。您是否需要将分隔符序列更改为保证数据集中不存在的内容?
如果是这样,那就是Unicode的66个“非字符”代码点是专门设计的。您可以将它们用作内部哨兵,因为它们知道它们不会出现在有效数据中。
如果你只是寻找一个视觉外观,那就非常不同了。我不建议这样做,因为有很多混淆因素。以下是其中一些:
U+0007C | GC=Sm SC=Common VERTICAL LINE
U+000A6 ¦ GC=So SC=Common BROKEN BAR
U+002C8 ˈ GC=Lm SC=Common MODIFIER LETTER VERTICAL LINE
U+002CC ˌ GC=Lm SC=Common MODIFIER LETTER LOW VERTICAL LINE
U+02016 ‖ GC=Po SC=Common DOUBLE VERTICAL LINE
U+023D0 ⏐ GC=So SC=Common VERTICAL LINE EXTENSION
U+02758 ❘ GC=So SC=Common LIGHT VERTICAL BAR
U+02759 ❙ GC=So SC=Common MEDIUM VERTICAL BAR
U+0275A ❚ GC=So SC=Common HEAVY VERTICAL BAR
U+02AF4 ⫴ GC=Sm SC=Common TRIPLE VERTICAL BAR BINARY RELATION
U+02AF5 ⫵ GC=Sm SC=Common TRIPLE VERTICAL BAR WITH HORIZONTAL STROKE
U+02AFC ⫼ GC=Sm SC=Common LARGE TRIPLE VERTICAL BAR OPERATOR
U+02AFE ⫾ GC=Sm SC=Common WHITE VERTICAL BAR
U+02AFF ⫿ GC=Sm SC=Common N-ARY WHITE VERTICAL BAR
U+0FF5C | GC=Sm SC=Common FULLWIDTH VERTICAL LINE
U+0FFE4 ¦ GC=So SC=Common FULLWIDTH BROKEN BAR
Unicode中有一个'light vertical bar':|,代码点U + 2758
http://www.fileformat.info/info/unicode/char/007c/index.htm
也可以看看:
Unicode,以及之前的ASCII,具有专门用于您的情况的字符。
有些字符旨在用作:
␟
):记录的字段或行的成员之间。␞
):记录或行的结尾您看到的那些字符是视觉表示:
现在实际上你不应该使用这些角色。实际字符返回ASCII天:
Character Symbol ASCII Unicode Unicode name
---------------- ------ ----- ------- -------------------------
Unit separator ␟ 0x0F U+001F Information separator one
Record separator ␞ 0x1E U+001E Information separator two
不幸的是,实际记录分隔符和单位分隔符字符是不可打印的:
这就是为什么这些符号存在符号的原因很好:
并没有什么能阻止你自己使用这些角色:
AUD␟Australian dollar␟0.923
BRL␟Brazilian real␟0.3443
CNY␟Chinese renminbi␟0.1926
EUR␟European euro␟1.5009
JPY␟Japanese yen␟0.01229
MXN␟Mexican peso␟0.06894
NOK␟Norwegian krone␟0.154
RUB␟Russian ruble␟0.02074
CHF␟Swiss franc␟1.3448
GBP␟UK pound sterling␟1.6844
VND␟Vietnamese dong␟0.000057
我知道你说你想要一些视觉上相似的东西。但: