URL有一个正则表达式但它不支持unicode字符。
^(ht|f)tp(s?)\:\/\/[0-9a-zA-Z]([-.\w]*[0-9a-zA-Z])*(:(0-9)*)*(\/?)([a-zA-Z0-9\-\.\?\,\'\/\\\+&%\$#_]*)?
我想在javascript和C#中使用它
用a-zA-Z替换每次出现的\pL。
a-zA-Z
\pL
感谢@Lesley:
JavaScript属性在javascript中不可用,我们必须使用像regexp这样的包。
当你使用Unicode字符时,我认为你想要获得非英语语言(如阿拉伯语,希伯来语或波斯语......),所以只需将a-z A-Z中的字符串改为ا-ی或其他等价物
a-z
A-Z
ا-ی