我正在构建一个正则表达式来检查单词是否以
http://
或 https://
或 ftp://
开头,我的代码如下,
public static void main(String[] args) {
try{
String test = "http://yahoo.com";
System.out.println(test.matches("^(http|https|ftp)://"));
} finally{
}
}
它打印
false
。我还检查了 stackoverflow 帖子 Regex 来测试字符串是否以 http:// 或 https:// 开头
正则表达式似乎是正确的,但为什么它不匹配?我什至尝试过
^(http|https|ftp)\://
和^(http|https|ftp)\\://
您需要在这里进行整个输入匹配。
System.out.println(test.matches("^(http|https|ftp)://.*$"));
编辑:(基于@davidchambers的评论)
System.out.println(test.matches("^(https?|ftp)://.*$"));
除非有一些令人信服的理由使用正则表达式,否则我只会使用 String.startsWith:
bool matches = test.startsWith("http://")
|| test.startsWith("https://")
|| test.startsWith("ftp://");
如果这也更快,我不会感到惊讶。
如果你想以不区分大小写的方式进行操作,这样更好:
System.out.println(test.matches("^(?i)(https?|ftp)://.*$"));
我认为正则表达式/字符串解析解决方案很棒,但是对于这个特定的上下文,似乎仅使用 java 的 url 解析器就有意义了:
https://docs.oracle.com/javase/tutorial/networking/urls/urlInfo.html
取自该页面:
import java.net.*;
import java.io.*;
public class ParseURL {
public static void main(String[] args) throws Exception {
URL aURL = new URL("http://example.com:80/docs/books/tutorial"
+ "/index.html?name=networking#DOWNLOADING");
System.out.println("protocol = " + aURL.getProtocol());
System.out.println("authority = " + aURL.getAuthority());
System.out.println("host = " + aURL.getHost());
System.out.println("port = " + aURL.getPort());
System.out.println("path = " + aURL.getPath());
System.out.println("query = " + aURL.getQuery());
System.out.println("filename = " + aURL.getFile());
System.out.println("ref = " + aURL.getRef());
}
}
产生以下结果:
protocol = http
authority = example.com:80
host = example.com
port = 80
path = /docs/books/tutorial/index.html
query = name=networking
filename = /docs/books/tutorial/index.html?name=networking
ref = DOWNLOADING
test.matches()方法检查所有文本。使用test.find()
在startsWith和matches之间添加验证。
import java.net.URL
fun main(args: Array<String>) {
val IMAGE_SERVER = "https://google.com/file/"
val IMAGE_REG: String by lazy {
val url = URL(IMAGE_SERVER)
"^(http|https)://${url.host}${url.path}.*\$"
}
val regx = Regex(IMAGE_REG)
println(IMAGE_REG)
var begin = System.nanoTime()
var aa = IMAGE_SERVER.startsWith(IMAGE_SERVER)
println("startsWith:"+ (System.nanoTime()-begin))
println("startsWith:"+ aa)
begin = System.nanoTime()
aa = IMAGE_SERVER.matches(regx)
println("matches:"+ (System.nanoTime()-begin))
println("matches:"+ aa)
}
开始于:3755625
开始于:true
匹配数:174250
匹配:true
matches 为 174us,startswith 为 3.755ms
场景中matches在性能和代码整洁度上比startsWith要好得多。
使用 stringUtils 中的startsWithAny。
StringUtils.startsWithAny(elementToMatch , Array-of-elements-to-match-against)