在Java中解析包含多部分/表单数据请求正文的字符串

问题描述 投票:0回答:2

问题陈述

我认为标题说明了一切:我正在寻找解析包含 multipart/form-data HTTP 请求正文部分的 String 的方法。 IE。字符串的内容看起来像这样:

--xyzseparator-blah
Content-Disposition: form-data; name="param1"

hello, world
--xyzseparator-blah
Content-Disposition: form-data; name="param2"

42
--xyzseparator-blah
Content-Disposition: form-data; name="param3"

blah, blah, blah
--xyzseparator-blah--

我希望获得的是一张

parameters
地图,或者类似的东西,就像这样。

parameters.get("param1");    // returns "hello, world"
parameters.get("param2");    // returns "42"
parameters.get("param3");    // returns "blah, blah, blah"
parameters.keys();           // returns ["param1", "param2", "param3"]

更多标准

  • 如果我不必提供分隔符(即本例中的
    xyzseparator-blah
    ),那就最好了,但如果必须的话,我也可以忍受。
  • 我正在寻找基于库的解决方案,可能来自主流库(例如“Apache Commons”或类似的库)。
  • 我想避免推出自己的解决方案,但在现阶段,恐怕我不得不这么做。原因:虽然上面的示例通过一些字符串操作来分割/解析似乎很简单,但真正的多部分请求体可以有更多的标头。除此之外,我不想重新发明(更不用说重新测试!)轮子:)

替代解决方案

如果有一个解决方案,满足上述标准,但其输入是 Apache

HttpRequest
,而不是
String
,那也是可以接受的。 (基本上我确实收到了一个
HttpRequest
,但是我正在使用的内部库是这样构建的,它将此请求的正文提取为字符串,并将其传递给负责进行解析的类。但是,如果需要的话,我也可以直接在
HttpRequest
上工作。)

相关问题

无论我如何尝试通过 Google 找到答案,在 SO 上以及其他论坛上,解决方案似乎总是使用 commons fileupload 来浏览各个部分。例如:这里这里这里这里这里... 但是,该解决方案中使用的

parseRequest
方法需要
RequestContext
,而我没有(只有
HttpRequest
)。

上面的一些答案中也提到了另一种方法,是从

HttpServletRequest
获取参数(但同样,我只有
HttpRequest
)。

编辑:换句话说:我可以包括Commons Fileupload(我可以访问它),但这对我没有帮助,因为我有一个

HttpRequest
,而Commons Fileupload需要
RequestContext
。 (除非有一种简单的方法可以从
HttpRequest
转换为
RequestContext
,我忽略了。)

java apache http multipart
2个回答
8
投票

您可以使用 Commons FileUpload 解析字符串,方法是将其包装在实现“org.apache.commons.fileupload.UploadContext”的类中,如下所示。

出于几个原因,我建议将 HttpRequest 包装在您建议的替代解决方案中。 首先,使用字符串意味着整个多部分 POST 正文(包括文件内容)需要适合内存。 包装 HttpRequest 将允许您对其进行流式传输,并且内存中一次只有一小部分缓冲区。 其次,如果没有 HttpRequest,您需要嗅出多部分边界,该边界通常位于“Content-type”标头中(请参阅RFC1867)。

import java.io.ByteArrayInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

import org.apache.commons.fileupload.FileItem;
import org.apache.commons.fileupload.FileItemFactory;
import org.apache.commons.fileupload.FileUpload;
import org.apache.commons.fileupload.disk.DiskFileItemFactory;

public class MultiPartStringParser implements org.apache.commons.fileupload.UploadContext {

    public static void main(String[] args) throws Exception {
        String s = new String(Files.readAllBytes(Paths.get(args[0])));
        MultiPartStringParser p = new MultiPartStringParser(s);
        for (String key : p.parameters.keySet()) {
            System.out.println(key + "=" + p.parameters.get(key));
        }
    }
    
    private String postBody;
    private String boundary;
    private Map<String, String> parameters = new HashMap<String, String>();
            
    public MultiPartStringParser(String postBody) throws Exception {
        this.postBody = postBody;
        // Sniff out the multpart boundary.
        this.boundary = postBody.substring(2, postBody.indexOf('\n')).trim();
        // Parse out the parameters.
        final FileItemFactory factory = new DiskFileItemFactory();
        FileUpload upload = new FileUpload(factory);
        List<FileItem> fileItems = upload.parseRequest(this);
        for (FileItem fileItem: fileItems) {
            if (fileItem.isFormField()){
                parameters.put(fileItem.getFieldName(), fileItem.getString());
            } // else it is an uploaded file
        }
    }
    
    public Map<String,String> getParameters() {
        return parameters;
    }

    // The methods below here are to implement the UploadContext interface.
    @Override
    public String getCharacterEncoding() {
        return "UTF-8"; // You should know the actual encoding.
    }
    
    // This is the deprecated method from RequestContext that unnecessarily
    // limits the length of the content to ~2GB by returning an int. 
    @Override
    public int getContentLength() {
        return -1; // Don't use this
    }

    @Override
    public String getContentType() {
        // Use the boundary that was sniffed out above.
        return "multipart/form-data, boundary=" + this.boundary;
    }

    @Override
    public InputStream getInputStream() throws IOException {
        return new ByteArrayInputStream(postBody.getBytes());
    }

    @Override
    public long contentLength() {
        return postBody.length();
    }
}

0
投票

在此行:

    FileUpload upload = new FileUpload(factory);

我收到一个错误,告诉我它无法实例化该类

© www.soinside.com 2019 - 2024. All rights reserved.