Apache SOlR：数据导入处理程序异常-如何跳过零字节文件

Question

通过solr日志时，发现某些数据导入错误文件。这是有关错误的详细信息。

Exception while processing: file document :
null:org.apache.solr.handler.dataimport.DataImportHandlerException: Unable
to read content Processing Document # 7866
        at
org.apache.solr.handler.dataimport.DataImportHandlerException.wrapAndThrow(DataImportHandlerException.java:69)
        at
org.apache.solr.handler.dataimport.TikaEntityProcessor.nextRow(TikaEntityProcessor.java:171)
        at
org.apache.solr.handler.dataimport.EntityProcessorWrapper.nextRow(EntityProcessorWrapper.java:267)
        at
org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:476)
        at
org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:517)
        at
org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:415)
        at
org.apache.solr.handler.dataimport.DocBuilder.doFullDump(DocBuilder.java:330)
        at
org.apache.solr.handler.dataimport.DocBuilder.execute(DocBuilder.java:233)
        at
org.apache.solr.handler.dataimport.DataImporter.doFullImport(DataImporter.java:424)
        at
org.apache.solr.handler.dataimport.DataImporter.runCmd(DataImporter.java:483)
        at
org.apache.solr.handler.dataimport.DataImporter.lambda$runAsync$0(DataImporter.java:466)
        at java.lang.Thread.run(Unknown Source)
Caused by: org.apache.tika.exception.ZeroByteFileException: InputStream must
have > 0 bytes
        at org.apache.tika.parser.AutoDetectParser.parse(AutoDetectParser.java:122)
        at
org.apache.solr.handler.dataimport.TikaEntityProcessor.nextRow(TikaEntityProcessor.java:165)

我如何忽略ZeroByteFileException作为文档。

我可以在dataimport.config中定义任何渗入吗？

谢谢！

Answer 1

有一个可以根据您的情况配置的属性。

您可以添加ignoreTikaException=true

ignoreTikaException

如果为true，将跳过在处理过程中发现的异常。但是，所有可用的元数据都会被索引。

Example: ignoreTikaException=true

有关更多详细信息，请参阅solr文档。Solr Documentation

Apache SOlR：数据导入处理程序异常-如何跳过零字节文件

问题描述投票：2回答：1

1个回答

最新问题

Apache SOlR：数据导入处理程序异常-如何跳过零字节文件

问题描述 投票：2回答：1

1个回答

最新问题

问题描述投票：2回答：1