[openbenno-users] Probleme mit PDF-Dokumenten

Thomas Koch koch at fides.ag
Wed May 26 12:42:04 CEST 2010


Moin,

ich bin momentan dabei, Openbenno einzuführen. Anfangs funktionierte es auch
sehr gut, nur irgendwann kam fetchmail ins stocken und seit dem kann ich
nichts mehr importieren.

In den Logfiles standen massig Fehler drin, welche auch auftreten, wenn man
den Index neugenerieren will.

mailarchive01:/opt/bennocore# java -jar bennoadmin.jar rebuild-index
Create archive /srv/mailarchive/repo /srv/mailarchive/index false
Rebuilding index..
# of Documents in Repository: 13602
Adding Message --0XlX15PfLR929pPl-UqQ==
Adding Message -01bb_kMUUfLV6fUSbN4Eg==
Adding Message -05EAN9DbGGcKZWKVK8ovA==
Adding Message -0nxlYyjHskMjpKY1lBGBg==
Adding Message -0n36HGuyU4bCw8FZ9sYbA==
Adding Message -0wXWYBeW5nOGflWIzr8Dw==
26.05.2010 12:36:18 de.lwsystems.mailarchive.repository.BaseArchive
extractTextFromPart
SCHWERWIEGEND: null
java.io.IOException: Error in encoded stream: needed 4 valid base64
characters but only got 1 before EOF, the 10 most recent characters were:
"8BJ2M2o8l0"
 at
com.sun.mail.util.BASE64DecoderStream.decode(BASE64DecoderStream.java:250)
 at com.sun.mail.util.BASE64DecoderStream.read(BASE64DecoderStream.java:148)
 at java.io.BufferedInputStream.read1(BufferedInputStream.java:273)
 at java.io.BufferedInputStream.read(BufferedInputStream.java:334)
 at org.apache.tika.io.ProxyInputStream.read(ProxyInputStream.java:89)
 at org.apache.tika.io.CountingInputStream.read(CountingInputStream.java:76)
 at org.apache.tika.io.ProxyInputStream.read(ProxyInputStream.java:89)
 at java.io.BufferedInputStream.read1(BufferedInputStream.java:273)
 at java.io.BufferedInputStream.read(BufferedInputStream.java:334)
 at java.io.BufferedInputStream.fill(BufferedInputStream.java:235)
 at java.io.BufferedInputStream.read(BufferedInputStream.java:254)
 at java.io.FilterInputStream.read(FilterInputStream.java:83)
 at java.io.PushbackInputStream.read(PushbackInputStream.java:139)
 at
org.apache.pdfbox.io.PushBackInputStream.read(PushBackInputStream.java:84)
 at
org.apache.pdfbox.pdfparser.BaseParser.readUntilEndStream(BaseParser.java:418)
 at
org.apache.pdfbox.pdfparser.BaseParser.parseCOSStream(BaseParser.java:321)
 at org.apache.pdfbox.pdfparser.PDFParser.parseObject(PDFParser.java:528)
 at org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:179)
 at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:841)
 at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:808)
 at org.apache.tika.parser.pdf.PDFParser.parse(PDFParser.java:53)
 at org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:120)
 at org.apache.tika.parser.AutoDetectParser.parse(AutoDetectParser.java:101)
 at org.apache.tika.parser.AutoDetectParser.parse(AutoDetectParser.java:114)
 at
de.lwsystems.mailarchive.repository.BaseArchive.extractTextFromPart(BaseArchive.java:311)
 at
de.lwsystems.mailarchive.repository.BaseArchive.extractTextFromPart(BaseArchive.java:256)
 at
de.lwsystems.mailarchive.repository.BaseArchive.extractTextFromPart(BaseArchive.java:276)
 at
de.lwsystems.mailarchive.repository.BaseArchive.extractTextFromPart(BaseArchive.java:256)
 at
de.lwsystems.mailarchive.repository.BaseArchive.generateMetaDocument(BaseArchive.java:440)
 at
de.lwsystems.mailarchive.repository.BaseArchive.rebuildIndex(BaseArchive.java:182)
 at de.lwsystems.mailarchive.Main.doMain(Main.java:169)
 at de.lwsystems.mailarchive.Main.main(Main.java:65)
Adding Message -13e4LM0EjR5MH9z1aClxg==
mailarchive01:/opt/bennocore#
 

Bei dem System handelt es sich um ein Debian Lenny x86 auf einem Celeron
2,66GHz mit 1GB RAM, auf dem System läuft nur Openbenno. Als JDK nutz ich
das OpenJDK 1.6.0_0, aber auch mit dem Sun JDK 1.6.2 tritt das Problem auf.

Schöne Grüße aus dem Ruhrpott

Thomas

 

 
-- 

 

Mit freundlichen Grüßen

Thomas Koch
Systemadministrator der fides AG

Borussiastraße 112
44149 Dortmund

 
 
 
 
Telefon: 
 - 
 
+49 (231) 967877-61
 
 
 
 
 
Fax:
 - 
 
+49 (231) 967877-20
 
 
 
 - 
 
 
 
 
E-Mail:
 - 
 
[koch at fides.ag
 
 
 
 
 
Website:
 - 
 
www.fides.ag ->
../../../../index.php?menuaction=felamimail.uicompose.compose+send_to=a29jaEBmaWRlcy5hZw==]
 
 
 


 
__________________________________________________


 

 
 
 
 
Registergericht:
 - 
 
Amtsgericht Dortmund
 
 
 
 
 
Registernummer:
 - 
 
HRB 18893
 
 
 
 
 
Aufsichtsführende Behörde:
 - 
 
IHK Dortmund
 
 
 
 
 
Vorstand der fides AG:
 - 
 
Markus Olejnik
 
 
 
 
 
Aufsichtsratsvorsitzender:
 - 
 
Jens Jeromin
 
 
 


 

 
__________________________________________________

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://www.openbenno.org/pipermail/users/attachments/20100526/f456d47a/attachment.htm>


More information about the users mailing list