[openbenno-users] Probleme mit PDF-Dokumenten
Thomas Koch
koch at fides.ag
Wed May 26 12:42:04 CEST 2010
Moin,
ich bin momentan dabei, Openbenno einzuführen. Anfangs funktionierte es auch
sehr gut, nur irgendwann kam fetchmail ins stocken und seit dem kann ich
nichts mehr importieren.
In den Logfiles standen massig Fehler drin, welche auch auftreten, wenn man
den Index neugenerieren will.
mailarchive01:/opt/bennocore# java -jar bennoadmin.jar rebuild-index
Create archive /srv/mailarchive/repo /srv/mailarchive/index false
Rebuilding index..
# of Documents in Repository: 13602
Adding Message --0XlX15PfLR929pPl-UqQ==
Adding Message -01bb_kMUUfLV6fUSbN4Eg==
Adding Message -05EAN9DbGGcKZWKVK8ovA==
Adding Message -0nxlYyjHskMjpKY1lBGBg==
Adding Message -0n36HGuyU4bCw8FZ9sYbA==
Adding Message -0wXWYBeW5nOGflWIzr8Dw==
26.05.2010 12:36:18 de.lwsystems.mailarchive.repository.BaseArchive
extractTextFromPart
SCHWERWIEGEND: null
java.io.IOException: Error in encoded stream: needed 4 valid base64
characters but only got 1 before EOF, the 10 most recent characters were:
"8BJ2M2o8l0"
at
com.sun.mail.util.BASE64DecoderStream.decode(BASE64DecoderStream.java:250)
at com.sun.mail.util.BASE64DecoderStream.read(BASE64DecoderStream.java:148)
at java.io.BufferedInputStream.read1(BufferedInputStream.java:273)
at java.io.BufferedInputStream.read(BufferedInputStream.java:334)
at org.apache.tika.io.ProxyInputStream.read(ProxyInputStream.java:89)
at org.apache.tika.io.CountingInputStream.read(CountingInputStream.java:76)
at org.apache.tika.io.ProxyInputStream.read(ProxyInputStream.java:89)
at java.io.BufferedInputStream.read1(BufferedInputStream.java:273)
at java.io.BufferedInputStream.read(BufferedInputStream.java:334)
at java.io.BufferedInputStream.fill(BufferedInputStream.java:235)
at java.io.BufferedInputStream.read(BufferedInputStream.java:254)
at java.io.FilterInputStream.read(FilterInputStream.java:83)
at java.io.PushbackInputStream.read(PushbackInputStream.java:139)
at
org.apache.pdfbox.io.PushBackInputStream.read(PushBackInputStream.java:84)
at
org.apache.pdfbox.pdfparser.BaseParser.readUntilEndStream(BaseParser.java:418)
at
org.apache.pdfbox.pdfparser.BaseParser.parseCOSStream(BaseParser.java:321)
at org.apache.pdfbox.pdfparser.PDFParser.parseObject(PDFParser.java:528)
at org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:179)
at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:841)
at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:808)
at org.apache.tika.parser.pdf.PDFParser.parse(PDFParser.java:53)
at org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:120)
at org.apache.tika.parser.AutoDetectParser.parse(AutoDetectParser.java:101)
at org.apache.tika.parser.AutoDetectParser.parse(AutoDetectParser.java:114)
at
de.lwsystems.mailarchive.repository.BaseArchive.extractTextFromPart(BaseArchive.java:311)
at
de.lwsystems.mailarchive.repository.BaseArchive.extractTextFromPart(BaseArchive.java:256)
at
de.lwsystems.mailarchive.repository.BaseArchive.extractTextFromPart(BaseArchive.java:276)
at
de.lwsystems.mailarchive.repository.BaseArchive.extractTextFromPart(BaseArchive.java:256)
at
de.lwsystems.mailarchive.repository.BaseArchive.generateMetaDocument(BaseArchive.java:440)
at
de.lwsystems.mailarchive.repository.BaseArchive.rebuildIndex(BaseArchive.java:182)
at de.lwsystems.mailarchive.Main.doMain(Main.java:169)
at de.lwsystems.mailarchive.Main.main(Main.java:65)
Adding Message -13e4LM0EjR5MH9z1aClxg==
mailarchive01:/opt/bennocore#
Bei dem System handelt es sich um ein Debian Lenny x86 auf einem Celeron
2,66GHz mit 1GB RAM, auf dem System läuft nur Openbenno. Als JDK nutz ich
das OpenJDK 1.6.0_0, aber auch mit dem Sun JDK 1.6.2 tritt das Problem auf.
Schöne Grüße aus dem Ruhrpott
Thomas
--
Mit freundlichen Grüßen
Thomas Koch
Systemadministrator der fides AG
Borussiastraße 112
44149 Dortmund
Telefon:
-
+49 (231) 967877-61
Fax:
-
+49 (231) 967877-20
-
E-Mail:
-
[koch at fides.ag
Website:
-
www.fides.ag ->
../../../../index.php?menuaction=felamimail.uicompose.compose+send_to=a29jaEBmaWRlcy5hZw==]
__________________________________________________
Registergericht:
-
Amtsgericht Dortmund
Registernummer:
-
HRB 18893
Aufsichtsführende Behörde:
-
IHK Dortmund
Vorstand der fides AG:
-
Markus Olejnik
Aufsichtsratsvorsitzender:
-
Jens Jeromin
__________________________________________________
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://www.openbenno.org/pipermail/users/attachments/20100526/f456d47a/attachment.htm>
More information about the users
mailing list