Skip to main content

PDF in epub umwandeln: Calibre vs. Web-Tools

Die Umwandlung statischer pdf-Dateien ins epub-Format, das auf dedizierten Lesegeräten eine ungleich bessere Figur macht, ist seit jeher eine Herausforderung. Neben Web-Tools zur Konvertierung können Anwender mit etwas Arbeit auch mit der eBook-Verwaltungssoftware Calibre sehr gute Ergebnisse erzielen. Ein Vergleich.

Zwar werden nahezu alle eBooks inzwischen in Containerformaten (azw/kfx, epub) angeboten, die eine flexible Textdarstellung ermöglichen. Nach wie vor liegen unzählige Textdokumente aber nur im pdf-Format vor – seien es Fachaufsätze, E-Paper oder schlicht ältere Literaturtitel.

Zwar unterstützen alle aktuellen eBook Reader das pdf-Format nativ (Kindle erst seit einigen Jahren, Tolino & Co. seit jeher). Die Lektüre insbesondere nativ großformatiger Dateien auf den vergleichsweise kompakten und reaktionsschwachen E-Ink-Displays ist allerdings alles andere als eine Freude. Weil die meisten eBook Reader außerdem nur rudimentäre Anpassungen der Anzeige zulassen – selbst Cropping und fixe Zoom-Stufen nur in Ausnahmen -, versuchen sich viele Anwender an einer Umwandlung.

epub-in-pdf-Umwandlung mit OCR-Software und Web-Tools

pdftoword

pdftoword

Ordentliche Ergebnisse lassen sich hier mit professioneller OCR-Software erzielen (ABBYY FineReader, Omnipage Ultimate), deren Kauf nur für eine gelegentliche Umwandlung von pdf-Dateien ins epub- oder in ein kindle-Format allerdings kaum lohnt. Daneben gibt es seit vielen Jahren kostenlose Online-Tools zur Umwandlung. Größerer Beliebtheit erfreuen sich hier etwa der epub-Converter von online-convert.com, das pdf2epub-Tool des Drucker-Riesen Xerox sowie pdftoword.

All diese Tools haben aber zwei große Nachteile. Zum einen haben sie häufig keine oder nur eine sehr rudimentäre OCR-Funktion, wodurch Text in Bildern – in pdf-Dateien keine Seltenheit – gar nicht beziehungsweise nur sehr fehlerhaft erkannt wird. Und in den konvertierten Dateien werden Header- und Footer-Informationen in der Regel 1:1 aus den pdf-Dokumenten übernommen. Mit dem Ergebnis, dass sich im „neuen“ Fließtext plötzlich mitten auf der Seite Seitenzahl und Kapitelname sowie weitere teilweise in der pdf-Datei unsichtbare Metadaten und Formatierungsanweisungen finden. Und zwar hundertfach.

Calibre: Stördaten entfernen mit regulären Ausdrücken

Calibre: Stördaten entfernen mit regulären Ausdrücken

Auch die kostenlose eBook-Verwaltungssoftware Calibre ermöglicht eine Umwandlung von pdf in epub, auch hier gibt es in der Standard-Ausgabe allerdings Metadaten mitten im Text. Das Fachblog „Dear Author“ präsentiert dazu jetzt eine Lösung: Reguläre Ausdrücke. Damit lassen sich sichtbare wie unsichtbare „Stördaten“ schon bei der Konvertierung entfernen und im Ergebnis saubere epub-Dateien erzeugen.

Calibre erfordert Einarbeitungszeit

Die Kollegen von Teleread, die sich der Thematik anlässlich eines des Testes eines neuen Online-Tools (mit ernüchterndem Ergebnis) annahmen, weisen darauf hin, hier wie generell ist Calibre nicht gerade das Synonym von „Benutzerfreundlichkeit“. Die Software ist zwar übersichtlich, aber nicht sonderlich smart und erfordert des öfteren komplexere händische Eingriffe, die „Einfach-Nur-Leser“ zumeist überfordern.

Die genannten Online-Tools erzielen „out of the box“ häufig brauchbarere Ergebnisse, höherpreisige Desktop-Software ohnehin. Wer gleichwohl Spaß an der Beschäftigung mit der Materie hat und viel Wert auf wirklich saubere epub-/kindle-Dateien legt, kann mit Calibre auch ohne Kosten ausgezeichnete Ergebnisse erzielen.

Ähnliche Beiträge


Kommentare


Digitale Bücher: ePub oder PDF? – Käptn Keks 24. Oktober 2016 um 19:01

[…] gibt Programme, mit denen Bücher im ePub-Format in das PDF umgewandelt werden können. Die erfordern manchmal […]

Antworten

Du hast eine Frage oder eine Meinung zum Artikel? Teile sie mit uns!

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

*
*