ebook erstellen mit LibreOffice Writer

      ebook erstellen mit LibreOffice Writer

      Hallo zusammen!
      Da ich noch noch einige ungelesene paperbooks zu Hause habe, möchte ich gerne versuche diese in epub zu wandeln, damit ich sie auf dem Reader lesen kann. Nun bräuchte ich eure Hilfe, wie gehe ich am besten vor?

      Ich hab das Buch eingescannt und die PDF Datei in word und html datei umgewandelt. Das Plugin für das Libre office hab ich ebenfalls runter geladen und installiert. Im Internet habe ich eine Anleitung gefunden, wie man die Kopf- und Fusszeile sowie die Eigenschaften bearbeitet.

      Wie gehts nun weiter? Soweit ich das beim Word doc sehe ist das alles ziemlich durcheinander. Absätze passen nicht und teilweise stehen irgenwelche Buchstaben in der Zeile. Ausserdem ist kein Titelbild vorhanden.

      Kann mir jemand helfen was ich denn nun als nächstes machen muss bzw. in wie weit ich diesen Text bearbeiten muss? Wie wandle ich das Buch nun in epub?

      Danke schon im Voraus!

      LG
      jutta

      jutta76 schrieb:

      Ich hab das Buch eingescannt und die PDF Datei in word und html datei umgewandelt.
      Womit hast Du den Scan in Word und HTML umgewandelt? Mit einem OCR-Programm? Welches in welcher Version?

      jutta76 schrieb:

      Das Plugin für das Libre office hab ich ebenfalls runter geladen und installiert.
      Da es mehr als ein Plug-In für Libre/OpenOffice gibt: Welches? writer2epub?

      jutta76 schrieb:

      Im Internet habe ich eine Anleitung gefunden, wie man die Kopf- und Fusszeile sowie die Eigenschaften bearbeitet.
      Was heisst für Dich "bearbeitet"? Da epub kein seitenorientiertes Format ist, müssten Kopf- und Fußzeilen entfernt werden. Das ist wiederum eine Arbeit, die ich lieber im OCR-Programm mache, damit der Export gar keine störenden Kopf- und Fußzeilen mehr hat.
      Ah! Gut.

      Free OCR speichert ja nur Fließtext ohne Formatierungen ab. Der Text sollte aber in der richtigen Reihenfolge sein. Das kannst Du bei Free OCR ja auf der rechten Seite überprüfen. Wenn das schon in Free OCR schlecht aussieht, wird es später auch nicht besser sein.

      Wenn das alles in Ordnung ist, würde ich Dir dazu raten, das Ergebnis als RTF abzuspeichern und von dort in LibreOffice zu importieren. Dort kannst Du dann zuerst die Formatierung machen. Dies betrifft vor Allem die Überschriften (mit den Formatvorlagen arbeiten), fett und/oder kursiv und die Vorliebe bezüglich Block- oder Flattersatz. Danach das Dokument speichern.

      Wenn Dein Ziel ausschließlich eine epub-Datei ist, kannst Du Dir Arbeiten wie Kopf- und Fußzeilen sparen. So etwas wird in epub gar nicht dargestellt. Stattdessen nach dem Speichern das writer2epub Plug-In starten. Dieses bietet Dir jetzt die Möglichkeit, die Metadaten einzupflegen: Titel, Autor, Sprache, Cover etc. Diese solltest Du möglichst genau ausfüllen, da diese Informationen von den eBook-Readern ausgelesen werden.

      Thema Cover: Du kannst nachträglich als erste Seite ein Bild mit dem Cover einpflegen. writer2epub bietet die Möglichkeit entweder die erste Seite oder eine externe Datei als Cover einzubinden. Bevorzugen würde ich, eine externe Datei zu nehmen, trotzdem aber als erste Seite das Cover einzubinden. Das ist so bei eBooks üblich. Und viele Reader zeigen als Cover auch die erste Seite des epub an.

      Falls Dir das Ergebnis noch nicht ganz zusagt, könntest Du dann das epub nehmen und in Sigil letzte Nachbearbeitungen machen.

      Falls Dein Geldbeutel es zulässt und es sich nicht nur um ein einziges Buch handelt, würde ich Dir allerdings lieber zu einer kostenpflichtigen OCR-Lösung raten. Abby FineReader z. B. hat in der aktuellen Version die Möglichkeit, direkt epub zu speichern. Die Erkennung geht über reinen Text heraus. Auch fett und kursiv werden relativ gut erkannt und exportiert.

      jutta76 schrieb:

      Kann jemand ein anderes kostenloses, besseres OCR Programm empfehlen?
      Sorry für die späte Antwort: Ich bin mit Abby Fine Reader 11 sehr zufrieden. Habe gerade ein Buch eingescannt. 1,5h Scannen, 10 Minuten OCR, 2h Nacharbeit. Vorteil von Abby: Es exportiert ein sehr schlankes epub.

      jutta76 schrieb:

      Hab ein Buch kopiert und es liegt jetzt in PDF vor. Mit calibre kann ich es nicht in pdf umwandeln, müsste aber mit Alf gehen, oder?
      Demnach besteht das PDF aus einer Grafik pro Seite? Da kann Calibre gar nichts machen. Calibre kann nur Text-PDFs umwandeln. Auch ALF wird da nicht benötigt. Es bleibt bei einer OCR. Und da empfehle ich eben Abby Fine Reader 11.
      Auch wäre interessant zu wissen, wie bisher ihr Worflow war

      Buch > Scanner (was für eine Auflösung etc) -> wie weiterverarbeitet (mit was?) ... in welchen Formaten? -> PDF (mit was?, ist auch der Text includiert?)

      Generell, wenn du als Zielformat Epub hast, solltest du den Scann nicht als PDF-Format enden lassen, sondern ein Textformat, welches du, falls die OCR dies nicht unterstützt, als HTML-Format abspeicherst
      Probleme mit ADE oder Adobe-ID? Dann schau mal hier im ADE Unterforum nach. Eine kleine Anlaufstelle für Calibre ist hier im Calibre Unterforum zu finden.
      Ist der Abby Fine Reader 11 kostenlos?

      @divingduck
      Kann ich das einstellen beim Scanner bzw. Kopierer? Hab das Buch auch als html Datei da, aber eben im nachhinein umgewandelt. Das Buch soll nur für mich zum lesen sein, weil ich kein Papierbuch mehr lesen will.
      Das dies nur für dich ist, dachte ich mir schon :)
      Meine Frage zielt woanders hin. Normalerweise nutzt man für die Texterkennung Programme, wie das von Peter vorgeschlagene Fine Reader oder Omnipage (beide nicht kostenlos). Diese machen die Scans automatisch mit den richtigen Einstellungen um nachfolgend eine vernünftige Texterkennung vornehmen zu können. Da mir bei dir nicht klar ist was du mit welchen Programmen wie gemacht hast, ist der Grund meiner Nachfrage.
      Wenn du auch das HTML-Format hast, könntest du dies mit Calibre umwandeln. Soweit ich in Erinnerung habe, gibt es für Libre Office auch ein Epub-Plugin, das wäre evtl. auch eine gute Idee, wenn du sowieso mit diesem Programm arbeitest.

      Edit: Plugin
      Probleme mit ADE oder Adobe-ID? Dann schau mal hier im ADE Unterforum nach. Eine kleine Anlaufstelle für Calibre ist hier im Calibre Unterforum zu finden.

      a.peter schrieb:

      jutta76 schrieb:

      Ist der Abby Fine Reader 11 kostenlos?
      Nein. Die Download-Version kostet 129,- €. Ist aber ihr Geld wert.


      Die Preise direkt bei Adobe sind etwas unrealistisch. Für 103 Euro bekommt man Version 11 Professionell nicht nur in einer Schachtel und mit Datenträger sondern auch mit PDF Transformer 3.0.

      z.B. bei Amazon:
      amazon.de/ABBYY-FineReader-Pro…Transformer/dp/B005I7TYRU

      Bei OCR sollte man halt beachten, dass bei Büchern ein gescheiter OCR-Scanner genauso wichtig ist wie ein OCR Programm. Oder man muss die Seiten aus dem Buch reißen (Das Buch zerstören). Dann kann man die einzelnen Seiten mit einem herkömmlichen Scanner auch gut einlesen.
      Plugins (Alf) für Calibre nötig?? (siehe mein Profil ) "DRM ist böse" Youtube
      Man sollte aber schauen, ob sich die Investition in einen Buchscanner und OCR-Software für einen rechnet - finanziell und zeitlich. Inzwischen gibt es Scans plus OCR auch als Dienstleistung für ein paar Euro pro Buch. In der Preislage werden sie allerdings zerschnitten und anschließend weggeworfen. Ich kenne Ergebnisse von Eridian hier in Berlin, die als Rohmaterial sehr brauchbar sind, auch bei komplizierteren Layouts. Der Preis liegt um die fünf Euro plus Porto. Vergleichbare Anbieter dürfte es inzwischen einige geben.
      Gemeinfreie Literatur gibts bei Mobileread.
      Also mein HP-Scanner hatte ein ganz brauchbares OCR-Programm von I.R.I.S. mit dabei, das mit dem Scanprogram automatisch mit installiert wird. Damit kann ich die Scans dann direkt als Textdatei ausgeben lassen, entweder als txt oder als rtf.
      Diesen Text lade ich dann in eine Textverarbeitung zur Korrektur und zum Löschen der Zeilenumbrüche. Dann mache ich noch eine grobe Formatierung, meist nur die Absätze und speicher wieder als rtf.
      Der Rest passiert dann in Sigil, kostet zwar etwas an Zeit, aber ich hab dann ein epub, wie ich es haben will, mit sauberem Code.
      Am meisten Zeit geht halt immernoch fürs Scannen drauf, da kann ich auch nur einzelne Seiten.
      I.R.I.S hatte ich auch schon und war nicht sonderlich zufrieden damit. Ich weiß ja nicht wie deiner Scann aussieht aber der Vorteil eines Buchscanner ist dieser:



      Das ist so ein relativ preiswerter Buchscanner. Wie man sieht kann man damit ein Buch, Seite für Seite gut Scannen. Die meisten "normalen" Scanner haben einen breiten Rand so das man Bücher nicht ordentlich damit scannen kann.

      Zudem wirst du - wenn du das Buch einigermaßen fehlerfrei haben willst - auch noch einige Zeit aufs Korrektur lesen verwenden müssen. DPR und GAGA verwenden ziemlich teuere Geräte und Software. Trotzdem wird ein Buch von mehrfach von verschiedenen Personen gegengelesen und trotzdem hat man noch OCR-Fehler im Text.
      Plugins (Alf) für Calibre nötig?? (siehe mein Profil ) "DRM ist böse" Youtube

      Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von „halsbandschnaepper“ ()

      Einen breiten Rand hat mein Scanner auch, aber so oft Scanne ich keine Bücher, dass sich ein Buchscanner lohnen würde. Die meisten sind auch Taschenbücher, die sich gut flachdrücken lassen. Als ich den gekauft habe, wusste ich noch nichts von E-Books und so.
      Zum Korrigieren find ich die Rechtschreibprüfung in einer Textverabreitung schon recht nützlich, alles findet man damit aber auch nicht.
      Die Fehlerquote hängt auch stark von den Büchern und vom Papier hab, bei schon etwas vergilbten Büchern in kleiner Schrift ist die Quote höher wie bei noch weißem Papier und größerer Schrift.
      Für meine Ansprüche reicht mir I.R.I.S.aus, zumal ja andere Kaufprogramme teurer sind wie der ganze Scanner.

      Den letzten Fehler findet man sowieso erst beim Lesen auf dem Reader.
      Hatte früher viel mit Flyern und kleinen Zeitungen zu tun, da konnte man auch 5 Leute Korrektur lesen lassen, nach dem Druck fanden sich trotzdem noch paar Fehler.
      Ich war auch ne zeitlang als Korrekturleser bei ner regionalen Zeitung, selbst da sind oft paar Fehler durchgerutscht, was hauptsächlich an der Uhrzeit (nachts von 12 bis morgens um 6) lag.