Internet Archive führt .mobi (Kindle) ein
Das Internet Archive ist (noch weit vor Google Books) die größte Online-Textsammlung der Welt. Über 2,5 Millionen Dokumente hält das gemeinnützige Projekt momentan zum kostenlosen Download bereit, darunter etwa 1,8 Millionen digitalisierte Texte. Ab sofort sind die meisten Dateien auch in Amazons proprietärem mobi-Format verfügbar.
Die Texte liegen nativ im pdf-Format vor, werden vom Internet Archive vorerst experimentell in .mobi-Files (und epubs) konvertiert. Zwar versteht sich der Amazon Kindle 2 neuerdings auch mit pdf-Dateien, mangels Zoom-Option ist die Anzeige von großformatigen Inhalten aber häufig ungenügend. Entsprechend bietet Amazon Kindle-Nutzern weiterhin einen halbautomatischen Umwandlungsservice für ungeschützte pdfs an – bei Internet Archive Dateien entfällt nun dieser Zwischenschritt.
In deutscher Sprache liegen im Internet Archive momentan 168.000 Texte vor. Diese beeindruckende Sammlung beinhaltet zwar auch zahlreiche "exotische" Dokumente wie Notenbücher und einzelne Zeitungsausgaben, beim Stöbern findet sich aber schnell die eine oder andere literarische Perle. Für historisch Interessierte ist das Internet Archive ohnehin eine einzigartige Fundgrube.
Alternative kostenlose deutschsprachige .mobi-Quellen sind das Project Gutenberg (ebenfalls experimentell) und mobipocket.de. Christoph Kaufmann hat in seinem Online-Shop Beam eBooks ebenfalls eine umfangreiche Kostenlos-Sektion mit .mobi eBooks. Die .mobi-Dateien kommen im Anschluss an den Download gratis via USB-Kabel oder wireless für happige 99 US-Cent/Mbyte aufs eigene Lesegerät.
<via Teleread>
Kommentare
Cybooker 15. Dezember 2009 um 12:35
Also zumindest bei den in Fraktur gesetzten deutschen Büchern, zB Ludwig Tiecks Schriften (http://www.archive.org/details/3383977.7-13) ist die mobi-Version völliger Schrott, ja eine komplette Verschwendung des Speicherplatzes. Offenbar hat jemand ein OCR-System genommen, dass mit Fraktur nicht zurecht kommt: Die Folge ist Zeichenmüll über tausende von Zeilen! D.h. man kommt um die PDF-Version nicht herum, ich bezweifle auch, dass epub oder andere OCR-Varianten anders aussehen. Ergo: Da die meisten gemeinfreien deutschen Scans in Fraktur gesetzt sind, dürften fast alle dt. Mobi-Versionen unbrauchbar sein.
Johannes 15. Dezember 2009 um 12:37
Problem ist bekannt, da gibt’s glaube ich auch noch kein automatisiertes Verfahren mit besseren Resultaten. Gibt im Internet Archive aber auch eine durchaus beachtliche Zahl an dt. Dokumenten mit "moderner" Schrift und entsprechend besseren Texterkennung, auch aus dem 18. & 19. Jht.
Ciao
Johannes
Baumi 15. Dezember 2009 um 15:45
Trotzdem peinlich, dass sowas da kommentarlos drinliegt. Schon klar, es handelt sich um wahnsinnige Mengen an Dokumenten und wahrscheinlich ist der komplette Workflow automatisiert, aber wenn das Problem bekannt ist, könnten sie doch bei allen deutschsprachigen E-Books wenigstens einen entsprechenden Hinweis reinstellen. Sonst ist man als potentieller deutscher Nutzer nämlich ganz schnell wieder enttäuscht weg, weil man keine Ahnung hat, wieso das Archiv nur Datenmüll anbietet.
Baumi 15. Dezember 2009 um 15:52
wenn man mal nach 'Fraktur OCR' googlet, findet man durchaus auch speziell auf diese Schriften angepasste Software.
Wenn’s dem Internet-Archiv mit seinem Archiv-Anspruch ernst ist, sollten die sowas lieber bald mal anschaffen – dürfte zwar nicht ganz billig sein, aber verglichen mit dem, was da jeden Monat an Server- und Traffickosten anfallen muss, wohl doch verschmerzbar…
Cybooker 15. Dezember 2009 um 20:30
Die "Digitale Bibliothek" hat wohl so einen Workflow, aber vermutlich scannen die auch selbst, um eine optimale Qualität des Materials zu haben. Gut, das kostet dann auch (wobei dafür die Preise dort angemessen günstig sind). Übrigens hat die Dig. Bib. ihr Leseprogramm so erweitert, dass es auch in epub exportiert.
mtravellerh 16. Dezember 2009 um 13:04
Unser Mod netseeker ist dabei, einen Fraktur-Workflow mit GUI für multiple Betriebssysteme zusammenzustellen! Interessierte mögen sich bitte an den deutschen Teil von MobileRead.com wenden!
e-book-news.de » Blog Archive » Internet Archive kommt auf’s iPhone: Kobo-App bietet 1,8 Mio. E-Books gratis 17. Dezember 2009 um 17:09
[…] Nutzer von bisher isolierten Gerätestandards wie dem Kindle-Reader – denn seit kurzem wird auch Amazons proprietäres .mobi-Format […]
EFF: Datenschutz bei eBooks mangelhaft » Debatte » lesen.net 22. Dezember 2009 um 16:24
[…] übertragen werden, bleibt unklar – die EFF mutmaßt, Amazon könnte auch Informationen über außerhalb des Kindle Store besorgte Literatur […]
Ebook-on-Tour.de: Ebookreader im Test – » Blog Archive » Kostenlose eBooks: Nicht nur Literatur für Studenten umsonst 4. Januar 2010 um 21:01
[…] Lesen.net zufolge hat das Internet Archive noch vor Google Books die größte Textsammlung im Angebot. 2,5 Millionen Dokumente und 1,8 Millionen Texte werden kostenlos zum Download von dem gemeinnützigen Projekt angeboten. Die Texte liegen im pdf-Format vor und können seit neuestem auch in das mobi-Format (für den Kindle) und epub-Format konvertiert. 168.000 Dokumente in deutscher Sprache stehen zur Verfügung, darunter aber auch einzelne Texte, Notenblätter und einzelne Zeitungsausgaben, aber bei der Recherche lässt sich mit Sicherheit das ein oder andere passende Buch gefunden. EIn Blick lohnt sich. […]
WLAN-Reader Bebook Neo kommt am 25.2. » eReader » lesen.net 22. Januar 2010 um 20:40
[…] wie beim Onyx Boox ein vollwertiger Webbrowser bereit, mit dem sich auch kostenlose Quellen wie das Internet Archive ansteuern lassen. Demovideos auf der Bebook-Website zeigen darüber hinaus bislang lediglich auch […]