iqd logo

RSS-Abo: Newsfeed | Kommentare | E-Mail

Internet Archive führt .mobi (Kindle) ein

15.12.2009 - von - eBooks 10 Kommentare

iarchieDas Internet Archive ist (noch weit vor Google Books) die größte Online-Textsammlung der Welt. Über 2,5 Millionen Dokumente hält das gemeinnützige Projekt momentan zum kostenlosen Download bereit, darunter etwa 1,8 Millionen digitalisierte Texte. Ab sofort sind die meisten Dateien auch in Amazons proprietärem mobi-Format verfügbar.

Die Texte liegen nativ im pdf-Format vor, werden vom Internet Archive vorerst experimentell in .mobi-Files (und epubs) konvertiert. Zwar versteht sich der Amazon Kindle 2 neuerdings auch mit pdf-Dateien, mangels Zoom-Option ist die Anzeige von großformatigen Inhalten aber häufig ungenügend. Entsprechend bietet Amazon Kindle-Nutzern weiterhin einen halbautomatischen Umwandlungsservice für ungeschützte pdfs an – bei Internet Archive Dateien entfällt nun dieser Zwischenschritt.

In deutscher Sprache liegen im Internet Archive momentan 168.000 Texte vor. Diese beeindruckende Sammlung beinhaltet zwar auch zahlreiche “exotische” Dokumente wie Notenbücher und einzelne Zeitungsausgaben, beim Stöbern findet sich aber schnell die eine oder andere literarische Perle. Für historisch Interessierte ist das Internet Archive ohnehin eine einzigartige Fundgrube.

Alternative kostenlose deutschsprachige .mobi-Quellen sind das Project Gutenberg (ebenfalls experimentell) und mobipocket.de. Christoph Kaufmann hat in seinem Online-Shop Beam eBooks ebenfalls eine umfangreiche Kostenlos-Sektion mit .mobi eBooks. Die .mobi-Dateien kommen im Anschluss an den Download gratis via USB-Kabel oder wireless für happige 99 US-Cent/Mbyte aufs eigene Lesegerät.

<via Teleread>

Ähnliche Meldungen:

Zugeordnete Tags:

Der Artikel "Internet Archive führt .mobi (Kindle) ein" wurde am 15. Dezember 2009 (Dienstag) um 8:51 Uhr von geschrieben. Johannes Haupt (Xing / Twitter) ist Chefredakteur und Herausgeber von lesen.net.

10 Antworten auf Internet Archive führt .mobi (Kindle) ein (zum Thread im Forum)

Cybooker 15. Dezember 2009 um 12:35 Uhr

Also zumindest bei den in Fraktur gesetzten deutschen Büchern, zB Ludwig Tiecks Schriften (http://www.archive.org/details/3383977.7-13) ist die mobi-Version völliger Schrott, ja eine komplette Verschwendung des Speicherplatzes. Offenbar hat jemand ein OCR-System genommen, dass mit Fraktur nicht zurecht kommt: Die Folge ist Zeichenmüll über tausende von Zeilen! D.h. man kommt um die PDF-Version nicht herum, ich bezweifle auch, dass epub oder andere OCR-Varianten anders aussehen. Ergo: Da die meisten gemeinfreien deutschen Scans in Fraktur gesetzt sind, dürften fast alle dt. Mobi-Versionen unbrauchbar sein.

Johannes 15. Dezember 2009 um 12:37 Uhr

Problem ist bekannt, da gibt’s glaube ich auch noch kein automatisiertes Verfahren mit besseren Resultaten. Gibt im Internet Archive aber auch eine durchaus beachtliche Zahl an dt. Dokumenten mit “moderner” Schrift und entsprechend besseren Texterkennung, auch aus dem 18. & 19. Jht.

Ciao
Johannes

Baumi 15. Dezember 2009 um 15:45 Uhr

Trotzdem peinlich, dass sowas da kommentarlos drinliegt. Schon klar, es handelt sich um wahnsinnige Mengen an Dokumenten und wahrscheinlich ist der komplette Workflow automatisiert, aber wenn das Problem bekannt ist, könnten sie doch bei allen deutschsprachigen E-Books wenigstens einen entsprechenden Hinweis reinstellen. Sonst ist man als potentieller deutscher Nutzer nämlich ganz schnell wieder enttäuscht weg, weil man keine Ahnung hat, wieso das Archiv nur Datenmüll anbietet.

Baumi 15. Dezember 2009 um 15:52 Uhr

wenn man mal nach ‘Fraktur OCR’ googlet, findet man durchaus auch speziell auf diese Schriften angepasste Software.

Wenn’s dem Internet-Archiv mit seinem Archiv-Anspruch ernst ist, sollten die sowas lieber bald mal anschaffen – dürfte zwar nicht ganz billig sein, aber verglichen mit dem, was da jeden Monat an Server- und Traffickosten anfallen muss, wohl doch verschmerzbar…

Cybooker 15. Dezember 2009 um 20:30 Uhr

Die “Digitale Bibliothek” hat wohl so einen Workflow, aber vermutlich scannen die auch selbst, um eine optimale Qualität des Materials zu haben. Gut, das kostet dann auch (wobei dafür die Preise dort angemessen günstig sind). Übrigens hat die Dig. Bib. ihr Leseprogramm so erweitert, dass es auch in epub exportiert.

mtravellerh 16. Dezember 2009 um 13:04 Uhr

Unser Mod netseeker ist dabei, einen Fraktur-Workflow mit GUI für multiple Betriebssysteme zusammenzustellen! Interessierte mögen sich bitte an den deutschen Teil von MobileRead.com wenden!

Du liest gerade: Internet Archive führt .mobi (Kindle) ein
Nutzungsbasierte Onlinewerbung
(c) 2009-2014 lesen.net - die Informationsquelle zu eBooks und eBook Readern. | Script | Made in Hannover.