Booktype: Plattform für das kollaborative Bücherschreiben

Booktype: Übersichtsdarstellung eines Buchs

Ähnlich wie Substance ist Booktype eine Web-Plattform, welche das gemeinschaftliche Schreiben, Überarbeiten und Publizieren von Büchern ermöglicht. Solche Bücher sind in Kapitel gegliedert, welche wiederum zu Sektionen gruppiert werden können. Ansonsten fühlt sich Booktype wie ein einfaches Web-CMS an: In einem Rich-Text-Editor werden die einzelnen Kapitel geschrieben, rudimentär gelayoutet und allenfalls mit Bildern versehen.

Booktype: Differenzdarstellung beim Versionenvergleich

Wird ein bereits bestehendes Kapitel bearbeitet, so legt Booktype automatisch eine neue Version an und ermöglicht es später, die Unterschiede zwischen zwei Versionen anzuzeigen – dies ist insbesondere dann wichtig, wenn mehrere Personen an denselben Textteilen arbeiten.

Booktype: Exportformate

Ist ein Buch fertig, so kann es in unterschiedlichen Formaten exportiert werden: als PDF, E-Book (EPUB oder Kindle) oder editierbares Open Document. Sogar eine Anbindung an den Print-on-demand-Service Lulu.com ist vorhanden, so dass man auch gedruckte Bücher aus Booktype generieren kann.

Hinter Booktype steht Sourcefabric, denen wir bereits Airtime verdanken. Die auf Python und Django basierende Software kann gemäss den Bestimmungen der GNU Affero General Public License frei genutzt werden. Kann oder will man keinen eigenen Server betreiben, so bietet sich www.booki.cc als Alternative an – allerdings nur, wenn man frei verfügbaren Content publizieren will. Ein weiteres Projekt, das auf Booktype basiert, ist FLOSS Manuals, wo Handbücher für freie Software kollaborativ erstellt werden.

Für gemeinschaftlich erstellte Fachbücher ist Booktype eine leicht verständliche und doch ausreichend leistungsfähige Plattform. Manch ein Autor mag sich vielleicht schwer tun, seine Texte in einem Web-Editor zu erfassen, doch kann die eigentliche Schreibarbeit ja weiterhin auch offline in einem Textverarbeitungsprogramm erfolgen. Die eigentliche Stärke des Tools liegt darin, dass man ein Manuskript sehr einfach überarbeiten und dann in verschiedenen Formaten publizieren kann.

PDF-Dokumente bearbeiten mit pdfsam

 image

PDF-Dokumente kann man mit dem Adobe Reader (sowie mit verschiedenen Open Source Readern) kostenlos lesen. Will man hingegen selbst PDF-Dokumente erzeugen oder bearbeiten, so lässt sich dies Adobe in Form der Acrobat-Software teuer bezahlen.

Auch hier gibt es allerdings Alternativen: Mit dem PDF Creator, der sich unter Windows als Drucker im System installiert und jedes beliebige Dokument in ein PDF-Dokument konvertiert, habe ich in den letzten Monaten gute Erfahrungen gemacht. Vermisst habe ich aber bisher eine Software, mit der man bestehende PDF-Dokumente nachbearbeiten kann – insbesondere zusammenfügen oder aufteilen möchte man PDF-Dokumente hin und wieder.

Genau dies kann pdfsam (PDF Split and Merge). Die Java-Software wirkt zwar etwas technisch und leicht ungeschliffen, ist aber auf Anhieb verständlich und erfüllt ihren Zweck. Wer noch etwas mehr Funktionen braucht, wählt die Enhanced-Version, für die der Programmierer allerdings eine Spende von mindestens 1 Euro verlangt (ausser man macht sich die Mühe und kompiliert den Source Code selbst). Diese Enhanced-Version kann zusützlich PDF-Dokumente verschlüssen und entschlüsseln, Titelseiten und Fusszeilen einfügen sowie den Standard-Ansichtsmodus eines Dokuments setzen.

P.S. Derzeit noch im Alpha-Stadium befindet sich die Version 2 von pdfsam. Damit wird man die Reihenfolge von Seiten visuell ändern sowie Seiten aus anderen Dokumenten einfügen können.

FSFE fordert und fördert freie PDF-Reader

image

Die Free Software Foundation Europe (FSFE) hat eine Initiative gestartet, um die Verbreitung von freien PDF-Programmen zu fördern. Das von Adobe entwickelte Portable Document Format (PDF) existiert in verschiedenen Versionen, von denen manche offene Standards sind, während andere Software-Patente beinhalten. Als Betrachter wird aber fast immer der Adobe Reader eingesetzt, der eine zwar kostenlose, aber proprietäre Software darstellt. Unter der Adresse www.pdfreaders.org will die FSFE deshalb die Verbreitung von Open Source PDF Readern fördern. Von den dort verlinkten Programmen kann ich insbesondere Sumatra PDF Viewer (Windows) und Skim (Mac OS) empfehlen.

(via Wortgefecht)

Inhalte aus einem MediaWiki als PDF exportieren mit der Collection Extension

image

Schon seit längerem beschäftigt mich die Frage, wie man den Inhalt eines Wikis mit vernünftigem Aufwand und in guter Qualität ausdrucken kann (vgl. Wie druckt man ein MediaWiki aus?). Inzwischen habe ich eine Lösung gefunden, die zumindest in meinem eigenen Setup sehr gut funktioniert.

Der Schlüssel zur Lösung ist die Extension Collection, welche von PediaPress entwickelt wird. Wie bei den meisten MediaWiki-Extensions ist zwar etwas Handarbeit erforderlich, im Prinzip ist die Installation aber nicht schwierig. Die Skripts der Extension kann man als Snapshot herunterladen (richtige MediaWiki-Version auswählen!), anschliessend sind noch einige Einträge in den LocalSettings.php sowie im Skin-File erforderlich. Wenn man das README.txt beachtet, kann eigentlich nichts schiefgehen.

Der Clou an der Sache ist, dass man die Phython-Libraries mwlib und mwlib.rl, welche für das Parsen der Wiki-Seiten und die Konvertierung in ein PDF zuständig sind, nicht unbedingt auf dem eigenen Server installieren muss, sondern dass man den Server von PediaPress benutzen kann. Für Wikis mit beschränktem Traffic reicht dies vollkommen aus.

image In der Anwendung ist Collection sehr elegant: In der Navigation erscheint ein neuer Befehl, mit dem man beliebige Seiten in eine Kollektion aufnehmen kann. Lässt man sich später die Kollektion anzeigen (vgl. obigen Screenshot), so kann man noch die Reihenfolge der Seiten anpassen und Kapitel einfügen. Anschliessend lässt sich aus der gesamten Kollektion ein einziges PDF generieren. Alternativ kann man auch ein Textdokument im OpenOffice.org-Format erzeugen, das man dann nicht nur drucken, sondern ggf. auch noch editieren kann.

Wie druckt man ein MediaWiki aus?

image

MediaWiki eignet sich hervorragend, um im Team-Work Informationen zusammenzutragen, zu strukturieren und zu überarbeiten. Aber was, wenn man das Resultat in Form eines PDFs exportieren oder ausdrucken möchte? Die Frage beschäftigt mich schon länger, und die perfekte Lösung habe ich noch nicht gefunden. Im Moment zeichnen sich zwei Favoriten ab:

  • PDF Book: Diese Extension erlaubt es, alle Seiten einer bestimmten Kategorie in einem einzigen Arbeitsgang als PDF zu exportieren. Dabei wird automatisch ein Inhaltsverzeichnis erstellt, pro Wiki-Seite wird ein Kapitel angelegt. Diese Lösung setzt allerdings voraus, dass HTMLDOC auf dem Server installiert ist.
  • Collection: Bei dieser Extension wird das PDF aus einer sogenannten Collection erstellt. Eine Collection ist vergleichbar mit einer persönlichen Bookmark-Sammlung, die direkt im Wiki abgelegt ist. Auf der Website WikiEducator kann man das in einem öffentlichen Beta-Test selbst ausprobieren. Und wie einer Medienmitteilung der Wikimedia-Foundation vom letzten Dezember zu entnehmen ist, handelt es sich bei dieser Extension um eine Entwicklung, welche strategische Bedeutung für MediaWiki hat und im Verlaufe des Jahres 2008 auch auf Wikipedia eingebaut werden soll. Vielversprechend ist auch die Ankündigung, dass bis Mitte 2008 zusätzlich ein Export im OpenDocument-Format möglich werden soll. Was mich dagegen irritiert ist die Tatsache, dass die Collection-Extension zwei Python-Libraries voraussetzt, während MediaWiki ja in PHP geschrieben ist. Ob diese Lösung auch für einfache Shared-Hosting-Accounts mit LAMP-Umgebung funktioniert?

Neben den beiden erwähnten Extensions gibt es noch eine ganze Reihe anderer Ansätze (vgl. die Liste der alternativen Parser sowie die Data Extracation Extensions), die mir allerdings – aus verschiedensten Gründen – weniger überzeugend scheinen. Gibt es tatsächlich keine Extension, die allein mit den Mitteln von PHP den Export einer ganzen Kategorie im PDF-, OpenDocument- oder RTF-Format erlaubt?

Djvu: Offener Standard für digitalisierte Dokumente

image

Bei der Digitalisierung von gedruckten Dokumenten (sog. Redigitalisierung) stellt sich unter anderem die Frage nach dem geeigneten Dateiformat. Einerseits sollen die Dokumente 1:1 und in möglichst hoher Auflösung wiedergegeben werden, was zwangsläufig auf Bitmap-Grafiken hinausläuft. Andererseits sollen Texte per Texterkennung (OCR) aus den Scans extrahiert und als durchsuchbarer Text im Dokument gespeichert werden. Zusätzlich sind kompakte Dateien gefordert, die kostengünstig archiviert und effizient über das Internet ausgeliefert werden können.

Reine Grafikformate (z.B. JPEG, GIF, PNG oder TIFF) können Texte nicht als solche behandeln und kommen deshalb nicht in Betracht. Mit dem Portable Document Format (PDF) von Adobe steht zwar ein Dateiformat zur Verfügung, das sowohl eine originalgetreue grafische Wiedergabe als auch durchsuchbare Texte bietet. Auch wenn es möglich ist, Scans in PDF-Dateien einzubetten so ist dieser Standard aber doch primär für Dateien gedacht, die digital erstellt und direkt in das PDF-Format konvertiert werden.

Ein interessanter Ansatz stellt Djvu (ausgesprochen als “déjà-vu”) dar. Es handelt sich um einen offenen Standard, und es gibt dazu passende Programme sowie Browser-Plugins für Windows, Mac OS X sowie Linux (unter Open-Source-Lizenzen oder zumindest kostenlos). Zwei Dinge sind es, die Djvu auszeichnen:

  • image Die gescannten Bitmap-Grafiken werden sehr effizient komprimiert, was im Vergleich zu den klassischen Grafikformaten sehr kleine Dateigrössen ergibt.
  • Per OCR extrahierte Texte können auf einer separaten Ebene in die Dateien eingebunden werden, wodurch die Scans durchsuchbar werden.

Mir persönlich sind Djvu-Dateien zwar noch selten begegnet. Wer sich das Browser-Plugin von Lizardtech installiert und eines der Beispieldokumente auf der Djvu-Webseite herunterlädt, wird aber rasch feststellen, dass Djvu absolut praxistauglich ist.

Weitere Links zum Thema:

Issuu: PDFs mit Flash E-Book Reader publizieren

Der übliche Weg, um eine gedruckte Publikation 1:1 im Internet bereitzustellen, führt über das PDF-Format. Gelegentlich möchte man aber eine Datei nicht extra herunterladen und im Adobe Reader öffnen müssen, nur um den Inhalt zu überfliegen. In diesem Fall ist eine E-Paper-Lösung auf Flash-Basis, die man direkt in eine Seite einbetten kann, die schönere Lösung. Die Frage ist nur: Wie konvertiert man sein PDF-Dokument in eine SWF-Datei? Und woher nimmt man einen Flash E-Book Reader, um ihn in seine Website zu integrieren?

Issuu (von engl. Issue) löst beide Probleme: Nach dem Prinzip von YouTube (Videos) und SlideShare (PowerPoint-Präsentationen) kann man bei Issuu eine PDF-Datei hochladen und erhält dann einige Zeilen HTML-Code, welche einen kompletten E-Book Reader in eine beliebige Website einbetten. Nebst dem Mini-Viewer (siehe oben) gibt es auch noch den Standard-Viewer, der bezüglich Bedienungskomfort und Ästhetik Seinesgleichen sucht. Gerade Bildungsinstitutionen, die über ein knappes IT-Budget verfügen und Ihre Zeitschriften und Bücher trotzdem in einer attraktiven Form als Open Content online verfügbar machen wollen, finden bei Issuu eine attraktive, einfache Lösung.

Skim: Das beste Programm, um PDF-Dokumente zu lesen und zu kommentieren

Skim PDF Reader

In einem Artikel über den PDF-Viewer Sumatra für Windows (vgl. Sumatra PDF Viewer: Schlanke Alternative zum Adobe Reader) hatte ich die Geschwindigkeit von Apples PDF-Viewer Vorschau gelobt. Was ich damals unterschlagen hatte: Vorschau ist zwar sehr schnell, aber auch sehr rudimentär ausgestattet – wer PDF-Dokumente intensiv nutzt, wird damit nicht glücklich.

Einer hervorragende Alternative ist Skim. Die Software orientiert sich stark an Vorschau (wodurch sie sehr vertraut wirkt), besitzt aber viele entscheidende Zusatzfunktionen:

  • Symbolleiste: Die häufigsten Aktionen beim Lesen eines PDF-Dokuments sind das Blättern, Zoomen und Rotieren. Apples Symbolleiste hat mich hier nie überzeugt: Die doppelt vorhandenen Zurück/Weiter-Buttons verwirren, und es fehlen elementare Funktionen wie z.B. die Anpassung der Zoom-Stufe an die Fensterbreite. Skim ist hier wesentlich besser ausgestattet und bietet für dieselbe Funktion oft mehrere Buttons zur Auswahl, so dass man sich leicht seine ideale Symbolleiste zusammenstellen kann.
  • Notizfunktionen: Mit Skim kann man PDF-Dokumente nicht nur lesen, sondern auch mit Notizen und Markierungen versehen – genau so, wie man auch ein gedrucktes Buch benutzen würde. Erst damit werden PDF-Dokumente zu einem echten Buchersatz im Bereich der wissenschaftlichen und fachlichen Arbeit. Nebst den bekannten Post-Its bietet Skim auch einfache geometrische Figuren (Linien, Rechtecke, Kreise) sowie die Möglichkeit, Textpassagen an- bzw. durchzustreichen.
  • Lesebalken: Das Lesen auf dem Bildschirm ist unter anderem deshalb ermüdend, weil es schwieriger ist, die Zeile zu halten – den Finger oder eine andere Lesehilfe kann man schlecht einsetzen. Der Lesebalken ist hier eine grosse Hilfe: Die aktuelle Zeile wird farbig hinterlegt, per Cursor-Taste wandert die Markierung zeilenweise nach oben oder unten.
  • Mehrfach-Ansichten: In Textverarbeitungsprogrammen und Editoren gibt es oft die Möglichkeit, das Fenster vertikal zu teilen und so zwei verschiedene Stellen desselben Dokuments zu sehen. Diese Möglichkeit bietet auch Skim. Zudem kann man sogenannte Snapshots anlegen, bei dem eine bestimmte Stelle im Dokument ähnlich einem Lesezeichen gespeichert, aber später in einem separaten Fenster betrachtet werden kann.
  • Volltext-Suche: Zusätzlich zur normalen Trefferliste (die es auch bei Vorschau gibt) bietet Skim eine Trefferliste, die nach Relevanz sortiert ist: Eine Balkengrafik zeigt, auf welchen Seiten der gesucht Begriff am häufigsten vorkommt.

Fazit: Skim schliesst eine schmerzliche Lücke zwischen Apples Vorschau und dem Adobe Reader. Wer auf einem Mac regelmässig PDF-Dokumente liest (und das ist heute fast jeder), sollte diese Software unbedingt installieren. Die einzige Herausforderung besteht darin, dass die Notizen und Markierungen nicht im PDF-Dokument selbst, sondern im Dateisystem abgelegt werden. Wer ein PDF-Dokument kopieren oder per Mail verschicken will, muss wissen, bei welcher Methode die Notizen erhalten bleiben oder bei welcher nicht. Sowohl die integrierte Hilfe als auch das Skim-Wiki bieten hier aber gute Unterstützung. Und im Zweifelsfall kann man mit der Export-Funktion bequem ein “PDF-Dokument mit eingebetteten Notizen” generieren, damit sicher keine Anmerkungen verloren gehen.

PDF-Dokumente mit Open Source Software erstellen

image

PDF-Dokumente kann man längst nicht nur mit Software von Adobe erstellen und lesen – ein Themen-Special auf heise.de zeigt diverse Alternativen auf, die teilweise kostenlos und vereinzelt sogar Open Source sind.

In dieser Übersicht nicht enthalten ist erstaunlicherweise der PDFCreator, den ich persönlich sehr schätze. Das könnte allenfalls damit zusammenhängen, dass der PDFCreator unter Windows Vista derzeit nicht läuft, weil er mit den strikten Sicherheitsrichtlinien von Vista in Konflikt gerät. Und bisher wollte sich niemand die Prämie von 150 US-Dollar verdienen, die für die Lösung des Problems ausgeschrieben sind.

Als Ausweg empfiehlt sich OpenOffice.org: Alle Komponenten der freien Office Suite können ein Dokument direkt als PDF exportieren, wobei ein vorgeschalteter Dialog Zugriff auf alle wichtigen Optionen bietet (z.B. Bildkompression, Standard-Ansicht, Passwortschutz).

Sumatra PDF Viewer: Schlanke Alternative zum Adobe Reader

sumatra_pdf.png

Wer sowohl auf einem Windows-PC als auch auf einem Mac arbeitet wird feststellen, dass das Öffnen eines PDF-Dokuments auf einem Mac wesentlich schneller geht. Dies liegt unter anderem daran, dass unter Windows der ressourcen-hungrige Adobe Reader gestartet werden muss, während unter Mac OS X ein Systemprogramm namens “Vorschau” diese Aufgabe sehr effizient erledigt.

Wer unter Windows regelmässig PDF-Dokumente liest und dabei lieber weniger Features und dafür mehr Tempo hat, findet in Sumatra eine Alternative zum Adobe Reader:

“Sumatra has a minimalistic design. Simplicity has a higher priority than a lot of features. It’s small and starts up very fast. It’s designed for portable use: it’s just one file with no external dependencies so you can easily run it from external USB drive.”

Wer seine Effizienz weiter steigern möchte sollte sich übrigens die Liste der Tastenkürzel anschauen, über die das Programm gesteuert werden kann.

Sumatra unterliegt der GNU General Public Licence (GPL) in der Version 2.