Wie druckt man ein MediaWiki aus?

image

MediaWiki eignet sich hervorragend, um im Team-Work Informationen zusammenzutragen, zu strukturieren und zu überarbeiten. Aber was, wenn man das Resultat in Form eines PDFs exportieren oder ausdrucken möchte? Die Frage beschäftigt mich schon länger, und die perfekte Lösung habe ich noch nicht gefunden. Im Moment zeichnen sich zwei Favoriten ab:

  • PDF Book: Diese Extension erlaubt es, alle Seiten einer bestimmten Kategorie in einem einzigen Arbeitsgang als PDF zu exportieren. Dabei wird automatisch ein Inhaltsverzeichnis erstellt, pro Wiki-Seite wird ein Kapitel angelegt. Diese Lösung setzt allerdings voraus, dass HTMLDOC auf dem Server installiert ist.
  • Collection: Bei dieser Extension wird das PDF aus einer sogenannten Collection erstellt. Eine Collection ist vergleichbar mit einer persönlichen Bookmark-Sammlung, die direkt im Wiki abgelegt ist. Auf der Website WikiEducator kann man das in einem öffentlichen Beta-Test selbst ausprobieren. Und wie einer Medienmitteilung der Wikimedia-Foundation vom letzten Dezember zu entnehmen ist, handelt es sich bei dieser Extension um eine Entwicklung, welche strategische Bedeutung für MediaWiki hat und im Verlaufe des Jahres 2008 auch auf Wikipedia eingebaut werden soll. Vielversprechend ist auch die Ankündigung, dass bis Mitte 2008 zusätzlich ein Export im OpenDocument-Format möglich werden soll. Was mich dagegen irritiert ist die Tatsache, dass die Collection-Extension zwei Python-Libraries voraussetzt, während MediaWiki ja in PHP geschrieben ist. Ob diese Lösung auch für einfache Shared-Hosting-Accounts mit LAMP-Umgebung funktioniert?

Neben den beiden erwähnten Extensions gibt es noch eine ganze Reihe anderer Ansätze (vgl. die Liste der alternativen Parser sowie die Data Extracation Extensions), die mir allerdings – aus verschiedensten Gründen – weniger überzeugend scheinen. Gibt es tatsächlich keine Extension, die allein mit den Mitteln von PHP den Export einer ganzen Kategorie im PDF-, OpenDocument- oder RTF-Format erlaubt?

Werk von Charles Darwin komplett digitalisiert

image

Die University of Cambridge hat die gesammelten Werke von Charles Darwin online zugänglich gemacht. Dies umfasst sowohl die gedruckten Publikationen als auch seine Manuskripte und Tagebücher.

image In der Regel stehen sowohl durchsuchbare Texte als auch Faksimile-Ansichten zur Verfügung. Bei gleichzeitiger Darstellung laufen die beiden Ansichten synchron, was trotz der einigermassen lesbaren Handschrift Darwins eine wertvolle Unterstützung darstellt. Technisch und optisch ist die Website einfach, aber funktional; sie kommt ohne Flash oder andere Technologien aus, welche beim Web-Browser ein Plug-In voraussetzen würde.

EasyTimeline: Timelines in MediaWiki

image

Für die Visualisierung von zeitgebundenen Fakten bieten sich Zeitleisten (Timelines) an. Von Haus aus hat MediaWiki hier keine Unterstützung zu bieten, aber mit der Extension EasyTimeline kann man Grafiken wie die oben gezeigte per Wiki-Text erstellen und editieren. Diese Methode ist natürlich – wie bei Wikis üblich – relativ technisch und setzt voraus, dass man sich in die Syntax der Extension einarbeitet. Der Aufwand lohnt sich aber, wenn man beispielsweise ein Wiki mit historischen Themen betreibt, einen Projektplan direkt im Wiki pflegen möchte oder (wie oben gezeigt) die Geschichte alle Apple-Macintosh-Computer nachzeichnen will.

Zotero: Material für wissenschaftliche Arbeiten in Firefox sammeln und verwalten

image

Zotero, “The Next-Generation Research Tool”, ist eine Extension für Firefox, mit der man Material aller Art direkt im Browser speichern, kategorisieren und kommentieren kann. Das ist insbesondere dann praktisch, wenn man Ergebnisse einer Recherche im Web findet – per Mausklick kann man dann auf ein Webseite verlinken oder eine Kopie davon lokal speichern. Hierarchische Kategorien, Tags, Querverlinkungen und Kommentare helfen, Fundstellen zu verwalten, anzureichern und damit für eine spätere Verwendung nutzbar zu machen.

Aber auch klassische bibliografische Angaben verschiedenster Dokumenttypen lassen sich in Zotero verwalten, und über Attachments kann man zudem beliebige elektronische Dateien in seiner Informationssammlung speichern. Eine ausgereifte Volltextsuche (die auch PDF-Dokumente durchsuchen kann) sowie die Möglichkeit, Daten auf einer sehr schönen Timeline zu visualisieren (vgl. SIMILE Timeline: Visualisierung von Geschichte auf der Zeitachse) runden das Tool ab. Und damit die mühsam gesammelten Informationen nicht in Firefox bzw. Zotero gefangen bleiben, gibt es flexible Export-Optionen.

Zotero überzeugt bezüglich Features, aber auch bezüglich Tempo, Optik und Liebe zum Detail. Manchmal könnte man richtig neidisch werden, dass man nicht mehr Student ist…

Schweizer Stadtwikis stecken noch in den Anfängen

image

Das Konzept eines Stadtwikis (engl. City Wiki) ist rasch erklärt: Basierend auf einer Wiki-Software erstellen die Bewohner einer Stadt, einer Gemeinde oder einer Region gemeinsam eine Online-Dokumentation ihrer Heimat. Im deutschsprachigen Raum ist das Stadtwiki Karlsruhe das oft erwähnte Vorbild, das auch international bezüglich Anzahl Seiten einen Masstab darstellt (vgl. Statistik des Omaha Wiki). Aber auch Hamburg, Kassel, die Region Rhein-Neckar, Passau, Pforzheim oder München haben lebendige Stadtwikis.

In der Schweiz bietet sich ein anderes Bild: Wer nach “Stadtwiki” in der Schweiz googelt, findet nur gerade das Berner Stadtwiki (das über zwei Dutzend halbleere Seiten nicht herauskomment) und ein Stadtwiki-Portal (das ganz offensichtlich noch keinerlei Inhalte hat). Hier wäre – gerade im Hinblick auf die Euro 08 – noch Potential vorhanden!

Open Clip Art Library: Das Archiv für Public-Domain-Grafiken

image

Auch wenn Designer typischerweise die Nase rümpfen über Cliparts: Manchmal sind vorgefertigte Grafiken eben doch besser als reine Textwüsten. Die Open Clip Art Library bietet einen Fundus von gegen 14’000 Sujets aus der Public Domain, also ohne jegliche Einschränkung bei der Nutzung. Das Konzept überzeugt – bis auf die Suche, denn die Trefferliste zeigt keine Previews an, so dass man sich mühsam von Detailansicht zu Detailansicht klicken muss. Somit tut man gut daran, stattdessen das Gesamtarchiv auf die eigene Festplatte herunterzuladen und lokal zu durchstöbern.

Djvu: Offener Standard für digitalisierte Dokumente

image

Bei der Digitalisierung von gedruckten Dokumenten (sog. Redigitalisierung) stellt sich unter anderem die Frage nach dem geeigneten Dateiformat. Einerseits sollen die Dokumente 1:1 und in möglichst hoher Auflösung wiedergegeben werden, was zwangsläufig auf Bitmap-Grafiken hinausläuft. Andererseits sollen Texte per Texterkennung (OCR) aus den Scans extrahiert und als durchsuchbarer Text im Dokument gespeichert werden. Zusätzlich sind kompakte Dateien gefordert, die kostengünstig archiviert und effizient über das Internet ausgeliefert werden können.

Reine Grafikformate (z.B. JPEG, GIF, PNG oder TIFF) können Texte nicht als solche behandeln und kommen deshalb nicht in Betracht. Mit dem Portable Document Format (PDF) von Adobe steht zwar ein Dateiformat zur Verfügung, das sowohl eine originalgetreue grafische Wiedergabe als auch durchsuchbare Texte bietet. Auch wenn es möglich ist, Scans in PDF-Dateien einzubetten so ist dieser Standard aber doch primär für Dateien gedacht, die digital erstellt und direkt in das PDF-Format konvertiert werden.

Ein interessanter Ansatz stellt Djvu (ausgesprochen als “déjà-vu”) dar. Es handelt sich um einen offenen Standard, und es gibt dazu passende Programme sowie Browser-Plugins für Windows, Mac OS X sowie Linux (unter Open-Source-Lizenzen oder zumindest kostenlos). Zwei Dinge sind es, die Djvu auszeichnen:

  • image Die gescannten Bitmap-Grafiken werden sehr effizient komprimiert, was im Vergleich zu den klassischen Grafikformaten sehr kleine Dateigrössen ergibt.
  • Per OCR extrahierte Texte können auf einer separaten Ebene in die Dateien eingebunden werden, wodurch die Scans durchsuchbar werden.

Mir persönlich sind Djvu-Dateien zwar noch selten begegnet. Wer sich das Browser-Plugin von Lizardtech installiert und eines der Beispieldokumente auf der Djvu-Webseite herunterlädt, wird aber rasch feststellen, dass Djvu absolut praxistauglich ist.

Weitere Links zum Thema:

Iconfinder: Freie Icons für freie Software

iconfinder.jpg

Wer Icons für freie Software benötigt, bedient sich entweder beim Tango Desktop Project – oder er benutzt den Iconfinder, wo man Icons mit Creative Commons Licence, GPL oder LGPL suchen und nach Grösse filtern kann. Die Qualität der Icons ist überzeugend, und die Suche wird durch eine Tag Cloud sowie einen Suggest-Mechanismus unterstützt. Vielversprechend!

Issuu: PDFs mit Flash E-Book Reader publizieren

Der übliche Weg, um eine gedruckte Publikation 1:1 im Internet bereitzustellen, führt über das PDF-Format. Gelegentlich möchte man aber eine Datei nicht extra herunterladen und im Adobe Reader öffnen müssen, nur um den Inhalt zu überfliegen. In diesem Fall ist eine E-Paper-Lösung auf Flash-Basis, die man direkt in eine Seite einbetten kann, die schönere Lösung. Die Frage ist nur: Wie konvertiert man sein PDF-Dokument in eine SWF-Datei? Und woher nimmt man einen Flash E-Book Reader, um ihn in seine Website zu integrieren?

Issuu (von engl. Issue) löst beide Probleme: Nach dem Prinzip von YouTube (Videos) und SlideShare (PowerPoint-Präsentationen) kann man bei Issuu eine PDF-Datei hochladen und erhält dann einige Zeilen HTML-Code, welche einen kompletten E-Book Reader in eine beliebige Website einbetten. Nebst dem Mini-Viewer (siehe oben) gibt es auch noch den Standard-Viewer, der bezüglich Bedienungskomfort und Ästhetik Seinesgleichen sucht. Gerade Bildungsinstitutionen, die über ein knappes IT-Budget verfügen und Ihre Zeitschriften und Bücher trotzdem in einer attraktiven Form als Open Content online verfügbar machen wollen, finden bei Issuu eine attraktive, einfache Lösung.

Öffentlich-rechtliches Fernsehen unter Creative-Commons-Lizenz

image

Der Norddeutsche Rundfunk NDR stellt ausgewählte Beiträge aus den Magazin-Sendungen “Zapp” und “Extra 3” unter einer Creative-Commons-Lizenz im Internet zur Verfügung. Die Wahl ist dabei auf die vergleichsweise restriktive BY-NC-ND-Version gefallen, was konkret bedeutet: Die Sendungen dürfen ausschliesslich zu nicht-kommerziellen Zwecken weiterverbreitet und nicht verändert werden.

Das Ganze ist offenbar nur ein Test. Doch eigentlich wäre das Modell nur konsequent: Da die Öffentlichkeit die Sendungen über Gebühren finanziert, sollte sie auch ein Nutzungsrecht an den Eigenproduktionen der öffentlich-rechtlichen Sender erhalten. Dies wäre zugleich ein starkes Argument in der ewigen Diskussion um die Radio- und Fernsehgebühren.