Wie druckt man ein MediaWiki aus?

image

MediaWiki eignet sich hervorragend, um im Team-Work Informationen zusammenzutragen, zu strukturieren und zu überarbeiten. Aber was, wenn man das Resultat in Form eines PDFs exportieren oder ausdrucken möchte? Die Frage beschäftigt mich schon länger, und die perfekte Lösung habe ich noch nicht gefunden. Im Moment zeichnen sich zwei Favoriten ab:

  • PDF Book: Diese Extension erlaubt es, alle Seiten einer bestimmten Kategorie in einem einzigen Arbeitsgang als PDF zu exportieren. Dabei wird automatisch ein Inhaltsverzeichnis erstellt, pro Wiki-Seite wird ein Kapitel angelegt. Diese Lösung setzt allerdings voraus, dass HTMLDOC auf dem Server installiert ist.
  • Collection: Bei dieser Extension wird das PDF aus einer sogenannten Collection erstellt. Eine Collection ist vergleichbar mit einer persönlichen Bookmark-Sammlung, die direkt im Wiki abgelegt ist. Auf der Website WikiEducator kann man das in einem öffentlichen Beta-Test selbst ausprobieren. Und wie einer Medienmitteilung der Wikimedia-Foundation vom letzten Dezember zu entnehmen ist, handelt es sich bei dieser Extension um eine Entwicklung, welche strategische Bedeutung für MediaWiki hat und im Verlaufe des Jahres 2008 auch auf Wikipedia eingebaut werden soll. Vielversprechend ist auch die Ankündigung, dass bis Mitte 2008 zusätzlich ein Export im OpenDocument-Format möglich werden soll. Was mich dagegen irritiert ist die Tatsache, dass die Collection-Extension zwei Python-Libraries voraussetzt, während MediaWiki ja in PHP geschrieben ist. Ob diese Lösung auch für einfache Shared-Hosting-Accounts mit LAMP-Umgebung funktioniert?

Neben den beiden erwähnten Extensions gibt es noch eine ganze Reihe anderer Ansätze (vgl. die Liste der alternativen Parser sowie die Data Extracation Extensions), die mir allerdings – aus verschiedensten Gründen – weniger überzeugend scheinen. Gibt es tatsächlich keine Extension, die allein mit den Mitteln von PHP den Export einer ganzen Kategorie im PDF-, OpenDocument- oder RTF-Format erlaubt?

Microsofts OpenXML wird (vorerst) kein ISO-Standard

Wie in diesem Blog schon mehrfach berichtet versucht Microsoft derzeit, das Dokumentenformat Office Open XML (OOXML) neben dem Open Document Format (ODF) als zweiten ISO-Standard für Office-Anwendungen zu etablieren. Der entsprechende Abstimmungsprozess hat hohe Wellen geworfen, da in verschiedenen Ländern Microsoft-Partner kurzfristig Mitglied der entsprechenden Entscheidungsgremien wurden, um den Abstimmungsverlauf zu Gunsten von OOXML zu beeinflussen – auch in der Schweiz, wie die Netzwoche berichtet.

Trotzdem ist Microsoft im ersten Anlauf gescheitert, die Norm per Schnellverfahren («Fast Track») zu etablieren: Die notwendige Mehrheit wurde verfehlt, da sich unter anderem Frankreich, Grossbritannien, Norwegen, Kanada, Brasilien, Südafrika, Indien, China und Japan dagegen aussgesprochen haben. Das Thema ist allerdings noch nicht vom Tisch: Anfangs 2008 wird eine Endabstimmung durchgeführt. Und da die Nein-Stimmen in der Regel nicht kategorisch, sondern unter Vorbehalt erfolgten, hat Microsoft noch immer Chancen, die prestigeträchtige ISO-Zertifizierung zu erhalten.

Mehr zum Thema:

Ist Microsofts OXML ein offenes Dateiformat?

Können digitale Daten von heute in zehn, zwanzig oder hundert Jahren noch gelesen und weiterverarbeitet werden? Diese Frage ist zentral für eine Informationsgesellschaft, die gigantische Datenmengen produziert und diese auch archivieren möchte. Aber ob man diese Frage mit «Ja» beantworten kann, ist keineswegs sicher: Durch die rasante Weiterentwicklung von Hardware und Software können schon nach kurzer Zeit bestimmte Datenträger nicht mehr gelesen oder bestimmte Dateiformate nicht mehr geöffnet werden. Datenträger kann man zur Not auf neuere Medien umkopieren, aber Daten laufend in neue Formate zu konvertieren ist schlicht nicht praktikabel. Abhilfe schaffen einzig offene Standards.

Im Bereich der Office-Dokumente gibt es mit ODF seit kurzem einen solchen offenen Standard (vgl. OpenDocument-Format ist ISO-Standard). Aber auch Microsoft hat im Zuge seiner neusten Office-Generation ein Format geschaffen, das dem Namen nach offen ist: Open XML (OXML) bzw. Office Open XML (OOXML). Wie die neue Neue Zürcher Zeitung vom 20. Juni 2007 auf Seite B1 schreibt, ist dies allerdings ein Etikettenschwindel:

«Als offen gilt ein Standard, der in einem ‹offenen› und allen interessierten Parteien zugänglichen Entscheidungsprozess erarbeitet wurde und bei dem das geistige Eigentum, das er enthält, unentgeltlich von allen Interessierten genutzt werden kann. Gemessen an dieser Definition schmückt sich OXML zu Unrecht mit dem Adjektiv ‹open›. Denn wer diesen Standard vollumfänglich implementieren will, muss Funktionen von immaterialgüterrechtlich geschützten Microsoft-Produkten oder -Techniken, die in der OXML-Spezifikation vorausgesetzt, aber nicht beschrieben werden, nachbilden.»

Dass Microsoft OXML ebenfalls zum ISO-Standard erheben lassen will, ruft deshalb Kritik hervor. Mit der Kampagne OOXML – Say NO to Microsoft Office broken standard versucht die Foundation for a Free Information Infrastructure FFII, diese Kritik in Form einer Petition zu kanalisieren. Die Argumente der FFII sind fundiert, und insbesondere Argument Nr. 1 überzeugt auch ohne vertiefte IT-Kenntnisse:

«There is already a standard ISO26300 named Open Document Format (ODF): a dual standard adds costs, uncertainty and confusion to industry, government and citizens.»

Selbst wenn dieser Protest Erfolg haben sollte muss man sich allerdings im Klaren sein, dass OXML trotzdem ein Standard werden wird – kein ISO-Standard zwar, aber ein proprietärer De-facto-Standard, wie Microsoft in seiner Firmengeschichte schon diverse geprägt hat. Immerhin muss man Microsoft aber zu gute halten, dass man sich mit den OpenXML/ODF Translator Add-ins for Office auch bemüht, den ISO-Standard zu unterstützen.

Microsoft Word: Add-in für Open Document Format (ODF)

Mit dem Release 1.0 des ODF Converter Add-in liest und schreibt Microsoft Word nun offiziell das Open Document Format, das unter anderem OpenOffice.org nutzt. Unterstützt werden die Word-Versionen XP, 2003 und 2007. Umgekehrt hat Novell angekündigt, den Konverter in die nächste Version von OpenOffice.org zu integrieren, damit auch der Writer in Zukunft das neue Microsoft-Format verarbeiten kann.

Für den November dieses Jahres hat das ODF Converter Team Add-ins für Excel und PowerPoint angekündigt.

Weitere Informationen:

Frühere Beiträge zum Thema:

OpenDocument-Format ist ISO-Standard

OASIS OpenDocument (ODF), das Dateiformat von OpenOffice.org, ist von der internationalen Normierungsorganisation ISO offiziell als Standard ISO/IEC 26300 anerkannt worden.

OpenDocument steht in direkter Konkurrenz zu Open XML von Microsoft, das mit Office 2007 eingeführt wird und in Office XP bzw. Office 2003 nachgerüstet werden kann. Dieses Format wurde kürzlich von der European Computer Manufacturers Association (ECMA) als Standard ECMA 376 anerkannt und strebt nun ebenfalls die Zertifizierung durch die ISO an.

Es ist absehbar, dass in Zukunft beide Formate nebeneinander existieren werden. Eine zentrale Rolle spielt dabei die Übereinkunft zwischen Microsoft und Novell, die unter anderem auch die Unterstützung von Open XML durch OpenOffice.org vorsieht. Umgekehrt entwickelt Microsoft aber auch ODF-Tools für das eigene Office-Paket.

Mehr zum Thema: