Produktiver mit TYPO3 (9): Eingeschleppte Textformatierungen verhindern

Eines der häufigsten Probleme im Umgang mit Content-Management-Systemen ist das Einschleppen von Textformatierungen. Kopiert man einen Text aus einem Word-Dokument oder von einer Web-Seite und fügt diesen im CMS-Editor ein, dann betrifft dies nicht nur den eigentlichen Text, sondern auch alle seine Formatierungsinformationen. Das kann im Einzelfall erwünscht sein, in der Regel geschieht es aber unbeabsichtigt. Und eigentlich sind “hart” formatierte Texte genau das, was man in einem CMS nicht will, denn die korrekte Formatierung soll das CMS sicherstellen (genau deshalb spricht man ja immer von der Trennung von Inhalt und Formatierung, welche ein CMS ermöglicht).

Bei TYPO3 gibt es verschiedene Ansätze, um diesem Problem zu begegnen. Die einfachste Methode besteht darin, den Text zuerst in einen reinen Texteditor (z.B. Notepad) einzufügen und dann von dort nochmals zu kopieren: Weil ein solcher Plain Text Editor keine Formatierungen kennt, wird er die Formatierungsinformationen verwerfen. Für Einzel- und Notfälle ist diese Methode gut genug, für den regelmässigen Einsatz jedoch nicht sehr komfortabel.

image

Ähnlich funktioniert auch eine zweite Methode, die ohne externen Editor auskommt: Indem man vor dem Einfügen den Rich Text Editor (RTE) im TYPO3-Backend temporär deaktivert, er hält man ein reines Textfeld. Fügt man den Inhalt der Zwischenablege jetzt ein, dann verliert er ebenfalls alle Formatierungsinformationen. Das Deaktivieren und Reaktivieren des RTE dauert allerdings einen Moment und stört deshalb ein bisschen den Arbeitsfluss.

imageDie dritte Methode besteht darin, den Text zunächst inklusive Formatierung einzufügen und erst anschliessend zu bereinigen. Der RTE von TYPO3 besitzt hierfür die Funktion “Remove Formatting”, die sich hinter dem Button mit dem Pinsel-Icon versteckt. Hier kann man nicht nur eingeschleppte Word- und HTML-Formatierungen entfernen, sondern auch spezielle Leerzeichen (welche den Zeilenumbruch verhindern), Bilder oder gleich sämtliche HTML-Tags.

imageFür einen erfahrenen Web-Publisher ist diese Methode auf jeden Fall interessant. Wer hingegen nur gelegentlich einige Seiten in TYPO3 aktualisieren soll, der wird diesen Dialog kaum verstehen (Was beispielsweise ist der Unterschied zwischen HTML- und Word-Formatierung?). Und dann wird eben auch das Resultat unter Umständen nicht dem entsprechen, was man erwartet.

Gerade wenn man es mit weniger geübten Content Managers zu tun hat scheint mir der Ansatz “verhindern statt beheben” besser. Statt also die Anwender darauf zu schulen, wie sie die leidigen Formatierungen loswerden, sollte man das System gleich so konfigurieren, dass das Einfügen von Formatierungen schlicht und einfach nicht möglich ist. Hierzu gibt es einerseits den TypoScript-Parameter RTE.default.enableWordClean, andererseits die Einstellungen für den HTML-Parser (RTE.default.proc). Ich kann hier nicht im Detail auf alle Optionen eingehen, verweise aber auf die Dokumentationen und Tutorials, die im TYPO3 Extensions Index verlinkt sind. Ein Nachteil dieser Methode sei allerdings nicht verschwiegen: Die Formatierungen werden erst beim Speichern des RTE-Inhalts in der Datenbank entfernt, unmittelbar nach dem Einfügen sind sie also noch vorhanden. Einen ungeübten Anwender wird es bestimmt verwirren, wenn sein Text nach dem Speichern plötzlich ganz anders aussieht als vorher.

image

Genau dieses Problem besteht nicht, wenn man die Exension ad_rtepasteplain einsetzt. Sie bewirkt, dass sich beim Einfügen jeweils eine separate Textbox öffnet, die wie ein Plain-Text-Editor wirkt, das heisst sie kann nur unformatierten Text aufnehmen. Gemäss Dokumentation funktioniert die Extension auch mit Internet Explorer 6 (und neuer), aber leider nicht mit Safari 4 und Opera 10. Solange die Content Managers jedoch keinen dieser Browser nutzen, ist diese Methode leicht verständlich und zuverlässig (weil man sie nicht vergessen oder umgehen kann).

Ich persönlich nutze allerdings nochmals eine andere Methode, nämlich PureText. Das kleine Programm wird auf Systemebene installiert und erlaubt das Einfügen ohne Formatierungen über eine wählbare Tastenkombination. Diese Methode hat für mich zwei Vorteile: Erstens kann ich sie selektiv einsetzen, d.h. wenn ich die Formatierungen übernehmen will, nutze ich CTRL+V, wenn ich sie hingegen löschen möchte, nutze ich WIN+V. Zweitens funktioniert das Prinzip nicht nur im RTE von TYPO3, sondern auf jeder Website und in jedem Programm. Der einzige Nachteil: PureText läuft nur unter Windows. Ich könnte mir aber vorstellen, dass es ähnlich Tools auch für den Mac gibt, z.B. Plain Clip (nicht getestet).

10 Gedanken zu „Produktiver mit TYPO3 (9): Eingeschleppte Textformatierungen verhindern“

  1. Ein guter Artikel, aber ich persönlich bevorzuge einfach TinyMCE über den ziemlich eingeschränkten Standard Editor.

    Bei Tiny gibt es einen Knopf “Aus Word einfügen” der den ganzen Mist entfernt aber einige sinnvolle Formatierungen wie z.B. Fett, Listen etc. drin lässt. Eine Variante “Als Text einfügen” die alles rauswirft gibt es allerdings auch.

    Damit haben wir gute Erfahrungen gemacht, man muss nur immer allen Kunden etc. einschärfen das sie den Knopf verwenden. Das große Problem bei aus Word kopieren Text ist nämlich häufig nicht die Formattierung sondern das die zusätzlichen Eigenschaften den IE abschießen.

  2. Unter Mac OS X gibts das im Betriebssystem integriert. Ich weiss nicht, ob alle Programme das unterstüzen, aber in Safari geht das Einfügen ohne Formatierung mit der Tastenkombination Befehl-Alt-Uschalt-V. Im Menü Bearbeiten die Option “Einfügen und Stil anpassen” – etwas unglücklich benannt.

    @Florian: der HTMLarea ist nicht (mehr) eingeschränkt. TinyMCE kann ein paar Sachen mehr (z. B. ist ein Linkhandler integriert, der es ermöglicht, auf News zu verlinken, was man im HTMLarea allerdings nachrüsten kann). Allerdings kann TinyMCE auch ein paar Sachen weniger, nämlich z. B. nicht einem Absatz mehrere Klassen zuweisen.

  3. Vielen Dank für das Vorstellen meiner Extension ad_rtepasteplain!

    Leider gab es mit Typo3 Version 4.4 einige Änderungen, weshalb die Extension nicht mehr ordentlich funktioniert.

    Ich möchte auch keine Entwicklungszeit mehr reinstecken da ich hoffe dass ein solches Feature bald Einzug finden wird…

  4. Das ist ein gelunger Blog. Ich bevorzuge hierfür eine simple Erweiterung des FireFox – “Copy Plain Text” – das reicht völlig mit einem Rechts-Klick den gewünschten Text ohne Formatierung zu kopieren.

  5. Die Tastenkombination CTRL + SHIFT + V ermöglicht Einfügen ohne Formatierungen. Das Funktioniert unter Windows und Mac OS X.

    Man braucht also keine Erweiterungen oder Programme, sondern einfach nur seine Shift-Taste.

  6. Thomas Alboth / uk: Das hilft uns aber nicht weiter, das Problem ist ja dass die Redakteure das nicht verwenden. Die drücken Strg-V und für sie ist das erledigt. Sie könnten ja auch auf den Clean-Button klicken um HTML und/oder Word Formatierungen zu entfernen, aber das macht von Haus aus leider (fast) keiner.

  7. Ja, der Redakteur muss in jedem Fall was Neues lernen, da gebe ich dir recht.
    Aber seit TYPO3 4.5 kann der Redakteur ja in seinen Settings angeben, wie und was genau eingefügt werden soll. Habs nur noch nicht getestet obs auch funzt wie erwartet…

Hinterlassen Sie einen Kommentar