Das Problem der Datei-Endungen

Wer das Geheimnis der Datei-Endungen kennt, ist dem Verständnis seines Computers schon deutlich näher gekommen. Der Anstand verbietet es jedoch, jede mögliche Datei auch anderen zuzusenden.

Wie in Analog./.Digital dargelegt, benötigt jede Datei irgendwelche Hinweise für das System, was sie für Daten enthält und welches Programm damit umgehen kann.

Unter Windows legt das die Datei-Endung fest. Drei Buchstaben, durch Punkt vom eigentlichen Dateinamen getrennt, sagen dem System, welchen Typ die Datei besitzt. Da auch Zahlen möglich sind, ergeben sich dadurch 36*36*36 Möglichkeiten (fast 50.000!). In einer internen Datenbank schaut das System dann nach, ob diese Endung registriert ist und welches Programm Dateien mit dieser Endung bearbeiten können. Bei www.filext.com kann man nachschauen, welche Programme mit welchen Dateiendungen umgehen können.

Im klassischen Macintosh-System gab es zu jeder Datei eine so genannte Ressource-Datei, die erstens versteckt war und zweitens zusätzliche Informationen enthielt. In den Ressource-Dateien ist die Ersteller-Datei und der Datei-Typ gespeichert (Type / Creator). Dadurch durften die Dateinamen auch den Punkt und andere Sonderzeichen enthalten; diese wurden ja nicht als Markierungselement benötigt. Außerdem werden Dateien – unabhängig von der Datei-Endung – mit dem Programm geöffnet, mit dem sie erstellt wurden; war das Programm nicht vorhanden, kann das System anhand des Dateityps entscheiden, welches Programm diese Datei verarbeiten kann. Deshalb war es notwendig – wollte man diese Dateien unter Windows nutzen – die Dateiendung anzufügen.

Eines der häufigsten Dateiformate dürfte .doc sein. Dieses bedeutet, dass es sich um ein Textdoument handelt. Anfangs wurde .doc von zahlreichen Textverarbeitungsprogrammen verwendet, inzwischen ist es hauptsächlich für Dateien, die MS Word erstellt, im Einsatz und wird durch die microsoftsche Produktpolitik von .docx abgelöst. Die reine Dateiendung .doc sagt leider nichts darüber aus, welche Version von MS Word. Eine Dokumentdatei für Word 2003 sieht genauso aus wie ein Dokument für Word 4, nur dass ich es mit Word 4 nicht öffnen kann.

Da wir so schön dabei sind, beschreiben wir doch gleich noch ein paar Probleme der Word-Dateien. Warum beispielsweise wird immer die Dokument-Historie mitgespeichert? Wie groß sie ist, lässt sich feststellen, indem man die Datei einfach aus Word heraus unter einem anderen Namen speichert und die Dateigrößen vergleicht oder indem man die Datei mal mit dem Editor öffnet. Da sind dann alle Bearbeitungsschritte zu sehen, doch Word selbst stellt sie nicht zur Verfügung. Man könnte doch einfach die Rückgängig-Funktion auch beim nächsten Öffnen verfügbar machen, die Informationen dafür liegen vor. Aber nein, die Datei wird immer größer, ohne dass ich als Nutzer einen Nutzen davon habe.

Das nächste große Problem klang mit den verschiedenen Word-Versionen schon an. Will man eine Datei via eMail versenden, wie kann ich dann sicher sein, dass der andere auch die richtige Word-Version hat? Kann ich überhaupt sicher sein, dass der Empfänger irgendeine Version von Word besitzt – dies ist ein teures Programm und Alternativen wie OpenOffice oder Papyrus sind zum Teil besser, preiswerter und überhaupt vorzuziehen. Oder der andere benutzt Linux oder den Rechner in einem Internet-Café, wo kein Word installiert ist. Die Abhängigkeit von MS Word schafft wie jede Abhängigkeit große Probleme.

Wie kann ich dieser Abhängigkeit entgehen, ohne auf Komfort zu verzichten? Ich speichere in einem Format, das jeder Computer versteht. Dafür bietet sich .rtf (RichTextFormat) an. Jede Textverarbeitung kann damit umgehen und in diesem Format speichern. Man muss es nur wissen, es beherzigen und anwenden:-) Übrigens ist das .doc-Format nur das erweiterte und „vergewaltigte“ .rtf-Format (das hatten wir schon mal bei html-Dateien Ende der 90er, als manche Internetseiten nur mit dem Internet Explorer anzusehen waren:-(

Aber nicht nur Microsoft ist gut darin, die Nutzer zu ärgern. Adobe schafft mit dem .pdf-Format das gleiche. Auch hier kann ich der Datei nicht ansehen, welche Version des Acrobat Reader (nunmehr Adobe Reader) ich benötige. Und auch hier geschieht das nur zum Nutzen der Nutzer …

Was folgt aus diesem kleinen Exkurs? Will ich Dateien mit anderen teilen oder anderen zur Verfügung stellen (ob via Internet, eMail oder Diskette), wähle ich ein Format, das die besten Chancen hat, vom anderen benutzt werden zu können: Also RTF für Text-Dateien, die niedrigste mögliche Version für PDF-Dateien, TIFF oder JPG für Bilder und auch sonst immer ein Standard-Format, für das es zumindest kostenlose Betrachter-Programme (sogenannte Viewer) gibt.

Alexander Florin: Alexander Florinein Kind der 70er • studierter Anglist/Amerikanist und Mediävist (M.A.) • wohnhaft in Berlin • Betreiber dieses Blogs zanjero.de • mehr über Alexanders Schaffen: www.axin.de ||  bei Google+ || auf Twitter folgen

3 Kommentare

  1. Das ist nun schon der zweite Text, den ich hier lese, der sich mit den Unterschieden zw. Windows NT- und MacOS-Systemen befasst.
    Es ist ja vollkommen in Ordnung, dass Sie sich für Produkte aus dem Hause Apple entscheiden und diese auch verteidigen wollen (warum auch immer Sie sich dazu gezwungen fühlen!?). Aber dass Sie über ein – für Sie – fremdes Produkt herziehen, erschließt sich mir nicht. Wieso setzen Sie so viel Energie ein, um derart lange Texte zu verfassen, die sich selbst „entlarven“. Inhaltlich nicht nur persönlich gefärbt (das ist Ihr gutes Recht!), sondern dazu noch vielfach unbegründet bis falsch! Da dieser Text 2006(!) – ich beziehe mich ab jetzt nur noch auf diesen Artikel – verfasst wurde, gehe ich davon aus, dass Ihnen die NT-Systeme – vom Namen her – bekannt sein sollten! Wie können Sie behaupten, dass Windows nur Dateiendungen der Länge DREI verwalten kann? Wie können Sie (indirekt) behaupten, dass Windows nicht mit Punkten und Sonderzeichen in Dateinamen umzugehen weiß? Dieser Text ist ein Produkt aus Unwissenheit und Schlampigkeit. Auch wenn Sie vllt. nicht den Anspruch wissenschaftlicher Publikationen an Ihre Texte haben, so sollten diese trotzdem frei von „Konflikten“ sein, wenn sie schon Fehler bei anderen suchen. Wie ist es denn zu erklären, dass es „*.docx-Dateien“ gibt, wenn Windows doch nur (genau) drei Stellen für die Dateiendung erwartet?! So etwas passiert aber vielen. Oft sind das Leute, die bei Gegenüberstellungen Unterschiede herauspicken und anhand ihres eigenen Favoriten „abwägen“.

  2. Dieses Datei-Endungs-Problem (Beschränkung auf drei Zeichen) ist zu diesem Zeitpunkt deshalb noch relevant, da – zumindest in meinem Bekanntenkreis – nicht wenige Menschen noch mit Windows 98 arbeiteten. Dieses hatte aufgrund seiner DOS-Wurzeln und Nicht-UTF8-Fähigkeit auf Systemebene eben Probleme mit Sonderfällen wie langen Dateiendungen oder Sonderzeichen im Dateinamen. Aus Kompatibilitäts- oder Kooperationsgründen war man also auf Dateinamen und -endungen angewiesen, die sich am kleinsten gemeinsamen Nenner (keine Sonderzeichen, drei Zeichen) orientieren, und docx erwähne ich ja durchaus … Aber mal versucht, eine docx-Datei auf einem Windows-98-PC zu öffnen? (eben, docx ist für Post-98-Computer).

    Dass ich mich auf Windows-NT-Systeme beziehe, erwähne ich gar nicht, sondern verwende „Windows“ ganz allgemein. Und da zu diesem Zeitpunkt Dateiendungen in der Wahrnehmung der meisten aus drei Zeichen bestehen, habe ich das zur Anschaulichkeit einfach an den Anfang gestellt. Die Zielgruppe des Beitrags sind auch weniger Informatiker als vielmehr Menschen, die im Alltag in einer damals bestehenden wilden Computerlandschaft (Windows 98, NT, XP, Mac, Linux) irgendwie mit Dateien umgehen wollen/sollen/müssen. Ja, 2006 galten für viele die genannten Einschränkungen bei Dateinamen und -endungen nicht mehr. Aber mal versucht, eine mit russischen Zeichen benamste Datei in einem deutschen Windows XP zu verwenden? Oder mit japanischen Zeichen? Kann zu lustigen Verwicklungen führen … Auch Windows NT (und XP) haben zahlreiche Beschränkungen und Probleme bei Dateinamen, die im „normalen“ Alltag allerdings seltener auffielen. Merkt man spätestens, wenn man Dateioperationen über die Kommandozeile oder Skripte erledigt. Aber ich wollte ja auch keine Typologie von Dateiendungsproblemen schaffen.

    Jedenfalls ist es im Alltag meist hilfreicher, sich an eine zu enge Begrenzung zu halten als davon auszugehen, dass alle Computer völlig frei bei Dateinamen und -endungen sind. Dass selbst heute die Dateinamen nicht völlig frei gewählt werden können, erkennt man, wenn man Dateien mit Leerzeichen oder Sonderzeichen im Dateiamen auf einige Webserver hochlädt.

    Dass MacOS inzwischen auch zu Zwangs-Dateiendungen umgeschwenkt ist, halte ich persönlich (u.a. wegen Manipulierbarkeit, versehentlich oder beabsichtigt, aus Unwissenheit oder Schadensabsicht) für falsch. Das klassische Mac-System (bis MacOS 9) konnte seine Vorteile (beliebige Zeichen im Dateinamen, keine -endungen) auch nur ausspielen, solange man in der Mac-Welt blieb. Mit MacOS X kam dann die volle UTF-8-Fähigkeit für alle Belange – auch auf der Kommandozeile (die es ja im klassischen Mac-System nicht gab).

    Bei aller berechtigten Kritik an der Vereinfachung zu Anfang aus Anschaulichkeitsgründen ist das eigentliche Thema des Beitrags aber ein ganz anderes: Wie erkennt der Computer, um welche Art Datei es sich handelt: durch eine Datei-Endung (die manipuliert werden kann) oder durch eine Meta-Information, die der Computer für den Nutzer anlegt und verwaltet. Und wie kann sichergestellt werden, dass eine Datei über Computergrenzen hinweg genutzt werden kann.

    Dieser Beitrag ist für eine Kritik an meiner Einseitigkeit der Darstellung ziemlich ungünstig ausgewählt, da gibt es in meinem Fundus jede Menge bessere Beispiele, in denen ich tatsächlich das Hohelied auf Mac singe und Windows verspotte; dagegen fällt dieser schon in die Kategorie „sachlich“ ;-)

  3. Pingback: Mac versus Windows | zanjero.de

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

*

This site uses Akismet to reduce spam. Learn how your comment data is processed.