Eine kurze Geschichte der Informationsspeicherung

Ich habe ja vor einigen Tagen einen Artikel über die Probleme geschrieben, mit denen man es zu tun hat, wenn man mit Kunden ueber ZFS spricht. Es ist wirklich so, man muss sich diskreditieren, um die Diskussion darauf zu bringen, das die Art und Weise, wie wir heute mit “rotating rust” (das Problem ist allerdings medienunabhängig) umgehen eigentlich ein Problem für sich ist. Deswegen moechte ich eine kurze Geschichte der Information erzaehlen:
Wir glauben, das unsere Daten korrekt und richtig sind, nur weil wir sie auf ein nicht flüchtiges Speichermedium geschrieben haben. “Nicht flüchtiger Speicher” ist ohnehin ein etwas inkorrekter Begriff. Alle Speichermedien sind fluechtig. Die Frage ist nur, wie lange es dauert, bis sich die Daten verfluechtigt haben. Bei manchen Datenträgern reicht das Ausschalten der Energieversorgung, bei anderen Medien braucht es ein wenig Zeit. Aber irgendwann haben sich auch diese Daten verfluechtigt. Kassetten sprechen ueber, CD´s zersetzen sich, Papier zerfällt, Stein zerbroeselt und Festplatten entmagnetisieren sich.
Und was nicht durch die Zeit verloren geht, geht durch Fehler verloren. Auch wenn wir eigentlich durch den täglichen Umgang mit einem Desktop-Betriebsystemen aus Redmond gewarnt sein muessten, gehen wir immer noch davon aus, das Festplatten sichere Medien sind. Dabei läuft auch dort eine Software drin, die Fehler haben kann, einfach Fehler haben muss. Die Daten bewegen sich durch die CPU, durch den Arbeitsspeicher, durch Hostbus-Adapter, durch Kabel, durch den Raidcontroller einer Storagebox, durch weitere Kabel, durch den Controller, der auf der Unterseite der Festplatte verschaubt ist, um dann schlussendlich durch ein kompliziertes Konstrukt feinmechanischer Ingenieurskunst auf das Speichermedium geschrieben zu werden. Ein langer Weg voller Gefahren. Wir gehen davon aus, das es klappt … wenn wir risikoscheu sind, machen wir das ganze Zwei mal, weil wir uns denken, der Blitz schlaegt schon nicht zwei mal ein. Doch damit hatten wir ein Problem: Angenommen Moses I hätte geschrieben “Du sollst begehren keines nächsten Frau”, Moses II war kurz abgelenkt und haette geschrieben “Du sollst begehren deines nächsten Frau” … wie hätten wir wissen sollen, was korrekt ist. Wonach haetten wir uns richten sollen. Wir wissen es nicht. So mussten die beiden Moses wieder auf den Berg, um noch mal nachzufragen. Genauso kann ein Computer nicht wissen, ob an dieser Stelle ein d oder ein k stehen soll. Für Ihn ist beides nur menschlich-profanes Rauschen. Irgendwann wurden wir intelligenter, und haben unsere Daten verteilt und sie mit Informationen versehen, die uns die Wiederherstellung erlaubten … in bestimmten Fällen … holten uns dafuer aber neue Probleme …. wir schreiben auf unser Papier … jeweils ein Wort auf ein Blatt Papier. Und beim fuenften Wort fingen wir wieder bei der ersten Seite an. Und weil wir ordentlich waren, gab es einen ältern weisen Schreiberling, der die vier Wörter nahm und sich eine Eselsbrücke ausknobelte, mit der er sich merken konnte, was auf einer Seite stand, wenn diese mal verloren ging. Und weil das einigen immer noch nicht genug war, wurden irgendwann auch zwei ältere Schreiberlinge eingestellt, die jeweils unterschiedliche Eselbrücken erknobelten. Einen der weisen Schreiberlinge traf nach langen Jahren der Arbeit der Schlag und er fiel tot um. Nun wusste aber niemand, ob er schon die neue Eselsbrücke hingeschrieben hatte, oder ob noch die alte das Blatt fuellte. Was war richtig. “Du sollst begehren keines nächsten Frau” und “Yeah, rumpimpern” wollten nicht so recht zueinander passen. Was war nun richtig. Wonach sollte man sich richten ? Und wieder musste man auf den Berg, um noch mal nachzufragen. Wie man sieht: Die Probleme sind universell und uralt. Sie sind aber sehr aktuell: asynchrone Spiegel und RAID-5 write hole nennen sich diese Probleme in die heutige Zeit uebertragen. Und mit jedem Jahr das wir technisch fortschreiten, wird das Problem offensichtlicher. Wir vertrauen unsere Daten einem Konglomerat aus Systemen an, das wir nicht wirklich ueberschauen, und dennoch halten wir uns kein As im Ärmel, haben keinen Plan B, um immer an die korrekten Daten zu kommen. Wir schreiben die Daten an viele Stellen gleichzeitig, um uns sicher zu fühlen, das wir irgendwo schon das richtige stehen haben. Doch beweisen können wir es nicht. Wir vertrauen unsere Erinnerungen, unsere Zivilisation etwas an, das zwangsweise unter der technologen spongioformen Encephalopathie leidet. Und genau das ist der Punkt, an dem das Zettabyte Filesystem einsetzt: Es lebt damit, das jeder Informationsträger letztlich fluechtig ist. Es lebt damit, das die Informationswege unsicher sind. Das Informationen ein hoechst empfindliches Gut sind. Zu wertvoll, sie ohne eine Leibgarde zu Ihrem Schutz irgendwo hin zu lassen. Die Schreiberlinge verwenden immer ein neues Blatt, wenn sie etwas schreiben sollen. und berichtet dies dem Oberschreiberling mit, der ein auf einem neuen Blatt diese Änderung verzeichnet und die Rolle vermerkt, auf der das neues Gebot steht, der dies wieder dem obersten Schreiberling mitteilt. Mit gewaltiger Stimme sagt dieser dann “So sei es” und so ist es dann. Und erst jetzt ist gewiss “Du sollst begehren keines nächsten Frau”. Doch die Schreiberlinge des Herrschers Z. Efes waren noch weiser. Der alte Schreiberling ueberlegte sich fuer jedes Blatt eine Eselbruecke. Länger und stärker als zuvor und uebergab sie an den Oberschreiberling. Und der schrieb sie an eine andere Stelle, weitab vom Text . Selbst wenn Blatt kaum noch lesbar war, konnte man nun an anderer Stelle nachgucken, ob man richtig gelesen hatte. Und sogar eine Nachschrift anfertigen, von der man wusste, das sie richtig war. Und so stehen wir vor einer Zukunft, die nicht mehr eine Zeit des digitalen Vergessens ist, weil wir irgendwann nicht mehr wissen, ob die Information auf ihrem Weg durch die Zeit an Korrektheit eingebuesst hat.