Was beim Surfen geschieht

Was beim einfachen Surfen im Internet im Hintergrund geschieht, ist beeindruckend. Nicht nur für Freaks und Nerds und um den Datenschutz Besorgte kann dieses Wissen aufschlussreich sein. Ein kleines Glossar erläutert die wichtigsten Begriffe.

Anonymität gibt es nicht. Genauso wie man im realen Alltag immer Gefahr läuft, dass einen jemand erkennt, wenn man an Orten ist, wo man lieber nicht sein sollte, so besteht die Gefahr im virtuellen Alltag umso mehr. Jedoch ist es im Internet keine Gefahr, sondern eine Tatsache.

Jeder Webserver speichert Daten von seinen Besuchern – dieser hier nicht ausgenommen. Diese Daten enthalten beispielsweise die IP-Adresse des Rechners, der die Internetseite besucht, den Namen und die Versionsnummer des Browsers, das Betriebssystem, von welcher Internetseite aus der Besucher kommt, welchen Internetanbieter er hat und einiges mehr. Das ist keine Bösartigkeit, sondern je nach Sichtweise entweder eine technische Notwendigkeit oder einfach Gewohnheit.

Zahlreiche Gerichte haben beschlossen, dass IP-Adressen personenbezogene Daten darstellen und daher nur im Bedarfsfall und mit Erlaubnis des Nutzers gespeichert werden dürfen. Eine höchstrichterliche Entscheidung gibt es bislang aber nicht.

Viele Webserver in Deutschland sind dazu übergegangen, die IP-Adressen nur noch anonymisiert abzuspeichern, dabei werden meist die letzten Stellen unkenntlich gemacht. Ob ein Webserver die Daten erhebt oder nicht, kann der Surfer nicht erkennen. Insbesondere bei Unternehmen mit Firmensitz außerhalb Deutschlands oder bei Webservern, die nicht in Deutschland stehen, sollte der Surfer davon ausgehen, dass die Daten gespeichert werden. Google als weltgrößter Datensammler geht mit schlechtem Beispiel voran und anonymisiert die Daten erst nach einigen Monaten.

Interessante Informationen

Der Besitzer des Webservers und damit der besuchten Internetseite hat den Vorteil, diese Daten auswerten zu können und beispielsweise zu erkennen, welchen Browser seine Besucher einsetzen, von welcher Suchmaschine sie kommen, welche Inhalte besonders oft und welche besonders selten genutzt werden. Vor allem erkennt er, wie lange Nutzer seine Angebote nutzen und ob sie wiederkehren. Das sind hilfreiche Informationen, um eine Internetseite zu verbessern und an die Bedürfnisse der Besucher anzupassen.

Aber wieso werden diese Daten eigentlich erhoben – beim Besuch eines Geschäftes will ja auch niemand all diese Daten erheben. In manchen Geschäften wird man beim Bezahlen nach seiner Postleitzahl gefragt, Kameraüberwachung ist häufig selbstverständlich – die Geschäftsbetreiber hätten diese Informationen gern, doch ist die Beschaffung dieser Daten eher aufwändig.

Im Internet wird jede Internetseite von einem Webserver bereitgestellt, der eine eindeutige IP-Adresse hat. Damit sich die Nutzer nicht diese Zahlen merken müssen, gibt es Domain Name Server (DNS), wo man einer IP-Adresse einen Domain-Namen zuordnen kann. Der Seitenbetreiber weiß mitunter nicht einmal, welche IP-Adresse seine Internetseite hat, da ein Webhoster diese Anmeldung für ihn übernimmt.

Daten unterwegs

Möchte jetzt jemand auf die Seite www.zanjero.de (auch Domain genannt), so schreibt er einfach diese Buchstaben in die Adresszeile seines Browsers. Der Browser fragt bei einem DNS nach, wo die Seite liegt (also welche IP-Adresse der Server hat), und holt sich dann von dort die Daten, um sie darzustellen. Bei vielen Internetseiten werden die anzuzeigenden Seiten erst beim Aufrufen generiert; ein Content Management System (CMS) verwaltet die Inhalte der Seite und das Layout. Einige Internetseiten optimieren ihre Layouts für verschiedene Browser – daher erhalten die Nutzer unterschiedlicher Browser mitunter optimierte Layout-Anweisungen.

Der Webserver und der Rechner des Besuchers kommunizieren also für einen Moment direkt miteinander (natürlich über diverse Datenknotenpunkte und Netze hinweg). Daher erfährt der Webserver die IP-Adresse des Besucherrechners – schließlich soll er die Daten ja nicht an den falschen Rechner schicken. Aus der IP-Adresse kann der Webserver den ungefähren Standort des Surfers ableiten und beispielsweise gleich die korrekte Sprache verwenden.

Wie in einem Unternehmen, wo jeder Postaus- und -eingang protokolliert wird, führt auch der Webserver genau Buch über alle Kommunikationspartner. Doch nur, wenn der Surfer zustimmt und der Grund für die Speicherung der IP-Adressen genannt wird, darf er – so zumindest die Auffassung zahlreicher, nicht aller, Gerichte – die IP-Adresse speichern. Für die statistische Auswertung genügt auch die anonymisierte IP-Adresse. Doch wie die meisten Datenschutzgesetze ist auch diese Anforderung ein zahnloser Tiger, es ist nicht gewährleistet, dass sich alle Webserver daran halten. Jedenfalls für die Dauer der Kommunikation mit dem Rechner des Surfers weiß der Server genau, welche IP-Adresse dieser hat – die Anonymisierung erfolgt erst beim Eintrag ins „Logbuch“ bzw. die Eintragungen im „Logbuch“ werden erst nach einer gewissen Zeitspanne anonymisiert.

Der Internetseiten-Betreiber kann bestimmte Nutzer von seiner Seite ausschließen; zumindest kann er IP-Adreesen oder -Adressbereichen oder Suchmaschinen oder Nutzer bestimmter Internetanbieter den Zugriff verweigern. Schließlich ist es sein Webserver (bzw. er hat ihn gemietet), und niemand kann ihn zwingen, jedermann seine Dateien anschauen zu lassen. Denn letztlich sind Internetseiten nichts anderes als Dateien auf fremden Rechnern, für die bestimmte Regeln gelten – wobei niemand gezwungen ist, sich an diese zu halten, jedoch kann er dann nicht sicher sein, dass die Besucher etwas mit seinen Inhalten anfangen können.

Warnung

Anonymität ist also keinesfalls gegeben, denn der Webserver weiß ganz genau, wann ein Rechner mit einer bestimmten IP-Adresse (die ja einmalig ist) eine Datei anfordert. Die IP-Adresse gibt dabei Rückschluss auf den Internet-Anbieter – spätestens der kann in seinen Protokollen nachschauen, wann er diese welchem Rechner oder Kunden zugeordnet hatte. Neben dem Anonymisierungsgebot gibt es noch das Gebot, Verbindungsdaten für einen längeren Zeitraum zu speichern. Stimmt der Nutzer – beispielsweise bei einem Online-Shop oder Internet-Forum – der Speicherung seiner IP-Adresse zu, kann über die Verbindungsdaten des Providers die Person, oder zumindest der konkrete Anschluss oder Computer, ermittelt werden. Speichert der Server aus Gewohnheit oder in Ignoranz der deutschen Gerichtsurteile die IP-Adresse sowieso, ist das Verfahren das selbe, nur dass der Nutzer nicht weiß, dass seine Daten gespeichert werden.

Theoretisch ist es also möglich, genau nachzuvollziehen, welche Internetseiten von einem bestimmten Rechner aus wann besucht wurden. Die daraus gewonnen Personenprofile – denn meist nutzt immer nur die selbe Person oder Personengruppe einen Computer – können sehr aufschlussreich sein und sehr viele Dinge über diese Person mitteilen. Google ist berüchtigt, alle Daten en masse zu sammeln, woraus sich dann leicht Profile ableiten lassen. Solche Profile können selbst Personen überraschen, die glaubten, den Profilierten sehr gut zu kennen.

Da der Aufwand zur Profilerstellung jedoch recht hoch ist und die Internetanbieter nur staatlichen Organen die Zuordnung der Daten zu konkreten Personen ermöglichen dürfen, ist die Gefahr nur theoretischer Natur. Dennoch sollte sich niemand in Sicherheit wiegen. Fälle, wie falsche Einträge in der Wikipedia oder beleidigende Forenbeiträge, können schnell problematisch werden, denn aus der IP-Adresse lässt sich bereits der Verdächtigenkreis deutlich einengen.

Anonymiserungsdienste fungieren wie ein Router, und die darüber surfenden Rechner, bleiben gegenüber dem Internet unerkannt, müssen jedoch mit einer Verzögerung rechnen. Anonymisierungsdienst setzen jedoch das Vertrauen der Nutzer voraus, dass sie nicht mitteilen werden, welcher Rechner zu welchem Zeitpunkt über diesen Dienst wohin unterwegs war.

ABC der verwendeten Fachbegriffe

Browser. Programm, das die Inhalte im Internet anzeigt. Populär sind Mozilla Firefox, Internet Explorer, Safari, Opera; es gibt noch zahlreiche Browser, deren Marktanteil jedoch verschwindend gering ist. Eine Internetseite besteht nur aus Beschreibungen – die man sich über den Browsermenüpunkt „Quelltext anzeigen“ ansehen kann –, die der Browser erst interpretieren muss, um dann die Seite so anzuzeigen, wie sie vorgesehen ist. Da nicht alle Browser jede Anweisung identisch interpretieren, gibt es mitunter Abweichungen in der Darstellung.

CMS (Content Management System). Man kann alle Inhalte eines Internetauftrittes statisch anlegen – wie Textdokumente mit der Textverarbeitung. Spätestens, wenn regelmäßig Aktualisierungen vorgesehen sind, lohnt sich ein CMS. Dieses besteht aus Datenbanken für den Inhalt und Layoutvorschriften. Wenn ein neuer Text eingestellt wird, muss der Autor nicht mehr an das Layout denken, sondern trägt seinen Text in einem Textfeld ein, und das CMS integriert diesen automatisch in den Internetauftritt und kümmert sich auch um die Aktualisierung der Navigation und der Verlinkungen.

DNS (Domain Name Server). Die DNS ordnen den Internet-Domains (also den www.xxx-Namen) die IP-Adressen der Webserver zu. Es gibt zahlreiche DNS auf der Welt, die redundant ausgelegt sind. In regelmäßigen Abständen werden die Eintragungen untereinander abgeglichen, sodass alle DNS auf ungefähr dem selben Stand sind. Der DNS wird vom Internetanbieter meist automatisch vergeben, idealerweise steht er in der Nähe des Surfers, sodass der Datenweg zur Abfrage kurz gehalten wird. Öffentliche Einrichtungen wie Universitäten betreiben häufig eigene DNS.

Domain. Der Name eines Internetauftrittes, beispielsweise www.zanjero.de. „www“ steht für das World Wide Web, das nur einen Teil des Internets ausmacht – wenn auch zugegebenermaßen den bekanntesten. Die am Ende des Domain-Namens stehende Top-Level-Domain (TLD) gibt das Herkunfts- oder Zuordnungsgebiet an: „.de“ für Deutschland, „.com“ für kommerzielle Angebote. Jede Domain darf nur einmal vergeben werden, wobei zanjero.de eine andere Domain ist als zanjero.com. Durch die technische Entwicklung ist der Zeichenvorrat, aus dem gültige Domain-Namen gebildet werden dürfen, erweitert worden: So sind inzwischen auch Umlaute und kyrillische Zeichen möglich. Da aber alle am Datenverkehr beteiligten Rechner, Datenknotenpunkte und Einrichtungen diese unterstützen müssen, ist die korrekte Übertragung nicht überall gewährleistet.

Internetseite. Auf dem Webserver liegen Hypertext-Dateien (HTML), Layout-Definitionsdateien (CSS), Grafiken und andere Elemente, die zu einer Webseite gehören. Auf Anfrage liefert der Webserver diese Dateien an den Browser, der aus ihnen die Internetseite zusammenstellt. Diese Internetseiten sind einer Domain zugeordnet, wo sie abgerufen werden können.

IP-Adresse. Jeder Rechner, der am Internet beteiligt oder dort unterwegs ist, erhält eine eindeutige Nummer zu Identifikation, die aus vier Dreiergruppen besteht. 192.168.12.128 wäre beispielsweise eine IP-Adresse aus dem Bereich, der für private Verwendung (der gesamte Bereich 192.168.x.x) reserviert ist. Beim Einwählen in das Internet (über Modem oder DSL) erhält der Rechner automatisch vom Internetanbieter eine IP-Adresse. Da die Anzahl der IP-Adressen begrenzt ist, wird seit einigen Jahren ein neuer Standard mit deutlich mehr eindeutigen Adressen (IPv6) forciert, der jedoch noch nicht komplett umgesetzt ist – am grundsätzlichen System ändert sich jedoch nichts, nur dass dann jedes Gerät seine eigene feste IP-Adresse besitzen könnte und keine dynamische Vergabe über den Internetanbieter mehr nötig ist.

Router. Ist quasi ein reduzierter Computer, der zwischen zwei Netzwerken vermittelt. Auf der einen Seite hält er die Verbindung zum Internet, auf der anderen zum privaten Netzwerk, das mitunter auch nur aus einem Computer besteht. Wählt sich ein Internetrouter ein, erhält er eine IP-Adresse, und die an diesem Router angeschlossenen Computer sind aus der Sicht des Internet mit der Router-IP-Adresse im Netz; egal welche IP-Adresse sie tatsächlich haben. Der Vorteil von Routern im privaten und kleinen Bereich besteht darin, dass mehrere Rechner sich darüber eine Internetverbindung teilen können.

Webserver. Der physische Ort, wo die Internetseite liegt. Das kann ein Rechner in der Nachbarschaft oder am anderen Ende der Welt sein – für den Besucher ist es egal. Bei oft genutzten Webseiten teilen sich mehrere Server die Anfragen; private Internetseiten liegen oft gemeinsam auf einem Webserver – für den Besucher ist auch das egal, solange seine Anfrage bzw. sein Besuchswunsch ohne nennenswerte Verzögerung erfüllt wird, ist alles in Ordnung. Unterhalb des Domain-Names kann der Internetseiten-Inhaber eine komplexe Dateistruktur anlegen, die der auf einer normalen Festplatte entspricht. Denn letztlich sind Internetseiten nichts anderes als Dateien, die man sich auf einem fremden Rechner anschaut.

Interessante Informationen

Daten unterwegs

Warnung

ABC der verwendeten Fachbegriffe

Schreibe einen Kommentar