You are here

Datenhoheit: Was passiert mit meinen Daten?

Ob im Web 2.0 oder bei anderen "shared services": überall geben wir unsere eigenen Daten vertrauensseelig aus der Hand. Warum machen wir das? Was passiert eigentlich mit den Daten? Müssen diese Daten aus technischen Gründen wirklich unbegrenzt gespeichert werden? Das Beispiel einer Installation von etherpad zeigt: wenn der Wille da ist, ist der technische Aufwand sehr gering.

Termine finden, gemeinsam einen Text erstellen, in der Gruppe etwas ausdiskutieren, den neusten Klatsch austauschen, Informationen weitergeben oder die Bilder von der Feier am Wochenende vorzeigen - alles dies machen wir heute über das Internet. Große und kleine Websites bieten uns ihre Hilfe an. Wir selber spielen alle gerne mit diesen neuen Angeboten und empfehlen sie weiter. Dieser Trend der letzten Jahre wird oft auch als "Soziales Netzwerk" oder "Web 2.0" bezeichnet .

Wir sind aber nicht wirklich flexibel bei der Auswahl und der alltäglichen Nutzung dieser Dienste. Man hört gerade und insbesondere von Marktführern oft "die Konkurrenz ist nur ein Mausklick entfernt" und "wir werden nur wegen unserer Qualität so gerne genutzt". Diese abgenutzten Phrasen mögen vielleicht in Teilen für den Bereich des E-Commerce gelten. Sie stimmen aber schon weniger für Nachrichten und Medien und ganz und gar nicht für die Soziologie. Wie oft gehen wir doch wieder in die selbe verräucherte Kneipe mit der selben unfreundlichen Bedienung und dem immer gleichen schalen Bier, nur weil wie hoffen, dort unsere Freunde und Bekannten zu treffen.

Wir wählen unsere Dienste nicht nach Qualität sondern nach der Bequemlichkeit und der Verbreitung in unserem Bekanntenkreis. Unsere sozialen Bindungen führen uns zu wenigen Anbietern im Internet und gerade die Auswertung dieser Bindungen stellt für die großen Anbieter die Grundlage ihres wirtschaftlichen Erfolges dar.

Die meisten Webangebote sind für die Nutzer kostenfrei. Da uns Nutzern schon klar ist, dass der Dienst den Betreibern Geld kostet, trösten wir uns mit der Vermutung, dass das Angebot sich durch "Werbung" finanziere. Der Betreiber des Dienstes stellt Werbeflächen bereit, d.h. Platz zur Darstellung von Anzeigen. Ob das zur Refinanzierung der Kosten reicht, ist nicht immer sicher. Entscheidend ist, ob es überhaupt eine passende Anzeige für die Werbefläche gibt. Eine Litfaßsäule im Innenhof bringt vermutlich kein Geld ein.

Welche Anzeige wo dargestellt wird, entscheidet der Vermarkter der Werbeflächen. Es gibt für die Vermarktung im Internet nur noch wenige große Anbieter. Für diese Vermarkter ist unser soziales Umfeld von entscheidendem Wert, da es ihnen erlaubt, die für uns vermutlich passende Werbung zielsicher auszuwählen. Wenn unsere Bekannten die Werbung angeklickt haben, sind wir vielleicht auch interessiert. Die Zielsicherheit der modernen Internet-Werbung und der Produktempfehlungen bei Online-Händlern ist ein Beispiel dafür, wie viel sich praktisch aus unseren Nutzungsdaten ermitteln lässt. Die Währung mit der wir die "kostenlosen" Dienste bezahlen sind selten harte Euros, sondern die Preisgabe der Daten von uns, unseren Freunden, Kollegen und Bekannten.

Die Informationen über unser soziales Umfeld stellt einen gemeinschaftlichen Wert dar. Dabei muss bei der Auswertung der Daten noch nicht einmal eine individuelle Nutzersitzung oder ein individuelles Dokument automatisiert vom Computer verstanden werden. Es reicht aus, statistische Quervergleiche zu ziehen. Je größer die herangezogene Datenmenge ist, desto besser ist die Vorhersage. Das erklärt auch, warum Anbieter von Web 2.0-Diensten so ungern irgendwelche Daten automatisiert löschen. Was ich heute noch nicht verstehe, kann mit dem Wissen von Morgen an Wert gewinnen.

Ein Beispiel für die "endlose" Datenspeicherung ist/war etherpad.com (http://etherpad.com/ep/about/faq#lifetime) von AppJet Inc. Bekannt geworden ist das Unternehmen dadurch, dass es zuerst von Google in einem Whitepaper zu Google Wave als Wettbewerber genannt wurde (http://etherpad.com/ep/about/faq#lifetime, http://etherpad.com/ep/blog/posts/google-wave-joins-etherpad) und dann von Google übernommen wurde (http://www.heise.de/newsticker/meldung/Google-kauft-Etherpad-und-schlies...). Der nun frei verfügbare Programmcode untermauert die offizielle Aussage von AppJet: eine Löschung alter Daten war nie vorgesehen. Der technische Aufwand zur Implementierung einer automatischen Löschung ist sehr gering (s.u.). Die Erstellung des entsprechenden Moduls hat mich bei http://etherpad.netluchs.de nur wenige Stunden Arbeit gekostet. Die Löschung war aber bei etherpad.com unternehmerisch nicht gewünscht oder die Bedeutung der Speicherung nicht durchdacht.

Als Nutzer will ich auf die Bequemlichkeit des Web 2.0 nicht verzichten. Damit bin ich aber immer auch bereit, Daten von mir, meinen Freunden und Kollegen Preis zu geben. Daraus resultiert aber auch, dass ich die Verantwortung für die erzeugten Daten tragen muss. Ich muss mir immer bewusst machen, wem ich die Daten überlasse und wie lange sie von wem eingesehen und genutzt werden. Dienste, die erfasste Daten ganz oder teilweise wieder vergessen sind mir daher besonders sympathisch.

Etherpad.com soll im März geschlossen werden. Falls Sie das Werkzeug weiterhin nutzen wollen, lade ich Sie ein, http://etherpad.netluchs.de/ zu nutzen. Ihre dort erstellten Texte löscht der Rechner 30 Tagen nachdem Sie das letzte Wort getippt haben. Probieren Sie es aus.

Themen: 

Kommentare

Ohne Gewähr folgen die Anweisungen, mit denen ich die öffentlichen Pads nach 30 Tagen automatisch lösche:


delete from PAD_AUTHORS_META where id in (select id from PAD_SQLMETA where lastWriteTime < (curdate() - INTERVAL 30 DAY) AND id NOT LIKE '%$%');

delete from PAD_AUTHORS_TEXT where numid not in (select numid from PAD_AUTHORS_META );

delete from PAD_CHAT_META where id in (select id from PAD_SQLMETA where lastWriteTime < (curdate() - INTERVAL 30 DAY) AND id NOT LIKE '%$%');

delete from PAD_CHAT_TEXT where numid not in (select numid from PAD_CHAT_META );

delete from PAD_REVMETA_META where id in (select id from PAD_SQLMETA where lastWriteTime < (curdate() - INTERVAL 30 DAY) AND id NOT LIKE '%$%');

delete from PAD_REVMETA_TEXT where numid not in (select numid from PAD_REVMETA_META );

delete from PAD_REVS_META where id in (select id from PAD_SQLMETA where lastWriteTime < (curdate() - INTERVAL 30 DAY) AND id NOT LIKE '%$%');

delete from PAD_REVS_TEXT where numid not in (select numid from PAD_REVS_META );

delete from PAD_REVS10_META where id in (select id from PAD_SQLMETA where lastWriteTime < (curdate() - INTERVAL 30 DAY) AND id NOT LIKE '%$%');

delete from PAD_REVS10_TEXT where numid not in (select numid from PAD_REVS10_META );

delete from PAD_REVS100_META where id in (select id from PAD_SQLMETA where lastWriteTime < (curdate() - INTERVAL 30 DAY) AND id NOT LIKE '%$%');

delete from PAD_REVS100_TEXT where numid not in (select numid from PAD_REVS100_META );

delete from PAD_REVS1000_META where id in (select id from PAD_SQLMETA where lastWriteTime < (curdate() - INTERVAL 30 DAY) AND id NOT LIKE '%$%');

delete from PAD_REVS1000_TEXT where numid not in (select numid from PAD_REVS1000_META );

delete from PAD_META where id in (select id from PAD_SQLMETA where lastWriteTime < (curdate() - INTERVAL 30 DAY) AND id NOT LIKE %$%');

delete from PAD_SQLMETA where lastWriteTime < (curdate() - INTERVAL 30 DAY) AND id NOT LIKE '%$%';

Ich bin gerade über http://twitter.com/piratenpad gestolpert: "Damit ich das Löschenfeatuere einbauen kann brauch ich die Patches die er gemacht hat. Weis nämlich auch gar nicht wo ich da ansetzen soll".

Man muss nichts am Code patchen! Man muss wirklich nur ein Skript bauen, das die Daten aus der Mysql-DB löscht. Es ist wirklich so einfach.

Ich bin gerne bereit zu helfen -> e-Mail reicht.

Neuen Kommentar schreiben