
About the talk: It has become very easy to create, publish, and collect data in digital form. The volume of structured and unstructured data is increasing at tremendous pace. This has led to a whole new set of applications that can be build if one solves the problem of turning raw data into valuable information.
Am 8. September, 2008 um 17 Uhr gibt es ein neues Hadoop get together im newthinking store in der Tucholskystr. 48 in Berlin.
This is going to be the second German Hadoop get together in Berlin. Just like last time there will be slots of 20min each for talks on your Hadoop topic. After each talk there will be a lot time to discuss. ...Talks scheduled so far:
- The topic of Marc Hofer's talk is: "UIMA scale-out with MapReduce using Apache Hadoop".
- Rasmus Hahn is going to share his experiences with Hadoop from the perspective of his projects at neofonie (http://www.neofonie.de).
Apache Hadoop is a free Java software framework that supports data intensive distributed applications running on large clusters of commodity computers.[1] It enables applications to work with thousands of nodes and petabytes of data. Hadoop was inspired by Google's MapReduce and Google File System (GFS) papers. Hadoop is a top level Apache project, being built and used by a community of contributors from all over the world[2]. Yahoo! has been the largest contributor[3] to the project and uses Hadoop extensively in its Web Search and Advertising businesses.[4] IBM and Google have announced a major initiative to use Hadoop to support University courses in Distributed Computer Programming. [5] Hadoop was created by Doug Cutting (now a Yahoo employee), who named it after his child's stuffed elephant. It was originally developed to support distribution for the Nutch search engine project.[6] (Wikipedia Version 16 August 2008, at 19:45, http://en.wikipedia.org/wiki/Hadoop)
Links:
[via Isabel Drost]
Freie Suchmaschinen sind kein schöner Traum, sondern eine Notwendigkeit für eine offene und freie Gesellschaft. Der Zugang zu Wissen und Informationen darf nicht ausschliesslich über Suchmaschinen verfolgen, die lediglich kommerziellen Privatinteressen verpflichtet sind und nicht dem Allgemeinwohl. Immer mehr scheint sich diese Ansicht auch in den Bibliotheken durchzusetzen. Auf einer Tagung des internationalen Dachverbands der Bibliotheksvereinigungen (IFLA) im Auswärtigen Amt zur Rolle der Bibliotheken in der Wissensgesellschaft äusserten sich auch Miriam Nisbet, Direktorin des Abteilung Informationsgesellschaft bei der UNESCO, und Johannes Fournier von der Deutschen Forschungsgemeinschaft (DFG) in diese Richtung.
Miriam Nisbet: "Googeln scheint den Zugang zu Wissen durch Bibliotheken zu untergraben" führte die US-Amerikanerin aus. Was diese Zugriffsmöglichkeiten aber erst wertvoll mache, sei die Plattform, über die sie erfolgen würden. Die Büchereien stünden auf dem Fundament der Idee der Freiheit und der Menschenrechte und hätten eine soziale Verantwortung. Daher müsse man fragen, ob "wir den Zugang zum Wissen überhaupt den Regeln des Marktes überlassen können". In diesem Falle würde die kulturelle Vielfalt verloren gehen, während sich soziale Ungleichheiten ausweiten würden, fürchtete Nisbet.
Auch Johannes Fournier von der Deutschen Forschungsgemeinschaft (DFG) sah die Gefahr einer digitalen Spaltung "auch in der Form, dass Bibliothekare verstärkt von Nutzern getrennt werden". Viele würden sich nur noch auf Suchmaschinen verlassen, während Professoren sich selbst im Netz zu Wissensanbietern entwickeln würden. Dem müssten die Bibliotheken das Katalogisieren und Verfügbarmachen von Informationen auf höchsten Niveau entgegenstellen. Dabei sollte die soziale Interaktion mit den Nutzern etwa über mit Web-2.0-Funktionen zur Bewertung von Informationsressourcen ausgebaut werden. (Stefan Krempl, 21.02.2008 17:02, http://www.heise.de/newsticker/meldung/103885)
Ich habe ein Interview mit Andrew Aitken bei der heise-Konferenz Open Source Meets Business gemacht. Andrew ist der Gründer und Managing Partner der Olliance Group und berät Firmen wie IBM, Microsoft, Motorola, große Banken oder auch die US Navy zu ihren Open Source-Strategien. Sein Fokus ist vor allem "Commercial Open Source". Nach Aitken ist Europa weltweit gesehen an der Spitze bei der Einführung von Open Source, nicht jedoch unbedingt bei der kommerziellen Verwertung von Open Source Software.
Videolink: http://video.google.com/videoplay?docid=1399202456228324192
Kamera: Stefan Koehler
Aitken: “I would say Asia is probably three years behind North America, and which is behind five years behind Europe. ... Europe is the leader in the adoption of Open Source, not necessarily commercial Open Source, but Europe is clearly the leader in the adoption of Open Source in general.”
Wie können wir diese Erkenntniss für die Einführung freier Suchmaschinen nutzen? Ich bin der Meinung, freie Suchmaschinen können wahrscheinlich nur über den kommerziellen Weg verstärkt in der "Google-Gesellschaft" Einzug halten. Das bedeutet, es müssen Produkte da sein, für die Firmen Subscriptions etc. kaufen können und die eine Alternative zur Googlesuche für Firmen darstellen. Aus den Einnahmen kann die weitere Entwicklung bezahlt werden. Leider konnte ich den Vortrag von Bernd Fondermann auf der Konferenz nicht verfolgen. Unter dem Titel "Mach es wie Google" sprach er über Apache Lucene.
"Apache Lucene bietet eine vollwertige Suchmaschine auf Java-Basis, die in Unternehmensanwendungen integriert werden kann. Subprojekte erweitern die Suchmaschine um Crawler, massive Skalierbarkeit und eine Server-Komplettlösung." (http://www.heise.de/events/2008/open_source_meets_business/listview/55/p...)
I followed a lightning talk of Georg Jähnig on serchilo.net at the 24c3 Chaos Communication Congress. The video is available now in the torrent network. I uploaded it to Google Video (please post alternatives as comments). Last year I already published an interview with Georg in German. He put quite a lot of work in improving the website and making it more international since then. Hope his ideas takes off even more in the upcoming year. Would be great to have him at the SuMa-eV congress this year as well.
Videolink: http://video.google.com/videoplay?docid=-5416119002471085549
Am Wochenende fand an der Jan van Eyck Academie ein Seminar zum französischen Suchmaschinenprojekt Quaero statt. Zuletzt hatte sich aus der niederländischen Kunstakademie vor sieben Jahren Richard Rogers mit dem Band "Preferred Placement. Knowledge Politics on the Web" zum Thema Suchmaschinen zu Wort gemeldet. Jetzt war es die Künstlergruppe Metahaven, die den "public think tank" initiierte. Im Laufe des zwei Tage langen Forums wurden viele interessante und kritische Fragen zur Suchmaschinenproblematik erörtert. Quaero selbst kam dabei nur sporadisch vor, denn noch weiß niemand, was eigentlich hinter diesem Projekt steckt.
Die Webseite des SuMa-eV Kongresses 2007 hat mittlerweile einen Status, den man als nahezu "fertig" bezeichnen kann (wirklich "fertig" ist imInternet ja nie etwas ;-) :
http://suma-ev.de/forum07
Ein großes DANKESCHÖN an alle, die durch Ihre Vorträge, Ihre Diskussionsbeiträge, Ihre Mitarbeit und durch Ihre Anwesenheit zum Erfolg des Kongresses beigetragen haben!
Sie finden auf der o.g. Webseite jetzt auch (fast) alle Vortragsinhalte, dazu viele Fotos, u.a. auch eine Diashow, die Herr Skobic dankenswerterweise produziert hat.
Während der Veranstaltung kam der Wunsch auf, ein email-Verzeichnis der Kongress-Teilnehmer anzulegen, um eine Kommunikation untereinander auf den Weg zu bringen. Bei email-Verzeichnissen müssen natürlich unsere "besonderen Freunde", die Spammer, im Auge behalten werden. Wir würden so ein Verzeichnis daher naürlich nur Passwort-geschützt anlegen.
Wenn Sie diesen Gedanken aufnehmen wollen, und Ihren Namen und email-Adresse in so ein Verzeichnis eintragen wollen, dann können wir das gerne einrichten. Mailen Sie mir also bitte, wenn Sie das wünschen.
Auch fuer weitere Vorschläge/Verbesserungen/Kritiken, insbesondere für kommende Veranstaltungen, sind wir natürlich jederzeit offen!
Neueste Kommentare
vor 2 Wochen 23 Stunden
vor 5 Wochen 1 Tag
vor 5 Wochen 5 Tage
vor 11 Wochen 6 Tage
vor 12 Wochen 21 Stunden
vor 12 Wochen 21 Stunden
vor 12 Wochen 21 Stunden
vor 12 Wochen 21 Stunden
vor 12 Wochen 22 Stunden
vor 12 Wochen 1 Tag