Das digitale Wissen der Welt soll im Internet für jede/n erreichbar sein. Suchmaschinen sind ein wichtiger Weg, es erreichbar/er zu machen. Weitere Instrumente, wie soziale Netze, folgen. Diese Wege sind so wichtig, dass wir
2004 den SUMA-EV gegründet haben, um freien Wissenszugang sichern zu helfen.

Echo zum SuMa-Kongress

Der SuMa-Kongress vom 25.09.08 hat bereits an ein paar Stellen im Netz Beachtung gefunden.

Politik zeigt keine Sensibilität für Suchmaschinen-Quasimonopol

"Suchmaschinen sind die zentralen Instrumente der
Informationsgesellschaft und damit wesentlicher Bestandteil der IT- und
Medien-Politik", so ein Leitgedanke des diesjährigen 5. Suchmaschinen
Kongresses in Berlin. Highlights der Veranstaltung am 25.9.08 waren
neben den gewohnt qualifizierten und vielfältigen Fachvorträgen die
erstmalige Verleihung der Suma Awards 2008 durch den MP3-Erfinder
Professor Karlheinz Brandenburg und die Podiumsdiskussion der
medienpolitischen Sprecher/innen aller Fraktionen des Deutschen
Bundestages zu ihren IT-politischen Zielen.

Thema der Podiums- und Plenumsdiskussion war "die Zukunft der digitalen
Informationsgewinnung in Deutschland". Hierzu waren die
medienpolitischen Sprecher/innen Dorothee Bär für die "CDU/CSU", Heiko
Hilker i.V. von Prof. Dr. Lothar Bisky für "DIE LINKE", Malte Spitz
i.V. von Grietje Staffelt (geb. Bettin) für "BÜNDNIS 90/DIE GRÜNEN",
Jörg Tauss für die "SPD" und Christoph Waitz für die "FDP" auf dem
Podium vertreten. Die Parteienvertreter stimmten darin überein, dass
Suchmaschinen eine zentrale Funktion im Internet haben. Im Hinblick auf
die quasimonopolistische Struktur des Suchmaschinemarktes wird von
politischer Seite jedoch kein Handlungsbedarf gesehen, auch nicht in
Anbetracht von 90% Marktanteil eines einzigen Anbieters.

Während die Regierungsparteien auch generell zum Thema Suchmaschinen
wenig Handlungsbedarf sehen, betonte insbesondere der Vertreter der
Partei "DIE LINKE" die Notwendigkeit eines transparenten Schutzes von
Nutzerdaten. Aus dem Publikum wurde u.a. mehrfach gefordert, die
Haftungsfrage von Suchmaschinen-Betreibern endlich gesetzgeberisch zu
regeln.

Ein weiterer Höhepunkt des diesjährigen SuMa-eV Kongresses in der
niedersächsischen Landesvertretung in Berlin war die Preisverleihung
der erstmals ausgelobten SuMa Awards 2008. Die Jury hatte sich bewusst
nicht für einen einzelnen Preisträger oder ein bestimmtest Fachgebiet
entschieden, sondern parallel zu den gesellschaftlich vielschichtigen
Wirkungen von Suchmaschinen die Preise auf drei Bereiche verteilt:
Suchmaschinentechnik (www.opportuno.de), Medienkunst (www.oamos.de) und
Musik. In seiner ausführlich auf die Preise eingehenden Laudatio
brachte Prof. Karlheinz Brandenburg diese Vielschichtigkeit deutlich
zum Ausdruck. Der Live-Auftritt der Musiker mit dem "Lied vom
Datenkraken" ist im Internet zu sehen und zu hören unter
http://vimeo.com/1817137

Der Geschäftsführer des SuMa-eV, Dr. Wolfgang Sander-Beuermann,
kündigte an, die SuMa Awards auch 2009 in ähnlicher Weise fortzuführen,
denn die Awards sind wichtiger Bestandteil einer fortgeschrittenen
Auseinandersetzung mit den fundamentalen Problemen der
Informationsgesellschaft. Die detaillierten Ausschreibungsbedingungen
mit den Daten für 2009 werden in Kürze unter http://suma-awards.de
erscheinen; die Inhalte der Fachvorträge werden ebenfalls demnächst
über die Webseite des Kongresses abrufbar sein:
http://suma-ev.de/forum08.



Wolfgang Sander-Beuermann

Themen: 

Johannes Schlooter ist Google

In einem Beitrag zum 10. Geburtstag der Firma Google verrät das Satiremagazin ExtraDrei einiges über den Kopf, der hinter der Suchmaschine steht. Der Film kann unter http://www3.ndr.de/ndrtv_pages_video/0,,SPM2362_VID4963978,00.html angeschaut werden.

Themen: 

Hadoop Meet up in Berlin

Hadoop LogoAm 8. September, 2008 um 17 Uhr gibt es ein neues Hadoop get together im newthinking store in der Tucholskystr. 48 in Berlin.
This is going to be the second German Hadoop get together in Berlin. Just like last time there will be slots of 20min each for talks on your Hadoop topic. After each talk there will be a lot time to discuss. ...

Talks scheduled so far:

  • The topic of Marc Hofer's talk is: "UIMA scale-out with MapReduce using Apache Hadoop".
  • Rasmus Hahn is going to share his experiences with Hadoop from the perspective of his projects at neofonie (http://www.neofonie.de).
Apache Hadoop is a free Java software framework that supports data intensive distributed applications running on large clusters of commodity computers.[1] It enables applications to work with thousands of nodes and petabytes of data. Hadoop was inspired by Google's MapReduce and Google File System (GFS) papers. Hadoop is a top level Apache project, being built and used by a community of contributors from all over the world[2]. Yahoo! has been the largest contributor[3] to the project and uses Hadoop extensively in its Web Search and Advertising businesses.[4]IBM and Google have announced a major initiative to use Hadoop to support University courses in Distributed Computer Programming. [5] Hadoop was created by Doug Cutting (now a Yahoo employee), who named it after his child's stuffed elephant. It was originally developed to support distribution for the Nutch search engine project.[6] (Wikipedia Version 16 August 2008, at 19:45, http://en.wikipedia.org/wiki/Hadoop)

Links:

- http://hadoop.apache.org

[via Isabel Drost]

Preisträger der SuMa Awards 2008 stehen fest

MP3-Erfinder Prof. Karlheinz Brandenburg nimmt Preisverleihung vor

Die Preisträger der in diesem Jahr erstmals vergebenen SuMa Awards
stehen fest. Sie wurden von einer Jury des SuMa-eV aus den Bereichen
Suchmaschinentechnik, Medienkunst und Musik ausgewählt. "Da lenkbare
digitale Informationsströme in alle Ebenen der (Wissens)-Gesellschaft
wirken, sind die Preise in sehr unterschiedliche Bereiche vergeben
worden", so Dr. Wolfgang Sander-Beuermann, Geschäftsführer des SuMa-eV.

Die Verleihung der SuMa Awards 2008 wird vom MP3-Erfinder und Direktor
des Instituts für Medientechnik der TU Ilmenau, Prof. Karlheinz
Brandenburg, beim SuMa-eV Kongress am Donnerstag, den 25. September
2008 in Berlin vorgenommen (http://suma-ev.de/forum08/).
Die SuMa Awards sind Förderpreise für den freien Wissenszugang, die zum
ersten Mal 2008 verliehen werden. Sie zeichnen Arbeiten oder Projekte
aus, die praktische oder theoretische Aufgabenstellungen, Lösungen oder
Probleme im Umgang mit dem digitalen Weltwissen aufgreifen und einer
breiten Öffentlichkeit anschaulich präsentieren. Die SuMa Awards werden
vom SuMa-eV zusammen mit dem Bundesverband Deutscher Internet-Portale
(BDIP) als neue Förderpreise für Suchmaschinen und ihr gesamtes Umfeld
zukünftig jährlich vergeben. Die Preise sind mit jeweils 2.500,-EUR
dotiert.

Die Preisträger der SuMa Awards 2008 sind:

- In der Suchmaschinentechnik:
http://www.opportuno.de von Michael und Andreas Bogen. Die
Job-Suchmaschine Opportuno verbindet modernste Suchmaschinentechnik
mit innovativer Ajax-Technologie zu einem Instrument, das gerade in
der heutigen, durch das Paradoxon von Arbeitslosigkeit und
Fachkräftemangel geprägten Zeit, Menschen wirklich helfen kann.

- In der Medienkunst:
http://www.oamos.com von Marc Lee. Oamos ist eine Suchmaschine
anderer Art: ein inspirationsgebendes Internet-Werkzeug, das für
Suchbegriffe ein crossmediales nutzergesteuertes Informations- oder
Unterhaltungsangebot aus den unendlichen Weiten des Web
zusammenstellt.

- In der Musik:
"Das Lied vom Datenkraken" der FunPunk-Gruppe "Die Betakteten". Der
Song reflektiert in FunPunk-typischer Art den zunehmenden Verlust der
Privatsphäre in der digitalen Gesellschaft; mit Mirco Bogumil (ehem.
"Abstürzende Brieftauben"):
Lead-Gesang & Schlagzeug; Thorsten
Blancke: Bass, Chorus Gesang; Georg Hanske: Gitarre, Chorus Gesang

Die Preisträger werden ihre Arbeiten zum SuMa-eV Kongress
(http://suma-ev.de/forum08/) vorstellen, die Musik wird zum Kongress
live vorgetragen und auf CD erhältlich sein.

Update, 26.9.2008: Der Live-Auftritt der Musiker mit dem "Lied vom
Datenkraken" ist im Internet zu sehen und zu hören unter
http://vimeo.com/1817137

Update, 5.10.2008 Foto der Preisträger

Wolfgang Sander-Beuermann

Themen: 

Lob für SuMa Blogger

Großes Lob an unser Blog gabs vor einer Woche im recherchenblog. Der Blogger Aude bezeichnet uns SuMa-Blogger als "Schätzkästchen", wo sich "Kompetenz von Gnaden" findet. Das hören wir natürlich sehr gerne und schicken ein herzliches Dankeschön für das Posting an die Kollegen vom Recherchenblog!

Themen: 

Build your Own Search Service - BOSS: Yahoo öffnet seine Such-Infrastruktur weiter

Yahoo oeffnet seine Suche mit einem neuen Service, "Build your Own Search Service" (BOSS), weiter als je zuvor. Yahoo hat bereits mit Search Monkey, eine zwar nicht 100% offene, aber zusammenklickbare individuelle Suchmaschine geschaffen. Auch Nutzer anderer Dienste konnten bei Eurekster, Rollyo, Microsoft und Google persönliche Suchdienste zusammenklicken. "Allerdings sind alle diese Dienste in irgendeiner Weise eingeschränkt; vollen Zugriff auf den Index erhalten die Nutzer nicht." (heise.de).

Yahoo BOSS

BOSS (Build your Own Search Service) is Yahoo!'s open search web services platform. The goal of BOSS is simple: to foster innovation in the search industry. Developers, start-ups, and large Internet companies can use BOSS to build and launch web-scale search products that utilize the entire Yahoo! Search index. BOSS gives you access to Yahoo!'s investments in crawling and indexing, ranking and relevancy algorithms, and powerful infrastructure. By combining your unique assets and ideas with our search technology assets, BOSS is a platform for the next generation of search innovation, serving hundreds of millions of users across the Web. (11.7.2008, http://developer.yahoo.com/search/boss/)

Sind wir mit der derzeitigen Entwicklung bei Yahoo auf dem Weg zu freien Suchmaschinen und offenen Zugang zu Suchtechnologien? Wie Semager kuerzlich berichtete benutzt Yahoo bereits Open Source Suchsoftware fuer seine Webmap.

Hadoop Now at the Heart of Every Yahoo! Search ... On a very related note, we're announcing today that we implemented what we believe is the world's largest commercial application of Apache Hadoop. We are now using Hadoop to process the Webmap -- the application which produces the index from the billions of pages crawled by Yahoo! Search. (19.2.2008, http://www.ysearchblog.com/archives/000521.html)

Microsoft will Powerset fuer 100 Mio US-Dollar kaufen

Wie VentureBeat berichtet will Microsoft die semantische Suchmaschine Powerset für 100 Millionen US-Dollar oder moeglicherweise noch hoeher kaufen und hofft damit Google und Yahoo paroli zu bieten.

By buying Powerset, Microsoft is hoping to close the perceived quality gap with Google’s search engine. The move comes as Microsoft CEO Steve Ballmer continues to argue that improving search is Microsoft’s most important task. Microsoft’s market share in search has steadily declined, dropping further and further behind first-place Google and second place Yahoo. (Matt Marshall, June 26th, 2008, http://venturebeat.com/2008/06/26/micr...)

The image “http://venturebeat.com/wp-content/themes/venturebeat/images/venturebeat_banner.gif” cannot be displayed, because it contains errors.

 Die Suchmaschine Suchmaschine Powerset durchforstet momentan ausschliesslich Wikipedia die Datenbank Freebase. Eine Besonderheit ist, dass sie natuerlich formulierte Fragen versteht. Die Technologie ist jedoch bei weitem noch nicht ausgereift und funktioniert offensichtlich gerade aus dem Grund, dass Wikipedia als hauptsaechliche Quelle herangezogen wird. Die Wikipedia ist meist gut betreut und logisch aufgebaut. Inwieweit Suchausgaben auch von anderen Webseiten gute Ergebnisse liefern werden, bleibt abzuwarten.

Im Gegensatz zu Powerset hat Google bisher keine oeffentlichen Versuche mit Suchanfragen in natuerlicher Sprache unternommen.

Google has generally dismissed Powerset’s semantic, or “natural language” approach as being only marginally interesting, even though Google has hired some semantic specialists to work on that approach in limited fashion.  (Matt Marshall, June 26th, 2008, http://venturebeat.com/2008/06/26/micr...)

 

e! Science - automatisierte Newsseite fuer die Wissenschaft mit Drupal und freier Suchmaschine Sphinx

Michael Imbeault, ein HIV-Forscher an der Université Laval in Quebec, hat eine automatisierte Newsseite und Suche namens e! Science News ins Netz gestellt. Wie er auf drupal.org berichtet, weil er unzufrieden mit den anderen computergenerierten News-Portalen wie Google News oder Yahoo News war

Die Website wird ausschliesslich auf Grundlage von freier GPL lizensierter Software betrieben und weiter entwickelt. Die Basis bilden Drupal und Sphinx, eine Volltext-Suchmaschine.

Sphinx Search LogoSphinx is a full-text search engine, distributed under GPL version 2. Commercial license is also available for embedded use. Generally, it's a standalone search engine, meant to provide fast, size-efficient and relevant fulltext search functions to other applications. Sphinx was specially designed to integrate well with SQL databases and scripting languages. Currently built-in data sources support fetching data either via direct connection to MySQL or PostgreSQL, or using XML pipe mechanism (a pipe to indexer in special XML-based format which Sphinx recognizes). (Abruf 28.6.2008, Andrew Aksyonoff, http://www.sphinxsearch.com/about.html)

Drupal setzt in der Regel auf einem sogenannten LAMP-System aus Gnu/Linux, Apache, MySQL und Php auf. In dem Beitrag auf drupal.org beschreibt Michael Imbeault die Entstehung der Newssite, gibt Hinweise fuer den Selbstbau einer derartigen Website und spricht ueber seine "Lessons learned".

esciencenews Here are a few lessons I learned in no particular order

  • Finding a good domain name is hard and takes time (and / or money) – start early and never stop searching, even if you got one or 2 good ones! You might find something even better.
  • Backup everything often! Especially on Windows.
  • Think simple; more is often less – do only what your users actually need / want as a starting point
  • Don’t be afraid to redo something from scratch if it’s not working right the first time around - I rebuilt critical components of the clustering system days before launch
  • Drupal is a market disrupting tool – it allows a single guy part time to build something great while learning it; imagine what a whole team of professionals can do!
  • I wish I knew about simpletest a year ago; I chased bugs for a long time (and sometimes the same bug that was reoccurring). Things like clustering and regex-based parsing could have been a whole lot easier with appropriate tests.
  • Release early; don’t be afraid to put off minor features to later
  • Keep a todo list through the process, and try to remove items from it as fast as they appear! (this is not as easy as it sounds!)
  • You know you built something great when you visit your own site and find it interesting :)
(http://drupal.org/node/261340)
Themen: 

Trends bei Google Trends

@-web berichtet, dass Google Trends den Nutzern Zahlen über den Traffic auf fremden Websites bietet. Für nicht angemeldete Google-Nutzer sind die Statistiken recht vage, aber mit Google-Account soll man laut @-web schon recht weit kommen ("Sie bekommen relativ genaue Zahlen sobald Sie sich mit einem Google Nutzeraccount angemeldet haben.").

Woher diese Zahlen, die eigentlich nur der Serverbetreiber selbst anhand der Zugriffsstatistiken kennen kann, stammen, bleibt unklar. Google selbst schreibt dazu etwas schwammig: "Trends for Websites combines information from a variety of sources, such as aggregated Google search data, aggregated opt-in anonymous Google Analytics data, opt-in consumer panel data, and other third-party market research." (http://www.google.com/intl/en/trends/websites/help/index.html). @-web stellt einige konkrete potentielle Datenquellen zusammen, darunter zum Beispiel die Google-Toolbar, AdSense und Doubleclick, sowie natürlich die Klicks auf Suchmaschinen-Ergebnisseiten.

Google Trends gibt also ein weiteres (fast schon schockierendes) Beispiel ab, wie weitgehend die Firma Google das Internet unter Kontrolle hat. Wenn es dieser Firma möglich ist, Zugriffszahlen von fremden Servern zusammenzustellen, sollte das erneut Anlass zum Nachdenken geben.

Seiten

Subscribe to SUMA-Blogger RSS