You are here

suchmaschine

Bauen Sie sich IHRE EIGENE Suchmaschine! Es ist viel einfacher, als Sie denken.

Im Internet gespeichertes Wissen findet man immer noch am besten über Suchmaschinen. Aber kann man dem vertrauen, was sie finden, und wie sie es darstellen? Vor allem: in welcher Reihenfolge sie es darstellen. Denn: wahrgenommen werden fast ausschließlich die ersten 10 Ergebnisse. Diese werden nach Algorithmen ausgewählt, die bei allen Suchmaschinen Betriebsgeheimnis sind. Einzige Ausnahme. SIE SELBER betreiben eine Suchmaschine! Das können Sie ganz einfach mir jedem PC machen. Der folgende Link beschreibt einen einfachen Einstieg:

Themen: 

benefind sucht mit Microsoft für Menschen in Not

„Mit jeder einzelnen Suchanfrage unterstützen Sie eine Hilfsorganisation Ihrer Wahl!“ – so das Motto der neuen Internet-Suchmaschine www.benefind.de. Das Sozialunternehmen benefind spendet alle Einnahmen aus der gleichnamigen Suchmaschine an anerkannte Hilfsorganisationen. Dank der Unterstützung durch Bing.de, der Suchmaschine von Microsoft, werden dem Nutzer gleichzeitig Suchergebnisse auf gewohnt hohem Niveau präsentiert.

 

Themen: 

Microsoft will Powerset fuer 100 Mio US-Dollar kaufen

Wie VentureBeat berichtet will Microsoft die semantische Suchmaschine Powerset für 100 Millionen US-Dollar oder moeglicherweise noch hoeher kaufen und hofft damit Google und Yahoo paroli zu bieten.

By buying Powerset, Microsoft is hoping to close the perceived quality gap with Google’s search engine. The move comes as Microsoft CEO Steve Ballmer continues to argue that improving search is Microsoft’s most important task. Microsoft’s market share in search has steadily declined, dropping further and further behind first-place Google and second place Yahoo. (Matt Marshall, June 26th, 2008, http://venturebeat.com/2008/06/26/micr...)

The image “http://venturebeat.com/wp-content/themes/venturebeat/images/venturebeat_banner.gif” cannot be displayed, because it contains errors.

 Die Suchmaschine Suchmaschine Powerset durchforstet momentan ausschliesslich Wikipedia die Datenbank Freebase. Eine Besonderheit ist, dass sie natuerlich formulierte Fragen versteht. Die Technologie ist jedoch bei weitem noch nicht ausgereift und funktioniert offensichtlich gerade aus dem Grund, dass Wikipedia als hauptsaechliche Quelle herangezogen wird. Die Wikipedia ist meist gut betreut und logisch aufgebaut. Inwieweit Suchausgaben auch von anderen Webseiten gute Ergebnisse liefern werden, bleibt abzuwarten.

Im Gegensatz zu Powerset hat Google bisher keine oeffentlichen Versuche mit Suchanfragen in natuerlicher Sprache unternommen.

Google has generally dismissed Powerset’s semantic, or “natural language” approach as being only marginally interesting, even though Google has hired some semantic specialists to work on that approach in limited fashion.  (Matt Marshall, June 26th, 2008, http://venturebeat.com/2008/06/26/micr...)

 

e! Science - automatisierte Newsseite fuer die Wissenschaft mit Drupal und freier Suchmaschine Sphinx

Michael Imbeault, ein HIV-Forscher an der Université Laval in Quebec, hat eine automatisierte Newsseite und Suche namens e! Science News ins Netz gestellt. Wie er auf drupal.org berichtet, weil er unzufrieden mit den anderen computergenerierten News-Portalen wie Google News oder Yahoo News war

Die Website wird ausschliesslich auf Grundlage von freier GPL lizensierter Software betrieben und weiter entwickelt. Die Basis bilden Drupal und Sphinx, eine Volltext-Suchmaschine.

Sphinx Search LogoSphinx is a full-text search engine, distributed under GPL version 2. Commercial license is also available for embedded use. Generally, it's a standalone search engine, meant to provide fast, size-efficient and relevant fulltext search functions to other applications. Sphinx was specially designed to integrate well with SQL databases and scripting languages. Currently built-in data sources support fetching data either via direct connection to MySQL or PostgreSQL, or using XML pipe mechanism (a pipe to indexer in special XML-based format which Sphinx recognizes). (Abruf 28.6.2008, Andrew Aksyonoff, http://www.sphinxsearch.com/about.html)

Drupal setzt in der Regel auf einem sogenannten LAMP-System aus Gnu/Linux, Apache, MySQL und Php auf. In dem Beitrag auf drupal.org beschreibt Michael Imbeault die Entstehung der Newssite, gibt Hinweise fuer den Selbstbau einer derartigen Website und spricht ueber seine "Lessons learned".

esciencenews Here are a few lessons I learned in no particular order

  • Finding a good domain name is hard and takes time (and / or money) – start early and never stop searching, even if you got one or 2 good ones! You might find something even better.
  • Backup everything often! Especially on Windows.
  • Think simple; more is often less – do only what your users actually need / want as a starting point
  • Don’t be afraid to redo something from scratch if it’s not working right the first time around - I rebuilt critical components of the clustering system days before launch
  • Drupal is a market disrupting tool – it allows a single guy part time to build something great while learning it; imagine what a whole team of professionals can do!
  • I wish I knew about simpletest a year ago; I chased bugs for a long time (and sometimes the same bug that was reoccurring). Things like clustering and regex-based parsing could have been a whole lot easier with appropriate tests.
  • Release early; don’t be afraid to put off minor features to later
  • Keep a todo list through the process, and try to remove items from it as fast as they appear! (this is not as easy as it sounds!)
  • You know you built something great when you visit your own site and find it interesting :)
(http://drupal.org/node/261340)
Themen: 

Grant Ingersoll von Lucene fordert freie Evaluierungsdaten fuer Open Source Search Engines

Grant Ingersoll, Entwickler bei Lucene, Solr und Mitbegründer von Mahout, hat zwei interessante Beitraege zum Thema freie Evaluierungsdaten geschrieben.

Lucene Logo
Es geht dabei darum, dass Entwickler z.B. von freien Suchmaschinen zur Evaluierung ihrer Software freie Testdaten benötigen. Im Falle einer Suchmaschine heißt das, ich brauche einen Korpus von Webseiten sowie eine Reihe von Queries. Für jede der Queries brauche ich Informationen darüber, welche Dokumente für die Query relevant sind und welche nicht. Die Erstellung solcher Testdaten ist üblicherweise relativ zeitintensiv. Dennoch existieren solche Testdaten sogar in relativ großem Umfang, sind allerdings nur zu Forschungszwecken zugänglich. Die Verwendung der Daten als privater Entwickler dagegen gestaltet sich relativ kostspielig. Grant regt ... an, solche Evaluierungsdaten allgemein zugänglich zu machen bzw. neue Testkorpora zu erstellen und diese dann unter eine weniger restriktive Lizenz zu stellen. Damit soll erreicht werden, dass man freie Implementierungen z.B. von Suchmaschinen* auch einigermaßen problemlos gegeneinander vergleichen kann. ... andere Beispiele wären Machine Learning Algorithmen, Data Mining Frameworks etc. (Isabel Drost, FSF Berlin Mailingliste, 13.6.2008)

Mahout Logo

[via Isabel Drost]

Themen: 

Yahoo-Suchmaschine "SearchMonkey" zum Zusammenklicken, aber nicht offen

Yahoo hat eine Suchmaschine namens SearchMonkey ins Netz gestellt. Damit können Websitebesitzer z.B. ihre eigens angepasste Suchoberfläche auf der eigenen Seite anbieten oder auch die Suchweite eingrenzen. 

So lässt sich zum Beispiel eine Site-übergreifende Suche aufbauen, die die zum Suchtreffer passende Adresse, Bewertungen oder den Börsenkurs anzeigt. Bei der Einrichtung hilft ein Assistent, der den Anwender in fünf Schritten Design und Datenfelder auswählen lässt. Der resultierende PHP-Code kann zwecks Feinabstimmung direkt bearbeitet werden. Auch für den Aufbau der passenden Webdienste bietet SearchMonkey Assistenten. (heb/c't)  (15.05.2008 18:02, http://www.heise.de/newsticker/Yahoo-veroeffentlicht-Suchmaschine-zum-Se...)

Das Konzept an sich gibt es schon länger bei Google. So kann man seine benutzerdefinierte Suchmaschine auch hier selber designen. Die Möglichkeit das Design einer Suchmaske zu ändern und die Suche einzuschränken, ändert nichts daran, dass die Suchmaschinentechnologie von Yahoo unfrei ist und Unabhängigen keinen Einblick in den Code gewährt wird. Zudem wissen Nutzer bei Yahoo, genauso wie bei Google oder Microsoft nicht, welche Daten, wie lange und wo gespeichert werden und inwieweit dies die Privatsphäre der Nutzer möglicherweise beeinträchtigt oder beeinträchtigen kann.

Auf der Website von SearchMonkey behauptet Yahoo zudem: "SearchMonkey is Yahoo! Search's new open platform." Nur weil Yahoo hier eine Api (Schnittstelle) bereitstellt und Entwickler Anwendungen bauen dürfen, handelt es sich bei SearchMonkey jedoch noch lange nicht um eine offene Suchmaschine, im Sinne von "Open Source" und noch weniger um eine freie und offene Suchmaschine, im Sinne von "free as in freedom". Nichts ändert sich an der genutzten Technologie hinter Suche. Sie basiert weiterhin auf die proprietären und geschlossenen Yahoosuch-Technologie

SearchMonkey is Yahoo! Search's new open platform.

Using SearchMonkey, developers and site owners can use structured data to make Yahoo! Search results more useful and visually appealing, and drive more relevant traffic to their sites. How does it work? The SearchMonkey developer tool helps you find and construct data services that you can use to build apps. Once you've built your app, you can use it yourself and share it with others.

Getting Started

1. Visit the Developer overview or Site Owner overview to learn more about participating in SearchMonkey
2. Browse the SearchMonkey Guide to learn what it takes to build a SearchMonkey app
3. Start building your data service or app using the SearchMonkey developer tool

(16. Mai 2008, http://developer.yahoo.com/searchmonkey/)

99 Millionen Euro für französische Suchmaschine Quaero

Wie heise.de berichtet hat die EU-Kommission nun eine erste Tranche von Beifhilfen Frankreichs in Höhe von 99 Millionen Euro für das Suchmaschinen-Projekt Quaero genehmigt.

Das Ziel von Quaero ist es, einen Google-ähnlichen Suchindex aufzubauen. Gestützt wird das Projekt von einem Konsortium von 23 Unternehmen, dem die Elektronikgruppe Thomson vorsteht. ... Das Gesamtbudget des FuE-Programms Quaero wird mit 199 Millionen Euro veranschlagt und soll eine Laufzeit von fünf Jahren haben. Ziel ist es, neue Lösungen und maßgebliche Verbesserungen für die Erschließung multimedialer und multilingualer Inhalten in verschiedenen Formaten zu entwickeln. Thomson will so sein Angebot an Plattformen für die Bereitstellung audiovisueller Inhalte über neue Plattformen wie IPTV oder Video on Demand erweitern. Außerdem will es neue Systeme zur Verwaltung digitaler Multimediainhalte entwickeln. Ehemals war Quaero ein deutsch-französisches Gemeinschaftsprojekt. Als die französischen und deutschen Konsortien unterschiedliche Vorstellungen entwickelten, beschlossen sie, zwei eigenständige Programme durchzuführen. Die Deutschen gründeten ein eigenes Projekt namens Theseus, das sich, gestützt auf semantische Technologien, auf die Entwicklung spezialisierter Suchwerkzeuge konzentriert. (Christiane Schulzki-Haddouti, jo/c't, 12.03.2008 16:17, http://www.heise.de/newsticker/meldung/104960)

Wikia Search Online

Die freie Suchmaschine von Wikipedia-Gründer Jimmy Wales ist nun endlich in einer ersten Alpha-Version Online. Im Netz gibt es dazu bereits zahlreiche Kritiken:

News Google: wikia search

Subscribe to RSS - suchmaschine