Feb 082007
 

In der aktuellen Chip findet sich die eine kurze Meldung mit dem Titel Neue Suchmaschine will Google angreifen. Gemeint ist Exalead, welche auch ein Teil des Quaero-Projektes war. In Webzeit gemessen ist sie so neu zwar nicht (als das Unternehmen Exalead sogar seit 2000) und beispielsweise bei netbib finden sich auch einige Beiträge zu der Suchmaschine, aber interessant ist sie dennoch.

Geht man auf Exalead.de, dann erhält man bei deaktivierten Cookies zwar erst mal Englisch – ein ziemlicher Fauxpas, da man sich zum Umstellen erst mal in die Preferences muss -, aber insgesamt sieht es „googlig“ aus. Im Grunde funktioniert die Suche auch wie bei Google. Was aber gleich auffällt: Während es bei Google zwar viele Advanced Search Operators gibt, muss man sich dort ziemlich weit durchklicken, bis man diese findet. Zudem ist die Advanced Search bei Google auch nicht sonderlich übersichtlich. Bei Exalead ist die Advanced Search hingegen sehr schön übersichtlich und bequem.

Diese erweiterten Suchmöglichkeiten miteinander zu vergleichen ist nicht ganz einfach, da Googe vieles transparant „einfach“ macht (ob ein Wörterbuch hinterlegt ist oder nur eine Worformreduktion stattfindet weiß ich immer nich nicht bei Google, aber gefunden wird ja jedenfalls normalerweise der Singular zum eingegebenen Plural). Als Nutzer bereitet mir diese Transparenz aber manchmal auch Probleme, bei der Bewertung der Ergebnisse, wobei bei Singular oder Plural natürlich die Phrasensuche noch Sicherheit gibt. Im Grunde unterscheidet sich Exalead da aber nicht unbedingt von Google. Ebenso wie Google gibt es dort auch die boolsche Operatoren wie AND / OR / AND NOT und die Suchmöglichkeiten nach bestimmten Top-Level-Domain, in Titeln oder ähnlichem unterscheiden sich ebenfalls überhaupt nicht im Angebot. Die Suche in einem bestimmten Zeitraum ist bei Google auf feste Zeiträume begrenzt, bei Exalead jedoch frei anzugeben. Obwohl ich es nicht getestet habe, wird die Suche innerhalb von Zeiträumen wahrscheinlich auch hier sehr schwach sein. Langsam kommen Zeitschriften/Zeitungen, die Artikel Online stellen zwar dahinter, dass eine Datumsangabe sinnvoll ist (eigentlich ist sie bei jedem Dokument sinnvoll), aber insgesamt sind die Ergebnisse aus diesem Grund wohl noch (?) schlecht.

Was ist bei den grundsätzlichen Suchmöglichkeiten, abgesehen von der angenehmeren Nutzung selbiger, dann eigentlich verschieden oder besser/interessant? Nun, als AltaVista noch Nummer eins war und Google langsam am Horizonz auftauchte, erinnere ich mich mit ziemlicher Sicherheit, dass Google da noch Wildcards (*) und den NEAR-Operator kannte. NEAR ist mittlerweile anscheindend bei Google über eine Relevanzanalyse (je näher, je besser?) abgelöste worden. Wildcards – umm, automatisch und dann erneut nach Relevanz sortiert? Persönlich finde ich es nicht unbedingt schlecht, dass Exalead mir diese Möglichkeit explizit zur Wahl stellt. Was Exalead mit spellslike („schreibt sich wie“) anbietet, ist bei Google GoogleSuggest. Exalead bietet allerdings auch Alternativen nach einer Suche an („Did you mean: …“), was also spellslike an Vorteilen bringen soll ist mir unklar. Die Variante soundslike („Klingt wie“), wird man wohl auch nicht wirklich nutzen, aber vielleicht fallen mir auch gerade nur die einzigartigen Möglichkeiten, die diese Suche eröffnet, nicht ein.

Was wirklich interessant sein könnte, ist die Suche nach regular expressions (reguläre Ausdrücke). Reguläre Ausdrücke sind sehr mächtig, allerdings auch recht kompliziert (ich muss jedes Mal wieder „von vorne“ anfangen, eine ganz gute Übersicht, neben den Wiki-Artikeln, gibt’s aber z.B. hier). Wer ein Programm zur Erstellung von regular expression haben will, der kann z.B. mit RegexPlor herumspielen (dazu gibt es auch ein Tutorial-Video).

Von den Suchoperatoren her ist dies aber die einzige sich wesentlich von Google absetzende Option, sicher aber auch eine, die nicht von vielen genutzt werden wird.

Bis jetzt haben wir also quasi einen Google-Clone – bedenkt man den Erfolg von Google, ist dies ja auch keine schlechter Ansatz. Interessant wird es eigentlich auch erst, wenn man eine Suche abgeschickt hat. Clustering ist nun auch nicht wirklich neues mehr und mittlerweile bei einigen Suchmaschinen umgesetzt – dort dauert es aber häufig sehr lange und ist manchmal auch irrtierend in der Darstellung. Hier erhalten wir hingegen unser Ergebnis wie bei Google gewohnt, wobei man wahlweise noch kleine Vorschaubilder der Ergbnisse und kleine Ergänzende Informationen haben kann (meis: „This result has no audio, video or RSS and is not listed in the web directory.“).

Daneben gibt es jedoch noch eine „Refine Your Search“-Box, welche angenehm plaziert ist. Hier kann man dynamisch im Ergebnisset nach Related terms, Multimedia, Languages, Directory und File types filtern. Die Vorgeschlagenen Filter können beliebig hinzugefügt und entfernt werden. An dieser Stelle kann ich es mir nicht verkneifen darauf hinzuweisen, dass andere änhliche geniale, oder wie im Falle von Web of Sciene noch genialerere Lösungen, bestehen. (PICA)-Bibliotheken dieser Welt schaut euch mal die WorldCat an (wenn das noch beta ist, was sind dann die grauen OPACs auf unseren Schirmen?)!

Das Clustering und das damit verbundene dynamische Refining halte ich für eine sehr zukunftsträchtige Technik. Es wundert, dass Google das noch nicht anbietet, aber vermutlich wird dies auch dort kommen. Wünschenswert wäre es, denn so schön Exalead ist, so mager sind doch die Ergebnisse. Ein (sehr) großer Teil des Indexes scheint auf dem Index des Open Directory Project aufzubauen (darauf bezieht sich der Filter Directory). Ansonsten scheint der eigene Index eher klein zu sein. Die Suche nach meinem Namen fördert doch – relativ zu Google, sehr wenig, nicht mal diesen (immerhin ab und an mal aktualisierten) Blog. Andererseits interessant, dass bei a-step noch keiner gemerkt hat, dass mein privater DynDNS-Webserver schon lange nicht mehr permanent läuft (wozu habe ich eigentlich den Quellcode geschickt – zugegeben: so toll war’s auch nicht, kriegen wir mittlerweile besser hin :D). Noch nie bei Google gefunden hingegen, dass auch meine dynDNS-Adresse indexiert worden wäre – da ist doch tatsächlich die Hausaufgabe aus IuK aus dem 2. Semester zu finden. Gott sei dank ist unter der Adresse beim Internet Archive nichts zu finden – nicht das da was illegales gewesen wäre, aber komplett eingescannte Regelwerke (Rollenspiel), dazu schön in einer Datenbank organisiert, aber nur zum Selbstnutzung bestimmt, könnten schon theoretisch Ärger machen. Wieder was gelernt – irgendwer indexiert auch dnymische Adressen.

Mit dem Refining kann man aber auch sehr viel Spaß haben. Gibt man netbib (wichtig: deutsch als Oberfläche in den Preferences angeben; nicht als gesuchte Sprache) kam gestern noch Klaus Graf als zweiter verbundener Begriff (heute letzter). 🙂

Spaß „bei Seite“: Im Fazit stell ich fest, dass mir die Features und ihre Umsetzung bei Exalead gefallen, allerdings scheint mir der Index doch sehr schwach zu sein (auch bei weniger egozentrischen Suchen). Im Grunde würde ich mir einfach die Advanced Search und das Refining in der Exalead-Form bei Google wünschen (umgekehrt, also Index von Google bei Exalead, scheint mir unrealistischer). Für die ein oder andere Suche oder auch einfach um verwandte Begriffe zu finden und diese dann bei Google einzustetzen, ist sie aber vielleicht ein guter Ansatz.

Für ein Multimillionen-Euro-Projekt wie Quaro, wäre dieses Ergebnis aber doch schwach…

Was mir noch auffiel: Usage Rights-Filter bei Googles Advanced Search – da hab ich ja was verpasst.

Tja, langsam hätte ich Lust in zwei Wochen zu der Euroforum-Veranstaltung Die Macht der Suchmaschinen zu gehen. Mag mit jemand 1800,- spenden? Bahnkarte, Hotel und Verplfegung brauche ich nicht, da es in Hamburg ist 🙂

  2 Antworten zu “Exalead – des Kaiser neue Kleider?”

 Antworten