{"id":70,"date":"2007-02-08T23:49:37","date_gmt":"2007-02-08T22:49:37","guid":{"rendered":"http:\/\/blog.verweisungsform.de\/2007-02-08\/exalead-des-kaiser-neue-kleider\/"},"modified":"2022-12-05T00:56:59","modified_gmt":"2022-12-04T22:56:59","slug":"exalead-des-kaiser-neue-kleider","status":"publish","type":"post","link":"https:\/\/blog.verweisungsform.de\/2007-02-08\/exalead-des-kaiser-neue-kleider\/","title":{"rendered":"Exalead – des Kaiser neue Kleider?"},"content":{"rendered":"
In der aktuellen Chip findet sich die eine kurze Meldung mit dem Titel Neue Suchmaschine will Google angreifen<\/em>. Gemeint ist Exalead<\/a>, welche auch ein Teil des Quaero-Projektes war. In Webzeit gemessen ist sie so neu zwar nicht (als das Unternehmen Exalead<\/a> sogar seit 2000) und beispielsweise bei netbib finden sich auch einige Beitr\u00e4ge<\/a> zu der Suchmaschine, aber interessant ist sie dennoch.<\/p>\n Geht man auf Exalead.de<\/a>, dann erh\u00e4lt man Diese erweiterten Suchm\u00f6glichkeiten miteinander zu vergleichen ist nicht ganz einfach, da Googe vieles transparant “einfach” macht (ob ein W\u00f6rterbuch hinterlegt ist oder nur eine Worformreduktion stattfindet wei\u00df ich immer nich nicht bei Google, aber gefunden wird ja jedenfalls normalerweise der Singular zum eingegebenen Plural). Als Nutzer bereitet mir diese Transparenz aber manchmal auch Probleme, bei der Bewertung der Ergebnisse, wobei bei Singular oder Plural nat\u00fcrlich die Phrasensuche noch Sicherheit gibt. Im Grunde unterscheidet sich Exalead da aber nicht unbedingt von Google. Ebenso wie Google gibt es dort auch die boolsche Operatoren wie AND \/ OR \/ AND NOT und die Suchm\u00f6glichkeiten nach bestimmten Top-Level-Domain, in Titeln oder \u00e4hnlichem unterscheiden sich ebenfalls \u00fcberhaupt nicht im Angebot. Die Suche in einem bestimmten Zeitraum ist bei Google auf feste Zeitr\u00e4ume begrenzt, bei Exalead jedoch frei anzugeben. Obwohl ich es nicht getestet habe, wird die Suche innerhalb von Zeitr\u00e4umen wahrscheinlich auch hier sehr schwach sein. Langsam kommen Zeitschriften\/Zeitungen, die Artikel Online stellen zwar dahinter, dass eine Datumsangabe sinnvoll ist (eigentlich ist sie bei jedem Dokument sinnvoll), aber insgesamt sind die Ergebnisse aus diesem Grund wohl noch (?) schlecht.<\/p>\n Was ist bei den grunds\u00e4tzlichen Suchm\u00f6glichkeiten, abgesehen von der angenehmeren Nutzung selbiger, dann eigentlich verschieden oder besser\/interessant? Nun, als AltaVista noch Nummer eins war und Google langsam am Horizonz auftauchte, erinnere ich mich mit ziemlicher Sicherheit, dass Google da noch Wildcards (*) und den NEAR-Operator kannte. NEAR ist mittlerweile anscheindend bei Google \u00fcber eine Relevanzanalyse (je n\u00e4her, je besser?) abgel\u00f6ste worden. Wildcards – umm, automatisch und dann erneut nach Relevanz sortiert? Pers\u00f6nlich finde ich es nicht unbedingt schlecht, dass Exalead mir diese M\u00f6glichkeit explizit zur Wahl stellt. Was Exalead mit spellslike<\/em> (“schreibt sich wie”) anbietet, ist bei Google GoogleSuggest<\/em>. Exalead bietet allerdings auch Alternativen nach einer Suche an (“Did you mean: …”), was also spellslike an Vorteilen bringen soll ist mir unklar. Die Variante soundslike (“Klingt wie”), wird man wohl auch nicht wirklich nutzen, aber vielleicht fallen mir auch gerade nur die einzigartigen M\u00f6glichkeiten, die diese Suche er\u00f6ffnet, nicht ein.<\/p>\n Was wirklich interessant sein k\u00f6nnte, ist die Suche nach regular expressions<\/a> (regul\u00e4re Ausdr\u00fccke<\/a>). Regul\u00e4re Ausdr\u00fccke sind sehr m\u00e4chtig, allerdings auch recht kompliziert (ich muss jedes Mal wieder “von vorne” anfangen, eine ganz gute \u00dcbersicht, neben den Wiki-Artikeln, gibt’s aber z.B. hier<\/a>). Wer ein Programm zur Erstellung von regular expression haben will, der kann z.B. mit RegexPlor<\/a> herumspielen (dazu gibt es auch ein Tutorial-Video<\/a>).<\/p>\n Von den Suchoperatoren her ist dies aber die einzige sich wesentlich von Google absetzende Option, sicher aber auch eine, die nicht von vielen genutzt werden wird.<\/p>\n Bis jetzt haben wir also quasi einen Google-Clone – bedenkt man den Erfolg von Google, ist dies ja auch keine schlechter Ansatz. Interessant wird es eigentlich auch erst, wenn man eine Suche abgeschickt hat. Clustering ist nun auch nicht wirklich neues mehr und mittlerweile bei einigen Suchmaschinen umgesetzt – dort dauert es aber h\u00e4ufig sehr lange und ist manchmal auch irrtierend in der Darstellung. Hier erhalten wir hingegen unser Ergebnis wie bei Google gewohnt, wobei man wahlweise noch kleine Vorschaubilder der Ergbnisse und kleine Erg\u00e4nzende Informationen haben kann (meis: “This result has no audio, video or RSS and is not listed in the web directory.”).<\/p>\n Daneben gibt es jedoch noch eine “Refine Your Search”-Box, welche angenehm plaziert ist. Hier kann man dynamisch im Ergebnisset nach Related terms<\/em>, Multimedia<\/em>, Languages, Directory <\/em>und File types<\/em> filtern. Die Vorgeschlagenen Filter k\u00f6nnen beliebig hinzugef\u00fcgt und entfernt werden. An dieser Stelle kann ich es mir nicht verkneifen darauf hinzuweisen, dass andere \u00e4nhliche geniale, oder wie im Falle von Web of Sciene noch genialerere L\u00f6sungen, bestehen. (PICA)-Bibliotheken dieser Welt schaut euch mal die WorldCat<\/a> an (wenn das noch beta ist, was sind dann die grauen OPACs auf unseren Schirmen?)!<\/p>\n Das Clustering und das damit verbundene dynamische Refining halte ich f\u00fcr eine sehr zukunftstr\u00e4chtige Technik. Es wundert, dass Google das noch nicht anbietet, aber vermutlich wird dies auch dort kommen. W\u00fcnschenswert w\u00e4re es, denn so sch\u00f6n Exalead ist, so mager sind doch die Ergebnisse. Ein (sehr) gro\u00dfer Teil des Indexes scheint auf dem Index des Open Directory Project<\/a> aufzubauen (darauf bezieht sich der Filter Directory). Ansonsten scheint der eigene Index eher klein zu sein. Die Suche nach meinem Namen f\u00f6rdert doch – relativ zu Google, sehr wenig, nicht mal diesen (immerhin ab und an mal aktualisierten) Blog. Andererseits interessant, dass bei a-step<\/a> noch keiner gemerkt hat, dass mein privater DynDNS-Webserver schon lange nicht mehr permanent l\u00e4uft (wozu habe ich eigentlich den Quellcode geschickt – zugegeben: so toll war’s auch nicht, kriegen wir mittlerweile besser hin :D). Noch nie bei Google gefunden hingegen, dass auch meine dynDNS-Adresse indexiert worden w\u00e4re – da ist doch tats\u00e4chlich die Hausaufgabe aus IuK aus dem 2. Semester zu finden. Gott sei dank ist unter der Adresse beim Internet Archive nichts zu finden – nicht das da was illegales gewesen w\u00e4re, aber komplett eingescannte Regelwerke (Rollenspiel), dazu sch\u00f6n in einer Datenbank organisiert, aber nur zum Selbstnutzung bestimmt, k\u00f6nnten schon theoretisch \u00c4rger machen. Wieder was gelernt – irgendwer indexiert auch dnymische Adressen.<\/p>\n Mit dem Refining kann man aber auch sehr viel Spa\u00df haben. Gibt man netbib (wichtig: deutsch als Oberfl\u00e4che in den Preferences angeben; nicht als gesuchte Sprache) kam gestern noch Klaus Graf als zweiter verbundener Begriff (heute letzter). \ud83d\ude42<\/p>\n Spa\u00df “bei Seite”: Im Fazit stell ich fest, dass mir die Features und ihre Umsetzung bei Exalead gefallen, allerdings scheint mir der Index doch sehr schwach zu sein (auch bei weniger egozentrischen Suchen). Im Grunde w\u00fcrde ich mir einfach die Advanced Search und das Refining in der Exalead-Form bei Google w\u00fcnschen (umgekehrt, also Index von Google bei Exalead, scheint mir unrealistischer). F\u00fcr die ein oder andere Suche oder auch einfach um verwandte Begriffe zu finden und diese dann bei Google einzustetzen, ist sie aber vielleicht ein guter Ansatz.<\/p>\n F\u00fcr ein Multimillionen-Euro-Projekt wie Quaro, w\u00e4re dieses Ergebnis aber doch schwach…<\/p>\nbei deaktivierten Cookies<\/strike> zwar erst mal Englisch – ein ziemlicher Fauxpas, da man sich zum Umstellen erst mal in die Preferences muss -, aber insgesamt sieht es “googlig” aus. Im Grunde funktioniert die Suche auch wie bei Google. Was aber gleich auff\u00e4llt: W\u00e4hrend es bei Google zwar viele Advanced Search Operators<\/a> gibt, muss man sich dort ziemlich weit durchklicken, bis man diese findet. Zudem ist die Advanced Search bei Google auch nicht sonderlich \u00fcbersichtlich. Bei Exalead ist die Advanced Search<\/a> hingegen sehr sch\u00f6n \u00fcbersichtlich und bequem.<\/p>\n