{"id":84,"date":"2007-03-08T08:40:57","date_gmt":"2007-03-08T07:40:57","guid":{"rendered":"http:\/\/blog.verweisungsform.de\/2007-03-08\/euroforum-tag-2\/"},"modified":"2022-12-05T00:56:58","modified_gmt":"2022-12-04T22:56:58","slug":"euroforum-tag-2","status":"publish","type":"post","link":"https:\/\/blog.verweisungsform.de\/2007-03-08\/euroforum-tag-2\/","title":{"rendered":"Euroforum: Tag 2"},"content":{"rendered":"

Aus dem “morgen mehr<\/a>” sind nun beinah zwei Woche geworden. Trotzdem wollte ich auch noch mal die Eindr\u00fccke des zweiten Tages<\/a> festhalten.<\/p>\n

Den ersten Beitrag Es geht um mehr als Suche!<\/em> von Dr. Stefan Wess (Gesch\u00e4ftsf\u00fchrer Empolis) fand ich eigentlich sehr interessant. Im Wesentlichen ging es \u00fcber Stichworte wie “Ein Begriff – viele Bedeutungen… und viele Synonyme”, “Informationsflut” und Kosten von langwierigen Recherchen (durch Wissenschaftler) schlie\u00dflich zur Begr\u00fcndung der Notwendigkeit eines semantischen Webs (und damit von Theseus). Nico Lumma, welcher an selbigem Tag einen Vortrag zu Blogs hielt, kommentiert diesen Beitrag von Dr. Wess in seinem Blog unter dem Titel Subventioniertes Leuchtturmprojekt mit 90% Eisberg<\/a><\/em> eingehender. Selber hat mich der Beitrag in seinen Aspekten zu Synonymen, Ontologien und so weiter sehr an unser sehr sch\u00f6nes HAW-Seminar Wissensorganisation erinnert – vielleicht sollten wir mal Herrn Wess einladen. \ud83d\ude42 Welch Zufall, dass die letzte Folie auch auf Vannevar Bushs Memex<\/a> hinwies (“As we may think<\/em>“), von dem wir dieses Semester auch h\u00f6rten. Sehr sch\u00f6n, aus bibliothekarischer Sicht, fand ich auch das angef\u00fchrte Zitat nach der Delphi Group: \u201eLack of organisation of information is in fact the number one problem in information management and retrieval<\/em>\u201c und “Suche ist ein Ausdruck mangelnder Organisation<\/em>” (wobei Suche in den Google-Farben geschrieben stand). Interessant auch die Begriffseinf\u00fchrung Informationslogistiker nach dem Prinzip “Die richtige Information, f\u00fcr die richtige Person, zur richtigen Zeit”.
\nKein Wunder also, dass Herr Wess die Internetsuche als Schl\u00fcsseltechnologie bezeichnete, dabei aber die These aufstellte, dass gerade einmal 10% des Potentials genutzt (=Google), 90% also noch zu erschlie\u00dfen seien. Unter diesem Motto liefe im Grunde auch Theseus und die Abspaltung von Quaero leite sich davon ab, dass man mehr als “10% + 10%” wolle. Ehrlich gesagt bleibt mir der Ansatz von Theseus als semantische Suchmaschine aber schleierhaft, wenn in der anschlie\u00dfenden Fragerunde die Frage “Ist eine weltweite Ontologie \u00fcberhaupt m\u00f6glich?” geantwortet wird, dass dies bisher immer “in die Hose gegangen sei” und das eine Ontologie nur lokal und f\u00fcr spezielle Anwendungszwecke Sinn mache (interessantes Beispiel \u00fcbrigens tats\u00e4chlich
Otto.de<\/a>, wenn man z.B. die nat\u00fcrlichsprachige Anforderung “Ich brauche eine blaue Hose f\u00fcr meine Tochter” in der Suchmaske eingibt).<\/p>\n

Der folgende Vortrag Geht nicht, gibt\u2019s nicht \u2013 Die lokale Suche<\/em> wurde von Peter Neumann (Director Content & Portals, Allesklar.com<\/a> AG) gehalten. Dabei ging es vor allem um die Erfahrungen mit meineStadt.de<\/a>. Dabei wurden viele Nutzeraspekte aufgef\u00e4chert – Geschlecht,Alter, Bildung etc. Quelle hierf\u00fcr war vor allem die Studie Internet Facts 2006-II<\/a> der AGOF-AG. Interessant ist doch, dass dort bei der Top 10 der generellen Produktinteressen, B\u00fccher an erster Stelle liegen – w\u00fcrde man das erwarten? Weiterhin fand ich interessant, wie sich der Sucheinstieg der Nutzer aufschl\u00fcsselte. Dabei wurde die Ansicht der Branchen von Kiel<\/a> als Beispiel herangezogen. Danach w\u00fcrden je 40% \u00fcber die Suchmaske und \u00fcber den Katalog einsteigen, die restlichen 20% \u00fcber die alphabetische Branchen-Suche. Abgesehen davon, dass man das Ergebnis nicht ganz isoliert vom Nutzerspektrum der Seite betrachten solllte, finde ich es doch erstaunlich, dass der Katalog so hoch im Kurs steht (auch wenn es Sinn macht). Ansonsten ging es schlie\u00dfllich vor allem um kundenspezifische Angebote – und nat\u00fcrlich Werbung. Interessant war noch die Aussage, dass Qype<\/a> als keine wirkliche Konkurrenz angesehen wird. Prinzipiell ist die Aussage, dass kein Mensch den Doktor um die Ecke eintragen w\u00fcrde (entgegen dem redaktionellen Angebot von meineStadt), jedoch einleuchtend. Erfolgsversprechender sei gegen\u00fcber dem rein user-generated-content eher die Erg\u00e4nzungm\u00f6glichkeit durch den Nutzer.<\/p>\n

Nach der Pause ging es mit dem Bereits erw\u00e4hnten Vortrag von Nico Lumma Konversationen sind das Salz in der Suche<\/em> weiter. Hier ging es um das bald startende Projekt blogmonitor.de<\/a>, ein Tool zur Anaylse der deutschen Blogosph\u00e4re und Nachfolger von blogstats.de<\/a>. Im Grunde ein Tool zur Trendanalyse, welche auch am ersten Tag<\/a> schon Thema war, f\u00fcr Blogs. Am\u00fcsant fand ich in diesen Zusammenhang die Einf\u00fchrung des Begriffs Eitelkeitssuche<\/em>, d.h. wenn ein Blogger seinen eigenen Blog analysiert. Ich denke f\u00fcr Blogleser ist es bereits schl\u00fcssig, dass eine Analyse der Blogossphere auch wirtschaftlich sehr interessant sein kann. Insofern waren auch die von Lumma gestellten Fragen “Wer bloggt” und “Wer liest Blogs?” interessant. Die erste Frage hatt, soweit ich das sehen konnte von meinem Platz, nur sehr wenige Meldungen (und bei denen bin ich nicht in die N\u00e4he des Namensschildchens gekommen). Die zweite Frage hatte bei “monatlich” noch einigermassen viele Meldungen, aber bei w\u00f6chentlich und t\u00e4glich waren es vielleicht noch eine Hand voll…<\/p>\n

Der folgende Vortrag Search Engine Marketing \u2013 Was geht, was lohnt?<\/em> von Prof. Hendrik Speck war sehr interessant, aber mit fast 90 Folien, sehr vielen Quellenangaben und sehr vielen Erl\u00e4uterungen auch extrem umfangreich. Sehr knapp zusammengefasst ging es um zum einen um den weltweiten Wandel in der Mediennutzung, nat\u00fcrlich mit Schwerpunkt auf der Internetnutzung. Zum anderen wurden daraufhin die gro\u00dfe L\u00fccke bei den Werbeinvestitionen im Internet gegen\u00fcber den Investitionen in den klassischen Medien dargestellt. Im Folgenden ging es entsprechend um (Google-) Adwords und Marktdruchdringung der Suchmaschinen \u00fcber die Jahre, mit dem “\u00fcberraschenden” Zuwachs bei Google…
\nGanz interessant war auch die graphische Gege\u00fcberstellung der Anzahl durchschnittlich verwendeter Suchworte mit Zahlen von 2003 (
OneStat<\/a>) gegen\u00fcber Zahlen von 2007 (RankStat<\/a>). Balkendiagramme zeigen dann doch sehr deutlich, dass es eine starke Tendenz zu mehr Suchworten gibt, wobei die Mehrzahl der Nutzer im Schnitt zwei Suchbegriffe verwendet. Die danach aufgef\u00fchrte Liste der meistgesuchten Begriffe (welche dies sind erahnt man ja), l\u00e4\u00dft dann aber vermuten, dass die h\u00e4ufigste Kombination “+free +sex” sein m\u00fcsse. Ebenfalls nicht so \u00fcberraschend neu (daf\u00fcr aber sehr detailreich dargestellt), dass Nutzer selten \u00fcber die ersten ein bis zwei Seiten der angezeigten Suchergebnisse hinausgehen. Hier wurde besonders h\u00e4ufig auf die Quelle iProspect<\/a> verwiesen.
\nIm weiteren ging es dann um die Bewertung des Marktwertes von Web 2.0-Seiten, sowie den entsprechenden Bewertungskritierien. Die Folie Brief history of decline<\/em> stellte dann gravierende Markteinbr\u00fcche der Geschichte, vom Wallstreet-Crash 1929, \u00fcber die geplatzte Dot-Com-Blase im Jahr 2000 hin zum Jahr 2007 mit dem Punkt “Web 2.0 Bubble evaporates”, dar.
\nPers\u00f6nlich hat mich der Vortrag sehr mit seinenganzen Zahlen erschlagen…<\/p>\n

Nach dem Mittagessen wurde es dann bereits ziemlich leer im Raum – anscheinend rief das Wochenende. Dabei war der folgende Beitrag Deep Web \u2013 Suchen wir was man finden k\u00f6nnte?<\/em> von Dr. Lewandowski ebenfalls sehr interessant, aber vielleicht tats\u00e4chlich nicht so sehr aus einer Marketingperspektive. Die Folien zu dem Vortrag kann man \u00fcbrigens unter www.durchdenken.de\/lewandowski<\/a> abrufen (Direktlink PDF<\/a>). Zum einen ging es um die Defintion des Deep Webs, vereinfacht dargestellt also der Teil des Webs, welcher nicht von Suchmaschinen erschlossen wird (werden kann), und zum anderen um die gesch\u00e4tzte Gr\u00f6\u00dfe. Die Herleitung der Gr\u00f6\u00dfe wurde recht feinstufig unternommen. Interessant ist dabei, dass nach Sch\u00e4tzungen von Lewandoski und Mayr die Gr\u00f6\u00dfe bei weniger als 100 Milliarden Dokumenten liegt, wobei diese Ergebnisse auf einer kritischen Auseinandersetzung insbesondere mit den Ergebnissen von Bergmann (500 Milliarden Dokumente) gr\u00fcnden.
\nDie Gr\u00f6\u00dfendimensionen sind zwar spannend, noch spannender ist jedoch die Frage: Wie kommt man daran? Ein Teil des Problems sind nat\u00fcrlich die Formate, d.h. Bilder, Video, Audio, Flash oder auch gepackte Dateien. PDFs, sofern sie als Volltext vorliegen (also keine “Bild”-PDFs sind), werden ja mittlerweile von den meisten Suchmaschinen indexiert. F\u00fcr Bilder zeichnen sich langsam auch L\u00f6sungen ab (der Name der Gesichtserkennungssuchmschine f\u00e4llt mir gerade jedoch nicht ein), die \u00fcber die Bereitstellung von Metadaten hinausgehen. Bei Audio- und Video nehme ich an, dass noch ein ganzes Weilchen auf die Inhalte \u00fcber den “umgebenden” Content zur\u00fcckgeschlossen werden muss, allerdings glaube ich auch nicht, dass hier die wichtigsten zu erschlie\u00dfenden Quellen liegen. Die gr\u00f6\u00dften “Sch\u00e4tze” liegen sicher gut verborgen in Datenbanken. Der Vorteil von Datenbanken, ihre Strukturiertheit und die feldspezfische Suche (u.a.), ist bei einem Volltextindex, wie in Suchmaschinen erstellen, ihr Nachteil.
\nEin Vorschlag zur L\u00f6sung dieses Problemes ist, dass zweigleisig gefahren wird, d.h. das die Datenbankinhalte noch einmal flach abgebildet werden – z.B. als HTML-Seiten. Als Beispiel f\u00fcr eine solche L\u00f6sung wird auf den Folien
imdb.com<\/a> genannt. Betrachtet man eBay oder Amazon, dann stecken dort wohl \u00e4hnliche Ans\u00e4tze dahinter.
\nMir kam dabei gleich der Gedanke, dass selbst wenn Nutzer eine Suchmaske f\u00fcr alles w\u00fcnschen, dass solche indexierbaren flachen Hierarchien aber zugleich Recall und Precision stark negativ beeinflussen k\u00f6nnten. Immer h\u00e4ufiger f\u00e4llt mir doch auf, dass ich ein Problem habe, recherchiere, aber die ersten Ergebnisse immer Amazon, eBay, idealo oder auch Foren sind, welche bei inhatlichen Fragen selten weiterbringen (was dazu f\u00fchrt, dass ich dann mit m\u00e4\u00dfigem Erfolg versuche diese \u00fcber “-amazon -eBay …” auszuschliessen). Das hat mich dann auch veranlasst bei Exalead den Vorschlag (M\u00f6glichkeite hier:
Englisch<\/a>, Deutsch<\/a>) zu machen, dass Refines der Suche auch nach “Quellart” oder Ausrichtung (Kommerziell, Foren, Mailinglisten etc.) m\u00f6glich sein sollten. Das erfordert (dummer Weise) nat\u00fcrlich wieder einen hohen intellektuellen Aufwand bei der Definition solcher Cluster, es sei denn man \u00fcberl\u00e4\u00dft es dem Nutzer selber seine permanenten Exclude-Filter zu definieren. Da mach ich mir vielleicht lieber an anderer Stelle Gedanken dr\u00fcber – sprengt hier wirklich den Rahmen.
\nEs gibt aber nat\u00fcrlich auch interessantere Quellen, welches \u00e4hnliches bereits machen.
E-Lis<\/a> z.B. ist im Wesentlichen ja ebenfalls flach organisiert. Die L\u00f6sung zur Erschlie\u00dfung des Deep Web scheint derzeit also am h\u00e4ufigsten eingesetzt zu werden, soweit dies vom Anbieter \u00fcberhaupt gew\u00fcnscht ist – was ja noch eine ganz andere Frage ist.
\nDie zweite M\u00f6glichkeit ist die spezieller Suchmaschinen, d.h. in der Regel Metasuchmaschinen f\u00fcr eine begrenzte Zahl an (fachverwandten) Datenbanken, die gegen\u00fcber Suchmaschinen zwar erweiterte Suchm\u00f6glichkeiten bieten, jedoch nat\u00fcrlich nicht das Potential der einzelnen Quellen ausnutzen. Im Grunde machen ViFas ja nichts anderes. F\u00fcr die als Beispiel genannte Deep-Web-Suchmaschiene
Turbo10<\/a> (“Search 804 Deep Net Engines”) bin ich aber irgendwie zu bl\u00f6d – weder im IE noch im FF erhalte ich hier Ergebnisse (au\u00dfer JavaScript-Fehler). Interessante Angebote sich eigene Suchmaschinensets zusammenzustellen gibt es aber ja auch sonst. Hier hat der Blog AgoraWissen<\/a> \u00fcbrigen h\u00e4ufig sehr interessante Beitr\u00e4ge – z.B. der Beitrag zu Trovando<\/a>.
\nDie dritte M\u00f6glichkeit die Lewandowski nennt, ist dass regul\u00e4re Suchmaschinen Links (Shortcuts) zu spezielleren Suchmaschinen oberhalb der eigentlichen Ergebnisse liefern. Dies wird bereits auch bei den meisten Suchmaschinen in der ein oder anderen Form umgesetzt, so erh\u00e4lt man bei Lycos z.B. gleich eine Grafik zum aktuellen Aktienkurs, wenn man einen Unternehmsnamen sucht. Was (wer) dann angezeigt wird ist allerdings eine andere Frage.
\nInsgesamt wird das Deep Web und L\u00f6sungen zu seiner (sinnvollen) Erschlie\u00dfung aber auch weiterhin ein spannendes Feld bleiben. Vielleicht kann man ja irgendwan bei Google&Co auch “bibliothek hamburg orwell” eingeben und kriegt ein “passendes” Ergebniss? \ud83d\ude42<\/p>\n

Der letzte Beitrag der Konferenz war Rechtliche Haftungsfragen f\u00fcr Internet-Anbieter<\/em> (Dr. Arnd Haller, Leiter Recht, Google Germany). Der Vortrag war sehr interessant und wurde anschaulich, angereichert mit vielen Beispielen, gehalten. Ich spar es mir aber an dieser Stelle auf die ganze gesetzlichen Haftungsregelungen f\u00fcr Internetanbieter einzugehen. Das Heise-Urteil ist ohnehin wahrscheinlich den meisten bekannt und das neue Telemediengesetzt (TMG) geistert derzeit auch durch die Kritiken s\u00e4mtlicher Zeitungen und Zeitschriften (oder der Blogosphere).
\nInteressant war nat\u00fcrlich auch die Frage des zweiten Vortragsteils: Ist das deutsche Urheberrecht \u201eWeb 2.0\u2013tauglich\u201c? Hier wurden aber vor allem weitere Fragen gestellt, denn Antworten gegeben (“Urheberrecht als Hindernis f\u00fcr die weitere Entwicklung des Web 2.0?; “Ausweichstrategien f\u00fcr Host- und Content-Provider ins Ausland realistisch \u2013 User generated content nur noch au\u00dferhalb des deutschen Rechtsraums?”). Nat\u00fcrlich durfte hier auch nicht der Hinweis auf die
Fair-Use<\/a>-Klausel des amerikanischen Urheberrechts fehlen.
\nDer dritte Teil Ausblick: Was gibt\u00b4s Neues in 2007?<\/em> war zugleich quasi das Fazit, n\u00e4mlich dass man erst mal abwarten m\u00fcsse, was sich 2007 im Bereich des Urheberrechtsgesetzes, der zu erwartenden Revision des TMG und bei relevanten Entscheidugen des BGH ergibt. Da kann man, als auf einmal beinah jounalistisch t\u00e4tiger Blogger, ja nur gespannt sein (hey, solange ich keinen Lektor besch\u00e4ftige, sollte die Bewertung \u00fcber die Zahl der Zeichensetzungsfehler passieren! :D).<\/p>\n

Nun, als Fazit dieser Konferenz komme ich zu dem Schluss, dass die Konferenz spannende Themen und Personen aufbot, dabei aber Fragen des Marketings sehr beherrschend waren. Begriffe wie Recherche- oder Informationskompetenz, Recall und Precision oder auch Nutzergruppen waren dabei eher implizit ein Thema, obwohl sich die Macht der Suchmaschinen auf lange Sicht wohl \u00fcber ihre Qualit\u00e4t definieren wird – hoffentlich auch ihrer Transparenz. Nicht ganz unwesentlicher Aspekt der (einer derartigen) Konferenz ist sicher aber auch das Kn\u00fcpfen von Kontakten (“Pflegen und erweitern Sie Ihr Netzwerk”) – Exzellenz wird auch von den Teilnehmern erwartet, wenn man die Frage der Dame neben mir zu Beginn der Konferenz betrachtet: “HAW – sind sie Suchmaschinenexperte?” \ud83d\ude00
\nAlles in allem waren mir neue Ideen und Konzepte wie die Trendanalyse, “Long Tail” und “Vertical Search” doch sehr spannend und letztlich kann es ja nur das eigene Blickfeld erweitern. Es weckt eine ganz andere Aufmerksamkeitsspanne, wenn man z.B. letzte Woche zweimal den Begriff Long Tail bei netbib findet oder der Rechercheblog ausf\u00fchrlich \u00fcber ZoomInfo (
ZoomInfo: Recherche von Unternehmen und Mitarbeitern<\/em><\/a>) berichtet. Denk ich an die Diskussion der Verlagsvertreter, dann trifft auch das Thema Magazine Publishing in a Web 2.0 World<\/a><\/em> (Folien eines Vortrags, \u00fcbrigens Titel der Folie 15: “Web 2.0 Priciples: The Power of the Tail”) bei David Rothman voll ins Schwarze – im Grunde wird hier die halbe Konferenz zusammengefasst, allerdings ohne von Kannibalisierung zu sprechen.
\nAlles in allem also eine gute Erfahrung – auch wenn diese mir zuk\u00fcnftig immer noch mit 1800 EUR zu teuer w\u00e4re. Umso mehr Dank an Herrn Lewandoski!<\/p>\n","protected":false},"excerpt":{"rendered":"

Aus dem “morgen mehr” sind nun beinah zwei Woche geworden. Trotzdem wollte ich auch noch mal die Eindr\u00fccke des zweiten Tages festhalten. Den ersten Beitrag Es geht um mehr als Suche! von Dr. Stefan Wess (Gesch\u00e4ftsf\u00fchrer Empolis) fand ich eigentlich sehr interessant. Im Wesentlichen ging es \u00fcber Stichworte wie “Ein Begriff – viele Bedeutungen… und […]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[8],"tags":[180,181],"_links":{"self":[{"href":"https:\/\/blog.verweisungsform.de\/wp-json\/wp\/v2\/posts\/84"}],"collection":[{"href":"https:\/\/blog.verweisungsform.de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.verweisungsform.de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.verweisungsform.de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.verweisungsform.de\/wp-json\/wp\/v2\/comments?post=84"}],"version-history":[{"count":1,"href":"https:\/\/blog.verweisungsform.de\/wp-json\/wp\/v2\/posts\/84\/revisions"}],"predecessor-version":[{"id":1002,"href":"https:\/\/blog.verweisungsform.de\/wp-json\/wp\/v2\/posts\/84\/revisions\/1002"}],"wp:attachment":[{"href":"https:\/\/blog.verweisungsform.de\/wp-json\/wp\/v2\/media?parent=84"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.verweisungsform.de\/wp-json\/wp\/v2\/categories?post=84"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.verweisungsform.de\/wp-json\/wp\/v2\/tags?post=84"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}