Mrz 102009
 

Zu schade ums es als Tweet untergehen zu lassen. Greg Linden in seinem Blog: Book review: Introduction to Information Retrieval.

Three search gurus, Chris Manning, Prabhakar Raghavan (head of Yahoo Research), and Hinrich Schutze, just published a wonderful new book, “Introduction to Information Retrieval“.

If you work in search or if you are just the kind of person that reads textbooks for fun, this one is a great one. It not only describes how to build a search engine (including crawling, indexing, ranking, classification, and clustering), but also offers the kind of opinionated wisdom you can only get from people who have had substantial experience using these techniques at large scale.

Hinter dem Link im Zitat verbirgt die Seite des Center for the Study of Language and Information (CSLI) der Stanford University, wo das Buch als Volltext runtergeladen oder online eingesehen werden kann (als pdf oder html). Interessant auch, dass um Feedback zum Buch gebeten wird und das die Onlineversion alle paar Monate aktualisiert werden soll. Außerdem gibt es noch interaktive Übungen, wobei man dann auf dem “Moodle server at the Institute for Natural Language Processing, Universität Stuttgart” landet. Als Gast kommt man allerdings nicht weit, Anmeldung hab ich jetzt allerdings nicht probiert. Quicklink zum PDF for online viewing:

Manning, Christopher D. ; Raghavan, Prabhakar ; Schütze, Hinrich: Introduction to information retrieval. Cambridge : Cambridge Univ. Press, 2008 – ISBN 9780521865715

Wäre sicher auch eine nette Ressource für eines meiner Lieblingsseminare – Wissensorganisation – gewesen. Bis heute crawlen Google und Co auf meinem privaten Webserver (ob dyndns-Adressen wirklich sinnvoll zu indexieren sind?) um meine PHP-Spielerei zu Recall/Precision/Stemming etc. zu finden – erstaunlich. Vielleicht wäre das Buch ein Ansatz um noch mal etwas weiter vorzudringen :-)


DB Recovery Info (Was soll das?)
Kommentare Original: 0
Lokale Google Cache Version (mit Kommentaren): Öffnen
Sonstiges:

  Eine Antwort zu “Book review: Introduction to Information Retrieval (and fulltext)”

Kommentare (1)
  1.  

    ja, das sind die fragen, die in zukunft entscheiden werden, ob irrelevanter datenmüll in den SERPs ganz nach vorne wandert. weitere ressourcen finden sie in sensiblochamaeleon.blogspot.com/2010/05/echte-wissenschaft-und-objektive.html . außerdem gehe ich dem verhältnis von dem noch nicht ganz zweifelsfrei wissenschaftlichen SEO zu ethik, politik, lautstärke und moral in sensiblochamaeleon.wordpress.com/2009/09/08/seoethik-heiligt-der-zweck-die-mittel/ ausführlich nach.

 Antworten