Dez 062006
 

Früh am Morgen kommt über den Newsfeed von mozilla.org doch ein Hinweis auf eine sehr interessante Erweiterung für Firefox rein. Ein Titel wie ClearForest Gnosis 0.8 for Firefox macht neugierig.

Unter obigem Link findet man folgende Beschreibung:

„With one click, Gnosis scans the text you’re reading and automatically identifies people, places, companies, organizations, products and more. Gnosis’s findings are presented to you in a sidebar […] We’ve implemented a small portion of our capabilities as a web service that Gnosis uses to extract information from unstructured text.“

Ich habe die Erweiterung jetzt nur kurz angetestet, aber der Ansatz die Kernbegriffe aus einem Text zu extrahieren und geordnet aufzulisten ist doch recht interessant. Ziemlich gut funktioniert das, soweit man das nach so kurzer Zeit sagen kann, für Countries, Cities, Companies, Organizations, Products und Persons. Das gilt für deutsche (wobei Heinz Herbertson hier gerne geadelt wird, wenn der Artikel von ihm ist) wie für englische Texte.

Da wo es interessant wird, nämlich bei den Industry Terms, da hier ganz wesentlich auf den Inhalt des Textes rückgeschlossen werden kann (könnte), kommen allerdings eher mittelprächtige Ergebnisse. Andererseits fehlen mir die ordentlichen englischsprachigen Texte (hab es nur mit einigen Artikeln vom Library Student Journal probiert) und das ganze ist auch nur ein allererster Eindruck.

Abgesehen von der Qualität, finde ich diese „on the fly“ Verarbeitung eines Dokumentes über einen Webdienst auf jeden Fall interessant und bemerkenswert.

  2 Antworten zu “Gnosis – Semantic Web on the fly for Firefox”

Kommentare (1) Pingbacks (1)
  1.  

    Just a brief note to let you know that ClearForest has published a new and improved version of Gnosis. While we’re waiting for the lengthy Mozilla approval process to complete the extension is hosted at gnosis.clearforest.com

    Cleaner UI and automated extraction for the top dozen or so news sites on the web. Better „launch“ options to take you to topix.net and other locations.

    A great starting point is a news site like CNN, the International Herald Tribune or the Wall Street Journal. For these and about a dozen other sites Gnosis will do its work in the background with no user intervention. Another great place to play is Wikipedia – the automated entity identification adds a whole new level of navigational possibilities.

 Antworten