Dez 062006
 

Früh am Morgen kommt über den Newsfeed von mozilla.org doch ein Hinweis auf eine sehr interessante Erweiterung für Firefox rein. Ein Titel wie ClearForest Gnosis 0.8 for Firefox macht neugierig.

Unter obigem Link findet man folgende Beschreibung:

„With one click, Gnosis scans the text you’re reading and automatically identifies people, places, companies, organizations, products and more. Gnosis’s findings are presented to you in a sidebar […] We’ve implemented a small portion of our capabilities as a web service that Gnosis uses to extract information from unstructured text.“

Ich habe die Erweiterung jetzt nur kurz angetestet, aber der Ansatz die Kernbegriffe aus einem Text zu extrahieren und geordnet aufzulisten ist doch recht interessant. Ziemlich gut funktioniert das, soweit man das nach so kurzer Zeit sagen kann, für Countries, Cities, Companies, Organizations, Products und Persons. Das gilt für deutsche (wobei Heinz Herbertson hier gerne geadelt wird, wenn der Artikel von ihm ist) wie für englische Texte.

Da wo es interessant wird, nämlich bei den Industry Terms, da hier ganz wesentlich auf den Inhalt des Textes rückgeschlossen werden kann (könnte), kommen allerdings eher mittelprächtige Ergebnisse. Andererseits fehlen mir die ordentlichen englischsprachigen Texte (hab es nur mit einigen Artikeln vom Library Student Journal probiert) und das ganze ist auch nur ein allererster Eindruck.

Abgesehen von der Qualität, finde ich diese „on the fly“ Verarbeitung eines Dokumentes über einen Webdienst auf jeden Fall interessant und bemerkenswert.