Wer suchet, der findet...


ein Sprichwort, welches im Internet-Zeitalter leider seine Berechtigung verloren hat. Das muss aber nicht so sein. Eine geniale Idee der Infominer AG schafft hier Abhilfe.

Der Grundgedanke ist die Funktion des menschlichen Gehirns und dessen Gedächtnisleistung. Werfen Sie alles Wissen über Suchmaschinen über Bord. Suche über Schlagworte, Suche in Synonymtabellen und ähnliche Krücken sind passé - jetzt erkennt das System selbsttätig Assoziationen, recherchiert in komplexen Inhalten und lernt auch noch aus dem genutzten Ergebnis dazu.

Zukünftig werden jene Shop-Betreiber, Suchmaschinen und generell Informationsanbieter die Nase vorn haben, welche den "Suchern" das "Finden" erleichtern und vor allem verbessern. 

Tassos - Technologie - Anwendungen

1.1   Grundlagen

Die Technologie der Software Tassos (Technologie assoziativer Speicher), auf der die Innovation der hier dargestellten Funktionen beruht, wurde in über zwanzigjähriger Forschungs- und Entwicklungsarbeit geschaffen.

Das Kernmodell beinhaltet vor allem Erkenntnisse über a) die Funktion des menschlichen Gehirns, b) aus der Mathematik der Künstlichen Neuronalen Netze und c) aus Verfahren der Künstlichen Intelligenz.

Diese Software wird seit mehreren Jahren als Kern einer intelligenten selbstlernenden Bildverarbeitungssoftware durch die Fa. IBV GmbH vermarktet.

1.2   Technologie Tassos

Der Technologie von Tassos liegen in einer modularen und erweiterbaren Struktur neuronale Netze und assoziative Speicher zugrunde. Der Aufbau des Systems sieht folgendermaßen aus:



Das wichtigste Merkmal der Innovation besteht darin, Informationen jeglicher Art auf einem Rechner so darzustellen, dass aus diesen Informationen Ähnlichkeiten und Abhängigkeiten erkannt werden und selbstlernende Prozesse ermöglicht werden. Im Folgenden wird versucht, die Funktionsweise anschaulich zu beschreiben.

1.3   Funktion der Technologie Tassos

In konventionellen Systemen sind die Textdaten immer in ihrer ursprünglichen Form als ASCII-Codes von Einzelworten gespeichert. Alle Zugriffe, wie direkte Textsuche, basieren ausschließlich auf Operationen mit diesem ASCII-Code (Vergleich von Texten mit einem Suchwort bei der Volltextsuche, Erstellen von Statistiken bei der Kategorisierung etc.). Modifikationen dieser Operationen wie z.B. Erreichen von Tippfehlertoleranz oder auch "Assoziationen" zwischen Wörtern beruhen auf der Existenz von Tabellen, in denen z.B. verschiedene Schreibweisen von Wörtern oder auch Synonyme für einzelne Wörter (per Hand) eingetragen werden.

Bei Tassos werden alle ASCII-Daten zur Speicherung in eine Menge von "Eigenschaften" verwandelt. Diese Menge legt damit mathematisch gesehen einen Punkt in einem Eigenschafts- oder Merkmalsraum fest. Jeder eingegebene ASCII-Text (Einzelwörter oder auch ganze Wortsequenzen beliebiger Länge) entspricht damit einem solchen Punkt im Merkmalsraum.

Der wichtigste Vorteil dieses Vorgehens ist der, dass nun die relative Lage dieser Punkte etwas aussagt über die Ähnlichkeit der darin kodierten Texte. Dieses Vorgehen ist nach der Speicherung von Informationen im menschlichen Gehirn modelliert: Wenn wir das Wort BALL geschrieben sehen, müssen wir zuerst diese Buchstaben in das zugehörige Wort BALL umwandeln. Dabei fügen wir unbewusst bereits einige Eigenschaften zu diesem Wort hinzu, z.B. "ist Hauptwort", "ist konkreter Gegenstand" etc.. Das Wort Ball ist uns aber vermutlich auch bereits als Bezeichnung für einen Gegenstand bekannt, so dass wir hier noch weitere Eigenschaften hinzufügen (rund, weich, innen hohl, geeignet zum Werfen,...). Wir erweitern damit das Wort zum (mit Bedeutung versehenen) Begriff.

Diese Art der Speicherung ermöglicht bereits an sich (ohne komplizierte Zugriffsoperationen) eine fast unübersehbare Reihe von Funktionen ! Als Beispiel sei hier der "assoziative Zugriff" genannt:

Wenn wir einen Gegenstand nur ertasten, nicht aber sehen können, dessen Eigenschaften ebenfalls "rund, weich, innen hohl,.." sind, dann erkennen wir daraus ohne weiteres den Begriff BALL (und damit letztendlich auch die ASCII-Eigenschaft BALL). Wir können also durch Vorgabe einiger Eigenschaften das ähnlichste uns bekannte Objekt wiedererkennen.

Alleine diese Eigenschaft macht einen assoziativen Speicher wie TASSOS bereits allen konventionellen Speichermethoden weit überlegen. Es ergibt sich daraus ohne weitere programmtechnische Maßnahmen eine sehr hohe Tippfehlertoleranz, "unscharfe" Suche ohne Boolesche Operatoren, Suchen von Einzelteilen in kompletten Texten, Zerlegen von Komposita, Eingabe längerer Suchstrings sowie eine sehr hohe Zugriffsgeschwindigkeit für das Finden der ähnlichsten Eintragungen.

Eine weitere Möglichkeit der Suche in assoziativen Speichern kann durch die Vorgabe von Zusatzwissen in einfacher Weise modifiziert werden. Am Beispiel "KUGEL" soll dies verdeutlicht werden:

Es wird nach dem ASCII-Begriff "KUGEL" in einem Gesamttext gesucht. Da dieses Wort aber recht mehrdeutig ist, erhält man u.U. eine lange Liste verschiedener Texte, die sich entweder mit Waffen (Bleikugel), Spielzeug (Murmeln), Sport (Kugelstoßen) oder anderen Themen beschäftigen.

Ist aber der Kontext der Abfrage durch weitere Angaben bei der Suchabfrage ("Kugel beim Zehnkampf", vorherige Eingaben des Benutzers "ich interessiere mich für Sportgeräte" oder andere Informationsquellen bekannt, dann werden die sich ergebenden Merkmale zusätzlich zum eingegebenen Suchwort mit verwendet. Die sich ergebenden "ähnlichsten Eintragungen" sind dann automatisch nach Zugehörigkeit zum entsprechenden Kontext sortiert.

Hier ist noch anzumerken, dass dieser Kontext (wie auch beim Menschen) dynamisch sehr schnell geändert werden kann, da er ja nicht programmtechnisch festgelegt, sondern rein durch Zusatzmerkmale definiert ist.

Aus Platzgründen kann an dieser Stelle nicht auf die Vielzahl von Vorteilen eingegangen werden, ein Punkt soll aber noch angesprochen werden, welcher fast als "Abfallprodukt" des eigentlichen Suchwerkzeugs TASSOS bezeichnet werden kann:

Auch die Struktur des assoziativen Speichers selbst beinhaltet relevante Informationen über die internen Zusammenhänge der eingelernten Daten! Wenn man mit den geeigneten Werkzeugen den Aufbau des Merkmalsraums nachträglich untersucht, sieht man die Zusammenhänge zwischen verschiedenen Begriffen abhängig vom jeweiligen Kontext. Dazu ein Beispiel:

Wenn bei den eingelernten Texten der Begriff "Himbeereis" und "hoher Umsatz" im Zusammenhang mit dem Begriff "Hitze" steht, dann hat das System den Zusammenhang "bei Hitze gibt es hohen Umsatz bei Himbeereis" gelernt. Mag dieses Beispiel auch trivial sein, der gleiche Vorgang kann auch dazu benutzt werden, völlig unbekannte Zusammenhänge aus Textdokumenten zu extrahieren.