-
Moderator
Die semantische Analyse ist extrem schwer, weil man sowohl "lol ihr stinkt" als auch "Wer tun können will muß auch lernen tun wollen" als auch "Du mußt in der Kernel-config nach rivafb greppen; die Config liegt in /usr/src/linux/.config." erkennen können muß - und das ist erst der Anfang. Die deutsche Sprache (und erst recht das, was im Internet als kommunikation durchgeht!) erlaubt eine Vielzahl von bescheuerten Satzkonstrukten, die einen - sofern man sie alle parsen können will - einen in den Wahnsinn treiben können.
Um hingegen grob das Thema eines Satzes zu bestimmen kann man viel lascher vorgehen - wenn man in Kauf nimmt, daß man ab und zu eben Unsinn erkennt. Man nimmt ein paar ganz allgemeine Regeln, nach denen man den Satz durchgeht und die immer irgendetwas zurückgeben, dann erhält man für jede Eingabe ein wahrscheinliches Thema. Wenn man da die Liste der möglichen Stichwörter einfließen läßt (über Stringähnlichkeitsalgorithmen und einen Baum kann man wahrscheinlich mit halbwegs erträglichem Aufwand gegen alle bekannten Wörter prüfen) sollte die Trefferquote mit genug Training halbwegs gehen.
Berechtigungen
- Neue Themen erstellen: Nein
- Themen beantworten: Nein
- Anhänge hochladen: Nein
- Beiträge bearbeiten: Nein
-
Foren-Regeln