Business Intelligence |
|
Text Mining: Grundlagen, Verfahren und Anwendungen |
Peter Gerstl, Matthias Hertweck, Birgit Kuhn |
Zusammenfassung
Im Zuge der zunehmenden elektronischen Speicherung von
unstrukturierten Daten wird der Zugriff auf die richtigen
Informationen zur richtigen Zeit immer bedeutsamer. Text
Mining stellt dabei eine Schlüsseltechnologie dar, die
Benutzern durch Automatisierung von Informationsextraktion
und -analyse schnellen Zugang zu relevanter Information
ermöglicht. Eine der großen Herausforderungen im Text Mining
besteht darin, Information, die sprachlich wiedergegeben ist,
explizit zu machen, um sie für die maschinelle Analyse zu
erschließen. Im Text Mining werden, abhängig von der zu
lösenden Aufgabe, Kombinationen heuristischer und
linguistischer Verfahren eingesetzt, die in der Lage sind,
mit der Vielfalt sprachlicher Ausdrucksmöglichkeiten
umzugehen, ohne eine tief gehende Analyse der sprachlichen
Strukturen zu leisten.
Dieser Artikel stellt die Grundlagen und Verfahren von Text
Mining vor, wobei vertiefend auf verschiedene Technologien
zur Inhaltsanalyse eingegangen wird, die den Weg ebnen für
eine linguistisch adäquate Vorverarbeitung der Texte. Zu den
Verfahren zählen die Merkmalsextraktion, Kategorisierung,
Clustering und automatische Ermittlung der Sprache eines
Dokuments. Text Mining findet in unterschiedlichen
Aufgabengebieten Anwendung, beispielsweise bei der Extraktion
relevanter Information aus Dokumenten, bei der Klassifikation
von Dokumenteninhalten und bei der automatischen Ermittlung
thematischer Ähnlichkeiten in Dokumentenkollektionen.
Inhaltsübersicht
- Grundlagen
- Aufgabengebiete und zugehörige Verfahren
- Erschließung des Dokumenteninhalts
- Klassifikation von Dokumenteninhalten
- Strukturermittlung in Dokumentenkollektionen
- Einsatzgebiete und Anwendungsbeispiele
- Text Mining in der Finanzdienstleistungsbranche
- Einsatz von Text Mining zur Patentanalyse
- Automatische Klassifikation von Zeitungsartikeln (Information Broker)
- Literatur
Dieses Heft ist vergriffen, d.h. nicht mehr lieferbar. Eine Neuauflage ist nicht geplant.
Die Beiträge aus diesem Heft sind jedoch noch separat und kostenpflichtig unter
www.genios.de erhältlich.
HMD, Heft 222, Dezember 2001
|