HMD Praxis der Wirtschaftsinformatik

ISSN 1436-3011

09.02.2010


Home
Suche
HMD aktuell
Aktuelle Ausgabe
40 Jahre HMD
Vorschau
Buchbesprechungen
HMD-Glossar
Veranstaltungskalender
HMD beziehen
HMD Probeabo
HMD Abo
HMD Einzelheft
Bezugsbedingungen
HMD archiv
HMD Info
Mehr über HMD
Herausgebergremium
Gastherausgeber
Mediadaten
Redaktion /' Verlag
Impressum
Autoren/ Gutachter
Autorenrichtlinien
Autorenfragebogen
Gutachter für die HMD
Beurteilungsbogen

Business Intelligence

[Zurück zum Inhaltsverzeichnis -
- E-Book bestellen -
- Feedback an den Herausgeber]

Text Mining: Grundlagen, Verfahren und Anwendungen

Peter Gerstl, Matthias Hertweck, Birgit Kuhn

Zusammenfassung

Im Zuge der zunehmenden elektronischen Speicherung von unstrukturierten Daten wird der Zugriff auf die richtigen Informationen zur richtigen Zeit immer bedeutsamer. Text Mining stellt dabei eine Schlüsseltechnologie dar, die Benutzern durch Automatisierung von Informationsextraktion und -analyse schnellen Zugang zu relevanter Information ermöglicht. Eine der großen Herausforderungen im Text Mining besteht darin, Information, die sprachlich wiedergegeben ist, explizit zu machen, um sie für die maschinelle Analyse zu erschließen. Im Text Mining werden, abhängig von der zu lösenden Aufgabe, Kombinationen heuristischer und linguistischer Verfahren eingesetzt, die in der Lage sind, mit der Vielfalt sprachlicher Ausdrucksmöglichkeiten umzugehen, ohne eine tief gehende Analyse der sprachlichen Strukturen zu leisten.

Dieser Artikel stellt die Grundlagen und Verfahren von Text Mining vor, wobei vertiefend auf verschiedene Technologien zur Inhaltsanalyse eingegangen wird, die den Weg ebnen für eine linguistisch adäquate Vorverarbeitung der Texte. Zu den Verfahren zählen die Merkmalsextraktion, Kategorisierung, Clustering und automatische Ermittlung der Sprache eines Dokuments. Text Mining findet in unterschiedlichen Aufgabengebieten Anwendung, beispielsweise bei der Extraktion relevanter Information aus Dokumenten, bei der Klassifikation von Dokumenteninhalten und bei der automatischen Ermittlung thematischer Ähnlichkeiten in Dokumentenkollektionen.

Inhaltsübersicht

  1. Grundlagen
  2. Aufgabengebiete und zugehörige Verfahren
    1. Erschließung des Dokumenteninhalts
    2. Klassifikation von Dokumenteninhalten
    3. Strukturermittlung in Dokumentenkollektionen
  3. Einsatzgebiete und Anwendungsbeispiele
    1. Text Mining in der Finanzdienstleistungsbranche
    2. Einsatz von Text Mining zur Patentanalyse
    3. Automatische Klassifikation von Zeitungsartikeln (Information Broker)
  4. Literatur

Dieses Heft ist vergriffen, d.h. nicht mehr lieferbar. Eine Neuauflage ist nicht geplant. Die Beiträge aus diesem Heft sind jedoch noch separat und kostenpflichtig unter www.genios.de erhältlich.

HMD, Heft 222, Dezember 2001

hosted by dpunkt.verlag