Glossar

zum Schwerpunktthema Web & Data Mining

Glossar zu HMD 268, erschienen im August 2009.

B

Business Intelligence (BI)
Unter Business Intelligence (BI) versteht man die Gesamtheit aller IT-gestützten Methoden zur systematischen Analyse (Sammlung, Auswertung, Darstellung) von Daten, die für das Unternehmen hohe operative oder strategische Bedeutung haben. Ziel ist die Gewinnung von Erkenntnissen, die bezogen auf die Unternehmensziele verbesserte operative oder strategische Entscheidungen ermöglichen. Hierfür steht eine Vielzahl analytischer Konzepte und IT-Systeme zur Verfügung. (HMD 268)

D

Data Mining
Data-Mining-Systeme stellen allgemein verwendbare, effiziente Analysemethoden zur Erkennung von Beziehungsmustern in großen Datenbeständen zur Verfügung. Mithilfe dieser Methoden wird insbesondere nach nicht trivialen, versteckten Strukturen und Zusammenhängen gesucht. (HMD 268)

O

Opinion Mining
Opinion Mining als Teilgebiet des Text Mining hat zum Ziel, entsprechend dem Anwendungsfall Meinungen, Einschätzungen und Stimmungen der betroffenen Personengruppen aufzudecken. Die Selektionskomponente wählt aus Datenbeständen (beispielsweise Foren) Datensätze (beispielsweise Beiträge) aus, extrahiert und aggregiert die darin enthaltenen Aussagen bzw. Bewertungen und stellt sie für weitere Analysen bereit. (HMD 268)

R

Random Forest
Random Forest ist ein Klassifikationsverfahren, bei dem anstelle eines einzelnen Entscheidungsbaumes mehrere Bäume erstellt und zur Klassifikation von Objekten in einer Menge benutzt werden. (HMD 268)

S

Semantisches Web
Das semantische Web (Semantic Web) zielt darauf ab, Informationen und multimediale Inhalte aufgrund ihrer Bedeutung (Semantik) miteinander zu verknüpfen und nutzbar zu machen. Es verfolgt dabei vor allem das Ziel, Inhalte des Web für Maschinen verarbeitbar zu machen. Dazu müssen die Inhalte des semantischen Web durch geeignete Software interpretiert und miteinander in Beziehung gebracht werden. Wesentlich dafür sind allgemein akzeptierte und standardisierte Wissensmodelle (Ontologien) sowie die entsprechende Auszeichnung der Inhalte (Semantic Markup). Eine Vielzahl hierfür verfügbarer Software, z.B. realisiert in Form von Webservices, ist bei der Herstellung der Beziehungen zwischen Begriffen über deren Bedeutung jedoch derzeit noch auf die Unterstützung durch Benutzer angewiesen. (HMD 268)

T

Text Mining
Text Mining bezweckt, Muster, Zusammenhänge und Erkenntnisse in Texten zu erkennen und daraus zu extrahieren. Texte liegen meistens in natürlicher und wenig strukturierter Form vor und müssen von geeigneter Software verarbeitet werden. Dazu wird der Text in seine Bestandteile zerlegt und anhand vorgegebener oder dynamisch trainierter Regeln hinsichtlich Syntax und Semantik untersucht. (HMD 268)

U

Unscharfe Klassifikation
Die unscharfe Klassifikation erlaubt, die Zugehörigkeit eines Objektes zu einer Klasse mit einem Zugehörigkeitswert zwischen 0 (gehört nicht dazu) und 1 (gehört voll dazu) auszudrücken. Durch Verzicht einer dichotomen Zuteilung erlaubt sie eine differenziertere Interpretation der Klassenzugehörigkeit. (HMD 268)

W

Web 2.0
Web 2.0 stellt einen weit gefassten Sammelbegriff dar, unter dem erweiterte Internettechnologien und - anwendungen sowie ein neues Verständnis des Internets durch den Nutzer subsumiert sind. Hauptmerkmal ist dabei die aktive Mitwirkung des Nutzers an der Content- Erstellung und Verteilung. Neben Internettechnologien wie z.B. Webservice-APIs, Ajax (Asynchronous JavaScript and XML), Weblogs oder Abonnementdiensten wie RSS werden auch Social Software bzw. Social Networks als Bestandteil von Web 2.0 angesehen. (HMD 268)
Web Analytics
Mit Web Analytics werden Verfahren bezeichnet, die das Verhalten der Besucher von Websites untersuchen. Mithilfe von Kennzahlen (gewonnen beispielsweise über eine Clickstream-Analyse) wird ermittelt, woher die Besucher kommen, für welche Webinhalte sie sich interessieren und wie viel Zeit sie investieren (Verweildauer). (HMD 268)
Web Mining
Beim Web Mining werden Algorithmen des Data Mining adaptiert oder spezielle Verfahren entwickelt, um Webinhalte (Content), Struktur oder Nutzungsaspekte analysieren zu können. (HMD 268)
HMD Best Paper Award 2011
Bestellen Sie ein Probeabo!
Bestellen Sie Ihr kostenloses Probeheft von IT-Governance!