Was versteht man unter Data Mining?

Durch automatisierte Systeme und der zunehmenden Digitalisierung von Arbeitsabläufen, wird das Erheben von Daten erleichtert. Big Data, Daten im Überfluss ist die unmittelbare Konsequenz aus dieser Entwicklung. Doch wie lässt sich aus dieser Entwicklung Profit schlagen? Ziel des data mining, oder auch explorative Statistik genannt, ist es aus genau diesen großen Datenmenge erste Erkenntnisse zu gewinnen und mögliche Zusammenhänge zu ermitteln. Die explorative Datenanalyse ist insbesondere dann von Interesse, wenn noch wenig über die gesammelten Daten bekannt ist.

Wir helfen Ihnen dabei einen guten Überblick über Ihre Datenlage zu gewinnen und erste Erkenntnisse daraus zu erlangen.

Welche Verfahren werden in der explorativen Statistik angewandt?

Bei Smart Statistical Consulting besteht der erste Schritt der explorativen Statistik darin Methoden der deskriptiven Statistik anzuwenden. Zu diesen gehört eine Vielzahl von geeigneten Diagrammen und Grafiken, wie z.B.:

Boxplots

Boxplots helfen die Streuung von Daten besser einzuschätzen. Dabei gehen verschiedene Kennwerte wie z.B. der Mittelwert, das Minimum und das Maximum in die Grafikerstellung ein und lassen sich mit einem kurzen Blick einschätzen.
beispiel boxplot

Histogramme

Histogramme ermöglichen einen guten Eindruck der Verteilung von Daten zu erhalten. In diesem Beispiel können Sie sofort ablesen welche der beiden Aktien wohl die risikoreichere ist.
beispiel histogramm

Scatterplots

Scatterplots helfen Zusammenhänge von Variablen zu erkennen. Dieses Beispiel demonstriert noch mal wie der Bremsweg bei steigender Geschwindigkeit zunimmt.
beispiel scatterplot
Aber auch Tabellen mit Kennwerten wie Mittelwerten, Medianen, Quantilen und Standardabweichungen, die in keiner deskriptiven Auswertung fehlen sollten. Natürlich verlassen wir uns dabei nicht auf unser Gespür, sondern werden unterstützt durch moderne Softwareentwicklungen wie z.B. RapidMiner und Weka. Diese Computerprogramme ermöglichen eine effiziente Auswertung großer Datenmengen, sodass kein Zusammenhang unentdeckt bleibt.

Im Anschluss an die deskriptive Beschreibung der Daten geben wir Ihnen ausführliche Handlungsempfehlungen. Je nachdem welche Resultate sich aus Ihren Daten ergeben, können wir Ihnen ausführliche Handlungsempfehlungen zu zukünftigen Datenerhebungen geben, oder Sie begleiten uns weiter entlang der statistischen Prozesskette zur Datenauswertung mit anschließender firmenspezifischer Integration der Handlungsempfehlungen.

Haben wir Ihr Interesse geweckt? Gerne helfen wir Ihnen mit Fragen weiter!

Ihr Ansprechpartner im Bereich Explorative Statistik:

Thomas Asendorf
0172/845 21 41
Inhaber
thomas.asendorf@statistik-beratung.com

Details vereinbaren