datenbank-projekt.de

 Datenanalyse

Daten­auf­berei­tung, Data-Mining und Process-Mining, Daten­visualisie­rung

(Data-Analytics, Data-Science)

Überall fallen Daten an und es werden immer mehr. Leider sind diese Daten oft nicht direkt zugänglich, unübersichtlich oder erscheinen unzusammenhängend und überfordernd. Lassen Sie Ihre Daten sprechen, lauschen Sie dem, was Ihre Daten Ihnen sagen können. Gewinnen Sie neue Einsichten. Entscheiden Sie ab sofort besser und schneller, entscheiden Sie datengestützt.

Ich helfe Ihnen, aus Ihren Daten Informationen zu gewinnen.

Als Data-Analyst unterstütze ich bei der Analyse, Aufbereitung, Gewinnung und Visualisierung Ihrer Daten, dem kompletten ETL-Prozess (Extract, Transform, Load). Es kommen statistische und logische Techniken (z.B. SQL) zum Einsatz um Daten auszuwerten. Datenbanken werden abgefragt, Daten um redundante und unbrauchbare bereinigt um die benötigten Informationen zu erhalten. Als Data-Scientist konzentriere ich mich eher auf die Entwicklung von Modellen und Implementierung von Tools, die bei der Analyse der Daten und der Extraktion der benötigten Informationen unterstützen.

  • Recherche
  • Extraktion
  • Konvertierung
  • Modellierung
  • Transformation
  • Bereinigung
  • Zusammen­führung
  • Berechnung
  • Sta­tis­tische Ana­lyse von Unter­neh­mens­daten
  • Erkennen von Zusammen­hängen, Mustern, Ab­hän­gig­kei­ten, Quer­ver­bin­dun­gen und Trends
  • Auswahl ge­eig­neter gra­fi­scher For­mate zur Daten­prä­sen­tation
  • Erstellen von Dash­boards
  • Nutzung von Busi­ness Intelli­gence Tools

Ich unterstütze Sie, Licht in den Daten­dschungel zu bringen, diesen zu analysieren, wichtige neue Informationen zu gewinnen, zu visualisieren und zu transportieren. Sie erhalten fundierte und begründete Entscheidungs­hilfen, die Ihnen helfen, bessere Ergebnisse zu erreichen. Neben einfachen Rechnungen kann ich deskriptive, induktive und explorative statistische Verfahren sinnvoll auswählen, einsetzen und erläutern: Daten beschreiben, Hypothesen mit statistischer Wahrscheinlichkeit prüfen, Besonderheiten feststellen und datenbasierte Ausblicke geben.

Einige Tools mit denen ich Erfahrung habe und die zum Einsatz kommen könnten (teils Open-Source Software, teils wird eine Lizenz benötigt): R (und verschiedene Oberflächen RKWard, RCommander, Jamovi, Jasp), Anaconda (Jupyter, Python), GNU PSPP, IBM SPSSBlueSky Statistics, Microsoft Excel inkl. Power Query, Microsoft Power BI, Tableau, und verschiedene Open-Source BI-Anwendungen. Hinzukommen diverse spezialisierte Tools für die Extraktion von Daten aus Datenbanken (SQL Server, MySQL/MariaDB, MS Access etc.). Gerne können Sie andere Tools für Ihre Analysen vorschlagen.

Zu viele Informationen? Zu detailliert? Lassen Sie uns gemeinsam Ihre Wünsche erörtern und mich im Anschluss Vorschläge zum Vorgehen machen. Nehmen Sie Kontakt mit mir auf, gerne auch telefonisch!

 Datenaufbereitung

Kriteriengeleitete Entscheidungen, die transparent und objektiv nachvollziehbar sein sollen, benötigen Daten. Diese liegen in unterschiedlichen Formen, an vielerlei Stellen im Unternehmen und in ganz unterschiedlicher Qualität vor. Daten können schriftlich in Textform, als Zahlen in einer Kalkulationstabelle oder auch nur als implizites Wissen Ihrer Mitarbeitenden vorliegen: In welcher Reihenfolge ein gewisser Sachverhalt bearbeitet wird, mag allen Mitarbeitenden klar, jedoch nirgends dokumentiert, sein. Auch aus Ablaufdiagrammen lassen sich Informationen ableiten und Daten gewinnen.
Wird die Qualität von Daten betrachtet, ist schnell zu erkennen, dass diese stark schwanken kann: Von der sekundengenauen Dokumentation eines Ablaufs einerseits über falsche oder fehlende Einträge in einzelnen Feldern einer Tabelle bis zum kompletten Fehlen von ganzen Datenreihen andererseits.

Die Datenaufbereitung betrifft somit viele unterschiedliche Tätigkeiten die sich dem Erkennen von Datenquellen widmen (Recherche), die sich damit beschäftigen, Daten aus diesen Quellen auszuwählen und zu extrahieren, auswertbar und nutzbar zu machen. Hierbei müssen Datenformate vor einer Weiterverarbeitung umgewandelt werden (Konvertierung, Transformation), fehlende Daten berücksichtigt werden und Ausreißer, Exoten und Duplikate entsprechend behandelt werden (Bereinigung). Es gilt ein sinnvolles Modell zu entwerfen, wie die Daten miteinander zusammenhängen und dies auch ggf. softwaretechnisch umzusetzen, damit eine Zusammenführung möglich wird und sich letztlich neue Werte berechnen lassen.

Erst im Anschluss ist eine weitere Nutzung der Daten möglich: Ableitung von Informationen mittels Data- und Process-Mining und Visualisierung.

Datenaufbereitung ist eine umfangreiche und sehr grundlegende Tätigkeit: Wenn sich hier Fehler einschleichen, sind alle darauf begründeten Berechnungen, Auswertungen und abgeleiteten Empfehlungen suboptimal oder im schlechtesten Fall komplett falsch. Daher ist die Datenaufbereitung das Fundament der Datenanalyse und muss mit entsprechender Sorgfalt durchgeführt werden.

Sie dürfen auf mich und mein Know-How bei dieser anspruchsvollen Tätigkeit zählen.

 Data-Mining und Process-Mining

Worum geht es hier? Data-Mining (auch Knowledge Discovery in Data, KDD) und Process-Mining dienen dazu, aus vorhandenen Informationen mittels statistischer Methoden, künstlicher Intelligenz und unterschiedlicher Software neue, wertvolle Informationen aus Daten zu gewinnen [IBM][Wikipedia][Gabler Wirtschaftslexikon]. Beim Process-Mining liegt der Schwerpunkt auf der Analyse und Verbesserung von Prozessen. Im Gegensatz zu anderen Methoden ist Process-Mining tatsächlich datenbasiert, d.h. es werden objektiv nachvollziehbare Daten zur Analyse genutzt [Celonis][Wikipedia]. Process-Mining kann auf ganz unterschiedliche Unternehmensbereiche wie Beschaffung, Buchhaltung, Vertrieb oder der Fertigung angewendet werden [Wikipedia].

Zusammengefasst verstehe ich hierunter, angelehnt an die bei Wikipedia beschriebe Definition, die Extraktion von Wissen, das im statistischen Sinne gültig ist, bisher oft unbekannt oder unbewusst war und potentiell nützlich ist [Wikipedia] aus den Daten, die Ihrem Unternehmen zur Verfügung stehen.

Meine fundierte wissenschaftliche und naturwissenschaftliche Ausbildung mit großen Schwerpunkten auf analytisches Arbeiten und statistische Verfahren, sowie jahrelange Erfahrung in der Arbeit mit Datenbanken, Datenmodellen, SQL, Tabellen und entsprechender Software befähigen mich, Ihnen Data-Mining und Process-Mining anzubieten und qualitativ hochwertig für Sie durchzuführen. Deskriptive und induktive statistische Kenntnisse erlauben mir nicht nur die nachvollziehbare und objektive Untersuchung und Interpretation Ihrer Daten, sondern auch die Ableitung von Handlungsempfehlungen. Die Datenanalyse kann ich mittels unterschiedlicher Tools durchführen, Trends und Besonderheiten erkennen und Ihnen die Ergebnisse transparent darlegen und erläutern. Durchgeführte Analysen lassen sich im Anschluss leicht erneut, für veränderte und aktualisierte Daten durchführen, und schaffen so langfristigen Nutzen.

 Datenvisualisierung

Ergebnisse des Data-Mining können unübersichtliche Zahlenreihen und lange, sowie breite Tabellenblätter sein. Ziel einer Datenvisualisierung ist es, die in Zahlen enthaltenen Informationen übersichtlich und eingänglich aufzubereiten. Die Auswahl geeigneter grafischer Formate zur Datenpräsentation ist damit eine Kernkompetenz der Datenvisualisierung. Nicht alles was möglich ist, ist für Ihren Fall geeignet. Nicht alles was geht ist sinnvoll.

Zusammenhänge sollen ersichtlich, Trends, Exoten und Ausreißer erkennbar werden. Das Ergebnis soll im besten Fall noch die Datenpräsentation für Mitarbeitende und Investoren erlauben. Dashboards sollen immer aktuell sein und Daten so aggregieren, dass eine schnelle Orientierung möglich ist. Filter lassen sich auf diese anwenden, und Grafiken, Tabellen und Auswertungen passen sich diesen sofort an.

Es leuchtet ein, dass jede Software spezifische Vor- und Nachteile bezogen auf Einfachheit der Nutzung, Funktionsumfang und Kosten hat: Excel mag vorhanden und relativ einfach zu bedienen sein, bietet aber weniger Möglichkeiten als spezielle Business Intelligence (BI)-Tools. Andererseits lassen sich auch hiermit dynamische Dashboards erstellen. Grafiken, die mittels Drittanbieter Software erstellt werden (z.B. R), lassen sich ggf. ebenfalls direkt in Auswertungen und Dashboards einbinden. So kann etwa Power BI R-Code direkt verarbeiten.

Geeignete dynamische Grafiken und Dashboards kann ich für Sie mittels unterschiedlicher Software erstellen. Die Nutzung von Business Intelligence Tools (Microsoft Power BI oder Tableau) ist genauso möglich wie die von Microsoft Excel oder Statistik Software.

So kann es weitergehen

Sehen Sie sich Beispiele bisheriger Projekte an oder nehmen Sie Kontakt mit mir auf, gerne auch telefonisch!