top of page

Time Series Analysemethoden

Autorenbild: Tobias DietzTobias Dietz

Aktualisiert: 16. Nov. 2023

Unternehmen sammeln zunehmen Daten ihrer Prozesse, um diese zu verbessern. Unter anderem gehören dazu Lagerdaten, Maschinendaten aber auch finanzielle Kennzahlen. Um effektiv mit den Daten arbeiten zu können und aus der Vergangenheit zu lernen, müssen diese Historisiert vorliegen. Dadurch stieg der Bedarf und die Popularität von Time Series Analysemethoden bzw. passende Datenbanken enorm. In diesem Artikel beschäftigen wir uns mit den Fragen:


- Woher kommt die Popularität von Time Series?

- Worauf sollte ich bei Time Series Daten achten?

- Was ist ein Quantile Forecast und wo liegen dessen Vorteile?

- Wieso sollte ich meine Time Series Daten speichern und wie kann ich mit Data Science aus ihnen einen Mehrwert zu generieren?



Steigende Popularität von Time Series


Das Sammeln von Daten und darauf basierende Analysen gewinnen in nahezu allen Branchen mehr und mehr an Bedeutung. Durch Smartwatches, Sensoren, Geldtransaktionen, Onlineeinkäufe, Website besuche, Logistik nehmen damit auch die potenzielle Datenquellen zu. In der unteren Übersicht haben wir einige Datenquellen aufgelistet:


Prinzipiell kann aus allen quantitativen Daten eine Zeitserie erstellt werden, um dadurch deren Verlauf über die Zeit zu überwachen bzw. deren Entwicklung zu beobachten. Wodurch Trends rechtzeitig erkannt werden können und so schnell gehandelt werden kann.



Data Science mit Time Series


Zeitserien liefert einen Vergleich der aktuellen Werte mit der Vergangenheit und ermöglichen damit eine bessere Bewertung der Lage und ein Gegensteuern bei Abweichungen. Aus Data Science perspektive ergeben sich allerdings noch weitere Anwendungsbereiche, um Entscheiden zu erleichtern bzw. zu verbessern:



Prädiktiv: Was passiert in der Zukunft?

• Wie viele Einheiten meiner Produkte werden morgen verkauft?

• Wie viele Ressourcen werden für die Produktion nächste Woche benötigt?

What-If-Analysen: Was passiert in der Zukunft, unter der Annahme, dass ...?

• Wie verändert sich die Ausschussquote bei höherer Maschinenauslastung?

• Wie verändert sich die Nachfrage bei einer Preisanpassung?

Time Series Classification: Welche Kategorie weist solche Eigenschaften auf?

• Ist ein Patient basierend auf dem EEG gesund?

• Wie ist Qualität des Materials gegeben der Sensorwerte?

• Lohnt es sich dieser Person Werbung zu schicken?

Anomaly Detection: Ist der Wert auffällig?

• Sind die Sensorwerte normal oder zu hoch?

• Sind die Finanztransaktionen legitim?



Besonderheiten bei Time Series Daten?


Um Zeitserien richtig nutzen zu können sind bei der Art der Datenerhebung einige Punkte zu beachten. Der Aggregationsgrad der Daten muss dabei ausreichend sein: Soll z.B. die stündliche Energieproduktion eine Photovoltaik Anlage vorhergesagt werden, müssen die Daten aus der Vergangenheit auch stündlich vorliegen. Durch die Art der Datenerhebung ergeben sich auch Fehlerquellen, z.B. Übertragungsfehler oder Messungenauigkeiten. Dabei sollte versucht werden diese zu minimieren z.B. durch Wartung und Monitoring.

Bei Zeitserien muss auch auf Konzept Drifts und Shifts geachtet werden. In dieses Fällen verändert sich das Verhalten der Zeitserie entweder über die Zeit oder schlagartig. Für die Genauigkeit der Vorhersagen ist es wichtig diese rechtzeitig zu erkennen, die Modelle anzupassen und neu zu trainieren. Ein Beispiel dafür könne das Verkehrsaufkommen im Jahr 2020 sein, welches sich durch Homeoffice schlagartig geändert hat. In diesem Fall wären die Vorhersagen basierend den alten Datenbeständen nicht mehr akkurat.

Möchte ein online Händler z.B. neue Produkte einführen und es wir ein Modell verwendet, um den Absatz vorherzusagen, ergibt sich ein weiteres Problem, denn es sind keine bzw. wenige Daten dafür verfügbar. Dies nennt sich Cold Start Problem. In einem solche Fall muss die Methode in der Lage sein zu generalisieren, um trotzdem eine Vorhersage treffen zu können. Dabei können Informationen über Produktgruppen bzw. Preiskategorien etc. helfen. Generalisierung ist die größte Stärke der modernen Machine Learning und Deep Learning Methoden.



Quantile Forecasts


Wenn es um Vorhersagen geht, wird oftmals die Zukunft anhand eines einzelnen Wertes vorhergesagt. Der einzelne Wert drück jedoch nichts über die Streuung bzw. Unsicherheit der Vorhersage aus. In vielen Anwendungsfällen ist eine Bewertung der Unsicherheit jedoch wichtig, um Entscheidungen ableiten zu können, in solchen Fällen sollte auf Quantile Vorhersagen zurückgegriffen werden. Eine Aussage könnte in diesen Fall sein: Der Vorhergesagte Wert liegt zu 90% zwischen 170 und 300. Eine solche Vorhersage nennt sich Quantile vorhersage. Wobei 170 das 5% Quantile sind und 300 das 95% Quantile. Die Vorhersage eines Intervalls, drückt die Unsicherheit der Vorhersage aus und liefert eine Einschätzung in welchem Raum die Vorhersage vermutlich liegen wird. Die Untere Abbildung zeig ein Beispiel für eine solche Quantile Vorhersage.



Für ein Unternehmen lohnt es sich, Daten über den Zeitverlauf zu sammeln, um daraus Zeitreiehen zu generieren und diese auszuwerten. Neben dem Rückblick der Historie, können vorhersagen eine bessere Planbarkeit und Überblick über Zusammenhänge der Vergangenheit liefern oder als Grundlage für eine Klassifikation von Qualität oder Risiken dienen.


Mit diesem Artikel wollten ich dazu anregen sich mit möglichen Anwendungsgebieten für Zeitreiehn Daten in ihrem Unternehmen zu beschäftigen und freue mich über Feedback. Nutzt ihr bereits Zeitreihen Daten und wertet diese mit Time Series Insights von Microsoft aus? Gerne können wir uns über LinkedIn oder E-Mail austauschen.



Aktuelle Beiträge

Alle ansehen

Comentarios


bottom of page