[01] Komm in die Handlung!
Aktie
Diese Änderungspunktdiagramme sind alle sehr schön, aber was sagen sie mir eigentlich?
Tatsächlich passiert im obigen Beispiel eine Menge, deshalb werden wir jeden Teil der Reihe nach erklären. Beginnend oben informiert uns der Haupttitel darüber, dass wir uns Änderungspunkte im Sonnenflecken -Datensatz ansehen, und dieser wird als Seriennummer S0001 identifiziert, was mit der nachfolgenden Ergebnistabelle übereinstimmt.
In diesem Fall stellen wir die monatliche Durchschnittszahl der von Januar 2000 bis Januar 2021 beobachteten Sonnenflecken dar. Dies ist die Zeitreihe, die blau dargestellt ist und sich sowohl im oberen als auch im unteren Diagramm wiederholt (bezeichnet als „Monatliche Menge“ ).
Das obere Diagramm zeigt alle in der Reihe in vier Iterationen des Änderungspunktalgorithmus erkannten Änderungspunkte. Die Reihenfolge, in der die Änderungspunkte erkannt werden, wird durch jede violette CPx- Nummer ( CP1 , CP2 , ... CPn ) angegeben. Der erste Änderungspunkt ist in der Regel die offensichtlichste Änderung. Die Tatsache, dass diese Reihe als saisonal identifiziert wurde, verhindert, dass regelmäßige saisonale Schwankungen als Änderungen identifiziert werden.
Der Grad der Sicherheit, dass es sich bei den erkannten Änderungen um tatsächliche Änderungspunkte und nicht nur um zufällige Schwankungen handelt, wird durch die Prozentwerte unter der entsprechenden CPx- Nummer angegeben. Änderungspunkte mit einem Konfidenzniveau über dem benutzerdefinierten Niveau (in diesem Fall 95 %) werden mit durchgezogenen violetten Linien dargestellt, während Änderungspunkte unter dem angegebenen Niveau gestrichelte Linien erhalten.
Änderungspunkte werden, sofern sie sinnvoll sind, in die untere Darstellung übertragen. definiert als:
- Sie sind statistisch signifikant und
- die Änderung des Durchschnittswerts überschreitet die benutzerdefinierte Mindeständerungsstufe (in diesem Fall +/- 10 %).
Die durchgezogene orange Linie zeigt den Durchschnittswert zwischen den Änderungen (beschriftet als Durchschnittliche Menge ) und die Größe der Änderungen an jedem Punkt wird durch die orangefarbenen Prozentwerte angezeigt. Die tatsächlichen Durchschnittswerte werden durch die Reihe orangefarbener Zahlen oben in diesem Diagramm angegeben.
In Wirklichkeit dienen die Diagramme nur als Bestätigung dafür, dass der Prozess wie erwartet funktioniert hat, und zwar nur während der Erkundungsphase Ihrer Analyse. Tatsächlich gibt es Optionen, während der Programmausführung nur eine Auswahl von Diagrammen anzuzeigen (sie sind schön anzusehen) oder gar keine.
Wie unten zu sehen ist, sind die in den Diagrammen angezeigten Schlüsselinformationen in der CSV-Ausgabetabelle zusammengefasst, obwohl die Change_IDs jetzt in chronologischer Reihenfolge sind. Diese Tabelle kann gefiltert und abgefragt werden, um Informationen für nachfolgende Analysen und die Einbeziehung in andere Modelle bereitzustellen. Start_Period und End_Period geben die Grenzen zwischen den einzelnen Änderungen an, während Duration der Zeitraum ist, über den die Avg_Quantity gilt (in diesem Fall die Anzahl der Monate).
Obwohl die Änderung zwischen einer End_Periode und der nächsten Start_Periode auftritt, möchten wir es lieber einfacher halten und sagen, dass die Änderung zum Zeitpunkt der Start_Periode aufgetreten ist.
Was die letzte Spalte in der Tabelle betrifft: Hoffentlich haben wir Ihr Interesse ausreichend geweckt und können dies in einem späteren Beitrag aufgreifen!