[02] Ich möchte, dass es sinnvoll und nachhaltig ist!

Aber was bedeuten diese Begriffe?

Der CPD-Algorithmus identifiziert statistisch signifikante Änderungspunkte gemäß dem benutzerdefinierten Konfidenzniveau . Dadurch wird sichergestellt, dass die Änderungen legitim sind und keine einmaligen oder zufälligen Abweichungen darstellen. Wir möchten bei der Anzeige einer Änderung falsche Positivwerte vermeiden und je höher das Konfidenzniveau ist, desto unwahrscheinlicher ist es, dass diese auftreten. Im Allgemeinen muss eine Bewegung etwa dreimal hintereinander auf einem neuen Niveau beobachtet werden, um mit 95 %iger Sicherheit als Änderung identifiziert zu werden.

Der Algorithmus behält außerdem nur Änderungen von ausreichender Größe bei, wie durch den Parameter „Mindestprozentsatzänderung“ angegeben. Diese beiden Anforderungen zusammen stellen sicher, dass die erkannte Änderung das ist, was wir als bedeutsam bezeichnen; das heißt, die Änderung ist statistisch signifikant und beträchtlich.

Eine weitere nützliche Voraussetzung ist, dass die Änderung nachhaltig ist, d. h. dass eine Änderung nicht durch eine nachfolgende Änderung in die entgegengesetzte Richtung kurz darauf aufgehoben wird. Im Beispiel für eine wöchentliche Reihe unten gab es zwei Änderungspunkte in schneller Folge, wobei die zweite Änderung die erste im Wesentlichen aufhob. Die Bewegung ist mehr als nur ein Ausschlag, sodass sie zu Recht als Änderung aufgefasst wurde. Der gesamte nicht nachhaltige Zeitraum wird durch die gepunktete orange Linie gekennzeichnet.

Wenn wir uns an dieser Stelle die CSV-Ausgabedatei ansehen würden, würden wir sehen, dass die Boolesche Variable „Sustained “ auf „False“ gesetzt ist, wenn die Bewegung nicht aufrechterhalten wird:

In der Praxis möchten wir nicht nachhaltige Änderungen in allen nachfolgenden Analysen ignorieren, da sie nicht das Gesamtbild widerspiegeln. Die einfache Möglichkeit wäre, solche Änderungszeilen zu löschen, wenn sie auftreten, aber dabei würden einige Informationen verloren gehen. Stattdessen bietet CPD die Möglichkeit, nicht nachhaltige Änderungen zu ignorieren und die Durchschnittswerte um sie herum neu zu berechnen.

Ich weiß, wir sind noch nicht auf die CPD-Einstellungen eingegangen und es gibt eine Menge davon (jetzt verfügbar unter Einstellungen ), aber in diesem Beitrag werden wir mit den sinnvollen und nachhaltigen Einstellungen beginnen, da diese am interessantesten sind. Diese Einstellungen werden auf der Registerkarte „Änderungspunkt“ angezeigt, wie unten dargestellt.

Sie können sehen, dass das Konfidenzniveau auf 95 % eingestellt ist. Wenn Sie diesen Wert beispielsweise auf 99 % erhöhen, verringert sich die Anzahl der ermittelten Änderungspunkte, es besteht jedoch das Risiko, dass einige legitime Änderungspunkte übersehen werden. Alternativ können Sie den Wert verringern und den Algorithmus empfindlicher machen und weniger als drei Beobachtungen benötigen, bevor eine Änderung erkannt wird. Dadurch erhöht sich jedoch das Risiko falscher Positivergebnisse. Um das geeignete Niveau zu bestimmen, müssen Sie die Kosten zwischen der Ermittlung falscher Positivergebnisse und dem Übersehen echter Positivergebnisse abwägen.

Die minimale prozentuale Änderung ist auf 10 % festgelegt, was bedeutet, dass nur Änderungen beibehalten werden, die +/- 10 % überschreiten. Wenn Änderungen kleinerer Größe erkannt werden, kombiniert der Algorithmus die Änderungsdauern, bis keine einzelnen Änderungen mehr vorhanden sind, die zu klein sind.

Das minimale Änderungsintervall gibt die kürzeste Dauer an, die zwischen Änderungen zulässig ist. Der Wert 5 bedeutet in diesem Fall, dass mindestens fünf Wochen vergehen müssen, bevor eine weitere Änderung in die eine oder andere Richtung beibehalten wird. Mit diesem Parameter kann verhindert werden, dass eine Änderung, die am besten als eine Änderung angesehen werden würde, in zwei Änderungen aufgeteilt wird, beispielsweise wenn es in einer Woche eine Erhöhung um 40 % und drei Wochen später eine weitere Erhöhung um 10 % gab.

Der Parameter „Dauer“ gibt das maximale Intervall an, in dem nicht anhaltende Änderungen erkannt werden. Wenn es in diesem Fall also innerhalb von 12 Wochen zu einer Zunahme und dann zu einer Abnahme (oder umgekehrt) kommt, wird dies wahrscheinlich als nicht nachhaltig gekennzeichnet. Das tatsächliche Ergebnis wird auch durch das angegebene minimale Änderungsintervall beeinflusst; wenn dieser Wert nahe am Wert für die Dauer liegt, gibt es möglicherweise ohnehin keine nicht anhaltenden Intervalle.

Und schließlich, um auf die Option zurückzukommen, nicht nachhaltige Änderungen zu ignorieren, wird diese durch den Selektor Nicht nachhaltige Änderungen ignorieren bereitgestellt. Die Verwendung dieser Option führt zur Neuberechnung der Änderungspunkte, was zu folgendem Diagramm führt:

und die folgende Ausgabedatei, in der alle Änderungen nun beibehalten werden:

Zurück zum Blog

Hinterlasse einen Kommentar

Bitte beachte, dass Kommentare vor der Veröffentlichung freigegeben werden müssen.