Elaboration in, Garbage out

Twitt*r ではメモできない何かそれ的なモノ・コトを

時系列データの因果性分析?

最近,時系列データから「異常」を見つけよう,という文脈で Temporal Causal Model with Granger Causality *1という名前をよく聞くので調べものメモ.用途を簡単に説明すると,

  • ある銘柄の株価の変動が他の銘柄の株に影響を与えるかを調べたい
  • 天気に関するデータから「異常」発生(ハリケーンとか)を予測したい

といった目的で使われる事が多いらしい.ソース Temporal Causal Models for Massive Time-series Data Mining: Climate Change Attribution and other Applications

んで,「異常」を予測するのなら,過去のデータには異常発生時刻があると便利そうと思う.てか普通使うだろ,と.でも Temporal Causal Model の学習するときには異常と正常を識別せずにぶん回すらしい.

どういうことかというと,この文脈では異常を全データの中ですごく稀な状態なこと(ex: 1ヶ月に 1 時間)だと定義している.だから,正常な時系列のパターンのみを「自然に」*2学習できて,正常状態を予測し続けることで,予測が外れたときに異常が検知できるといったロジックになっている,

うーん,なんだこの微妙な感じ.

*1:名前についてはそこまで調べてないので,定着した名前があるかもしれない

*2:レアケースの異常な状態は,正常状態の数の暴力により影響が無くなりやすい