H法による株価チャートの予測計算について、その具体的な内容・計算方法などを詳細に説明します。
いろいろな予測システムがありますが、基本は、横軸に項目,縦軸にデータ数といったDB(データベース)形式の情報からスタートします。今回の解析も、MT4や証券会社からDL(DownLoad:ダウンロード)したCSVファイルをベースに予測シミュレーションしています。データ表を以下に示します。CSVで読み込める情報は四本値(始値,最大,最少,終値)だけです。EXCELに取り込んでインディケーターやオシレーターを計算しておきます。なお、今回データベースとして使用したデータは11年分以上で70000行にも及ぶもので、かなり重たいファイル容量になっています。
軸(項目)は、4本値からはじまり、移動平均(5,21,75),ボリンジャーバンド(1σ,2σ,3σ),RCI(9,21,52),MACD(MACD,シグナル,オシレータ)を計算しました。世の中にはこれ以外のインディケーターはたくさんありますが、よく使われるもの+自分が使っているもの、ということでこの項目にしています。生データは数字の集まりで視覚的に見えにくいですが、グラフにすると下図のようになります。最初の図がローソク足を「株価チャート」という形式のグラフにしたものと、3本のMA(移動平均線),6本のボリンジャーバンド(-3σ~+3σ)の図。その下がRCI,最下段がMACDのグラフです。
今現在の形状から、上がるか下がるかを予想したいのですが、予測のシミュレーションをするため、データの任意の位置を予測したい形状として決めます。そして、その前後のデータを使って予測することとします。
予想したい形は、下図のピンクで囲った部分となります。このデータと、その前後にあるデータとを評価して、青く囲った部分、つまりその後のローソク足形状(一般には終わり値を使うので、終わり値の値の推移)を予測します。
検索したい形のデータ群と、それ以前のデータ(データベース)におけるデータ群とを比較して近い形を探します。
まずは、代表的な計算例から示します。H法は複数の項目について誤圧(検索したいものとデータベースとの差の2乗平均)を計算することから始まります。わかりやすいように、1条件のみ,終わり値の例で見ていきましょう。
数値ではわかりづらいと思うので、図示しながら説明します。求めたい形状の終わり値を赤線で引きました。この赤線とどれくらい近似しているかを計算します。
データベースを順に全て計算するのですが、その1画面が下図だとします。緑色の線がその位置における終わり値の線です。検索したい終わり値の赤線と緑線の差を計算します。
基準日(一番右端)は値が異なります。そこがズレたままでは正しく評価できないので、まず基準点(基準日)を合わせます。つまり、緑線と赤線の右端を合わせます。次に、1 point前から順にn個の誤圧Veを計算します。
この計算で、終わり値についてのVeが計算できます。
同様にMAやBB,MACDなどについてもVeを計算していきます。
ここで重要なのは、基準をどこにおくかと言うことになります。
移動平均線の例で示せば、下図75MAの場合、終値を基準にする場合と、75MAの最終値にする場合が考えられます。下図では、検索したい形と比較する形とで、終値を基準にすると大きく異なりますが、75MA最終値を基準にすると差はありません。どちらが正しいというわけではなく、何を重視するかによって基準点を変える必要があるということです。もちろん、どちらか片方を選択しなければならないわけではなく、両方を項目として評価しても良いわけです。
各項目ごとのVeが計算できたら、それを総合します。
全てのVeの合計がある閾値以内のものだけを抽出します。閾値は試行錯誤しながら決めるしかないのですが、生き残る数は少なすぎても多すぎても良くないので、10個ていど生き残るように決めました。
閾値をクリアしたブロックの各未来動向(各基準日からの終わり値の推移)について、Veで重み付けしながら計算します。そうして出力された値が推定値となります。
今回の計算は、標準的なH法の計算手順とは実は異なります。
通常は、1行毎に総合Veを求めます。(下図右側)この場合規準化も必要です。また項目数も少ないので、例えばMAならβ(傾き)を追加するなどすべきでしょう。しかし、チャートは流れがあり、形状も非線形であるので、それをなるべく正確に近似させたいので、今回は基準となる位置から数pointさかのぼったデータを含めてVeを計算しました。H法のいわば応用計算です。課題に合わせて計算式を変えるような柔軟さも必要だと思います。
下図の中央付近(複数の折れ線の始まり位置)が基準日です。図は検索したいデータのチャートで、基準日以前の形状を使って,その後の推移を予測しました。閾値をクリアしたデータは緑色の細い折れ線で複数本あります。これらの折れ線の値をVeで重み付けして、最終推定値として計算したのが赤く太い折れ線です。
H法による予測値の計算方法について説明しました。
項目の範囲(何point前まで遡るか)や基準点の取り方(例えば移動平均線であれば、基準日の値を基準にするか、終わり値を基準にするか)、各指標の重み付け(項目毎に閾値を分けることで重み付けとなる)など、設定パラメータは複数あります。これらのパラメータをどう決めるかによって、推定精度は変わってきます。パラメータを最適化する手順については こちら を参照してください。