2009年6月2日火曜日

【情処本勉強中】回帰直線と相関係数

目下基本情報の勉強中。
使ってる参考書はこちら。


とりあえず第1章基礎理論終了。
だいぶ前に勉強したところで忘れてるところが結構あって勉強になった。
知らないところもあったので今後調べていこう。

今回は回帰直線と相関係数について。
統計情報を扱うには非常に重要な項目。意外と回帰直線の傾きと相関係数について見落としポイントがあったのでまとめ。

--
回帰直線は、散布図に描かれる各データと、回帰直線との差である偏差を最小にする直線。
相関係数とは2変数に密接な関連があるか否かを示す係数。-1~1の範囲をとる。
1に近ければ正の相関。-1に近ければ負の相関。0に近ければ無相関。

相関係数の値が異なっていても同一の回帰直線が求められることがある。

回帰分析は単回帰分析と重回帰分析に分けられる。
単回帰分析は1変量。重回帰分析は2変量以上。

単回帰分析はいわば体系化のための分析法。
構造化のための分析法にクラスタ分析(データを類似のグループに分割する)がある。
--


ちなみに。
回帰直線はサンプルデータの1次関数近似として表現できる。
この1次関数は、サンプルデータと1次関数の偏差の総和を1次関数のパラメータで微分してあげると簡単に求めることができる。
多変量の場合に難しいかと言われればそうでもなくて、1次関数が単に多変量になっただけで1変数の場合と同様に近似関数のパラメータで偏微分してあげるといい(微分とはチョイ違う)。

さらには1次関数だけでなく複雑な関数でサンプルデータを近似することができる。
ただ、微分がちょっとだけ面倒になることがネックかも。

この辺の話を公式として覚える際には1変量、1次関数近似が限界だけど、微分の手法を覚えれば多変量、複雑関数でも何でも適用できる。

0 件のコメント: