「決定係数をエクセルで計算したいけど、どの関数を使えばいいの?」と悩んでいる方は多いのではないでしょうか。
エクセル(EXCEL)は、統計分析においても非常に強力なツールであり、決定係数(R²)を求める方法も複数用意されています。
RSQ関数を使う方法、グラフの回帰直線からR²を表示する方法、そしてデータ分析ツールを使う方法と、アプローチはさまざまです。
本記事では、それぞれの方法について手順を丁寧に解説していきます。
エクセル初心者の方でも迷わず実践できるよう、具体的な操作手順とともに確認していきましょう。
目次
エクセルで決定係数を求める最速の方法はRSQ関数を使うこと
それではまず、エクセルで決定係数を求める最も基本的な方法について解説していきます。
結論として、エクセルで決定係数を求める最も手軽な方法はRSQ関数を使うことです。
RSQ関数は「R-Squared(Rの二乗)」を意味し、まさに決定係数R²を直接計算するために設計された関数といえるでしょう。
RSQ関数の基本的な書き方
RSQ関数の構文は非常にシンプルです。
RSQ関数の構文
=RSQ(既知のY, 既知のX)
既知のY :目的変数(予測したい変数)のデータ範囲
既知のX :説明変数(予測に使う変数)のデータ範囲
例:=RSQ(B2:B11, A2:A11)
※YとXの順番を逆にしないよう注意が必要です。
RSQ関数が返す値は0から1の間の数値で、これが決定係数R²そのものです。
なお、RSQ関数は内部的に相関係数を計算してその二乗を返す仕組みになっているため、単回帰における R² = r² の関係がそのまま実装されています。
RSQ関数を使った具体的な操作手順
ここでは、実際にエクセルでRSQ関数を使う手順を追って確認していきましょう。
| 手順 | 操作内容 |
|---|---|
| ① | エクセルにデータを入力する(A列にX、B列にYを入力) |
| ② | 決定係数を表示したいセルをクリックして選択する |
| ③ | =RSQ( と入力する |
| ④ | Yのデータ範囲をドラッグして選択する(例:B2:B11) |
| ⑤ | カンマ(,)を入力する |
| ⑥ | Xのデータ範囲をドラッグして選択する(例:A2:A11) |
| ⑦ | )を入力してEnterキーを押す |
この手順で入力した数式は =RSQ(B2:B11, A2:A11) のような形になります。
Enterキーを押すと、そのセルに決定係数の値が表示されるでしょう。
たとえば「0.8521」と表示されれば、このモデルはデータのばらつきの約85%を説明できているということを意味します。
RSQ関数を使う際の注意点
RSQ関数を使う際には、いくつか注意しておきたいポイントがあります。
まず、YとXのデータ範囲のサイズ(データ数)が同じでないとエラーになるため、必ず同じ行数のデータを指定しましょう。
次に、RSQ関数は単回帰(説明変数が1つ)の場合にのみ直接使えるという点です。
複数の説明変数を使う重回帰の場合は、後述するデータ分析ツールを使う必要があります。
また、データに文字列や空白セルが混在していると正しく計算されない場合があるため、事前にデータを整理しておくことが大切でしょう。
エクセルのグラフと回帰直線からR²を表示する方法
続いては、エクセルのグラフ機能を使って散布図に回帰直線を引き、R²を視覚的に表示する方法を確認していきます。
この方法はコードや関数を書かずに、グラフ上にR²の値を直接表示できるため、プレゼン資料や報告書を作る際に非常に便利です。
散布図を作成する手順
まずは散布図を作成するところから始めます。
| 手順 | 操作内容 |
|---|---|
| ① | XとYのデータが入力された範囲(例:A1:B11)を選択する |
| ② | 「挿入」タブをクリックする |
| ③ | 「グラフ」グループの中から「散布図」を選択する |
| ④ | 「散布図(直線なし)」を選んでクリックする |
| ⑤ | 散布図がシート上に挿入される |
散布図が作成できたら、次は回帰直線(近似曲線)を追加します。
散布図の中の任意のデータ点を右クリックして「近似曲線の追加」を選ぶのが最も直感的な方法でしょう。
回帰直線とR²をグラフ上に表示する手順
「近似曲線の追加」を選ぶと、エクセルの右側に「近似曲線の書式設定」パネルが表示されます。
| 手順 | 操作内容 |
|---|---|
| ① | 「近似曲線の種類」で「線形」を選択する |
| ② | 「グラフに数式を表示する」チェックボックスにチェックを入れる |
| ③ | 「グラフにR²値を表示する」チェックボックスにチェックを入れる |
| ④ | パネルを閉じる |
この操作を行うと、散布図上に回帰直線(y = ax + b の形の式)とR²の値が同時に表示されます。
グラフ上にR²が表示されることで、一目でモデルの当てはまり具合を確認できるでしょう。
グラフ上のR²と関数で求めたR²の一致を確認する
グラフ上に表示されたR²の値は、RSQ関数で計算した値と一致するはずです。
もし一致しない場合は、データの選択範囲や変数の順番が正しくない可能性があります。
グラフのR²とRSQ関数の値を照合することで、計算の正確性を相互チェックできるという利点があります。
また、グラフ上に表示される回帰直線の式(y = ax + b)から回帰係数(傾きaと切片b)も確認できるため、単回帰分析の結果を一枚のグラフで簡潔にまとめるのに非常に有効な方法といえるでしょう。
エクセルの散布図にR²と回帰直線の式を表示する機能は、分析結果を視覚的に伝えたいときに非常に便利です。プレゼンテーション資料や報告書を作成する際には、この方法でグラフを作成することで、データの読み手が直感的にモデルの精度を把握できるようになります。
データ分析ツールを使ってより詳細に決定係数を求める方法
続いては、エクセルに内蔵されている「データ分析ツール」を使った、より詳細な決定係数の求め方を確認していきます。
データ分析ツールを使うと、決定係数だけでなく、回帰係数・標準誤差・F統計量など、回帰分析の詳細な結果をまとめて出力できます。
データ分析ツールのアドインを有効にする手順
データ分析ツールはエクセルのアドイン機能の一つで、デフォルトでは表示されていない場合があります。
まず、アドインを有効化する手順を確認しましょう。
| 手順 | 操作内容 |
|---|---|
| ① | 「ファイル」タブをクリックする |
| ② | 「オプション」をクリックする |
| ③ | 「アドイン」を選択する |
| ④ | 下部の「管理」ドロップダウンが「Excelアドイン」になっていることを確認して「設定」をクリックする |
| ⑤ | 「分析ツール」チェックボックスにチェックを入れてOKをクリックする |
| ⑥ | 「データ」タブに「データ分析」ボタンが追加されたことを確認する |
一度有効化すれば、次回以降は自動的に使えるようになるため、最初だけの設定作業です。
データ分析ツールで回帰分析を実行する手順
アドインが有効になったら、実際に回帰分析を実行してみましょう。
| 手順 | 操作内容 |
|---|---|
| ① | 「データ」タブをクリックし「データ分析」ボタンをクリックする |
| ② | 分析ツールの一覧から「回帰分析」を選んでOKをクリックする |
| ③ | 「入力Y範囲」に目的変数のデータ範囲を入力する(例:$B$1:$B$11) |
| ④ | 「入力X範囲」に説明変数のデータ範囲を入力する(例:$A$1:$A$11) |
| ⑤ | ラベル行がある場合は「ラベル」チェックボックスにチェックを入れる |
| ⑥ | 「出力先」を指定してOKをクリックする |
OKをクリックすると、指定した場所に回帰分析の結果がまとめて出力されます。
出力結果の読み方と決定係数の確認方法
データ分析ツールの回帰分析結果には、複数のテーブルが出力されます。
最初に表示される「回帰統計」テーブルの中に、決定係数に関する情報が含まれています。
| 出力項目 | 内容 | 見方 |
|---|---|---|
| 重相関 R | 相関係数(r) | −1〜+1の値。方向と強さを示す |
| 重決定 R² | 決定係数(R²) | 0〜1の値。モデルの説明力を示す |
| 補正 R² | 自由度調整済みR² | 重回帰では重決定R²より重視する |
| 標準誤差 | 予測の誤差の大きさ | 小さいほどモデルの精度が高い |
| 観測数 | データのサンプル数 | 分析に使ったデータの個数 |
「重決定 R²」の値が、求めたい決定係数R²にあたります。
単回帰の場合、「重相関 R」の値を二乗したものが「重決定 R²」と一致するため、RSQ関数で求めた値とも一致するでしょう。
データ分析ツールを使う最大の利点は、決定係数だけでなく、各回帰係数のp値や信頼区間なども同時に確認できることです。
「この回帰係数は統計的に有意か」「係数の範囲はどのくらいか」といった詳細な分析が一度の操作で行えるため、本格的な統計分析には非常に便利なツールといえるでしょう。
エクセルのデータ分析ツールは、RSQ関数やグラフのR²表示よりも詳細な回帰分析結果を提供します。決定係数だけでなく、係数の有意性や信頼区間まで確認したい場合には、ぜひデータ分析ツールを活用してみてください。重回帰分析も対応しているため、複数の説明変数を扱う場合にも大変役立ちます。
CORREL関数・PEARSON関数との連携と決定係数の手動計算
続いては、CORREL関数・PEARSON関数を使った相関係数の計算と、そこから決定係数を手動で求める方法を確認していきます。
RSQ関数以外のアプローチを知っておくことで、より柔軟にエクセルで統計分析を行えるようになるでしょう。
CORREL関数・PEARSON関数で相関係数を求める
エクセルには、相関係数を直接計算するための関数が2つ用意されています。
相関係数を計算する2つの関数
=CORREL(配列1, 配列2)
=PEARSON(配列1, 配列2)
どちらもピアソンの相関係数を返します。
例:=CORREL(A2:A11, B2:B11)
例:=PEARSON(A2:A11, B2:B11)
※どちらを使っても結果は同じです。
CORREL関数とPEARSON関数は、引数の順番がXとYのどちらを先に書いてもよいという点でRSQ関数と異なります。
相関係数は対称的な指標なので、引数の順番を入れ替えても同じ値が返ってきます。
相関係数を二乗して決定係数を手動で計算する
CORREL関数やPEARSON関数で求めた相関係数を二乗することで、決定係数を手動で計算できます。
相関係数から決定係数を手動計算する式
=CORREL(A2:A11, B2:B11)^2
または
=PEARSON(A2:A11, B2:B11)^2
エクセルでは「^2」で二乗を表現できます。
この値はRSQ関数の結果と一致します(単回帰の場合)。
この方法は計算の仕組みを理解する上でも有益で、「なぜR² = r²なのか」を実際の数値で確認できる良い機会になるでしょう。
各関数の用途をまとめて整理する
ここまで紹介したエクセル関数の用途を、一覧表で整理しておきます。
| 関数名 | 計算する値 | 主な用途 | 単回帰への対応 |
|---|---|---|---|
| RSQ | 決定係数(R²) | 単回帰のR²を直接求める | ○ |
| CORREL | 相関係数(r) | 2変数の線形関係を確認する | ○(二乗でR²に変換可) |
| PEARSON | 相関係数(r) | CORRELと同じ(互換関数) | ○(二乗でR²に変換可) |
| データ分析ツール(回帰分析) | R²・係数・p値など | 詳細な回帰分析結果を得る | ○(重回帰にも対応) |
目的に応じてこれらを使い分けることで、エクセルだけで本格的な回帰分析が行えるでしょう。
単純にR²の値だけが必要ならRSQ関数が最速で、より詳細な分析が必要ならデータ分析ツールが最適といえます。
エクセルで決定係数を使うときの実践的なポイントと応用
続いては、エクセルで決定係数を扱う際の実践的なポイントと応用例について確認していきます。
関数の使い方を覚えるだけでなく、実際の分析でどう活かすかを知ることで、エクセルを使った統計分析のスキルがぐっと高まるでしょう。
複数のモデルを比較する際の決定係数の活用法
エクセルで複数の回帰モデルを試して比較する際、決定係数は非常に有用な比較基準となります。
たとえば、「Xだけで予測するモデル」「XとZで予測するモデル」「XとZとWで予測するモデル」を作って、それぞれのR²を比較することで、どの変数の組み合わせが最も説明力が高いかを判断できます。
ただし、この際には重回帰の場合は自由度調整済みR²(補正R²)を比較基準にすることが重要です。
単純なR²は変数を増やすだけで高くなってしまうため、公平な比較ができないからです。
決定係数を使ったモデルの改善サイクル
エクセルでの実際の分析では、決定係数を使ったPDCAサイクルのようなモデル改善の流れが有効です。
| ステップ | 操作 | 確認すること |
|---|---|---|
| ①モデル構築 | 説明変数を選んで回帰分析を実行 | R²と係数の有意性を確認 |
| ②評価 | R²・補正R²・残差をチェック | 当てはまりは十分か?残差に偏りはないか? |
| ③改善 | 変数の追加・削除・変換を試みる | R²が改善するか?補正R²はどう変わるか? |
| ④検証 | テストデータで予測精度を確認 | 訓練データでのR²と大きく乖離しないか? |
このサイクルを繰り返すことで、データに対してより適切なモデルを探していくことができます。
エクセルはこのような試行錯誤のプロセスをシートを並べながら直感的に行えるため、統計分析の学習ツールとしても非常に優れています。
エクセルで決定係数を扱う際のよくあるエラーと対処法
エクセルでRSQ関数やデータ分析ツールを使う際に、よく発生するエラーとその対処法も押さえておきましょう。
| エラーの種類 | 原因 | 対処法 |
|---|---|---|
| #N/A エラー | XとYのデータ数が異なる | データ範囲を揃える |
| #DIV/0! エラー | Xの値がすべて同じ(分散が0) | データに多様性があるか確認する |
| #VALUE! エラー | 範囲に文字列や空白が含まれている | 数値データのみにする |
| R²が1になる | データ数が2点のみ(直線に必ず乗る) | データ数を3点以上にする |
| データ分析が表示されない | 分析ツールアドインが無効 | アドインを有効化する(前述の手順参照) |
これらのエラーに遭遇したときも、慌てず原因を一つずつ確認していけば解決できるでしょう。
特にデータの品質チェック(欠損値・外れ値・文字列の混在)は分析前に必ず行うべき重要なステップです。
エクセルで決定係数を正しく求めるためには、関数の使い方だけでなく、データの前処理にも十分注意を払う必要があるでしょう。
まとめ
本記事では、エクセルで決定係数を求める方法について、RSQ関数・グラフと回帰直線・データ分析ツールの3つのアプローチに分けて詳しく解説しました。
最もシンプルなのはRSQ関数を使う方法で、=RSQ(Y範囲, X範囲) の一行で決定係数を求められます。
視覚的に結果を見せたい場合は散布図に回帰直線とR²を表示する方法が便利で、より詳細な分析結果が必要な場合はデータ分析ツールが最適でしょう。
また、CORREL関数やPEARSON関数で相関係数を求めて二乗することでも、決定係数を手動で確認できます。
どの方法を使う場合でも、データの品質確認・散布図での視覚的確認・自由度調整済みR²の活用という基本的な姿勢を忘れずに持っておくことが大切です。
エクセルは無料で手軽に使える統計ツールとして非常に優秀ですので、本記事の手順を参考にしながら、ぜひ実際のデータで決定係数の計算に挑戦してみてください。