パソコン操作

f分布とは?意味や特徴をわかりやすく解説!(統計学:確率分布:F検定:分散の比較:自由度:カイ二乗分布など)

当サイトでは記事内に広告を含みます

統計学を学んでいると、t分布・カイ二乗分布と並んで登場する重要な確率分布がF分布です。

F分布は特に「二つの集団の分散が等しいかどうか」を検定するF検定や、複数の群の平均差を比較する分散分析(ANOVA)の基盤となる分布であり、統計的仮説検定において欠かせない概念です。

しかし「F分布って何?」「なぜ2つの自由度が必要なの?」「カイ二乗分布とどう関係するの?」という疑問を持つ方も多いでしょう。

本記事では、F分布の定義・意味・特徴を数式を交えながらわかりやすく解説し、F検定・分散分析への応用、カイ二乗分布との関係、自由度の意味なども丁寧に説明します。

統計学を初めて学ぶ方にも理解しやすいよう、具体的な例や図表を交えて進めていきます。

F分布をしっかり理解することで、統計的検定の理解が大きく深まるでしょう。

目次

f分布の結論|二つの分散の比が従う確率分布

それではまず、F分布の基本的な意味と定義から解説していきます。

F分布とは、二つの独立したカイ二乗分布に従う確率変数の比から生まれる確率分布です。

より直感的に言えば「二つの母集団の分散の比がランダムにばらつくときの、そのばらつき方を表した分布」と理解するとわかりやすいでしょう。

F分布の数学的定義

F分布の定義

χ₁² が自由度 m のカイ二乗分布に従い、χ₂² が自由度 n のカイ二乗分布に従い、かつ両者が独立であるとき

F = (χ₁²/m) / (χ₂²/n)

で定義される確率変数 F は「自由度 (m, n) のF分布」に従います。

これを F ~ F(m, n) と表記します。

m:分子の自由度(第一自由度)

n:分母の自由度(第二自由度)

F分布の名前は、統計学に多大な貢献をしたロナルド・フィッシャー(Ronald A. Fisher)の頭文字「F」に由来します。

フィッシャーは分散分析の考案者としても知られており、F分布は彼の業績を称えて命名されました。

F分布が持つ基本的な性質

性質 内容
定義域 F ≥ 0(正の実数のみ)
分布の形状 非対称(右に長い裾を持つ右歪み分布)
自由度の数 二つ(分子の自由度 m と分母の自由度 n)
平均値 n/(n-2) (n > 2 のとき)
分散 2n²(m+n-2) / [m(n-2)²(n-4)] (n > 4 のとき)
自由度との関係 自由度が大きいほど分布は正規分布に近づく

F分布の重要な特徴は、必ず正の値しか取らないという点です。

これは「分散は常に正(または0)」という事実を反映しており、分散の比として定義されるF分布が正の値のみを取ることは数学的に自然な帰結です。

カイ二乗分布との関係とF分布の導出

続いては、F分布とカイ二乗分布の関係について確認していきます。

F分布はカイ二乗分布を基礎として定義されているため、カイ二乗分布の理解がF分布の理解を深めます。

カイ二乗分布のおさらい

カイ二乗分布(χ²分布)は、標準正規分布に従う独立な確率変数の二乗和が従う分布です。

カイ二乗分布の定義

Z₁, Z₂, …, Zk が独立に標準正規分布 N(0,1) に従うとき

χ² = Z₁² + Z₂² + … + Zk²

は自由度 k のカイ二乗分布に従います。

正規分布に従う母集団から n 個のサンプルを取り出したとき、標本分散 S² は (n-1)S²/σ² が自由度 (n-1) のカイ二乗分布に従うことが知られています。

これはサンプルの変動(ばらつき)がカイ二乗分布で記述できることを意味します。

F分布とカイ二乗分布の関係の具体例

二つの正規母集団から独立にサンプルを取り出した場合を考えます。

母集団1:正規分布 N(μ₁, σ₁²) から n₁ 個のサンプル → 標本分散 S₁²

母集団2:正規分布 N(μ₂, σ₂²) から n₂ 個のサンプル → 標本分散 S₂²

このとき

(n₁-1)S₁²/σ₁² ~ χ²(n₁-1)

(n₂-1)S₂²/σ₂² ~ χ²(n₂-1)

したがって

F = (S₁²/σ₁²) / (S₂²/σ₂²) ~ F(n₁-1, n₂-1)

特に σ₁² = σ₂² (等分散)のとき

F = S₁²/S₂² ~ F(n₁-1, n₂-1)

この結果が、F検定(等分散検定)の理論的根拠です。

二つの標本分散の比が F(n₁-1, n₂-1) に従うため、この比の値が棄却域に入るかどうかで等分散の帰無仮説を検定できます。

F分布とt分布の関係

F分布とt分布の間には興味深い関係があります。

F分布とt分布の関係

自由度 n の t 分布に従う確率変数 T について

T² は自由度 (1, n) の F 分布に従います。

すなわち F(1, n) = t(n)²

二標本のt検定(等分散を仮定)は、F検定の特殊ケース(分子の自由度が1)と見なせます。

この関係は、t検定・F検定・分散分析が統一的な理論体系(線形モデル)の中に位置づけられることを示しており、統計学の美しさを感じさせるポイントの一つです。

F分布の形状と自由度の影響

続いては、自由度の違いによってF分布の形状がどのように変化するかを確認していきます。

自由度はF分布の形状を決定する最も重要なパラメータです。

自由度とF分布の形状の関係

F分布の形状は分子の自由度 m と分母の自由度 n の両方によって変化します。

m と n がともに小さい場合、分布は右に大きく歪んだ形(右裾が長い)になります。

m と n がともに大きくなるにつれて、分布はより対称的な釣り鐘型に近づき、正規分布に収束していきます。

分子の自由度 m が 1 のとき、F分布の確率密度関数は F = 0 での値が最大となるL字型の形状になります。

m が大きくなるにつれて最頻値(モード)が正の値に移動し、分布が山型になっていきます。

分子の自由度と分母の自由度の意味

F分布に現れる二つの自由度はそれぞれ異なる意味を持ちます。

分子の自由度(第一自由度)m は、比較対象となる変動(例:グループ間変動)のカイ二乗変数の自由度で、グループ数や仮説のパラメータ数に関係します。

分母の自由度(第二自由度)n は、基準となる変動(例:グループ内変動・誤差変動)のカイ二乗変数の自由度で、サンプル数や残差の自由度に関係します。

一般にサンプル数が多いほど分母の自由度が大きくなり、検定の精度(検出力)が高まります。

F分布の応用|F検定と分散分析

続いては、F分布が実際にどのように統計検定で使われるかを確認していきます。

F検定と分散分析(ANOVA)はF分布の最も重要な応用です。

F検定(等分散検定)の手順

二つの母集団の分散が等しいかどうかを検定するF検定の基本的な手順は次のとおりです。

F検定(等分散検定)の手順

【Step 1】 仮説の設定

 帰無仮説 H₀:σ₁² = σ₂²(二つの母分散は等しい)

 対立仮説 H₁:σ₁² ≠ σ₂²(二つの母分散は異なる)

【Step 2】 検定統計量の計算

 F = S₁²/S₂²(大きい方の分散を分子にすることが多い)

【Step 3】 棄却域の設定

 有意水準 α に対応する F 分布の臨界値 F(m, n, α) を F 分布表から読む

【Step 4】 判定

 F > F(m, n, α) であれば H₀ を棄却(分散は異なると判定)

F検定の結果は、その後に実施する二標本t検定において「等分散を仮定するか否か」の判断材料として使われます。

一元配置分散分析(One-way ANOVA)での使われ方

分散分析(ANOVA:Analysis of Variance)は、三つ以上の群の平均値に差があるかどうかを検定するための手法で、F分布がその中心的な役割を担います。

一元配置分散分析では、全体の変動を「グループ間変動(群間変動)」と「グループ内変動(誤差変動)」に分解し、その比をF値として計算します。

F値の計算(一元配置ANOVA)

F = (グループ間の平均二乗 MSB)/ (グループ内の平均二乗 MSW)

= (グループ間変動 / 自由度(k-1))/ (グループ内変動 / 自由度(N-k))

k:グループ数 N:全サンプル数

F が F(k-1, N-k) 分布の棄却域に入れば、少なくとも一つの群の平均が他と異なると判定します。

分散分析は医学・心理学・農学・品質管理・マーケティングリサーチなど、複数の条件(群)を比較する必要がある研究・実務で広く使われています。

応用手法 F分布の使われ方 主な使用場面
F検定(等分散検定) 二つの標本分散の比のF分布 t検定の前処理・品質管理
一元配置ANOVA 群間/群内変動比のF分布 三群以上の平均比較
二元配置ANOVA 各主効果・交互作用のF統計量 二因子実験計画の解析
回帰分析のF検定 回帰の有意性検定 重回帰モデルの有効性確認

まとめ

本記事では、F分布の意味・定義・カイ二乗分布との関係・形状の特徴・F検定と分散分析への応用について体系的に解説しました。

F分布の核心は「二つの独立したカイ二乗変数の比が従う確率分布」であり、二つの自由度(分子・分母)によって形状が決まる右歪みの非負の分布です。

カイ二乗分布を基礎として定義され、t分布とも F(1, n) = t(n)² という関係で結ばれており、統計学の各種分布が有機的につながっていることが理解できます。

F検定では二つの母分散の等質性を検定し、分散分析では複数群の平均の差を検定するという形で、F分布は実践的な統計解析の中心に位置しています。

統計学の理解を深めるためにも、F分布・カイ二乗分布・t分布の三角関係をぜひ整理して覚えておきましょう。

本記事がF分布の理解の助けとなれば幸いです。

ABOUT ME
white-circle7338
私自身が今まで経験・勉強してきた「エクセル」「ビジネス用語」「生き方」などの情報を、なるべくわかりやすく、楽しく、発信していきます。 一緒に人生を楽しんでいきましょう