統計的検定は仮説検定に使用されます。
- 予測子変数が結果変数と統計的に有意な関係を有するかどうかを判断するために使用することができます。
- 二つ以上のグループ間の差を推定します。
統計的検定は、グループ間の関係または差がないという帰無仮説を仮定します。 次に、観測されたデータが帰無仮説によって予測された値の範囲外にあるかどうかを判断します。,
扱っている変数のタイプがすでにわかっている場合は、フローチャートを使用してデータに適した統計検定を選択できます。
統計検定フローチャート
統計検定は何をしますか?
統計的検定は、検定統計量を計算することによって機能します–検定の変数間の関係が関係なしの帰無仮説とどれだけ異なるかを記述する数。
次に、p値(確率値)を計算します。, P値は、関係がないという帰無仮説が真であった場合に、検定統計量によって記述された差がどの程度見られる可能性があるかを推定します。
検定統計量の値が帰無仮説から計算された統計量よりも極端な場合、予測変数と結果変数の間に統計的に有意な関係を推測できます。
検定統計量の値が帰無仮説から計算された値よりも極端でない場合、予測変数と結果変数の間に統計的に有意な関係を推測できません。,
統計検定を実行するタイミング
統計的に有効な方法で収集されたデータに対して、実験または確率サンプリング法を使用して行われた
統計的検定が有効であるためには、調査対象の母集団の真の分布を近似するのに十分な大きさのサンプルサイズが必要です。
使用する統計検定を決定するには、次のことを知る必要があります。
- データが特定の仮定を満たしているかどうか。
- あなたが扱っている変数のタイプ。,
統計的仮定
統計的検定は、それらがテストしているデータについていくつかの一般的な仮定を行います。
- 観測の独立性(別名自己相関なし):テストに含める観測/変数は関連していません(たとえば、単一の被験者の複数の測定値は独立していませんが、複数の異なる被験者の測定値は独立しています)。分散の均質性:比較される各グループ内の分散は、すべてのグループ間で類似している。, 場合にグループにより変動のように限定し、試験の実効性について
- データの正規性:データは正規分布(別名ベル曲線)に従います。 この仮定は、定量的データにのみ適用されます。
データが正規性または分散の均質性の仮定を満たさない場合、ノンパラメトリック統計検定を実行できる場合があります。,
データが観測値の独立性の仮定を満たさない場合、データ内の構造を考慮したテスト(反復測定テストまたはブロッキング変数を含むテスト)を使用でき
変数のタイプ
通常、使用できる統計検定のタイプは、変数のタイプによって決まります。
量的変数は、物事の量(例えば、森林内の木の数)を表します。 量的変数のタイプには次のものがあります。
カテゴリ変数は、物事のグループ化を表します(例えば、森林内の異なる樹種)。, カテゴリ変数のタイプは次のとおりです。
収集した予測変数と結果変数のタイプに適合する検定を選択します(実験を行っている場合、これらは独立変数と従属変数です)。 以下の表を参照して、どのテストが変数に最適かを確認してください。
パラメトリック検定の選択:回帰、比較、または相関
パラメトリック検定は通常、ノンパラメトリック検定よりも厳しい要件を持ち、データからより強い推論を行うことができます。 これらは、統計的検定の共通の仮定に準拠したデータでのみ実施できます。,
パラメトリック検定の最も一般的なタイプには、回帰検定、比較検定、および相関検定があります。
回帰検定
回帰検定は、因果関係をテストするために使用されます。 彼らは、別の変数に対する一つ以上の連続変数の効果を探します。,
予測子変数 結果変数 研究質問の例 単純な線形回帰 - 連続
- 1予測子
- 連続
- 1結果
収入の影響は何ですか長寿について?, 重線形回帰 - 連続
- 2つ以上の予測子
- 連続
- 1結果
長寿に対する一日あたりの運動の収入と分の影響は何ですか? ロジスティック回帰 - 連続
- バイナリ
被験者の生存に対する薬物投与量の影響は何ですか?, 比較テスト
比較テストは、グループ平均間の違いを探します。 これらは、他の特性の平均値に対するカテゴリ変数の効果をテストするために使用できます。
t検定は、正確に二つのグループ(例えば、男性と女性の平均身長)の平均を比較するときに使用されます。 ANOVAおよびMANOVAテストは、二つ以上のグループ(例えば、子供、ティーンエイジャー、および大人の平均身長)の平均を比較するときに使用されます。,
予測子変数 結果変数 研究質問の例 対になったt検定 - カテゴリカル
- 1予測子
- 定量的
- グループは同じ母集団から来る
- グループは同じ母集団から来る
- グループは同じ母集団から来る
同じクラスの学生のための平均試験の点数に二つの異なるテスト準備プログラムの効果は何ですか?, 独立したt検定 - カテゴリカル
- 1予測子
- 定量的
- グループは、異なる集団から来ています
二つの異なる学校の学生の平均試験スコアの違いは何ですか? ANOVA - カテゴリカル
- 1つ以上の予測因子
- 定量的
- 1アウトカム
三つの異なる鎮痛剤を与えられた手術後の患者の平均痛みレベルの違いは何ですか?, MANOVA - カテゴリカル
- 1以上の予測因子
- 定量的
- 2以上の結果
花びらの長さ、花びらの幅、および茎の長さに対する花種の影響は何ですか? 相関テスト
相関テストは、因果関係を仮定せずに二つの変数が関連しているかどうかをチェックします。
これらは、重回帰検定などで使用する二つの変数が自己相関であるかどうかをテストするために使用することができます。,
Predictor variable Outcome variable Research question example Pearson’s r Continuous Continuous How are latitude and temperature related?, ノンパラメトリック検定の選択
ノンパラメトリック検定は、データについて多くの仮定をしないため、一般的な統計 しかし、それらが行う推論は、パラメトリック検定ほど強力ではありません。,h>Wilcoxonランク和検定
- カテゴリカル
- 2グループ
- 定量的
- グループは異なる集団から来る
独立したt検定 Wilcoxon符号付きランク検定 - カテゴリカル
- 2つのグループ
- 定量的
- グループは同じ集団から来る
対になったt検定 フローチャート:統計検定の選択
このフローチャートは、パラメトリックテストの中から, ノンパラメトリック代替の場合は、上記の表を確認してください。
統計的検定に関するよくある質問
統計的検定の主な仮定は何ですか?統計検定は、一般的に次のことを前提としています。
- データは正規分布しています。
- 比較されるグループは同様の分散を持っています。
- データは独立しています。
データがこれらの仮定を満たしていない場合でも、要件が少なくなりますが、より弱い推論を行うノンパラメトリック統計検定を使用できる可能性があります。,
検定統計量とは何ですか?検定統計量は、統計的検定によって計算された数値です。 いつかの観測データがnullの場合仮説の関係を変数には差がな中サンプルです。
検定統計量は、二つ以上のグループが母集団全体の平均とどれだけ異なるか、または帰無仮説によって予測される勾配と線形勾配がどれだけ異なるかを示します。 異なる検定統計量が異なる統計的検定で使用されます。
統計的有意性とは何ですか?,統計的有意性は、統計的検定の帰無仮説の下で観察が起こった可能性は低いと述べるために研究者によって使用される用語である。 有意性は、通常、p値、または確率値で示されます。
統計的有意性は任意である-それは研究者が選択した閾値、またはアルファ値に依存する。 最も一般的なしきい値はp<0.05であり、これは帰無仮説の下でデータが発生する可能性が5%未満の時間であることを意味します。,
p値が選択されたアルファ値を下回ると、検定の結果は統計的に有意であると言います。
定量変数とカテゴリ変数の違いは何ですか?量的変数は、データが量(身長、体重、年齢など)を表す任意の変数です。
カテゴリ変数は、データがグループを表す任意の変数です。 これには、ランキング(レースの仕上げ場所など)、分類(シリアルのブランドなど)、およびバイナリ結果(コインフリップなど)が含まれます。,
データに適した統計検定を選択し、結果を解釈するには、どのタイプの変数を使用しているかを知る必要があります。
離散変数と連続変数の違いは何ですか?離散変数と連続変数は、二つのタイプの量的変数です。
- 離散変数は、カウント(例えば、コレクション内のオブジェクトの数)を表します。
- 連続変数は、測定可能な量(例えば、水の体積または重量)を表します。