Anonim

p 値と帰無仮説の背後にある理論は、最初は複雑に見えるかもしれませんが、概念を理解すると、統計の世界をナビゲートするのに役立ちます。 残念ながら、これらの用語は一般的な科学でしばしば誤用されているため、誰もが基本を理解するのに役立ちます。

記事「Excelで1行おきに削除する方法」も参照してください。

モデルの p 値を計算し、帰無仮説を証明/反証することは、MS Excelでは驚くほど簡単です。 それを行うには2つの方法があり、それらの両方について説明します。 掘り下げましょう。

帰無仮説と p値

帰無仮説は、既定の位置とも呼ばれるステートメントであり、観測された現象間の関係は存在しないと主張します。 また、観測された2つのグループ間の関連付けにも適用できます。 研究中に、この仮説をテストし、反証しようとします。

たとえば、特定の流行の食事が重要な結果をもたらすかどうかを観察するとします。 この場合の帰無仮説は、食事の前後で被験者の体重に有意差がないということです。 対立仮説は、食事が違いを生んだということです。 これは、研究者が証明しようとするものです。

p 値は、特定の統計モデルについて帰無仮説が真である場合に、統計サマリーが観測値以上になる可能性を表します。 多くの場合、10進数で表されますが、一般的にはパーセンテージで表した方が適切です。 たとえば、 p 値0.1は10%として表されます。

p 値が低いということは、帰無仮説に対する証拠が強いことを意味します。 これはさらに、データが重要であることを意味します。 一方、 p 値が高いということは、仮説に対する強力な証拠がないことを意味します。 流行のダイエットが機能することを証明するには、研究者は低い p 値を見つける必要があります。

統計的に有意な結果は、帰無仮説が真の場合に発生する可能性が非常に低い結果です。 有意水準はギリシャ文字のアルファで示され、結果が統計的に有意であるためには p 値よりも大きくなければなりません。

幅広い分野の多くの研究者が p 値を使用して、作業しているデータをより深くより深く洞察します。 著名な分野には、社会学、刑事司法、心理学、金融、経済学などがあります。

Excelで p値を 見つける

T-Test関数またはデータ分析ツールを使用して、MS Excelでデータセットの p 値を見つけることができます。 最初に、T-Test関数を調べます。 30日間のダイエットを行った5人の大学生を調べます。 食事の前後で体重を比較します。

注:この記事では、MS Excel 2010を使用します。これは最新のものではありませんが、一般に新しいバージョンにも適用されるはずです。

T検定関数

T検定関数で p 値を計算するには、次の手順に従います。

  1. テーブルを作成して入力します。 テーブルは次のようになります。

  2. テーブルの外側のセルをクリックします。
  3. 入力:= T.Test(。
  4. 開き括弧の後に、最初の引数を入力します。 この例では、ダイエット前の列です。 範囲はB2:B6である必要があります。 これまでのところ、関数は次のようになります:T.Test(B2:B6。
  5. 次に、2番目の引数を入力します。 After Diet列とその結果は2番目の引数であり、必要な範囲はC2:C6です。 数式に追加してみましょう:T.Test(B2:B6、C2:C6。
  6. 2番目の引数の後にコンマを入力すると、片側分布および両側分布オプションがドロップダウンメニューに自動的に表示されます。 最初の片側分布を選択しましょう。 それをダブルクリックします。
  7. 別のコンマを入力します。
  8. 次のドロップダウンメニューで[ペアリング]オプションをダブルクリックします。
  9. 必要な要素がすべて揃ったので、ブラケットを閉じます。 この例の式は次のようになります。= T.Test(B2:B6、C2:C6, 1, 1)

  10. Enterキーを押します。 セルには p 値がすぐに表示されます。 この場合、値は0.133906または13.3906%です。

5%を超えるため、この p 値は帰無仮説に対する強力な証拠を提供しません。 この例では、研究は、ダイエットが被験者の大幅な体重減少を助けたことを証明しませんでした。 これは必ずしも帰無仮説が正しいという意味ではなく、まだ反証されていないということだけです。

データ分析ルート

データ分析ツールを使用すると、 p 値の計算など、多くのクールなことができます。 物事を簡単にするために、前の方法と同じテーブルを使用します。

方法は次のとおりです。

  1. D列にはすでに重量の差があるため、差の計算はスキップします。 将来のテーブルでは、次の式を使用します:=” Cell 1”-“ Cell 2”。
  2. 次に、メインメニューの[データ]タブをクリックします。
  3. データ分析ツールを選択します。
  4. リストを下にスクロールして、t-Test:平均の2つのサンプルのペアオプションをクリックします。
  5. OKをクリックします。
  6. ポップアップウィンドウが表示されます。 次のようになります。

  7. 最初の範囲/引数を入力します。 この例では、B2:B6です。
  8. 2番目の範囲/引数を入力します。 この場合、C2:C6です。
  9. [アルファ]テキストボックスの既定値(0.05)のままにします。
  10. [出力範囲]ラジオボタンをクリックして、結果を表示する場所を選択します。 A8セルの場合は、$ A $ 8と入力します。
  11. OKをクリックします。
  12. Excelは p 値と他のいくつかのパラメーターを計算します。 ファイナルテーブルは次のようになります。

ご覧のとおり、片側の p 値は、最初のケースの0.133905569と同じです。 0.05以上なので、このテーブルには帰無仮説が適用され、それに対する証拠は弱いです。

p値 について知っておくべきこと

以下は、Excelでの p 値の計算に関する便利なヒントです。

  1. p 値が0.05(5%)に等しい場合、テーブル内のデータは重要です。 0.05(5%)未満の場合、データは非常に重要です。
  2. p 値が0.1(10%)を超える場合、テーブル内のデータは重要ではありません。 0.05〜0.10の範囲にある場合、わずかに重要なデータがあります。
  3. アルファ値は変更できますが、最も一般的なオプションは0.05(5%)と0.10(10%)です。
  4. 仮説に応じて、両側検定を選択することをお勧めします。 上記の例では、片側テストとは、被験者がダイエット後に体重が減少したかどうかを調査することを意味し、まさにそれを見つけるために必要なものです。 しかし、両側検定では、統計的に有意な量の体重が増加したかどうかも調べます。
  5. p 値は変数を識別できません。 つまり、相関関係を特定する場合、その背後にある原因を特定することはできません。

p値が わかりやすい

自分の塩分に値するすべての統計学者は、帰無仮説検定の詳細と p 値の意味を知っている必要があります。 この知識は、他の多くの分野の研究者にも役立ちます。

Excelを使用して統計モデルの p 値を計算したことがありますか? どの方法を使用しましたか? それを計算する別の方法が好きですか? コメントセクションでお知らせください。

Excelでp値を計算する方法