Anonim

p 値は、統計の最も重要な概念の1つです。 研究プロジェクトに取り組むとき、これは科学者が最も頻繁に依存する出力データです。

Googleスプレッドシートの別のタブにデータをリンクする方法の記事もご覧ください

しかし、Googleスプレッドシートで p 値を実際にどのように計算しますか?

この記事では、トピックについて知る必要があるすべてを紹介します。 記事の終わりまでに、 p 値を簡単に計算し、結果を確認できるようになります。

p 値とは何ですか?

p 値は、特定の仮説が正しいかどうかを判断するために使用されます。 基本的に、科学者はデータまたは値の範囲を選択します。これは、データが相関していない場合の通常の期待される結果を表します。 データセットの p 値を計算すると、これらの結果にどれだけ近いかがわかります。

期待される結果を表す定数は、有意水準と呼ばれます。 以前の調査に基づいてこの数を選択できますが、通常は0.05に設定されます。

計算された p 値が有意水準をはるかに下回る場合、期待される結果は実現しませんでした。 p 値が低いほど、データが何らかの相関関係を表している可能性が高くなります。

p 値を手動で計算する方法は?

紙の p 値を計算する手順は次のとおりです。

  1. 実験の期待される結果を決定します。
  2. 実験の観測結果を計算して決定します。
  3. 自由度を決定します–尊敬される結果からの逸脱はどれほど重要とみなされますか?
  4. 最初の予想される結果を、カイ2乗の観測者の結果と比較します。
  5. 有意水準を選択します。
  6. カイ二乗分布表を使用して、 p 値を近似します。
  7. 最初の帰無仮説を拒否または維持します。

ご覧のように、ペンと紙でこれを行う際には、計算して考慮すべきことが非常に多くあります。 すべてのステップで正しい式に従っているかどうかを確認し、正しい値があるかどうかを再確認する必要があります。

計算が正しくないために誤った結果になるリスクを回避するには、Googleスプレッドシートなどのツールを使用することをお勧めします。 p 値は非常に重要なので、開発者はそれを直接計算する関数を含めました。 次のセクションでは、その方法を説明します。

Googleスプレッドシートでの p 値の計算

これを説明する最良の方法は、従うことができる例を使用することです。 既存のテーブルがある場合は、次のチュートリアルから学んだことを適用してください。

まず、2つのデータセットを作成します。 その後、作成されたデータセットを比較して、それらの間に統計的な有意性があるかどうかを確認します。

パーソナルトレーナーのデータを調べる必要があるとしましょう。 パーソナルトレーナーから、プッシュアップとプルアップの進行に関するクライアントの番号が提供され、Googleスプレッドシートに入力しました。

この表は非常に基本的なものですが、この記事の目的には役立ちます。

これら2つの異なるデータセットを比較するには、GoogleスプレッドシートのT-TEST関数を使用する必要があります。

この関数の構文は次のようになります:TTEST(array1、array2、tails、type)しかし、構文T.TEST(array1、array2、tails、type)を使用することもできます。両方とも同じ関数を参照します。

Array1は最初のデータセットです。 私たちの場合、それはPushups列全体です(もちろん、列名を除く)。

Array2は2番目のデータセットで、プルアップ列の下にあるすべてのものです。

尾は、分布に使用される尾の数を表します。 ここには2つのオプションしかありません。

1 –片側分布

2 –両側分布

タイプは、1(ペアのT-TEST)、2(2標本の等分散T-検定)、または3(2標本の不等分散T-検定)の整数値を表します。

選択したTTESTの列に名前を付け、この関数の結果をその隣の列に表示します。

この関数を使用するには、 p 値を表示する空の列をクリックして、必要な式を入力します。 この例では、次の式を入力します: = TTEST(A2:A7、B2:B7, 1, 3)。 ご覧のとおり、A2:A7は最初の列の開始点と終了点を示しています。 最初の位置(A2)にカーソルを置き、列の下部にドラッグするだけで、Googleスプレッドシートが数式を自動的に更新します。 数式にコンマを追加し、2番目の列にも同じことを行います。

次に、末尾に入力し、引数を入力して(コンマで区切って)Enterキーを押します。

結果は、数式を入力した列に表示されます。

一般的なエラーメッセージ

TTEST式の入力を間違えた場合は、おそらく次のエラーメッセージのいずれかが表示されています。

  1. #N / A-2つのデータセットの長さが異なる場合に表示されます。
  2. #NUM-入力されたtails引数が1または2に等しくない場合に表示されます。type引数が1、2、または3に等しくない場合にも表示されます。
  3. #値! –テールまたはタイプ引数に非数値を入力した場合に表示されます。

Googleスプレッドシートでデータの計算がかつてないほど簡単に

これで、別のGoogleスプレッドシート関数が武器庫に追加されたことを願っています。 このオンラインツールの可能性と機能について学習すれば、たとえ統計学者でなくても、データの分析が上手くなります。

p 値の計算に使用する代替方法はありますか? 以下のコメントでお気軽にお問い合わせください。

Googleシートでp値を計算する方法