研究で幅広く使用されているp値をめぐり、学術界に議論が巻き起こっています。偽陽性を防止するために有意水準を0.005に引き下げるべきだと主張する研究者グループがいる一方、別の研究者たちは、p値の誤用をなくすためのより良い方法を提案しています。
p値とは、グループや関係性における違いが偶然によるものなのか、あるいは研究対象の変数によるものなのかを示す尺度で、幅広く使用されています。一般的に、p値が0.05未満の場合、結果は統計的に「有意」であるとみなされます。しかし一部の研究者たちは、偽陽性を防止するために有意水準を0.005に引き下げる必要があると主張しています。この提案は、科学コミュニティに議論を呼び起こしました。別の研究者たちはこの提案に対し、p値の誤用をなくすためのより良い方法は、それぞれのp値の使用方法が正当であることの説明を研究者に義務付けることであると主張しています。
問題となっているのは、現状のp値の有意水準には、誤用や誤解の余地が多く残されているという点です。2017年7月、72名の著名な研究者が、ある論文をPsyArXivのプレプリントサーバーに投稿しました。その論文では、社会科学や生物医科学におけるp値の有意水準は、0.005に引き下げるべきであるとの主張がなされていました。論文の筆頭著者の1人で南カリフォルニア大学(ロサンゼルス)の経済学者、ダニエル・ベンジャミン(Daniel Benjamin)氏は、「p値の基準を0.05にするか0.005にするかというそれぞれの主張は、確立された知識ではなく、単なる“示唆的証拠”として扱うべきです」と述べています。
2017年9月18日、ある研究者グループが、この主張に反論する論文を発表しました。論文の筆頭著者で、アイントホーフェン工科大学実験心理学者のダニエル・ラーケンス(Daniel Lakens)氏は、「p値の有意水準を厳格化することで、偽陰性が増加するなどの新たな問題が発生します。ある問題の解決策は、新たな問題の発生源になり得るのです」と主張しています。ラーケンス氏は、ネガティブな結果はジャーナルに受け入れられにくく、多くの論文が出版されないままお蔵入りになってしまうという問題についても指摘しており、「ある方針を実施する際は、意図しないネガティブな結果を招く可能性がないことを確認しなければなりません」と述べています。同氏は研究者に対し、データ収集の開始前に、選択したp値の有意水準とその選択の正当性を書き留めておくことを提案しており、「この作業によって、p値の責任ある使用につながるだけでなく、用法の分析も容易になります」と主張しています。
結果の再現不可能性の問題は、研究者が直面している最大の課題であり、責任を持ってp値を使用することには重要な意味があります。一部のジャーナルが、再現性がないことを理由にp値の使用を禁止しているように、研究者たちの間には、p値の扱い方に関する明確な分断が生じているようです。研究者たちはこの問題について、全会一致で納得できる解決策を見つけることができるのでしょうか。
あなたは研究でp値を使用していますか?有意水準の引き下げについてどう考えますか? あなたの研究には影響がありそうですか? 影響がありそうな場合、それはどのような影響ですか?下のコメント欄から、ご意見をお寄せください。
関連記事:
Is my research significant? Why you shouldn't rely on p values
参考資料:
Big names in statistics want to shake up much-maligned P value