P値は帰無仮説検定の基本として広く利用されており、統計学的妥当性を見るための「至適基準」と言われてきましたが、これに対して批判的な専門家も多く存在します。賛否両論ある中、T&F社のBASP誌が、帰無仮説有意性検定およびそれに類する統計学的処理の使用を禁止しました。
P値は帰無仮説検定の基本として広く利用されており、統計学的妥当性を見るための「至適基準」と言われてきました。しかし、P値の利用と、<0.05という棄却域(P値が0.05未満の場合、帰無仮説を支持しない強力な証拠と考える)に対して批判的な専門家も多く存在します。値の操作が容易で、脆弱なデータを支持するために利用されているというのがその理由です。P値に否定的な研究者は、P値は「当てにならない」、すなわち再現性が高くないという事実も指摘しています。
議論の余地はあるものの、P値は数多くの研究に利用されてきました。P値の利用に伴う諸問題を考慮した社会心理学系のジャーナル、Basic and Applied Social Psychology(BASP)は、帰無仮説有意性検定およびそれに類する統計学的処理を禁止すると発表しました。この新方針について、同誌編集者のデイビッド・トラフィモー(David Trafimow)氏と副編集者のマイケル・マークス(Michael Marks)氏は、「以前から、帰無仮説による検定の手順(NHSTP)は行わないよう伝えていた」とエディトリアルで述べていますが、今回は全面的な使用禁止となりました。トラフィモー氏がP値の代わりとなる統計学的手法は分からないと述べていることは、注目すべき点です。
BASP誌の編集者は、「著者は、今後もP値や帰無仮説有意性検定に類する統計学的手法が含まれた論文を同誌に投稿することはできるが、その部分は出版前に削除される」と明言しています。また、「推測統計学的手法は求めないが、効果量等を含む有力な記述的統計を求める」と定めており、「可能であれば、度数分布データを提示することが望ましい。さらに、一般的な心理学実験よりもサンプル数を多くすることを奨励する。なぜなら、サンプル数が多いほど記述的統計の安定性が増し、標本誤差の問題が相対的に低くなるためである」と述べています。
P値禁止というBASP誌の決定に対する反応はさまざまです。ビーレフェルト大学(ドイツ)の認知科学者、ヤン・デ・ルーター(Jan de Ruiter)氏は、帰無仮説有意性検定の信頼性が高くないという点には同意していますが、使用しないという選択が正しいかどうかは分からないとしており、「何らかの推測統計学を利用せずに科学を行うことは不可能である」と述べています。また、BASP誌がもう一つの方針として掲げたサンプル数の増大は、予備的研究を行う若手研究者に対するハードルを上げることになるかもしれません。これを避けるためには、予備的研究や検証的研究に対して別の規定を設けることも考えられるでしょう。
科学的正確さを維持するために、統計の説明やベイズ解析を添えてP値を補完することを提案する研究者もいます。しかしBASP誌は、ベイズ的アプローチを用いることに乗り気ではありません。P値の禁止決定については学術界での議論が続きますが、BASPの新方針が、P値への過度な依存に伴う諸問題に注目を集めさせたことは間違いありません。