外れ値

※本用語の解説は1992年に作成されたものです。

得点分布において,何らかの原因で多くの受験者とは異なり,際立って大きな,あるいは小さな値を示す少数のデータ。例えば,ある試験(100点満点)においてほとんどの受験者が80点の近くの狭い範囲に収まっている場合の0点等は,外れ値と考えて良い。また試験においては,何らかの事情(例えば,受験番号の記入ミス)で0点が与えられるケースがあるが,このような場合も,その受験者の学力とは無関係であるという意味で外れ値と考えられる。
外れ値の検出方法としては,例えば,得点分布を正規分布と仮定し,各受験者の得点が平均値から標準偏差を単位として何倍離れているか等の観点から外れ値を自動的に摘出する方法等がある。しかし通常は,ヒストグラム,散布図等を参考にし,過去の経験に照らし合わせて主観的に判断することが多い。この方法は,外れ値の判断に関する客観性に問題はあるが,そのデータに固有な性質を考慮し得るという意味ではより望ましいと思われる。
外れ値は,分布を数値によって要約する場合に特に問題となる。例えば,平均値,標準偏差(分散),相関係数等は,外れ値の影響を受け易い,外れ値を除くか否かでその値が大きく変わる可能性がある。したがって,これらの指標を用いる場合には,まず得点分布等に基づいた外れ値の有無に関する充分な吟味が必要である。そして外れ値の候補が見出されたら,その意味・理由を検討し,それらがその他の多くのデータとは明らかに性質が異なっている場合には,それらの値を除外することも必要である。