スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
このエントリーをはてなブックマークに追加

5段階評価はどう使うべきか

僕は中学生のころから、5段階評価によって評価されてきた。
(たとえば、「がんばりましょう~大変よくできました」あるいは「1~5」など)

小学生のころから5段階評価を受けてきた人もいるだろう。

この評価方法は企業での社員の評価においても使われ、
更には顧客満足度アンケートなどでは特に頻繁に使われる評価方法である。

それだけ広まっている評価方法である分、
その特徴について全く考えられずに使われている場合が多々あるのではないか。
(さすがに大学ではある程度特徴を考えて使っているのが分かる)


そんなことを思ったので、つらつら考えてみる。
(今回は、個人が個人について評価する場合を想定し、5を最高、1を最低とする)


まず、強調したいのは、「5段階評価では絶対評価はできない」ということだ。

例えば、自己評価をするときに、ある人が、
「自分のパフォーマンスの質は高い」という項目に1をつけたとしても、
実際の成果物がある一定レベルの質を超えている、ということはありうる。

逆に、5をつけたとしても、及第点にも満たないという場合がある。

つまり、これは「成果物に対しての自分の評価」を表しているだけで、
自分の成果物の質、を表しているだけではないのだ。

だから、複数の自己評価者の間で数値を比べても、
「実際の成果物の質×自己の成果物に対しての満足感」のようなものを比べることになり、
その違いは個人の物事の捉え方によって大きく左右されてしまう。

よって、この数値によって個々人の絶対値を比べることでは、
その質問内容を直接測ることができない。


それでは、評価者が同一であればどうだろうか。

例えば、中学校の成績は同一の講師が、5段階で評価をつける。
これは一見絶対評価ができていそうにも見えるのだけれど、これにも限界がある。

ここでの問題は講師間で起こる。
つまり、同じ科目の教師同士でも観察力などの違いによって、
評価の仕方が変わってしまうのである。

それは講師間で無くとも学校間でも起こる。

人によっては高校受験の際に、「中学によって評定平均が大きく違う」
という問題があるということを聞いたことがあるかもしれない。

同じ試験を受けるにあたって、同じ国、同じ地域で定められた教育を受けている限り、
同一の基準で絶対評価されるべきではあるが、事実それは実現していない。

講師間の対策として、評価者同士での基準のすり合わせをしたり、
例えば「1は○○%まで、5は△△%まで」のような決まりを作って工夫がなされているが、
さすがに学校間ではそのようなすり合わせはなされていないのは想像に難くない。


そもそも、こういった5段階評価は集計して比較するための評価法であり、
絶対評価には向いていないと僕は思っている。

つまり、この評価法は、例えば、個人の自己評価を吸い上げ
集計して(集団などの)数値を比較評価する方法(個人→集計)であり、

集計によって出た平均などを基準にして
個人の絶対評価をできる方法(集計結果→個人)ではないはずである。

もし、後者の方法を取ってしまうと
「自己評価が低い人」は評価されなくなってしまう。


自分に引きつけて考えると、
僕は自分の成果に対する評価が非常に厳しく、
それに比べて集団の成果に対する評価が甘いようだ。

自分の成果にはどこかしら穴を見つけて反省してしまうので、
おのずと5段階評価の満足度は低くしてしまう癖がある。

その場合、本来の「仕事の質は?」という質問の答えは、
仕事の絶対的な質に関して答えていることにはならないのだ。


もっと具体的な例をあげれば、
「勉強全然できないと思っている東大生」と
「勉強むっちゃできると思っている偏差値30の大学生」を想像すれば、
自己評価のアンケートで成績も、成績の絶対差も測ることはできないことが分かるだろう。


では、5段階評価のbetterな使い方はどういうものなのだろうか。

恐らく、先ほど書いたように、個人→複数という形で、
同一人物による評価を比較することにはある程度の意義は見出せると言えるだろう。

例えば、同じ仕事に対する同一人物の自己評価を半年ごとに比較すれば、
ある程度、その人の仕事の質の推移を見られる。
(しかし、この場合も「自己評価が甘くなった」という可能性も考えられる)


また、同一のものに対する複数人の評価を集めることによって、
その「同一のもの」に対する印象の傾向を測ることができる。

例示すると、
アンケートに答えた全員の評価を集計すれば、
各質問に対する自己評価の差を見ることができる。

これが研修の後のものだとすれば、
その研修の良い印象と悪い印象を知ることができるだろう。
(しかし「どれくらい良い/悪いのか」という目盛はつけることができない)

「勉強絶対できないと思っている東大生」の学力は測れないが、
各科目についての評価を集めて集計すれば、
「質問を受けた東大生の得意/不得意と思っている分野」などは分かることができる、ということだ。
(細かいが、これも各科目へのバイアスはかかる可能性はある)


つまり、「○段階評価」(別に何段階でも上述の性質は同じ)は
「質問群の中でどの項目が最低で、どの項目が最高なのか、
と評価者が思っているのか」を調べる為の評価法だと言える。


こんな風に考えれば、例えば、子供の通知表は、
「同学年内での成績の変化」を第一に評価すべきだと思うし、
「学年が変わった際の成績の変化」にはある程度寛容になる方がいい。

顧客アンケートは、
「個々の数値」や「集計後各項目の絶対値」に一喜一憂するのではなく、
「集計後各項目間の順位の順位」を中心に眺めるべきであり、
「顧客満足」のようなものは、何か他の指標(例えばリピート率など)から
推測する方が信頼性があるといえるのではないだろうか。


もちろん、
質的(定性的)なものを量的(定量的)なものに変換する時点でおかしい、
とか、
統計的な計算というもの自体が怪しい、
みたいなことも言えるのだけれど、

それら対してある程度の寛容さを持った上で考えても、
こういった「○段階評価」に限らず評価法というものは、
人の人生を大きく変える可能性もあるので評価者は
一定のリテラシ-は見につけないといけないと思う。
(といってもこの日記では何も参考にせず思うままに書いているだけなのだがw)


ただここで、誤解を生じないように言っておくと、
「○段階評価」について色々書いてきたけれど、
このような量的な評価は説得力(≒公平感)があるし、
かなり便利な評価ではあるのは間違いないと思うし、
そもそも他に絶対的に正しい&手軽な評価方法があるわけでもない。


しかし、絶対的な評価法が無いからこそ、
その評価者は評価法の限界を知らないことによって、
いわれの無い誰かがネガティブな印象を持たれるのは避けるべきだと思うので、
考えもなしに広く扱われていそうな評価方法について書こうと思ったのである。


さて、「ではどうすればいいのか」について、もっと考えるべきなのだろうけれど、
そのような数十年解決してこなかった問いに一晩で挑めると思っていないので、
ここでいったん筆を擱くことにする。

正直なところ、ここからはもっとインプットが無いと、
どこから切り込めばいいのか分からないのだ(笑)
スポンサーサイト
このエントリーをはてなブックマークに追加

コメント

非公開コメント

カレンダー
09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -
月別アーカイブ
カテゴリ
最新コメント
QRコード
QRコード
検索フォーム
ブロとも申請フォーム

この人とブロともになる

リンク
RSSリンクの表示
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。