見えないものを測る~人材アセスメントと育成について
第2回:テストを使った能力開発~良いテストとは何か

執筆:齊藤 友彦

2012.11.28

前回は、人材を評価するために「測定する」ということの意味を中心に「正しく測定する=アセスメントする」という行為が、経営や人事にとって非常に大切であること、人材をアセスメントするためのツールには、様々なものがあるということをご紹介しました。

今回はアセスメント手法の一つ「テスト」(ペーパーテスト)について考えてみたいと思います。「よいテスト」とは、どのようなものか、また「よいテスト」を個人の人材育成と結びつけるにはどのようなポイントがあるか、について整理します。

「よいテスト」とはどのようなものか

「よいテスト」とは、シンプルに言うと
  “測りたいものを”
  “正確に測ることができる”
 というものです。
 
「測りたいもの」があって、初めてそれを「測るツール」がある。これをセットで考えておかないと「よい」か「悪い」かの判断ができません。非常に単純な例ですが、いくら正確に0.1gまで測れる体重計があっても、身長を測りたいときには使いません。身長を測るときには身長計(または長さを測る機械)を使います。この場合、体重計は良いメジャーであるとは言えないのです。「測りたいものは何か」とは、テストをやる目的、つまり何のためにテストをやるのか、ということになります。
 
例えば、

・上位の職責でも十分やっていけるマネジメント能力を持っているか
・新入社員として必要な「学ぶ力」や「ポテンシャル」を持っているか

といった、具体的な活用場面をイメージすることで、「測りたいもの」を定義付けしていくことができます。
 
もう一つの「正確に測る、測定する」という点はどう考えたらよいでしょうか。

目に見えない人間の能力やスキルを測ろう、という時には、体重計や身長計で測定するというような単純な話にはなりません。人間の能力を表現するには、メートルやキログラムといった標準の単位は存在しません。したがって、絶対的な基準を元に測るのではなく、相対的な位置づけを測る、というアプローチをとります。
 
人事アセスメントを行う目的は、能力や性格、適性といった人間の目に見えない側面を測定したいという事だと思います。
 
「正確に測る事の出来るテスト」とは、能力や性格などの特定の領域や分野において、個々の人間の「相対的な差異」を正しく表現することができるもの、とも言えるでしょう。テストで表現されたその「差異」をいかに解釈するかで、採用や昇進昇格、能力開発といった様々な場面で結果(テスト結果)を活用することが出来ます。
 
繰り返しになりますが、「よいテスト」とはこの人間の差異を客観的に分かりやすく示すことができるテストである、といえます。

信頼性と妥当性

テスト理論の世界では、「測りたいものを正しく測れるかどうか」というテストの品質を、「信頼性」と「妥当性」という指標で表しています。
 
テストにおける「信頼性」とは、「受験者の真の能力をどのくらいの確かさで測定しているか」という事を意味しています。
 
もし、テストを実施するたびに、同じ受験者の得点が大幅に変わるようであれば、そのテストそのものの信用がなくなってしまいます。(これを信頼性の低いテストといいます)例えて言うならば、体重60キロの人が、体重計に乗った時にある時は70キロと表示され、またある時は50キロと表示されるようなものです。これでは「体重を測る」という目的に照らして、役に立たないことは明白です。
 
テストの結果は、この体重計のようにシンプルではないのですが、定量的には統計を使った「信頼性係数」という指数で表されます。一般的に信頼性係数は0.7以上(0~1の範囲)あることが目安とされています。
 
次に「妥当性」という考え方ですが、これは、「そのテストの内容が、本当に受験者の測りたいものを測定しているか」という事を意味しています。
 
例えば、仕事に対する専門知識を知りたいのに、読み書きの書き取りテストを実施する。これでは能力を測定するといっても、ちょっと的外れな行為になってしまいます。この例のように(これは分かりやすすぎる例ですが)、妥当性のあるテストかどうかという点は、テスト導入の際に議論すべき論点だと言えます。
 
妥当性について検証する最もわかりやすい方法は、基準となる既知のテストとの相関を測ることです。この二つのテストの相関係数(‐1.0~+1.0)を取ることで、この相関が+1.0に近くなればなるほど、新しいテストは既知のテストと同様に測定することが出来る、つまり妥当性が高いという事が言えます。
 
しかし、既知のテストが存在しない場合や、「マネジメント能力」のような抽象的で新しい概念を測定しようとする場合もあります。このような場合は事前に考えておくことがあります。
 
例えば「マネジメント能力」を測定しようとする場合には、「マネジメント能力」を構成する概念を定義づけしておかなくてはいけません。例えば、マネジメント能力=能力+性格+意欲、のように、あらかじめ「枠組み」を定めておくことで、「マネジメント能力」を定義付けられます。この定義された「マネジメント能力」と、測定しようとするテストの構成概念がどの程度理論的に整合しているか、この観点で妥当性を考える事で、妥当性の高いテストかどうかを判断することができます。(「構成概念妥当性」という言い方をします)
 
このことは、テストの枠組みを判断する際に、テストを実施する目的を押さえておくことが大切だという意味にもなります。つまり、「そもそもこのテストは何の目的でやるのか」という論点に常に立ち返っておくことが重要です。

能力開発でアセスメントを活用する

テストに限らずアセスメントの結果は、「判断目的(Judgement)」と「能力開発目的(Development)」の2つの目的で使われます。
 
判断目的では、採用や昇進昇格、選抜、報酬の決定などの判断材料となります。採用試験や社内の選抜試験で使われる、適性検査や能力テストが最も代表的なものとなります。グロービスのGMAPも、論理思考力を測定する「GMAP-CT」が採用試験で利用されています。
 
このコラムをご覧いただいているのは、教育や育成担当の方が多いかと思いますので、個人への能力開発目的で活用するケースを、もう一段細かく整理してみると、さらに大きく2つに分ける事が出来ます。
 
一つは「学習効果の測定」ということです。

研修やeラーニングなどで学んだ内容がしっかり定着しているか、という目的で、研修終了後に実施するのがその典型的な方法です。知識やスキルなどを身につけることが主眼の教育であれば、よりその効果を実感できると思います。
 
また教育プログラムと直接連動しなくても、管理職の昇格要件として設けた判断基準を満たしているか、を評価することも、広義での「学習効果測定」に入ります。具体的には、「昇進昇格試験」「研修後の確認テスト」などという名称で実施されるケースがこれに当てはまります。
 
もう一つの目的は、「学習意欲の喚起」という点にあります。

これはテストやアセスメントの結果を受験者にフィードバックすることで、受験者に「もっと頑張って勉強しよう(仕事しよう)!」という、意欲を高めてもらうことを目的としています。現在の受験者の知識や理解のレベルを、客観データとして本人にフィードバックします。そのことで、受験者本人の強み弱みを自覚させ、具体的な学習目標の設定につなげていく。ここにアセスメント結果活用の意味を置くものです。
 
この目的の場合、フィードバックされた結果の高低よりも、自分の結果を客観視して、どこを伸ばすべきか、また強みはどこで今後何をすべきか、といったことに重点を置いて考えてもらいます。
 
この時に重要なのは、評価結果をフィードバックする側の役割です。単純に得点や結果の高低のみを伝えるのではなく、そこに表れている結果が、本人にとってどのような意味を持つのか、その点を十分に考えてもらうようコミュニケーションすることが大切です。特に得点によって数字の比較が出来るテストだと、得点そのものに引っ張られて「出来た」「出来なかった」だけの解釈に終わってしまいがちです。結果は結果として一喜一憂しないこと、組織の期待や改善点などと併せて伝える事で将来に向かっての前向きな解釈を導き出すこと、こんなことが結果をフィードバックする上司や経営者に求められます。
 
テストやアセスメントの種類によっては、専門のトレーニングを受けたアセッサーがフィードバックやフォローアップをするケースも多いです。できるだけ受験者の気持ちに配慮した場のセッティングが求められます。

活用事例

学習意欲の喚起、という目的で、研修プログラムと組み合わせた事例を紹介します。
 
10か月間のリーダー選抜研修を実施いただいているA社様。
研修スタートのオリエンテーションに合わせて、アセスメントテスト「GMAP」の実施結果をフィードバックしていらっしゃいます。
 
毎年のオリエンテーションの様子はこんな風景です。
 
1時間のオリエンテーションは、長期間の研修スタートに当たり、役員講話や先輩受講生の体験談や、受講生に対する期待値や乗り切るための工夫など、様々なメッセージが伝えられる場となります。選抜されたことに対する賞賛とプレッシャーを感じてもらい、研修受講に対するマインドセットをする事が目的なのです。
 
受講生の皆さんは、これから始まる10か月の様々なプログラムに対し、期待と不安を感じながら、緊張の面持ちでテキストや教材を受け取るのですが、その中でも最も表情が変わるのが自分自身のテスト(GMAP)結果をフィードバックされる瞬間です。思ったよりも結果が良かった、逆に悪かったなど、一般の平均と比べて自分の現在実力を数字で突き付けられますので、多かれ少なかれインパクトが大きいのです。
 
しかしながら、
 
 ・このテストが自分の全能力を全て表しているものではないこと
 ・学習を積めば点数を上げる事は可能であること
 ・次世代の会社の中核とな受講生の皆さんにはこの程度の知識は必須であること
 
などを結果のフィードバックと合わせて説明すると、さすがに選抜された優秀層であるだけに、その後の行動はすぐにとられます。自分の実力と立ち位置を冷静に受け止めて、研修を通じた自分なりのゴール設定に結びつけ、研修に対する意欲が更に高まった状態になるのです。
 
このように、第三者や上位役職者からのメッセージだけではなく、客観的なテストというパーソナルデータを利用することで、個人の気持ちや感情に強く訴えかける事ができます。このような使い方をすることで、テストを能力開発の目的でも非常に強力なツールとして活用することが出来るのです。

終わりに

第1回、第2回とアセスメントとテストについての見方・考え方を開発者の視点も交えて紹介してきました。
 
次回は、もう少しテストを実際に利用することをイメージできるような切り口、例えば選択型と記述型のどちらが有効か、といったことなどについて考えてみたいと思います。

執筆者プロフィール
齊藤 友彦 | SAITO TOMOHIKO
齊藤 友彦

※文中の所属・役職名は原稿作成当時のものです。

コラム/レポート