近年、オンライン上でできる、ビジネス英語の検定やアセスメントが市場に溢れています。その1つ1つには、測定しようとする対象や領域などを明確にしたテスト設計書があり、様々なポリシーで運用されています。
ここでは自社にどのようなテストが適しているのかを考えるにあたって知っておきたい観点を分かりやすくご紹介します。
どのようなビジネス英語の測定ツールが必要なのか?
「どのようにビジネス英語の測定ツールを選んだら良いですか?」という質問をいただくことがよくあります。
当然、自社のアセスメントをお勧めしたいところですが、最も適した測定ツールを選ばなければ学習者の苦労が浮かばれません。
まずは、「どのような測定ツールを望んでいるのか?」を明確にしましょう。
1. 何を測りたいのか?
英語で仕事ができるかどうかを測るならば、当然、スピーキングやビジネスライティングが出題されるツールが必要です。
一方で、基本的な英語を理解できる力があるかどうかを測りたいのであれば選択肢型のツールでも十分かも知れません。
今後、社員がどのようなシーンで英語を使うのかを具体的に想定しましょう。
2. どの程度の領域レベルを測りたいのか?
測定したい社員が、基礎レベルの英語力があるのか、それともグローバルに活躍できるレベルかどうかまでを測定したいのか、測定領域を想定することも大切です。
3. どのような環境が用意できるのか?
大きな会場を用意して、社員を集合させて受検をすることを想定しているのか、あるいは一定の期間で、社員が自由に受検に挑む環境を優先するのか、といった運用コストも視野に入れた上で、測定ツール単体の単価と併せて検討が必要です。
オンラインテストを選ぶための5つの観点
実は、このコロナ禍により在宅勤務が急増し、オンラインテストへのニーズが市場で拡大しています。
つまり前述の③の観点で、これまで大きな会場に社員を集めて試験をさせるといった環境をつくることが難しくなってしまったことによります。
しかし、オンラインテストにも様々なタイプのものがありますので、選ぶ際に知っておきたい5つの観点を具体的にご紹介しましょう。
1. CBT【Computer BASED TEST】=コンピューター利用型テスト
まずはCBT(Computer Based Test)、コンピューター利用型テストのことです。対義語はPBT(Paper Based Test)です。
つまりマークシートや答案用紙などを用いたテストの事です。
オンラインテストの中には、パソコンを使わずにTV電話形式で英語力を測定するものや、スマホだけで測定するもの等も含まれています。
どのようなツールを利用したテストなのかが第一観点になります。
2. CAT【Computer Adapted TEST】=コンピューター適応型テスト
オンラインでPCを使うテストにも2つのケースがあります。
1つは単純に問題や解答がPC上で展開され解答情報がオンラインでサーバーに送信されるパターンです。
もう1つがCAT(Computer Adapted Test)と言って、テスト中に受検者の解答によって、次に出題される問題の難易度を自動的に変えているテストです。
問題を進める中で、だんだん受検者のレベルを特定し、その受検者のレベルにあった問題に調整されていくため、どのレベルの人でも一様に“難しい“と感じますが、出題されている問題の難易度は受検者によって全く違うといったタイプのテストです。
このタイプの場合、自分のレベルに合わない問題に取り組む必要がないため、必然的にテスト時間が短縮されることと、オンタイムで受検者の能力を把握し出題レベルのチューニングを繰り返します。
そのため、PBTとは比べ物にならないほどスコアの精度が高くなるというメリットがあります。
3. IRT【ITEM Response theory】=項目反応理論
次の観点はIRT(Item Response Theory)を用いた測定ツールかどうかです。
CAT形式によって、受検者個々のレベルに合わせて出題された問題セット間の難しさの差に影響されない成績評価の方法となります。
また、出題された問題が異なっていても、受検者集団が異なっていても、そこで得られたスコアを互いに比較することができます。
単純にCATだけのテストとは違い、スコアの精度は確度の高いものになります。
4. 自動採点とAI採点とNative採点
採点方法にもいくつか種類があります。
自動採点は選択方式のテストで用いられるものでセンター試験やマーク式テストで使われる方法です。最近ではスピーキングやビジネスライティングを測定するツールも増えてきました。
この中で出てきたのがAI採点です。AI採点では、イントネーションの正確さ、発話の正しさなど、発話された音や抑揚の波形やキーワードを並び替えて正しい語順で発話しているかどうかをAIで測定しています。
一方でNativeが採点をする手法の場合は、発話された発音やイントネーションもさることながら、発話されたコンテンツ、つまりアウトプットした内容がどれだけNativeに伝わったかどうかに力点を置いた採点方法となります。
アウトプットさせるボリュームもAIよりは多く解答させる内容も、より個人のレベルに合わせることが可能です。
5. 本人認証や不正監視への取り組み
測定の目的が、入社試験や昇格試験などの場合は本人認証や不正監視も無視することができません。会場に社員を集めて試験を運営していた際には、特段、問題にはならなかった部分かも知れません。
しかし、コロナ禍となり在宅にて受検をするといったケースが増えてきた昨今では、測定ツールの提供元がこの本人認証や不正監視への取り組みにどのような姿勢で取り組んでいるのかも無視できない観点になるでしょう。
最優先の観点は社員のメリット
いかがでしょうか?
ここではオンラインテストに特化してご紹介をしましたが、なんと言っても最優先にすべきは受検をする社員のメリットです。
受検の気軽さや負担の少なさ、そしてフィードバック性の高いスコアレポートであることなどを視野に入れ測定ツールは選びたいものです。