2026年以降を展望しても、小さな漸進的な調整は見当たりません。私は、その根本から再編成されているセクターを見ています。
評価に影響を与える最大の要因は業界内ではなく、私たちがサービスを提供する職業で起きています。AIは人々の働き方、役割の構造、そして実際の実務における能力のあり方を変えています。その混乱はすでに存在しており、さらに加速するでしょう。私たちの責任は、仕事と学びの性質、そしてそれらの間の経路が絶えず変化し続ける世界において、授与する資格が関連性と信頼性を保つことを保証することです。
同時に、技術は私たちのシステムを悪用しようとする者たちが利用できるツールを進化させており、しばしば不正行為にお金を払わせた受験者を狙っています。セキュリティ上の脅威は急速に進化しており、不正行為の機会もますます複雑になっています。したがって、将来に向けて私たちが最も強いプレッシャーは明確です。すなわち、資格を現実の実践に沿わせ、それを支える試験プロセスの信頼性を守ることです。
AIがどのように能力を再構築しているのか、そして何が? 私たちは評価します
AIはすでに評価プロセスを強化し、コンテンツの生成効率を高め、大規模なデータセットを分析し、より革新的なセキュリティ管理を可能にしています。これらの改善は重要ですが、それが本当の破壊ではありません。より根本的な変化は職場で起きています。
放射線撮影、建築、会計、建設、教育など多くの分野で、AIは日常を大きく変革しています。AIツールは、かつては手動で行われていた作業の自動化にますます活用されています。かつては暗記が必要だった情報が、今では瞬時にアクセス可能になりました。その結果、最も重要なスキルは知識の保持ではなく、情報の解釈、判断力の行使、自動化システムの出力監督といった応用にあります。
知識の想起がもはや能力の主な指標でなくなるなら、評価は進化しなければなりません。人々が知識を文脈の中でどのように応用し、AIツールとどのように協力し、技術がワークフローに組み込まれた際の意思決定の方法を測定する必要があります。AIの最大の影響は、評価の方法ではなく、能力そのものの定義に現れるでしょう。
評価の進化:一度きりから 継続的な証拠への検査
これらの能力の変化は、当然ながら評価モデルの変化を招きます。私が最も明確に見ている傾向の一つは、単一ポイントの選択式試験から、より連続的でリアルタイムの能力実証への移行です。
アーリーアダプターはすでに実務作業、パフォーマンスデータ、リアルタイムの活動を模索し、より豊かで正確な能力の全体像を構築しています。時間が経つにつれて、こうしたアプローチはもっと一般的になると予想しています。
この変化は複雑になるでしょう。評価は教育、訓練、監督付き実務、規制というより広範なエコシステムの中に位置しています。例えば、免許試験を受ける前に、何年も準備を終えています。評価モデルを変えるということは、そのエコシステムのすべての部分が私たちと共に動かなければならないことを意味します。
再設計されたTOEFL試験で見られたように、意味のある変化には長いリードタイムと世界中の教育者との深い関与が必要です。しかし、方向性は明確です。認定や免許は、数年に一度の能力証明よりも、継続的に能力を示すことに重点が置かれていきます。
労働力の不確実性と新たなスキル ニーズ
これらすべては労働力の不確実性を背景に展開しています。自動化可能な役割の数は増加しており、特にエントリーレベルの職種が顕著です。一部の仕事は消え、多くの新しい仕事が生まれるでしょう。しかし現時点では、新たに生まれる仕事よりも、失われる仕事の方が分かっています。これにより、労働者と雇用主は二つの現実の間で板挟みになります。
- 従来のスキルだけではもはや十分ではありません。
- 新しいスキルはまだ明確に定義されていません。
AIリテラシーという、最も頻繁に挙げられる新興能力の一つでさえ、普遍的な基準はありません。異なるプラットフォームは異なる専門知識を必要とし、AIの適切な活用が実際にどのようなものかについて共通の理解が欠けています。さらにこの課題を複雑にしているのは、これらのプラットフォームがあまりにも急速に進化しているため、今日の能力が必ずしも明日の能力を意味するわけではないことです。
だからこそ、今後数年間で研究が非常に重要になるのです。私たちは前提に頼ってはいけません。これらの新しいスキル領域を定義し、責任を持って測定する方法を決定するためには、確かなデータ、調整された方法論、そして測定の科学に支えられた厳密な分析が必要です。
変わらないもの
職場や教育で求められるスキルは変わるかもしれませんが、変わらないのは「測定の科学」です。心理測定の原則は、ツールや文脈が進化しても依然として適用されます。馬から車に移り、飛び始めたときも重力の原理が変わらなかったように、評価の基礎も変わらない。公平性、妥当性、信頼性、偏見のなさ、倫理的実践は、スキル自体がどのように進化し続けようと適用され続けます。
近い将来、以下により多くの注目が集まると予想しています:
- 応用スキルと意思決定
- AI支援ツールの監督と管理
- デジタルタスクパフォーマンス
- 適応力を支える持続的で移転可能なスキル
私たちの強みは、数十年の科学に根ざした健全で擁護可能な方法論を用いて新しい能力を測定できる能力にあります。
ETSとPSIがリーダーシップへと進化する方法
ETSとPSIは、この変革期を導く上で非常に強い立場にあります。イノベーションを追い求めるからではなく、科学、証拠、そして現実世界の影響に基づいているからです。
そのリーダーシップの中心にはETS研究所の活動があり、AI対応の時代における評価の進化に伴い、3つの重要な優先事項に焦点を当てています。
- AI時代に重要な能力の定義
仕事や学業が変化する中で、私たちは本当に重要なスキルや能力の形態を見極めることに注力しています。そして、その期待が職業、教育、労働市場全体でどのように変化しているかについても。 - 測定の実施方法に関する新たなパラダイムの創出
これには、従来の評価モデルの再考、能力の証拠を時間をかけて捉える新たな方法の模索、そして新興のアプローチが有効で公正かつ信頼性が高く、防御可能なものであり続けることを含みます。 - イノベーションの責任ある活用を促す政策調査の実施
イノベーションは真空の中で起こるものではありません。私たちの研究は、政策立案者、規制当局、機関がAIの評価、資格認定、公共の信頼への影響を乗り越えるための支援を目的としています。
この仕事は、数百の職業、産業、地域にわたって収集した幅広いデータと洞察によって強化されており、新興トレンドを早期に把握できる立場にあります。しかしリーダーシップには規律も求められます。科学に根ざし、証拠に導かれ、誇大宣伝や憶測ではなくデータが示すものに集中することです。
AIガバナンスは不可欠です。テストセキュリティの革新も同様に進みます。AIが無限のアイテムプールやほぼユニークな試験用紙を受験者ごとに可能にしてくれることで、アイテム露出への不安は薄れると予想しています。そしてデジタルや生体認証データが成熟するにつれて、簡単には再現できない行動署名を通じてなりすましや代理テストを識別できるようになるでしょう。
誠実さは信頼の礎であり続け、技術はその信頼を維持するための新たな手段を与えてくれます。
評価の未来
評価の未来は、関連性、誠実さ、そしてAIが根本的に仕事を形作り変えつつある世界で実際の能力を評価する能力によって定義されるでしょう。成功する組織は、科学に根ざし、データに駆動され、学習者、労働者、雇用主、そして一般のニーズに焦点を当てている組織です。
PSIの運営力に支えられ、ETSはこの移行をリードするのに最適な立場にあります。これからの道は困難ですが、同時にチャンスに満ちています。基礎に集中し続ければ、評価の未来に適応するだけでなく、その形作りにも貢献できるでしょう。