メインコンテンツにスキップ
Skip to footer

 

TOEIC® リサーチ

英語評価、教育、学習の推進

TOEICスコア解釈の妥当性と公平性

TOEIC テストの設計と開発プロセスは体系的かつ厳密であるため、スコア利用者はスコア解釈が意味があり、公平で、現実世界に関連していると安心 できます。 裏付けとなる研究は、1) スコアが意図した意味を持つかどうか、2) TOEICスコアの英語スキル解釈が偏りなく公平かつ現実の能力を反映していることを検証します。

新しい言語能力評価のための構成概念定義の正当化:再設計されたTOEICブリッジ®テスト — フレームワークペーパー

本論文は、4つのコミュニケーションスキルすべてを測定する再設計されたTOEIC Bridge評価の設計動機、評価の目的、そして基礎から中級者までの日常的な文脈における英語のリスニング、読解、話し、作文能力をどのように定義したかを説明しています。 この情報は試験開発およびその後の妥当性研究の基盤となります。

続きを読む

再設計されたTOEICブリッジ®試験の開発

再設計されたTOEICブリッジ試験は、エビデンス中心設計(ECD)と呼ばれる評価開発手法を用いて開発されました。 本論文は、受験者の基礎から中級レベルの英語能力を示す証拠を引き出すタスク設計にECDがどのように用いられたか、またテスト開発過程で得られた様々なデータ源が問題や試験設計の意思決定にどのように影響したかを記録しています。

続きを読む

再設計されたTOEICブリッジ®試験のためのフィールドスタディ統計解析

本論文は、再設計されたTOEICブリッジ試験の開発に貢献したフィールドスタディの結果を報告しています。 統計分析は、再設計されたTOEICブリッジのテストスコアが一貫性を持ち、テストスコアが基礎から中級レベルの英語能力を示す意味のある指標であるという主張を支持する初期証拠を提供しています。

続きを読む

再設計されたTOEICブリッジ®テスト:受験者の英語能力の認識との関係

本論文では、再設計されたTOEIC Bridgeテストスコアと言語能力の自己評価との関係を検証した2つの研究について述べています。 結果は、テストスコアが言語能力の有意義な指標であり、共通ヨーロッパ言語参照枠組(CEFR)などの言語能力基準で定義される言語能力レベルを有意義に区別するためにテストスコアが用いられるという主張を裏付ける証拠を提供しています。

続きを読む

国際職場におけるコミュニケーション効果の予測:言語素人によるTOEIC®スピーキングテストのスコア支援

本研究は、TOEIC®スピーキングテストのスコアが国際的な職場の専門家による受験者のコミュニケーション効果の良い予測因子かどうかを調査しました。 10か国の専門家が参加し、異なるコミュニケーションシナリオにおける受験者のコミュニケーション効果を評価しました。 この結果は、TOEICスピーキングテストのスコアが、専門家がコミュニケーションの効果をどう認識するかと比較して、能力の有意義な評価であることの証拠を提供しています。

続きを読む

国際職場における作文の機能的適切性を示す指標としてのTOEIC®ライティングテストスコア:言語学者による評価

本研究は、TOEICライティングテストのスコアが、国際的な職場の専門家が評価する受験者の文章力の「機能的十分性」(またはコミュニケーション効果)を良好に予測する指標かどうかを調査しました。 10か国の専門家が参加し、受験者の異なるコミュニケーションシナリオにおける文章作成の機能的適切性を評価しました。 この結果は、TOEICライティングテストのスコアが、専門家が文章作成の機能的適切性をどう認識するかと比較して、熟練度の有意義な評価であることの証拠を提供します。

続きを読む

新しい言語能力評価の質と利用の根拠を立証する:再設計されたTOEICブリッジ®テストの妥当性の議論

本論文は、再設計されたTOEICブリッジ試験の「妥当性」の議論をまとめています。 妥当性の主張は、スコアの一貫性、妥当性と公平性、適切なテスト使用、そしてポジティブな影響に関する4つの主要な主張で構成されています。 これらを合わせると、測定の質とテストスコアの意図された用途について一貫した物語が示されます。 妥当性の主張と支持証拠を考慮することで、読者は再設計されたTOEIC Bridgeテストが自分の状況に適しているかどうかをよりよく評価できるはずです。

続きを読む

妥当性:TOEIC®テストにとって何を意味するのか?

本稿は、TOEICのテストスコアがグローバルな職場環境で受験者の英語コミュニケーション能力の有効な指標となることを確実にするために実施された試験開発と研究プロジェクトの非技術的な概要を提供します。

TOEICテストの主な価値は、その妥当性にあり、テストが私たちが主張する機能をどの程度行っているかと定義できます。

続きを読む

TOEIC®のリスニング、読解、話し、作文スキルの関係

テストスコアの検証を通じて、TOEICテストは異なるが関連するスキルを測定し、それらを総合することで英語能力のかなり完全な全体像を提供していることが分かりました。 この発見は、言語能力評価における4つのスキルアプローチが重要であることを示す追加の証拠を提供しています。

続きを読む

サブグループ間の英語能力測定:スコア公平性評価を用いたテストの公平性評価

英語能力評価は対象となるテスト集団を対象としており、多様な人口統計学的、社会文化的、教育的背景を持つ受験者を含む場合があります。 テストは公平であると仮定されており、受験者の異なるサブグループが得たスコアは同じ意味を持ちます。 テストの公平性を評価する一つの方法は、各サブグループごとにリンクテストを作成し、リンクされたテストの結果と元のテストスコアを比較することです。

続きを読む

TOEIC®スピーキングテストのスコアを他の評価や基準と比較するベストプラクティス:スコアユーザーガイド

テストスコアの意味をよりよく理解し、意思決定を促進するために、スコアユーザーは異なる2つのテストのスコアがどのように関連しているかを理解する必要があるかもしれません。 異なる2つのテストのスコア間の関係は通常、「コンコルダンス表」にまとめられ、両テストのスコア間の対応を示します。 残念ながら、一部のコンコーダンス表は研究支援なしに作成・配布されており、受験者に対する不正確で不公平な判断につながることがあります。

続きを読む

サブグループを跨えた英語職場習熟度の測定:テストスコア解釈の検証のためのCFAモデルの活用

この研究では「因子分析」と呼ばれる統計手法を用いて、TOEICリスニング・リーディングテストのパフォーマンスを最もよく説明する統計モデルを特定しました。 研究者たちは、読解力と聴力スキルを別々の能力として表現するモデル(二要素モデル)が、スコアの解釈方法と整合し、パフォーマンスを最もよく説明できることを発見しました。

続きを読む

TOEIC®リスニングスコアを使ったTOEIC®スピーキングスコアのリンク

テストプログラムでは、異なる管理機関で複数のテスト形式が使用され、試験用紙の過剰露出を防ぎ、受験者が試験内容の事前知識を得る可能性を減らすために使われます。 代替形式の統計難易度にわずかな差が生じることがあるため、テストスコアリンクと呼ばれる統計手法が一般的に用いられ、これらの難易度差を調整してテスト形式同士を比較可能にしています。

続きを読む

TOEIC®スピーキングテストの問題形式の拡充

伝統的に、研究者たちは「真正性」という用語を、言語テスト上の課題が現実世界で使われるものとどの程度一致するかを指し、課題やテストにおいて望ましい特性として使われてきました。 このホワイトペーパーでは、TOEICスピーキングテストのいくつかの問題形式がどのように拡大され、より多様な実世界の状況を含み込んだかを説明します。

続きを読む

英語能力の包括的で4つのスキル評価の必要性

本論文では、4つのスキル言語テストが英語でコミュニケーションできるかどうかを評価する最良の方法であること、そしてこのアプローチがどのような効果をもたらすかを説明します。

  • 受験者にとってより公正な評価方法となる
  • テストユーザーの意思決定の質を向上させる
  • 意思決定者、教師、学習者にとって、よりポジティブなインパクトを生み出す

続きを読む

TOEIC®リスニングテストのための自然言語処理ツールによる問題生成の分析

TOEICリスニングテストは、グローバルな職場に関連する項目やタスクを含み、さまざまな実際の文脈を含みます。 テスト用紙の数が増える中、TOEICリスニングテストの重要な目標は、幅広い文脈で大量の問題プールを維持することで問題生成の効率を高めることがTOEICリスニングテストの重要な目標でした。

続きを読む

TOEIC®のリスニング、リーディング、スピーキング、ライティングテストが実際の英語課題の成績予測に与える段階的貢献

本研究では、特定の言語スキル(例:話す)における習熟度を、そのスキルに対応するTOEICテストのスコアだけでなく、他のスキルのTOEICテストスコアも考慮することで、より正確に推定できるかどうかを調査しました。 結果はこの主張を支持し、4つのスキルによるTOEICテストのスコアを合わせることが、単独のスキルよりも英語能力のより有効な測定手段であることを示唆しています。

続きを読む

TOEIC®のリスニング、リーディング、スピーキング、ライティングテスト:英語能力評価における独自の貢献を評価する

本研究は以下のことを調査します:

  • TOEICのテストの1つの能力スコアが、4つのスキルすべてにおける受験者の英語能力の自己評価とどれだけ相関しているか
  • 一つの英語スキル(例:読解)が、複数のTOEICテストスコア(すなわちリスニング、スピーキング、ライティング)を使ってより正確に推定または予測できるかどうか

続きを読む

TOEIC®スピーキングおよびライティングテストにおける構成応答(CR)差異問題機能(DIF)評価

差分問題機能分析(DIF)は、予期せぬ偏りがあり、ある受験者グループに不適切に有利な問題や課題を特定するための統計手法です。 話す・作文テストの課題の一つは、パフォーマンスベースや「構成応答」テストを分析するために使える実証済みの実践的なDIF技術が不足していることです。 本論文では、いくつかのそのような手法を調査し、スコア解釈の公平性を確保するための研究がどのように行われているかを示します。

続きを読む

再設計されたクラシックなTOEIC®リスニング・リーディングテストにおける内容、問題統計、受験者の成績の比較

本論文では、古典的なTOEICリスニング・リーディングテストと2006年に再設計されたものの内容、信頼性、難易度を比較します。 再設計されたテストは、現在の言語能力モデルをよりよく反映するために若干異なる項目タイプを含んでいましたが、テストはバージョン間で類似していると判断されました。

続きを読む

エビデンス中心設計:TOEIC®スピーキングとライティングテスト

エビデンス中心設計(ECD)は、評価が何を測定し、テストスコアに基づくスキル解釈を支持するのかを明確にする評価開発手法です。 本論文では、TOEICスピーキングおよびライティングテストの開発に用いられたECDプロセスについて説明します。 テスト設計プロセスを通じて収集された証拠は、TOEICのスピーキングおよびライティングテストのスコア解釈の妥当性を裏付ける基礎的な支持を生み出しました。

続きを読む

TOEIC®スピーキング・ライティングパイロットスタディの統計分析

本論文は、TOEICのスピーキング&ライティング試験開発に貢献したパイロット研究の結果を報告しています。 テストスコアの信頼性分析では、複数の評価者間の信頼性(複数の評価者がスコアに合意していること)や内部整合性(同一テストの項目間の相関に基づく指標)など、いくつかの種類のスコア一貫性の証拠が見つかりました。

続きを読む

更新版TOEIC®リスニング・リーディングテストの統計解析

テストが受験者のニーズを満たし、利用者を採点し続けるためには、テストプログラムが定期的に評価を見直すことが重要です。 このため、英語の使用が絶えず変化し、グローバルな職場や日常生活で個人が一般的にコミュニケーションを取る方法に対応するため、2016年5月に改良版TOEICリスニング・リーディングテストが設計・開始されました。

続きを読む

再設計されたTOEIC®リスニング・リーディングテスト:受験者の英語習熟度の認識との関係

テストの再設計プロジェクト、例えば2006年のTOEICリスニング・リーディングテストの再設計後は、テストスコアが依然として意味のある解釈が可能であることを示すことが重要です。 この研究は、TOEICリスニング・リーディングテストの再設計に関するスコアと、受験者自身の英語能力に対する認識との関係を調査しました。 研究者たちは、テストスコアと受験者の認識との間に中程度の相関があることを発見し、再設計されたTOEICリスニング・リーディングテストのスコアが英語能力の有意義な指標であることの証拠を提供しました。

続きを読む

TOEICブリッジ™スコア:韓国と日本の妥当性証拠

この研究は、TOEICブリッジのスコアと、受験者が英語で日常の言語課題を行える能力についての自己評価を比較しようとしました。 結果は、テストスコアが受験者の自己評価と良好に相関していることを示唆しており、TOEIC Bridgeスコアが英語能力の有効かつ公正な指標であることを裏付けるさらなる証拠となっています。

続きを読む

TOEIC®リスニング・リーディングテストとTOEIC®スピーキング・ライティングテストで測定されたテストスコアの関係

本研究は、TOEICのリスニング・リーディングスコアとTOEICスピーキング・ライティングスコアの関係を調査し、リスニング・リーディングスコアをスピーキング・ライティングのスコアの予測因子として使用すべきかどうか、またはその逆を判断します。 調査結果は、測定されたスキルに対するテストスコアの妥当性を支持しています(例:リスニングおよびリーディングテストのスコアはリスニングおよびリーディングスキルの意味のある解釈を提供します)。

続きを読む

TOEIC®のスピーキングおよびライティングテスト:受験者の英語能力の認識との関係

この研究は、TOEICのスピーキングおよびライティングテストのスコアと、学生が日常の英語課題を遂行する能力についての自己評価を比較することを目的としました。 研究者たちは、テストのスコアと自己評価の間に比較的強い相関があることを報告しました。 この発見は、TOEICのスピーキングおよびライティングテストのスコアが英語能力の指標であることを支持するさらなる証拠となります。 この研究はPowers, Kim, Weng, and Van Winkle(2009年)としても発表されました。

続きを読む

TOEIC®リスニング・リーディングテストスケールアンカーリングスタディ

スケールアンカリングは、テストスコアをスコア範囲や習熟度レベルにまとめるプロセスです。 統計的手法と専門的な判断を組み合わせ、各習熟度レベルで受験者が通常示すスキルや知識の説明を生み出します。 この研究報告書は、TOEICリスニング・リーディングテストのスケールアンカーリングプロセスを説明しており、意味のあるスコア解釈を促進します。

続きを読む

TOEIC®リスニング・リーディングテスト更新プロジェクトの背景と目標

本報告書は、2016年にTOEICリスニング・リーディングテストを更新するプロジェクトの目標と成果を説明しています。 特に国際的な職場の文脈で、英語によるコミュニケーションは絶えず進化しています。 そのため、TOEICリスニング・リーディングテストは定期的に再審査され、試験内容が職場や日常生活における最新のコミュニケーションを反映していることを確認し、英語能力に関する意味のある解釈を支援し、英語教育と学習に良い影響を与えることを目的としています。

続きを読む

TOEIC®リスニング・リーディングテスト再設計プロジェクトの背景と目標

時間が経つにつれて、言語能力の概念化が現在の理論と整合し、テスト課題が現実の課題を示すものであることを確実にするために、テストの設計を見直すことが重要になります。 本報告書は、TOEICリスニング・リーディングテストの再設計の目標、理論的整合性、手順および成果を概説しています。  

続きを読む

再設計されたTOEIC®リスニング・リーディングテストのフィールドスタディ結果

本稿は、2006年に再設計されたTOEICリスニング・リーディングテストのフィールドスタディの結果を説明しており、問題とテストの難易度、信頼性、そして従来のTOEICリスニング・リーディングテストとの相関関係の分析が含まれています。 結果は、別の比較可能性研究(2010年のLiao、Hatrak、Yuの研究)と一致しており、そこでは再設計されたテストの信頼性の証拠が示され、再設計されたテストのスコアは従来のTOEICリスニング・リーディングテストのスコアと似た解釈や利用が可能であることが示唆されています。

続きを読む

中国の職業学生の教師評価とTOEICブリッジ™のスコアの検証

この研究では、TOEICブリッジのスコアと、受験者が英語で日常的に言語課題をこなす能力を評価する教師の評価を比較しました。 著者らは、これらの評価とテストスコアの間に中程度の相関関係があり、TOEICブリッジテストスコアが英語能力の指標として有効であることを裏付ける証拠を提供していると報告しました。

続きを読む

TOEICブリッジ™スコアを教師および生徒の評価と比較する:小規模研究

本研究は、TOEIC Bridgeスコアが英語能力の2つの指標である学生の自己評価および教師による学生評価とどの程度対応しているかを評価しようとしました。 TOEICブリッジのスコアはこれらの測定値と中程度の相関が見られ、TOEIC Bridgeスコアが英語能力の指標として意味のある解釈が可能であることの妥当性の証拠となっています。

続きを読む

TOEICブリッジ™テストのスコアと学生の英語能力の認識との関連付け

本研究では、TOEICブリッジのスコアと学生自身の英語能力評価との関係を調査しました。 TOEICブリッジのテストスコアは自己申告の読解力と聴力と相関していることが判明し、TOEIC Bridgeテストのスコアが英語の読解力およびリスニング能力の有効または意味のある指標であることの証拠を提供しています。

続きを読む