テストの公平性と妥当性

GREテストの公平性と妥当性を、テストの開発、実施、採点プロセス全体で確保することが最優先事項です。これらの目標を達成するために、ETSは綿密な内部チェック・アンド・バランスのシステムを構築し、監査チームはAPA、AERA、NCMEが定める厳格な専門基準を満たしているかを定期的に検証しています。さらに、研究開発チームは調査、委員会活動、広範なデータ分析、測定、評価、比較に焦点を当てた多様な研究を実施しています。

公平性

公平性への懸念は、すべてのテストの開発と採点において不可欠な要素です。公平性を確保する多くの活動には以下が含まれます:

専門的に訓練された公平性審査員を雇い、テスト問題が厳格な基準を満たしていることを確実にします
テスト問題のパイロットテスト、事前テスト、継続的な統計分析を行い、問題が公平であり、グループの違いに不公平に寄与しないことを確認します
試験問題の開発や採点に関わるすべての人に対して厳格な訓練を行い、すべての受験者が平等に自分のスキルと能力を示す機会を得られるよう努めています
障害や健康上の必要性を持つ受験者のための適切な配慮(例:代替形式、追加時間)を

妥当性

妥当性研究と分析により、この検定は本来測定すべきものを測定していることが確立されています。GREスコアの適切な使用を支持する妥当性の議論の側面には以下が含まれます:

コンストラクト・バリシティ(測定すべきスキルや能力を測定するテスト)
内容の妥当性(適切な内容を測定するテスト)
予測妥当性(テストが成功を予測する)
結果的妥当性 (ホリスティックレビューの一環として適切に用いられる場合、このテストは悪影響が最小限であることを示します)
外部妥当性(同じ構成概念の他の測定値と期待される関係を持つ)

ETSは提供および採点プロセスの各段階で妥当性の証拠を蓄積していますが、妥当性研究の初期の方向性は、大学院コミュニティ、特にビジネスや法学分野から、大学院レベルのプログラムで成功するために不可欠と考えるスキルや能力に関する情報からのフィードバックに基づいています。

構成要素と内容の妥当性は、GRE プログラムを支える妥当性論証の二つの側面です。

コンストラクト・バリシティとは、テストが測定すべきスキルや能力を測定することを意味します。
内容の妥当性とは、テストが適切な内容を測定することを意味します。

ETSは、ビジネスや法科大学院を含む大学院および専門職プログラムから、プログラムの成功に不可欠と考えるスキルについて情報を収集しています。

言語推論セクション

GRE 一般試験の言語推論セクションは、教員が調査を通じて大学院レベルの成功に重要と特定したスキルを測定します。評価される能力には以下が含まれます:

テキストの理解力(例えば、文の意味を理解する能力、テキストの正確な要約を認識する能力、文章の主要なポイントと関連しないポイントを区別する能力);および
談話を解釈する能力(結論を導き出す能力、欠落した情報を推測する能力、仮定を特定する能力など)。

定量的推論セクション

GRE一般試験の定量的推論セクションは、アメリカ数学協会の『大学卒業生のための定量的推論:基準の補完 』に記載されたスキルと整合し、教員調査からのフィードバックに基づいています。GRE定量的推論の評価対象となるスキルには以下が含まれます:

定量的な情報の読み解と理解
データから推論を導き出すことを含む定量的情報の解釈と分析
定量的問題を数学的手法で解決する方法

分析ライティングセクション

大学院レベルの教員へのインタビュー、大学院レベルの教員へのアンケート、GREライティングテスト委員会の活動では、大学院プログラムの成功において批判的思考力と文章力が重要であると一貫して指摘されています。

分析的ライティングセクションを構成する2つの課題(問題の評価と議論の評価)は、多くの大学院研究分野で必須とされています。したがって、このテストの構造は、大学院コミュニティが多くの分野で成功に不可欠と判断したスキルを評価するため、内容妥当性を持つことが示されます。

ETSでは、GRE テストやスコアの公平性と妥当性を確保するために、厳格な内部チェック・アンド・バランスのシステムに依存しています。当社の研究開発チームは、調査、委員会活動、広範なデータ分析、そして測定、評価、比較に焦点を当てた多様な調査を実施しています。詳細については、以下の文書をご覧ください。

データはGRE^® スコアがMBAプログラムの成功を予測する有効な指標であることを裏付けています
米国法科大学院における学業成績予測におけるGRE^® スコアの妥当性
GRE^® 改訂一般試験研究財団 :研究概要(PDF) — 2011年8月に成功裏に実施されたGRE一般試験の成功に至るまでの広範な研究活動やその他の活動を網羅した包括的なコレクション。約10年にわたる研究の要約や、改訂版テストに関する未公開情報は、試験の改訂理由、開発プロセス、テスト設計、スコアスケール、自動採点、妥当性、公平性、アクセスのしやすさなど、多様なテーマを網羅しています。
公開された GRE^® 有効性データの包括的なレビュー(PDF) — GRE一般試験の妥当性研究をまとめた。
GRE^® 一般試験は生物学の学生の成功をどの程度予測できるのか? (PDF) — GRE一般試験が生物学の1年次大学院成績の指標としてどれほど価値があるかを示す分析を提示します。
GRE^® 一般試験は化学の学生の成功をどの程度予測できるのか? (PDF) — GRE一般試験が化学の1年次大学院成績の指標としてどれほど価値があるかを示す分析を提示します。
GRE^® 一般試験は教育学生の成功をどの程度予測できるのか? (PDF) — GRE一般試験が教育学部の1年次成績の指標としてどれほど価値があるかを示す分析を提示します。
GRE^® 一般試験は英語学科の学生の成功をどの程度予測できるのか? (PDF) — GRE一般試験が英語の大学院1年次成績の指標としてどれほど価値があるかを示す分析を提示します。
GRE^® 一般試験は心理学学生の成功をどの程度予測できるのか? (PDF) — GRE一般試験が心理学の大学院1年次成績の指標としてどれほど価値があるかを示す分析を提示します。
GRE^® 一般試験の妥当性:獣医学部のケーススタディ(PDF)
GREテストの有効性:視点から捉える(PDF)

テストの公平性と妥当性

公平性

妥当性

Construct and content validity

言語推論セクション

定量的推論セクション

分析ライティングセクション

GRE validity resources