ターゲット1900を「ワードファミリー圧縮」したら実質何単語になるのか?検証してみた
大学受験界の定番英単語帳として知られる
英単語ターゲット1900。
名前の通り見出し語は1900語だが、実際には派生語・関連語・語源的ファミリーを含めて覚える受験生も多い。
そこで今回は、
- 「1900語をワードファミリー単位でまとめたら何グループになるのか?」
- 「実質的な語根数はどれくらいなのか?」
- 「英語学習は実は“圧縮可能”なのでは?」
という視点から検証していく。
そもそもワードファミリーとは?
ワードファミリー(word family)とは、
同じ語根から派生した単語群をまとめて扱う考え方である。
例えば:
- create
- creation
- creative
- creativity
- creator
これらは全部「create系」であり、
脳内ではほぼ同一ネットワークとして管理できる。
つまり、
「1900単語」と言っても、
完全独立1900個ではない可能性が高い。
ターゲット1900は実際かなり“派生語型”である
ターゲット1900は見出し語1900語だが、
派生語・関連語も多数掲載されている。 1
特に5訂版では、
見出し語1900語+派生語・関連語1573語=3473語
というデータも確認できる。 2
つまり受験生は実質3000語超規模に触れているとも言える。
では1900語をワードファミリー圧縮すると?
ここからが本題。
英語学習研究では、
派生語群をまとめて認知することで語彙効率が大幅向上することが知られている。
また近年の自然言語処理でも、
単語を「subword(部分語)」へ分解する発想が一般化している。 3
この観点でターゲット1900をざっくり分類すると、
かなりの割合が以下のように統合可能になる。
| 代表語 | 派生群 | 実質1ユニット化? |
|---|---|---|
| create | creative / creation / creator | ◯ |
| decide | decision / decisive | ◯ |
| produce | product / production / productive | ◯ |
| act | action / active / activity | ◯ |
| appear | appearance / disappear | ◯ |
推定:1900語 → 実質900〜1200ファミリー程度?
厳密集計は版ごとの解析が必要だが、
一般的な英語語彙研究と受験単語帳の構造から推定すると、
1900見出し語 ≒ 900〜1200程度の語根ファミリー
に圧縮可能と考えられる。
つまり受験英語は、
「1900個の完全独立暗記」ではなく、
1000前後の概念ネットワーク学習
として見ることもできる。
さらに語源圧縮するともっと減る説
さらに語源レベルで見ると、
- spect(見る)
- tract(引く)
- scribe(書く)
- press(押す)
- cede(行く)
など、
ラテン語語根に大量の単語が収束する。
例えば:
- inspect
- respect
- spectator
- prospect
- suspect
は全部「見る系」である。
このレベルまで抽象化すると、
受験英語コアは数百語根規模にまで圧縮できる可能性がある。
なぜ英単語学習が「途中から急に楽になる」のか
受験生がよく言う:
「1000語超えた辺りから新単語が覚えやすくなる」
これは偶然ではない。
脳内で:
- 接頭辞
- 接尾辞
- 語根
- 派生パターン
のネットワークが形成され始めるためである。
つまり途中からは、
完全新規暗記 → 既知ネットワークへの追加
へ変化する。
逆に日本人が英単語を苦手化しやすい理由
学校英語では、
- 単語をバラバラに暗記
- 派生語を軽視
- 語源をほぼ教えない
というケースが多い。
その結果、
create と creation を別物として覚える
という非効率状態が発生しやすい。
本来は:
「create系」
として一括管理した方が遥かに脳負荷が低い。
結論:「1900語」は実は1000前後のネットワークかもしれない
今回の検証をまとめると:
| 分類 | 推定規模 |
|---|---|
| 見出し語 | 1900語 |
| 派生語込み | 3000語超 |
| ワードファミリー圧縮 | 900〜1200群 |
| 語源レベル圧縮 | 数百コア |
つまり受験英語とは、
「1900個の孤立単語暗記」ではなく、
巨大な語彙ネットワークを構築するゲーム
と見る方が実態に近いのかもしれない。
余談:「英単語帳を何冊もやる人」問題
なお、
ワードファミリー思考で見ると、
単語帳を何冊も回すより、
- 派生語
- 語源
- 接頭辞
- コロケーション
まで掘った方が、
語彙効率は高い可能性がある。
1900語を1900個として見るか、
1000ネットワークとして見るかで、
英語学習の景色はかなり変わる。
“`4