pontaパス

同義語は可換可能性で測れる? 数学的根拠を徹底検証





同義語は可換可能性で測れる? 数学的根拠を徹底検証

同義語は「可換可能性」で測れるのか? 数学的根拠を探る

「同義語とは何か?」という問題は、言語学だけでなく論理学や情報科学でも長年議論されてきた。
そこで浮上するのが、

「二つの単語が入れ替えても意味が変わらないなら同義語では?」

という発想である。
本記事では、この考え方を数学の「可換性(交換可能性)」と結びつけて検証する。


そもそも可換性とは何か

数学で可換性(Commutativity)とは、
順序を入れ替えても結果が変わらない性質である。

代表例は加法である。

a + b = b + a

3 + 5 も 5 + 3 も結果は8になる。

つまり、

順番を変えても意味が保存される

という性質を持つ。


言語に置き換えるとどうなるか

例えば、

  • 自動車

を考える。

「車を買った」

「自動車を買った」

へ置き換えても大きく意味は変わらない。

このとき、

車 ↔ 自動車

は高い交換可能性を持つ。

つまり実質的に可換である。


数学的には「置換不変性」が近い

実は言語学で重要なのは、
厳密な可換性よりも
「置換しても命題の真偽が変わらない」
という性質である。

論理学ではこれを

salva veritate
(真理保存)

と呼ぶ。

例えば、

  • 太郎は車を持っている
  • 太郎は自動車を持っている

が常に同じ真理値を持つなら、
両語は非常に近い意味を持つと考えられる。


フレーゲ以降の意味論との関係

ドイツの哲学者
0
は、
語には

  • 意味(Sinn)
  • 指示対象(Bedeutung)

があると論じた。

有名な例が、

  • 明けの明星
  • 宵の明星

である。

どちらも金星を指すが、
完全には交換できない。

つまり、

同じ対象を指す ≠ 完全な同義語

なのである。


AIは実際に交換可能性で意味を測っている

現代の大規模言語モデルは、
ある単語が別の単語に置き換えられる頻度を学習している。

例えば、

  • 大きい
  • 巨大な
  • でかい

は似た文脈に出現するため、
ベクトル空間上で近い位置に配置される。

これは数学的には、

交換可能性の確率分布を測定している

とも解釈できる。

つまり現代AIは、
「どれだけ可換か」を統計的に学習しているのである。


ただし完全な可換性は存在しない

例えば、

  • 死ぬ
  • 逝去する
  • くたばる

は指す事象は近い。

しかし感情や敬意のニュアンスは全く異なる。

交換すると文の印象が激変する。

したがって自然言語では、

100%可換な同義語

はほぼ存在しない。


結論

「同義語かどうかを可換可能性で測る」という発想には強い数学的根拠がある。

  • 数学の可換性 → 順序を変えても結果不変
  • 論理学の真理保存 → 置換しても真偽不変
  • 言語学の同義性 → 文脈中で交換可能
  • AIの埋め込み空間 → 交換可能性を統計的に学習

ただし自然言語ではニュアンスが存在するため、
「完全可換=完全同義語」はほぼ成立しない。

むしろ、

同義語とは「高い確率で可換な語」である

という定義の方が現代言語学・AI理論に近いと言える。

つまり、


同義語 ≒ 言語空間における交換法則の近似解

という見方は、意外にもかなり数学的なのである。


コメントする

Pontaパス