Sitemap

人工言語アルカ公式サイト
STUDY:はじめてのアルカや概説等

Contents Menu


もどる

人工言語の目標語彙

人工言語は何語程度単語を作ればよいだろうか――と言語作者は必ず一度は考える。
結論からいうと、12000~15000程度ではないかと思われる。

この結論を見て「はぁ、なるほど」と思えれば後は読む必要がない。
「どういう根拠でそうなるの?」と思う場合は続きを読んでみる。


そもそも必要な単語というのはいくつか意味がある。日常生活に必要という意味であれば15000もいらない。
12000~15000というのは上限だ。下限は1000程度ではないかと思われる。
そのほかにもいくつか区切りが考えられる。以下にリスト化する。

1:1000レベル
2:2000レベル
3:3000レベル
4:5000レベル
5:8000レベル
6:10000レベル
7:12000レベル
8:15000レベル

このようにおおむね8段階の語彙レベルが考えられる。
5~6間と6~7間が狭いのは理由があって、この時点だと高校レベル以上の学問の用語を登録しているため、調査時間が増えて造語のペースが遅くなるからだ。この辺りの事情は後でまた説明する。
7~8間が広いのは単に8段階で15000語というのを上限としているからだ。

なお、このリストは半分客観的な理由で、半分経験的な理由で推測したものだ。
客観的というのは、この語彙レベルが英検やTOEICといった語学学習の語彙レベルに即している点。
例えば英検4級は1300語(調査時)で、おおむね上記最低水準1000語に当たる。
逆に1級は15000語(調査時)で、これは上記最高水準に一致する。

一般的には英検1級を取ると英語がペラペラというイメージがあるが、そうとは限らない。むしろそうでないことのほうが多いだろう。
とはいえ、ではそれは語彙数の問題かというと、やはりそうでもない。英検1級の単語帳をネイティブに見せると、ネイティブも知らないことがある。そのことからも明らかだ。
15000に達っしていれば、喋れない原因は語彙数ではなく、用例や成句の少なさなど、別にある。
そう考えれば人工言語でも15000あれば語彙的には十分ということになるだろう。


ところで、人間はふつう3000語くらいで日常生活を行っている。
日常生活に使う語彙の境界線を定義することができないため、言語学でもこの数値を特定することはできない。
学者個人の判断に委ねられるため、本によってこの数字が1000だったり5000だったりと幅があるが、おおむね3000程度とされることが多い。

では生きていく上で3000で十分かといえば、それは最低限の日常生活なので十分ではないといえよう。
学校生活、会社、買い物、旅行などを入れれば必要な語彙は大きくなる。
また、学校で習うような学問の用語を入れれば語彙はさらに大きくなる。

そしてその上限が12000~15000程度ではないかと考えている。
「半分客観」については上述のとおり。「半分主観」については下記。

----

さて、主観である経験について述べる。
人工言語を実際に作るときのワークフローについて考えてみよう。

まずは「私」「大きい」「歩く」などの基本的な単語が必要だと誰もが考える。
しかし自分の頭の中だけで必要な単語リストを作っていると漏れが出る。
そこで英語や日本語の教材を利用して、単語リストを持ってくる。そしてそのリストを見ながら造語していく。

その際、自分の言語には必要ない単語は排除していく。ホワイトハウスはアルカにないので必要ないといった具合に。
結構カットするところが多くて、言語作者は驚くのではないかと思う。

この作業を終えると5000前後の単語ができる。
ただしこの数値はリストのサイズとカット率によって変動が激しいことを付け加えておく。


次にこれを増やそうとすると、別のリストが必要になる。
ところがこの時点で、そもそも世の中にそういうリストがあまりないことに気付く。
英和辞典をリストとして使用するとそれこそ何万何十万のリストが得られるが、それを一人ないし少数の人間で点検しながら作るのは現実的でない。

というより、やってみれば無駄が多すぎることに気付く。例えばジーニアス英和第2版を使ってやってみる。
最初のに来るのはアルファベットのAと不定冠詞のa。これで1ページが終わる。
2ページ目に入るとAA, AAA, AAAL, AAAS, AAFなどなど、到底必要とは思えない頭字語ばかり目に付く。

この時点で人は気付くのだ。「カットする部分が多すぎる。そして造語したところで使う見込みのない単語が多すぎる」と。
さらにいえば、この時点ではまだ数千の日常語彙を造語したにすぎないので、少し専門的な単語が出てきたら対応できなくなってしまう。
たいてい専門用語は簡単な単語を組み合わせて造語するが、その材料がこの時点では足りないのだ。

そういうわけで、英和辞典はこの時点では少なくともリストとして使えない。
同様の理由で専門用語の辞典も使えない。例えば医学用語を数千数万も造語する必要性はないし、それより先にすべきことがある。
実際、どんなに駒を進めたところで、必要性に駆られないかぎり、専門用語を造語する必要はない。
なぜなら車ひとつとっても実は数万のパーツがあり、そのすべてに名前が付いているからだ。
付けようと思えばキリがないし、広辞苑や日本国語大辞典や大型の百科事典ですらそんなことをしようなどとは考えない。

結果、たいていの人が考えつくのは、「まずは学校で習う義務教育レベルの単語を作ろう」ということだ。
これなら科目ごとに容易にリストを得られるし、専門用語と違って多くの人の生活で使う可能性がある。
このように、日常語彙の次はたいてい義務教育の語彙になる。

それが終わると次のリストは高校レベルの学問の用語だ。
三角関数などという、社会人になればほとんど使わないような単語が入ってくる。
この時点で「本当にこの作業に意味があるのだろうか。使わない単語を作っても……」という気持ちが強くなってくる。

そしてこの作業を終えると、分析性の高い言語を除いてほぼ間違いなく語彙数は1万前後に達している。
分析性の高い言語の場合は、一部成句の数を語彙数に含めて算出する。


さて、ここからが頑張りどころだ。
もう残っているのは大学レベルの用語しかないが、大学は各分野ごとに専門性が高くなるため、上述の専門用語と大差ないのだ。
しかしよく考えれば大学レベルというのはしょせんそれぞれの学問の概説程度でしかない。
なので各分野の概説書を読み、必要な単語を作っていけばいい。

だが、ふつうはひとりの大学生がひとつの分野を勉強するのに、こちらはひとりで全分野をやらなければならないことになる。
理系も、文系も、芸術も。だからここが頑張りどころなわけだ。
そしてたいていそれは時間がかかりすぎるので、苦手な分野はほかの人にやってもらうというような分業をするのが現実的だ。実際アルカもそうしている。

この作業をしているとあることに気付く。
概説の専門用語には重要なものとそうでないものがあるということだ。
例えば言語学の場合、「有標」は重要だ。言語学がほかの学問に術語を輸出した数少ない例で、汎用性が高いことも理由のひとつだ。
しかし「ダウンステップ」はどうだろう。恐らく造語するまでもない。

重要なのはこの「さじ加減」や「感覚」だ。
これは要るとか、これは要らないとか、そういうのは人間にしかできない判断だ。
しかも勉強をきちんとして、その上経験もある人間にしかできないことだ。

その感覚があるから、概説書や専門書の中から必要な単語だけ造語することができる。
だがこの感覚を各分野で身につけるのは現実的だろうか?それで分業の必要性があるのだ。


ところでこの作業をやっていると、無駄無駄しいということに気付く。到底使いそうもない単語ばかりができていくからだ。
「アセチルサリチル酸」はまだいい。鎮痛剤で知っている人も多いだろうから。
しかし「イソニトリル」はどうか。恐らく使わないだろう。
かといって有機物の命名法を作る以上は、「イソニトリル」も「アシル基」も作る必要がある。

言語作成には必要であっても、実際の言語運用から見ると無駄無駄しい例が多い。
その上言語作成にすら必要ない単語を作るくらいなら、基本語の用例や語法や文化欄を拡充すべきだ。

それに、単語が増えるというのは作者にとってリスクがある。
増えれば増えるほど辞書の総ざらいに時間がかかる。
書き換え頻度の高い辞書は数年に一度は総ざらいする必要がある。
そのときどうせ使いもしない単語が無駄に多いと手間がかかってしかたない。

そこで言語作者は「では単語は今後必要に応じて作ろう」と考え、オンデマンド方式に変える。
それがこの時点で最も効率が良いことに気付くからだ。

オンデマンドに切り替えると、急激に単語の伸びは遅くなる。なぜなら必要な分しか作らないからだ。
しかもこの時点ですでに日常語もある程度の学術用語もできているので、なおさら必要性が出てこない。

さて、ここで最初の話と繋がる。人工言語の目標語彙、人工言語に必要な語彙だ。
ここまで作業すると語彙数は1万以上になっているはずだ。
ところが「必要に応じて」作っていると、なかなかここからが伸びない。
さて、これは何を意味するだろうか。
つまり「必要な単語がその程度」だということだ。

オンデマンドに切り替えると、たいてい語彙の拡大が停滞する。
そしてその幅がおおむね12000~15000程度だと考えている。考えているというよりも、実際の経験から算出している。
実はアルカというのは複数の言語のシリーズ名で、過去3回大型の人工言語を作っているが、3回ともこの12000~15000の範囲に収まっているのだ。

何十年もかけて複数の人間を巻き込んで人体実験ともいえる研究をした結果なので、この数字はいい加減なものではない。
人工言語は作者が作るものなので、「まぁこのくらいの学術用語は最低限いるだろう」とあらかじめ設定するものがある。
それは必要性によるものでなく、余剰ともいえる単語だ。それを加えても「人工言語に必要な語彙」は恐らくこの12000~15000の範囲に収まるだろう。

----

理解語彙というのがある。読んで意味の分かる単語の総体のことだ。
ところがこれも定義が曖昧で、英語でいうなら-er、日本語なら「~人」、アルカなら-anなどを付ければ理解語彙などいくらでも増やせる。
読んで意味が分かるというだけでは定義が不十分で、定義にパッチを当てることになる。ところがそのパッチも学者の主観にすぎない。

人工言語の場合、辞書の語彙数は理解語彙を目指す必要はない。
今も言ったように、-anなどといって造語していけばすぐに辞書は何万にもなるからだ。
しかし無造作に増やすと総ざらいのときに自分の首を締めるので、不必要な単語を増やして自分の言語にはこんなにたくさんの単語があると豪語するのは避けたほうがよい。
豪語できるとしたら、ひとつひとつ検討して手塩にかけて作った単語をきちんと取捨選択し、それでも大きな語彙を得た場合だ。機械的に作るのなら単語など数秒で数万作れる。

----

ところで、語彙が12000~15000の範囲に到達したらどうするか。
次は用例、語法、文化の拡充をすべきだ。
人工言語に一段落はあっても終わりはない。

Tweet