2015/4/19 seren arbazard
人工言語を作るとき、2種類の作り方がある。1つは――というかこれまで人類はこのタイプの人工言語しか作ったことがないが――ボトムアップ式に、音、文法、語彙、文化、風土、語法、認知法、表現法をこの順で作り上げていく方法である。語法などはすべて辞書に記載され、読まれて理解される。このタイプの作り方ではたとえばアルカのhan(広い)のように「面積が甚大であることを示す」といった語法の定義となる。言葉で語法を定義していくと世界の切り分け方が直線的で四角四面になる。イメージ的にはアフリカの国々の国境みたいな感じである。
一方、自然言語の持つ概念はすべて曲線的であり、ヨーロッパの国々の国境のようである。ボトムアップな作り方では直線的な概念(世界)の切り分け方しかできない。別に人間という生物は四角四面な切り分け方の人工言語でもネイティブになれるし、そのことはアルカのネイティブを制作したことからも実証されている。
ただ「あたかも自然言語のような言語を作る」という点において、このボトムアップ式の直線的なやり方では満たせない。
自然言語にしても人工言語にしても辞書というのはすべてボトムアップ式な説明で四角四面な定義である。たとえば明鏡第二版では「夢」は「睡眠中に様々な物事をあたかも現実の経験であるかのように感じる心的現象。多くは視覚像として現れる」とされている。日本語ネイティブがこれを読んだら「まぁそうだな」とは思うだろうが、誰一人としてこの定義を法律の条文のように覚えてはいない。人間は辞書の定義のように概念を理解しない。
なのでたとえば英英辞典を読んで完璧に暗記したとしても、辞書的な言葉による四角四面な定義でしかないので、英語のネイティブにはなれない。
もちろん明鏡を全文暗記しても日本語のネイティブにはなれない。日本語は自然言語であり、その概念の切り分け方は曲線的だからだ。
たとえば夢の定義を覚えても「彼が今朝夢に出てきた」のような言い方はできない。何が曲線的って、明鏡で「出現」を調べると「現れ出ること」とあるが、じゃあこの定義と夢の定義をかけ合わせると「彼が今朝夢に出現した」と言えることになる。これこそ直線的なボトムアップ式の表現だ。しかしこの文が非文でないが100%不自然なのはすべてのネイティブに共有されるはずである。日本語ネイティブはみな「夢のときは出現より出てくるのほうが自然だ」と分かっている。
自然言語にせよ人工言語にせよ、音~表現法までのボトムアップ式のやり方だと、ロジカルな説明でしかなく、直線的でしかいられない。自然言語に極限まで近づけた、というか自然言語と見紛うような人工言語を作る場合、音~表現法まで作りこんでも直線的でしかなく、現実の自然言語のような曲線性は持てない。
で、もう一方の作り方である。今までこの手法で人工言語が作られたことはない。
それはトップダウン式の曲線的な作り方である。
そのやり方とは「メンタルコーパスを構築する」ことである。
たとえば日本人が「彼が今朝夢に出てきた」という表現をできるのは、辞書を読んだからでなく、メンタルコーパスを構築してあるからである。まず赤ん坊の頃夢を見てそのことを親に話したり、悪夢を見て泣いたときなど、母親から「怖い夢を見たのね」などと言われる。この繰り返しでやがて子供は「どうも寝てるときに見たあれは『ユメ』というらしいぞ」と理解したり、「ユメを見る」というコロケーションを獲得したりする。
次に夢に父がでてきたりして、そのことを親に話すなどして、「ボク、パパを夢で見たよ」などと説明すると、母親は「パパが夢に出てきたのね」などと説明する。
こうして夢に人が現れる場合は「Nが夢に出てくる」というふうに表現するのだなと理解し、「Nが夢に出てくる」という文子1言子・文子の概念についてはArbazard(2004)(貞苅詩門の学習院大学における学士論文を参照のこと。同大学文学部棟8階の書架にて閲読可。副手に声をかけて読むことができる)。言子とは他の類似概念で言えばチャンクに近い。文子は成句に近い。(言子でなく)を獲得する。
人はこうして子供のうちは口語で、大きくなるにつれて文語も合わせてかなり多くの言子と文子を獲得する。そしてメンタルコーパスとはこの言子と文子の集合のことである。
ネイティブは辞書を読んでその四角四面な定義を見て概念を覚えない。日本人の場合、ほとんどの人間は辞書は漢字を確認するために使うものだ。
間違えても日本人の子供は明鏡の定義を暗記して言葉を覚えない。
そしてこのことはあらゆる言語のネイティブに言える。
さて、もし人工言語を自然言語レベルにまで作りこむとしたら、旧来のボトムアップ式のやり方ではいけない。実際自然言語というものは「出現するってのは現れるってことだろ。たとえばライバルが出現した、とかさ。じゃあ夢に人が現れた場合、○○が出現したって言うか?言わないよな。ふつう夢に出てきたっていうよな」というように、四角四面な直線的な定義では例外が多すぎて定義しきれず、結局言子と文子の集積というメンタルコーパスの構築を通した曲線的な定義を通して作られるものだからである。
アルカも1991から2015までボトムアップ式であった。というか語法、認知、表現法まで言及した人工言語はアルカが初めてである。しかしボトムアップを究極まで突き詰めても直線的な定義しかできず、まあそのおかげでロジカルに齟齬なく外国人間でも意思疎通できたわけだが、ゼロから自然言語レベルの言語が作れるかという点においては、ボトムアップを究めても不可能だった。
研究の結果、人工言語を自然言語レベルで精巧に作るなら、曲線的な、トップダウン式の、メンタルコーパスを構築するやり方が必要であることがわかった。
ようはメンタルコーパスさえ構築できれば日本語だろうと英語だろうとネイティブレベルになれる(ただし発音は幼いころでないとネイティブ化は難しい。東大のロバート・キャンベルあたりは大人になってから日本語をやりメンタルコーパスを獲得したが、発音はやはり外国人である)。
ではそもそもメンタルコーパスとは何かというと、文字通り頭の中でにある個々人のコーパスで、言子と文子の集まりである。たとえば「夢を見る」というのは文子であり、文法処理を行って「夢を見た」などを導出する。「Nが夢に出てくる」も文子であり、Nに任意の名詞が入る。
言子や文子は記憶に定着しやすいものとしにくいものがある。一番定着しやすいのは対人コミュニケーションでかつ強い感情を伴ったものである。たとえば父親がキレて「この野郎!」といって殴られたとする。このように強い感情を伴った対人コミュニケーションでかつ出来事であると、人は言子や文子を獲得しやすい。「この野郎」と言われて殴られた子供は決して「この野郎ってどういう意味だろう」と考えて辞書を引かない。
単に「あぁ、こういう場面ではこう言うんだな」というようにスキーマと関係付けて覚える。だから自分が父になって息子を殴るときも容易に「この野郎!」と言うことができる。「こういうシーンではこういう風に言うものだ」というスキーマを獲得しているからである。
一番記憶に残りにくいのは上の逆で、要するにほとんどの日本人が英語を学習するときにやっている、「単語帳を読んで訳を覚える」というものだ。
出来事でもないし、場所やイベントと関連付けることもないし、コミュニケーションでもないし、感情も伴わない。恐らく日本人が英語を勉強しても使えないのは単語の訳を覚えるというボトムアップ式のやり方をしているからではないか。
2015にnias avelantisが私に出した手紙の中で、”I can make an advice”2nias補足、私が書いたのはmake an adviceでなくgive an adviceだが、確信がなかったのでgoogleでこの表現があることを確認して書いた。しかし誤用が引っかかるので意味がなかったらしい(知性に欠ける)。という文があって、初見でかなり違和感があったのだが、まず私はこれを見たとき「ふつうIf you want my adviceだろう」と思った。私には多少英語のメンタルコーパスがあるからだ。彼にはwant one’s adviceという文子がなかったので、日本語の「私はアドバイスできる」という文を頭のなかで作り、私はできるの部分をI canにした。で、アドバイスするという言い方を英語でどう言うか知らなかったので、日本語の「私はアドバイスできる」という文を頭の中で作り、私はできるの部分をI canにした。で、アドバイスするという言い方を英語でどう言うか知らなかったのでdo an adviceと考えたのだろう。しかし英語はdoをあまり使わないという受験知識があったので、「強いて言えばmakeかな?」と思ってmake an adviceとしたのだと思われる。
ちなみにadviceは不可算名詞なのでan adviceという言い方はおかしいし、このことは受験で習うのだが、これについては覚えていなかったようで、英文法の原則に基づいてanを付けたというところだろう。
彼はボトムアップ式の学習法しかしてこなかったので訳も日本語を基底としたやり方になったのだろう。
誤解のないように言っておくが、avelantis卿は日本の中で最も知的なクラスタに属するし、私も敬意を持っている。ただ言語というのはアメリカなら中卒底辺だってメンタルコーパスを持っているので自然な言い方ができるし、なんというか知性より習慣的知識に依存するものでしかなく、彼ほどの知能があってもメンタルコーパスなしには自然な言い方はできないということである。
さて話を戻して、ようは自然言語ライクを目指す人工言語はメンタルコーパスを作るべきなのである。子供の頃のあなたが日本語や英語を覚えたとき辞書を使わなかったように。
ただ人工言語の場合メンタルコーパスを作るのはかなり難しい。なぜって、テレビもラジオも本も人工言語を使わないし、あなたの家族や学校の友達も人工言語を使わないからである。人間は出来事記憶は忘れにくい。人間が記憶しやすい条件は上で述べたとおりだが、人工言語にはメンタルコーパスを構築するだけの社会的環境が整っていない。なのでせいぜいできることといえば人工言語で書かれた本を読んでメンタルコーパスを構築することだが、そんなたくさんの本というかコーパス自体が人工言語にはないし、本で見ただけの記憶は比較的薄れやすいし、臨界期を過ぎた大人には更に難しい。
ただ、幸いなことにメンタルコーパスはOEDやCOBUILDのような何億ものコーパスを集めなくても作れる。実は音~表現法までの全段階において、満足に表現できるためのメンタルコーパスを、3~4歳の子供でもおおむねは、6歳にもなればだいぶ、10歳になればほぼ完璧に、14歳ともなれば完全に獲得している。
生活をして生きていくというだけのレベルであれば、6~10歳程度の子供でも立派にメンタルコーパスを持っていてネイティブである。
彼らが脳内に蓄えている言子などたかが知れていて、その程度のメンタルコーパスなら明文化して辞書に登録することができる。
つまり人工言語でも自然言語ライクになれるということである。――メンタルコーパスを獲得するのに十分なコーパス集を作っておけば。それは小説でもいいし辞書の用例でもいいし、どのような形であれ良い。
このメンタルコーパス構築用のコーパスを用いるときのコツとしては、訳を読まず、個々の例文をできるだけ文だけでなく音声で、かつPCを使ってさも人とコミュニケーションをしているかのようにインタラクティブに、行うことである。できればその人工言語を使える人かアンドロイドとコミュニケーションするのが良いのだが。
母語に訳すのはいけない。訳の大意だけ他言語で覚えてしまい、人工言語のメンタルコーパス構築に役立たない。
なのでこれからの人工言語の辞書は、まぁ自然言語にもOEDや明鏡があるように、そういうボトムアップ式のものも作りつつ、かつトップダウン式のやり方で行くべきである。
それをやるにあたって、紙に書かれた文字だけで覚えようとは無理である。
我々人類が今まで外国語を勉強してきたようなやり方は実は一番効率が悪い。PCを使えば辞書は画像や動画も使えるし、音声も使えるし、プログラムを組んでAIを使ってインタラクティブにもなれる。
つまりメンタルコーパスを構築する際記憶に残りやすくなる。
なので人工言語というか自然言語もだが、辞書がやるべきことはこれからは紙の脱却なのである。無論「不可逆的」のような普通口語で使いそうにない言葉は本で読んで覚え、メンタルコーパスを構築するのが普通だろう。
しかし口語のほとんどはインタラクティブな方が効率が良い。
ちなみにこの論文はAIを作るときにも役立つと思う。
注
1. | ↑ | 言子・文子の概念についてはArbazard(2004)(貞苅詩門の学習院大学における学士論文を参照のこと。同大学文学部棟8階の書架にて閲読可。副手に声をかけて読むことができる)。言子とは他の類似概念で言えばチャンクに近い。文子は成句に近い。 |
2. | ↑ | nias補足、私が書いたのはmake an adviceでなくgive an adviceだが、確信がなかったのでgoogleでこの表現があることを確認して書いた。しかし誤用が引っかかるので意味がなかったらしい(知性に欠ける)。 |
へー
すっごく面白かった。