人工言語の作りこみと辞書の発展
人工言語がどれだけよくできているとか作りこまれているといったことは、qualityとquantityの積算で表すことができる。
これは簡単にいえば、質の高いものをたくさん作るということであり、直感的に理解しやすい。
アセスメントの対象となるソースは辞書や文学資料などのテキストコンテンツが主体であるが、絵画などの芸術資料も含めるべきであろう。
その中でも主役となるのは辞書である。
同じクオリティなら5000語より10000語あるほうが評価は勝る。
しかし単なる単語帳を辞書と呼んで一万語集めても、市販の小さなサイズの英和辞典に勝ることはない。
この点は特に重要で、一般に人は辞書の作りこみを収録語数で計ることがある。
しかし単語帳のような形式で一万語作ったところで、作りこみはOED形式の数百語にも満たない。
つまりクオリティはしばしば量を凌駕するということである。
クオリティを数値化することは難しいため、段階ごとに分類するのが妥当である。
なお、筆者はserixというアポステリオリの言語からアルカのような有文化アプリオリ言語まで経験がある。
また、辞書に関しても単語帳のようなものから[[ディアクレール>../klel/diaklel]](dk)のような総合辞典まで経験がある。
これを踏まえた上で、以下を述べる。
1:単語帳
man 男 名詞
――というような、いわゆる単語リスト。最も手軽に作れ、クオリティは低い。
さらに、その言語がアポステリオリの場合、クオリティは最も低くなる。筆者も最初はここから始めた。
「無文化*アポステリオリ*単語帳」と「有文化*アプリオリ*総合辞典」を比べると、かなりの労力差がある。
筆者はどちらのタイプも作ったことがあるので、語数だけで作りこみを判断しないよう特に注意している。
2:語義とミニ語法の追加
play 他動詞 ~(競技名)で遊ぶ、戯れる、そよぐ
名詞 劇、遊び、娯楽
少し進んだ段階になると、語義が増え、複数の品詞に対応するようになる。
「~(競技名)で遊ぶ」というようなミニ語法も付与されるようになる。
3:用例の追加
用例が追加される。
ここまで来ると辞書としての体裁が整う。
4:語法の追加
rip(唇)という単語はどこまでの範囲を含むのか。
play soccerがいえるなら、play chessはいえるのか。
こういった語法情報が追加されると、アポステリオリ・アプリオリにかかわらず、その言語自体のオリジナリティが得られるようになる。
5:文化の追加
文化を持たない言語はない。
言語というのは柔軟で、風土の異なるアメリカでイギリス語を喋ることができる。つまりイギリスの文化をアメリカが継承することはできる。
だからといってアメリカ語が文化を持たないわけではない。自国の風土と異なるイギリスの風土に影響を受けた文化を持つ。
他所で言語が使えるからといって、言語と文化が分離可能であることにはならない。
アポステオリオリの場合、参照言語の文化か作者の文化を継承することになる。
人工言語には文化設定を行わないものがあるが、いずれにせよ文化注記は必要である。
「あなた」という概念でさえ、その概念をどう見るかは民族によって異なる。
その見方が辞書を編集するのに使う言語から見て一般的でない場合は、文化注記をせねばならない。
ということはこの5の段階で文化を作る必要がある。あるいは参照言語の文化を調べる必要がある。
アプリオリの場合、文化があるということは風土がなければならない。歴史もである。
それらを作ることになるので、作業量は膨大になる。
6:一言語辞典
人工言語を日本語で説明する段階を終え、人工言語で人工言語を説明する段階。
言語の基盤がしっかりできていないと、とてもではないが人工言語で人工言語を説明することはできない。
従って5までをよく作っておく必要がある。
7:総合辞典
データの散逸と引きなおしの面倒を防ぐため、総合辞典として辞書を作る。
市販の辞書は語源辞典や百科事典など、用途ごとに分かれる。
だが人工言語、特に有文化アプリオリの場合は辞書作成そのものが言語と文化と風土の作成に繋がる。
そこで、歴史的観点から語源辞典、文化や風土を示すために百科事典や語法辞典というように、数種類の辞書を同時に作る必要があり、かつそれが合理的な手順でもある。
結果的に、さまざまな辞典を組み合わせた総合辞典ができあがることになる。
dkはこの段階にある。dkの場合、実に14種類もの辞書を、ひとつの辞典としての統一性を持たせつつ取り入れている。
***dkの収録内容
<辞書の種類>
1:国語辞典(いわゆる英英辞典などのコトバ典)
2:百科事典(エンサイクロペディアとしてのコト典)
3:語源辞典(言葉の歴史が分かる)
4:対訳辞典(ある概念をほかの言語で何というかという情報。ルティア語や古アルバザード語などが同時に分かる)
5:シソーラス(類義語辞典、反義語辞典)
6:文化辞典(国際的に見たアルバザードの文化的記述が見られる)
7:語法辞典(国語辞典的な語法が見られる)
8:字典(漢和辞典のようなもの。表意幻字での表記法を記載)
9:古語辞典(語源欄や対訳欄が古語辞典の機能を果たす)
10:ことわざ成句熟語イディオム辞典(用例欄に実装)
11:文法辞典(語法に実装)
12:専門用語辞典(アルカの語彙を総なめにするので、同時にこれも実装)
13:アクセント辞典
14:コロケーション辞典
<書式と辞書番号>
この形式の場合、例えばアクセントの欄が13番の辞書(アクセント辞典)として機能している。
見出し語 4 9 10 12
----
単語レベル
アクセント 13
字解 8
[タグ]語義 1
語源 3
用例
[タグ]語義2
----
類義語 5
反意語
----
コロケーション 7 14
----
補足
語法 7 11
----
百科事典 2 6
***「無文化*アポステリオリ*単語帳」と「有文化*アプリオリ*総合辞典」の労力比較
「man 男性 名詞」という「無文化*アポステリオリ*単語帳」を最低クオリティとし、「有文化*アプリオリ*総合辞典」を最大クオリティとした場合の労力比について考察する。
1:テキスト量
まず最初に、同じ「男性」についてテキスト量を比較する。
http://www8.atwiki.jp/arbazard/pages/1006.html
2:一言語辞典
テキスト量のほかに、一言語辞典であることを考慮する。
全文母語と全文人工言語では、後者のほうが労力がかかる。
3:アプリオリ
次に、アプリオリであることを考慮する。
appleという語は英和辞典や英単語リストを活用できるが、アプリオリの場合、参考にできるものがない。
妥当な語形を一から自分で作る労力がある。
4:文化・語法・歴史
さらに、有文化であることを考慮する。その文化から見てその語形が妥当であるか考える必要がある。
また、男性がその文化においてどのような存在であるかを考慮する。
上掲の例には「大きい」という形容詞の例も出ているが、「大きな問題」とアルカで言えるのかという語法問題にも触れねばならない。
その上語源欄を設置するにはその文化の歴史や言語史にまで踏み込む必要がある。
5:国語辞典と百科事典の読み込み
語義欄と百科欄を書くのに際し、辞書を読み込む必要がある。
筆者の場合、一語執筆するのに「国語辞典、ラーナーズ英英辞典2冊、ネイティブ用英英辞典、ネイティブ用仏仏辞典」を読んで参考にしている。
百科欄の場合、ウィキペディアは信憑性に乏しいのでブリタニカで裏を取り、合っていればウィキペディアを参考にするという確認作業を取っている。また、和書の百科辞典も用いている。
一語執筆するのにたくさんの資料を読む必要があり、これが最も時間を食う。
執筆より調査と検討のほうが時間がかかる。だからけっこう見えないところで苦労することになる。
調査を雑にして時間を削減すればかかるのは執筆時間だけだから、見かけ上はたくさん語数を稼げる。
しかしそれではクオリティが下がってしまい、作りこみにならない。
----
以上5点を踏まえると、テキスト量以外にもさまざまな評価点があることが分かる。
vikやlaxといった特に記述の長い語については、一語書くだけで2,3時間かかることもザラである。
もしこれが「man 男性 名詞」というリストなら、一語書くのに数秒で事足りる。
実際はアポステオリオリでもいくつかの言語と比較してどの語根がいいか調べたりするので数秒というわけにはいかないが、それでも労力は比較にならない。
もちろん、dkもvikのように長い単語ばかりがあるわけではない。
とはいえ、難しい単語になるほど5の作業量が増えるので、記述が短くなっても総作業量は減らない場合もある。
そういう実作業の経験から言うと、恐らく「無文化*アポステリオリ*単語帳」と「有文化*アプリオリ*総合辞典」の労力比は数十倍から百倍程度はあると思われる。
同じ編集力の人間が2人同時に辞書作りを始めた場合、前者が一万語に到達した時点で、恐らく後者はまだ数百語であろう。
機械的に単語リストを作るだけなら、もっと差が広がるかもしれない。
だからこそ最初の議論に戻るのだが、人工言語の作りこみというのは量ではなく、辞書の見かけ語数でもなく、あくまでqualityとquantityの積算なのである。
|