第 201 回 PTT のお知らせ


日時: 1994年 10月20日 (木) 18:30 から
場所: 早稲田大学 理工学部 59号館 4F 「情報学科会議室」 (新宿区大久保 3 丁目、早稲田大学 理工学部 キャンパス) 山手線新大久保駅下車(高田馬場寄り出口)。改札口前の大久保通 りを横断し、右方向(東)に大久保通り歩道を進行。左側に「百十 四銀行」があり、過ぎたら次の細い道を左折。直進すると道は、 右にほぼ直角に曲がるので、道なり右折。直進すると「理工社」 という文房具屋があり、次の左への道を左折。前方右方向にテニ スコートがあり、テニスコートに沿って右折。テニスコート右側 の出入口が理工学部への入口。その出入口を入り、守衛所の右奥 手建物が59号館。59号館の入口は、大変分かりにくいので、お尋 ね下さい。 山手線高田馬場下車(地下鉄東西線側出口)。改札を出て、右手バ ス・ターミナル側に進行。駅舎を出たら左に進行。正面に「ビッ グ・ボックス」というビルディングがあり、その左側の坂道を登 る。直進すると、T字路なっており、信号を渡り左折。次の信号 を右折し、道の左側を進行すると戸山公園の入口がある。戸山公 園に入り、「新宿区スポーツセンター」のビルへの道を進行。そ のビルを過ぎるとすぐに出口があり、そのまま直進すると、左側 にテニスコートがある。テニスコートに沿って左折し、理工学部 の出入口から入る。守衛所の右奥の手建物が59号館。59号館の入 口は、大変分かりにくいので、お尋ね下さい。
話者: 片岡 裕
題目: 世界の文字
概要:
  情報交換用文字コード、Internationalization 及び世界の文
字の混在処理に関し、曖昧な推測に基づく論議を排除するため、
正確に世界の文字とその Writing Convention を知る必要がある。
早稲田大学では、それらを研究・分析し、正しい図形集合拡張を
行なう完全な Multilingual X Window System を作成した。本シ
ステムは、R5 以上の実行速度を持ち、ISO 2022/6429 を満足す
るのみでなく、正しい変形図形を表示し処理する。
  しかし、上記の文字に関する知識なしでは、
Internationalization に関し、何が必須で何が論議されるべき
か、極めて曖昧な推測と仮定のみによって行なわれることになる。
本システムの設計・製作以前に行なわれた、全世界の文字とその
Writing Convention の調査に基づいて、文字に関する解説を行な
う。扱われる文字の範囲は、現在使用されている文字以外に、歴
史的文字も含む。解説は、できる限り、歴史的に行なう予定であ
る。現代の文字に関しては、特に曖昧な推測がなされている、
Perso-Arabic、Devanagari、Thai 等の文字群に関し、知るべき
特徴について解説する。

食事:


第 201 回 PTTメモ


日時: 1994年10月20日(木) 18:35〜21:05
場所: 早稲田大学 理工学部 59号館4F 情報学科会議室
題目: 世界の文字
話者: 片岡 裕
出席者: 小西聡(NECオフィスシステム), 清水和久(NECソフトウェア), 佐々木崇郎, 馬上博樹(慶應大), 多田好克, 中村嘉志(電通大), 鵜坂智則, 小川宏高, 川幡太一, 下國治, 立山義祐, 田辺浩靖, 田中哲朗, 寺田実, 永松礼夫(東大), 並木美太郎, 天野純一(農工大), 和田英一(富士通研), 伊知地宏, 倉部淳, 佐口(富士ゼロックス), 石畑清(明大), 西田明宏(リコー), 上園一知, 片岡朋子, 沢田大輔, 鈴木哲也, 谷口清継, 辻可織, 朴哲済, 中山泰徳(早稲田大) 31人
質疑応答:
  早稲田大学では、完全な Multilingual I/O & Text
Manipulation/Communication System を完成し、X Window System に組み込ん
だ。本システムは、ISO 2022/6429 をサポートし、縦書きを含めてText
manipulation/communication を行なうシステムである。本システムの研究に
あたり、全世界と文字コードを調査して必須情報を求め、最適なアルゴリズム
と最速の実装を行なった。本システムの理解には、世界の文字の正しい理解が
必須であるため、特徴的な文字群と文字の持つ情報に関し、解説を行なった。

文字の現状の解説書は、ある特定の言語を記述する必須文字群について解説さ
れているわけでない。特に、文字が部品から構成され、部品自体も文字である
文字群では非常に誤解されている。さらに、文字とは別に言語再現情報をが必
要となる。この1文字の確定と言語再現情報の正しい認識について Egyptian
Hieroglyph を例にあげて解説した。

また、文字コードが、対象とする言語の必須文字群を含んでいないことがあり
得ることを Arabic script を用いて解説し、特に Hebrew では、aspiration 
を示す文字がコード上示されないこと等から「正書法」の理解なくして文字の
正しい理解はあり得ないことを解説した。即ち、正書法の定める正しい図形を
表示しなければ、読みにくいのではなく、読めなくなる文字群が大量に生じる。

Thai script と Devanagari script を例にあげ、文字が接続して元の文字図
形と異なる図形となり、それが正しく表示されないと読めなくなる例を示し、
且つ、これら音節文字では、音節の組合せが有限個であり、Thailand や 
India の国家規格と各々の言語による正書法で、明確に BNF で表記し得るこ
とをしめした。これらの文字と言語を理解すれば、一意に定まらなければ可読
の文字とはならないことがわかる。さらに Devanagari script と IS 13194 
を用いて、Sanskrit と Hindi では異なる図形を要求することを示した。

Arabic script を例にして、書体によって、文字の連結規約が変更され、さら
に、Fasi では、名詞連結では語末文字と語頭文字が非連結であり、現在の著
名な文字コードと 6429 では、これを表現し得ないことを示した。

Mongolian script を例にあげ、文字は、固有の表記方向を持つものとそうで
ないものに分類でき、且つ、最終表示図形が表記方向によって変化する文字と
しない文字に分類可能であることを示した。これらの分類は、既に49回情報処
理学会で発表済みである。これらの分類を基に、文字の正しい表示に必須な情
報を示した。

文字に関する知識の欠如によって ISO 10646 の不適性を具体的に示し得ない
ことから、Sanskrit in Devanagari と Hindi in Denavagari 等の実例をあげ
て、ISO 10646 の不適性を示した。同時に、Text Manupulation には目的に応
じて複数の Text Manupulation Code が必要であり、且つ Text Manupulation
unit が存在し、それを定義し文字コードから変換可能であることを示した(49
回情報処理学会で既発表)。

各位
農工大の並木です。202回PTT開催のお知らせです。なお、12月のPTTは 終了後、忘年会を行います。よろしくご参加下さい。