次々回: 1992年 4月 16日 (木) 東大 (予定) 差出人(幹事): 113 文京区本郷 7-3-1 東京大学工学部計数工学科 岩崎英哉 03-3812-2111 ext. 7411 iwasaki@wadalab.t.u-tokyo.ac.jp
日本語ソフトウェア開発環境を構築するにあたり,日本語コンパイラの開 発を今回の研究目標とした.そのためには,「文節の区切り」や「品詞」といっ た情報が必要であると思われる.その情報を得るため Wnn4.1 のライブラリを 利用して「仮名漢字逆変換システム」を作成した.今回はその概要と実現方法 それに逆変換システムの応用について報告した.
逆変換システムとは,既存のツールで作成された日本語文書(漢字仮名混在) を入力し漢字から仮名に変換する際,文節の区切りや品詞といった情報を取得 し S式の形式でファイルに出力するシステムである.
実際の変換は,Wnn の関数を使用し行なっており,それにより各種の情報 が構造体という形で渡される.その構造体を組替えて利用しユーザが意図した 変換結果を得れる様な仕様になっている.さらに,変換パラメータを設定する 機能を追加することによりほぼ正確な変換結果を出力できるようになった.余 談ではあるが,keyバインドは ATOKライクにしてある.
以上のような逆変換システムの概要とその実現方法を述べた後,このシス テムが出力する S式ファイルに含まれる「読み」「品詞」を利用した jLaTeX 索引生成システムの概要と,古文の解析作業にどうやってこのシステムを利用 するのか,古文を解析する上での問題点などについても報告した.
このシステムは,文節の区切りや品詞といった情報を取得するためには有 効な手段であること,さらに今後の課題として,ユーザインターフェースを充 実させていきたいと考えている.
参加者の皆様からは,以後の研究を進める上で貴重な意見を多くいただき, 大変参考になりました.
- -- ┏━┓ ┃■╂┐【早稲田大学 理工学部 情報学科 筧研究室】 ┗┿□│【日立情報システムズ】 └─┘山下 雅史《wnn@kakehi.info.waseda.ac.jp》