第 173 回 PTT のお知らせ


日時: 1992年 3月 9日 (月) 18:30 から
場所: 早稲田大学理工学部 59号館 4階 402号室 情報学科会議室 (山手線新大久保駅下車.改札を出て右にしばらく歩いていくと,右側にダン キンドーナツがあるので,その向かい側の道に(左折して)入る.しばらく行く とつき当たるので,右に曲がりすぐまた左に曲がって進む.すると,早大のテ ニスコートがあるので,右手にコートを見ながら行き,塀の切れ目を入る.10 分程度です.)
話者: 山下 雅史 (日立京浜工業専門学院,早稲田大学大学院理工学研究科)
題目:日本語ソフトウェア開発環境の一研究
--- 仮名漢字逆変換システムの構築とその応用 ---
概要:
日本語によるソフトウェア開発環境を構築するにあたり,日本語プログラミン グ言語の開発を今回の研究目標とした.しかし,日本語は英語などの言語と違 いわかち書きがされていないので日本語を文節に分解し,品詞情報を付加する 必要がある.そこで今回は,仮名漢字フロントエンドプロセッサである Wnn のライブラリを用いて仮名漢字混じり文章を文節に分け品詞情報を付加しなが ら読みに直す『逆変換システム』を提案し,更にその応用についても述べる.
食事: 今回はありません.
次々回: 1992年 4月 16日 (木) 東大 (予定)

差出人(幹事):
113  文京区本郷 7-3-1
     東京大学工学部計数工学科  岩崎英哉
     03-3812-2111  ext. 7411
     iwasaki@wadalab.t.u-tokyo.ac.jp

第 173 回 PTTメモ


日時: 1992年 3月 9日 (火)
場所: 早稲田大学 理工学部 59号館 4階 情報学科会議室
題目: 日本語ソフトウェア開発環境の一研究
--- 仮名漢字逆変換システムの構築とその応用 ---
話者: 山下 雅史 (日立京浜工業専門学院,早稲田大学 大学院 理工学研究科)
出席者: 岩崎 英哉, 寺田 実, 石井 裕一郎, 田中 哲朗 (東大), 川平 吉樹, 森山 茂男, 多田 好克 (電通大), 伊地知 宏, 倉部 淳 (富士ゼロックス) , 西村 和夫 (駒澤大), 久保田 光一 (慶大), 筧 捷彦, 落合 大, 李 昌煕, 大井川 隆夫, 永塚 弘毅 (早大) (順不同)
質疑応答:

日本語ソフトウェア開発環境を構築するにあたり,日本語コンパイラの開 発を今回の研究目標とした.そのためには,「文節の区切り」や「品詞」といっ た情報が必要であると思われる.その情報を得るため Wnn4.1 のライブラリを 利用して「仮名漢字逆変換システム」を作成した.今回はその概要と実現方法 それに逆変換システムの応用について報告した.

逆変換システムとは,既存のツールで作成された日本語文書(漢字仮名混在) を入力し漢字から仮名に変換する際,文節の区切りや品詞といった情報を取得 し S式の形式でファイルに出力するシステムである.

実際の変換は,Wnn の関数を使用し行なっており,それにより各種の情報 が構造体という形で渡される.その構造体を組替えて利用しユーザが意図した 変換結果を得れる様な仕様になっている.さらに,変換パラメータを設定する 機能を追加することによりほぼ正確な変換結果を出力できるようになった.余 談ではあるが,keyバインドは ATOKライクにしてある.

以上のような逆変換システムの概要とその実現方法を述べた後,このシス テムが出力する S式ファイルに含まれる「読み」「品詞」を利用した jLaTeX 索引生成システムの概要と,古文の解析作業にどうやってこのシステムを利用 するのか,古文を解析する上での問題点などについても報告した.

このシステムは,文節の区切りや品詞といった情報を取得するためには有 効な手段であること,さらに今後の課題として,ユーザインターフェースを充 実させていきたいと考えている.

参加者の皆様からは,以後の研究を進める上で貴重な意見を多くいただき, 大変参考になりました.

- -- 
┏━┓
┃■╂┐【早稲田大学 理工学部 情報学科 筧研究室】
┗┿□│【日立情報システムズ】
 └─┘山下 雅史《wnn@kakehi.info.waseda.ac.jp》