4月のPTTは,早稲田です.今回は,PTT始まって以来(?), 初の 2本立て興行です.演者は,ふたりとも,早稲田大学 理工学部電子通信学科村岡研究室所属の人です.
(山手線新大久保駅下車.改札を出て右にしばらく歩いていくと,右側に ダンキンドーナツがあるので,その向かい側の道に(左折して)入る.しばらく 行くとつき当たるので,右に曲がりすぐまた左に曲がって進む.すると,早大 のテニスコートがあるので,右手にコートを見ながら行き,塀の切れ目を入る. 10分程度です.)
本報告では,並列処理システム−晴−におけるデータフロープログラム開 発環境とその視覚的インターフェースについて述べる.本環境は,コンパイラ 生成コードに対するデバッグを目的としており,ユーザのコード把握が重要な 鍵となる.そこで,単なる配置の工夫だけでなく,プログラムの制御構造を考 慮した表示方法を提案している.
印刷漢字を対象とした文字認識システムとそのヒューマンインターフェー スのXウィンドウシステム上での構築について述べる.本研究では,とくに文 字対象として「大正大蔵経」(仏典)の中の漢字を用いる.
食事:今回はありません.
113 文京区本郷 7-3-1 東京大学工学部計数工学科 岩崎英哉 03-812-2111 ext. 7411 iwasaki@wadalab.t.u-tokyo.ac.jp
本発表では、データフロープログラムの表現手段としてのデータフローグ ラフに対する表現手段について述べた。データフロープログラムは、演算と演 算間の依存関係により記述されるプログラムで、データ駆動アーキテクチャを 持つプロセッサ上で実行される。データフロープログラムでは、演算間の直接 の依存関係のみしか記述されないため、プログラムの全体構成をつかむことが 困難である。このため、一般にデータフローグラフと呼ばれる有向グラフを用 いて表されるのが普通である。
本発表では、まずデータフローグラフをディスプレイ上で扱う上での問題 点を述べ、その問題を対処する機能を持つデータフローグラフエディタGRAPE について述べた。GRAPEはXを用いて記述されており、画面上で複数のウィンド ウを用いてデータフローグラフを表示、編集することが出来るエディタである。 さらに、データフロープログラムに対するグラフを生成する方法について述べ た。
ディスプレイは表示情報量が限られており、細かすぎる表現や複雑な表現 の多用はユーザインターフェースとしての機能を低下させる恐れがある。単純 な表現を用いながら、より多くの情報を分かりやすく提示するための1手法を 示した。
(2)Xウィンドウ上の漢字認識システム
内容としては、
(a)認識アルゴリズム
(b)X上のGUI(グラフィカル・ユーザー・インタフェース)
(c)現在までの認識実験結果(デモを含む)
の3つでした。ただし、対象とする漢字を大正大蔵経(お経の全集のような もの)の中に出てくる漢字とすることで、問題が複雑になってしまいました。 なにしろ、この活字については、標準パターンというものがないのです。
私はまだ文字認識に関する研究を始めたばかりですので、どの程度、既存 の技術をつかったらよいのかわかりません。そこで、とりあえず辞書化のこと はほっといて、特徴抽出だけを考え、サンプル中で同じ特徴を持つものをまと めることにしました。そして、特徴抽出には、すでに提案され有効性の確認さ れているペリフェラル特徴とメッシュ特徴を併用したアルゴリズムを採用しま した。これについては、梅田三千雄・目黒眞一両氏の論文を参考にさせていた だきました。これに改良を加え、原稿にあったアルゴリズムを考えていく方針 です。
原稿は古いものですので、印刷の質が悪く、かすれ・つぶれが目立ちます。 中には同じ文字種でも見るからに違うようなものも見られます。これらは、お そらく違う文字と認識されるでしょう。なぜなら、標準パターンというものが もともとないので、偏差を求めることができないわけです。また、標準パター ンがないため、辞書化は画像中に出てきた文字の順で作成するという形式をと るでしょう。そこで候補を仮に10番目まで出すとして、同じ文字種がその中に あったとしても、その文字種のそれ以降の特徴はどうすればよいのでしょうか。 どちらの文字もかすれ・つぶれが含まれるわけだから、そこから理想のパター ンの特徴を求めるのは困難でしょう。
このように、当日は話が発散してしまったのですが、とりあえず、動くも のをつくって実験を繰り返し、どの程度問題が深刻なのかを考えることにしま した。
ご出席のみなさまにはたくさんの心からのアドバイスをいただき、まこと にありがとうございました。