------------------------------------------------------------------ 第359 回 PTT のお知らせ --- Programming Tools and Techniques --- ------------------------------------------------------------------ ■日時: 2009年10月22日 (木) 18:30 から ■場所: 東京大学 本郷キャンパス 浅野地区 情報基盤センター 4F 遠隔講義室(*) (http://www.u-tokyo.ac.jp/campusmap/cam01_13_01_j.html) (*) 入口が施錠されるため、アクセス情報の「入館について」を参照してください ------------------------------------------------------------------ ■話者: 鴨志田 良和(東京大学 情報基盤センター スーパーコンピューティング研究部門) ------------------------------------------------------------------ ■題名:T2Kオープンスーパーコンピュータ東大版の1年 ------------------------------------------------------------------ ■概要: 東京大学に導入されたT2Kオープンスーパーコンピュータ「HA8000クラスタシス テム」はこの10月で正式サービスを開始してから1年を迎えた。 T2Kオープンスーパーコンピュータは筑波大学・東京大学・京都大学が共同で 仕様を定めたクラスタ型のスーパーコンピュータである。本発表では、まず システムの概要を述べ、これまでの1年間の運用や利用者からのアンケート から得られた知見、問題点とそれに対する取り組みについて紹介する。 ※なお、発表終了後にサーバ室でT2Kオープンスーパーコンピュータ (HA8000 クラスタシステム) をご見学いただく予定です。 ------------------------------------------------------------------ ■アクセス情報: ●本郷キャンパス 浅野地区のご案内 最寄り駅は千代田線根津駅で、下車徒歩10分弱です。 他に南北線東大前駅(徒歩10分強)、 丸ノ内線・大江戸線本郷三丁目駅(徒歩15分)が 利用可能です。 バスをご利用の方は以下も参照してください。 http://www.u-tokyo.ac.jp/campusmap/map01_02_j.html ●入館について 会場の建屋は18:00に閉館となり、シャッターが閉まります。 当日はシャッターの左隣にある通用口からお入りいただきますが、 施錠されているため担当者が解錠します。18:20〜18:40は 担当者が通用口外にいるようにしますが、不在の場合は張り紙を しておくのでその指示に従ってください。 ---- 質疑応答: Q. PCクラスタで満足できるユーザに対して,スパコンはコストパフォーマン ス的にどうか? A. 自前で持つほうが、rootになれたり自由度は高が、計算力としてだけ考える なら、HA8000は利用者は電気代のみを負担するような料金体系なので、おそ らく割安 負担金表は以下のリンクに掲載 http://www.cc.u-tokyo.ac.jp/service/ha8000/service.html Q. 今,実際に大規模ジョブを使っているのは何人? A. 月によって異なるが、10名弱 2009年9月の実績は、5名、34ジョブ Q. 稼働率を変更するためのパラメータは何か? A. キューとノード集合の対応表の変更 キューに流せる最大ジョブ数の変更 Q. どれくらいの時間間隔で調整するのか? 1時間程度の粒度かも。よくわからない。 Q. なぜ同時実行ジョブ数を2なのか? 8では駄目なのか? Q. 実際に調整により稼働率がどれくらい変わるのか? A. 本年度からよりアグレッシブに調整しているとのこと すべてがこの調整の効果というわけではないが昨年度より5から10%くらい 向上しているように見える Q. 東大の利用者はどれくらいの割合なのか? A. 半数程度 Q. CPU時間? ジョブが動いていた時間? A. CPU時間ではなくジョブが動いていた時間から稼働率を計算している Q. ファイルシステムのトラフィックを Myrinet に流して MPI 計算を阻害しないのか? A. 同じジョブの中では干渉する 別ジョブの場合、ファイルアクセスのトラフィックは干渉するが、 HA8000のサブクラスタのMyrinetはフルバイセクションバンド幅を実現するよ うにネットワークが組んであるため、あるジョブが他のジョブのMPI通信に 大きく干渉することはない。 Q. トラフィック制御などはしないのか? A. していない Q. 対数グラフにするのは問題ないか? A. 大きな差があるため、対数グラフのほうがわかりやすいと考えられる Q. 遅いのになぜ HSFS を使ったのか? A. ここまで遅いことは予想しなかった。今後はファイルシステムの仕様策定時 に注意する必要がある Q. 従来のユーザには問題ではなかったのか? A. 今回、新規ユーザが増えたため問題があることがより明らかになったが、 従来ユーザも問題ではないともっていたわけではないと思う Q. サービス料でどれくらいシステム維持になっているか? A. 電気台を利用負担金でまかなっている。その意味では赤字ではない。 Q. 電源が落ちてるノードはどれくらい? 稼働率は? A. ほぼすべてのノードが稼働中 Q. 研究とのマッチングはないか? A. 共同研究プロジェクトでスパコン部門の教員とのマッチングは行っている 外部の人も含めたマッチングは今後検討していきたい Q. スケジューリングのデータをスケジューリング問題として公開できないか? A. いまのところは予定していないが、これも今後検討 Q. 共同研究はどれくらいあるのか? A. 共同研究プロジェクトの採択件数は年間5件程度 Q. コンパイラは何が多いか? Intelコンパイラだとライセンスは? A. intelコンパイラのライセンスは、同時実行数8までのアカデミックライ センス 実行頻度については今のところ集計されたデータがない。 Q. Opteron でも Intel コンパイラは速いのか? A. 日立コンパイラ、PGIコンパイラもあるので、いろいろ試して速かったも のにすればよいのでは?