10:00 受付開始
10:25-10:30 開会挨拶
10:30-12:00 「SIGMOD2013 国際会議報告 (1)」
鈴木 伸崇 (筑波大学)
概要:
2013年6月23日から27日に,ニューヨークで開催されたSIGMOD2013について報
告する.前半では,SIGMODおよびPODSの採択率など統計データについて紹介す
ると共に,キーノートやパネルディスカッションを中心に紹介する.SIGMODの
キーノートでは,証券市場のビッグデータに関する講演が行われた.
12:00-13:10 昼休み
13:10-14:40 「SIGMOD2013 国際会議報告 (2)」
鈴木 伸崇 (筑波大学)
概要:
後半は,Best paperを含めた興味深い講演を取り上げて紹介する.なお,
SIGMODのBest paperは "Massive Graph Triangulation",PODSのBest paperは
"Verification of Database-Driven Systems via Amalgamation"であった.
14:40-14:50 休憩
14:50-15:50 「クラスタリング技術の基礎と応用」
澤田 宏 (NTT)
概要:
ビッグデータ時代を迎え,データへの教師ラベル付けが不要な「教師なし機械学
習」の重要性が増している.本講演では,教師なし学習の中でもクラスタリング
技術に着目する.特に,ガウス混合モデル(GMM: Gaussian Mixture Model)
と,非負値行列因子分解(NMF: Non-negative Matrix Factorization)の基礎を
説明し,実データへの適用例をいくつか示す.
15:50-16:00 休憩
16:00-17:00 「Silkによる並列分散ワークフロープログラミング - ゲノム情報処理への応用」
斉藤太郎 (東京大学)
概要:
SilkはScalaで実装された並列・分散計算とワークフロー管理の融合を目指した
フレームワークです.Silkではプログラム中のデータ(変数)と分散演算(map,
reduce, joinなど)の依存関係をプログラムのASTから解析し,クラスタの空き状況
に応じて実行プランの最適化やデータの分割を行います.また,プログラムの部分
実行により,GNU Makeのように障害からの回復やプログラムの変更によるワーク
フローの再計算,実行状態の検索(ワークフロークエリ)が行えるのが特徴です.
今回は大規模ゲノム情報処理(アラインメント,エピゲノム情報解析など)を題材
に,Silkがどう活用できるかを紹介します.
17:00 閉会 |