第20回先端的データベースとWeb技術動向講演会(ACM SIGMOD 日本支部第57回支部大会)

SIGMOD/PODS2014国際会議報告とビッグデータ技術と応用の最前線

日時：2014年10月4日（土）10:00-17:00

主催：ACM SIGMOD 日本支部（支部長：川越恭二 (立命館大学)），日本データベース学会(会長：北川博之(筑波大学)）

支部長：川越恭二

プログラム

9:30
 受付開始

10:00-10:05 開会挨拶

10:05-11:05 「SIGMOD/PODS2014 国際会議報告 (1)」
野宮 浩揮　（京都工芸繊維大学）
概要：
2014年6月22日から27日にアメリカの Snowbird で開催された SIGMOD/PODS 2014 について報告する。前半では、会議全体の概要の報告と、下記2件の SIGMOD の キーノートやパネルディスカッションを主とした紹介を行う。

・"How I Learned to Stop Worrying and Love Compilers,"
　Eric Sedlar (Oracle Labs)
・"Fun with Hardware Transactional Memory,"
　Maurice Herlihy (Brown University)

11:05-11:20 休憩

11:20-12:20 「SIGMOD/PODS2014 国際会議報告 (2)」
野宮 浩揮　（京都工芸繊維大学）
概要：
後半では、SIGMOD の Best Paper "Materialization Optimizations for Feature Selection Workloads" ならびに PODS の Best Paper "Weaker Forms of Monotonicity for Declarative Networking: a More Fine-Grained Answer to the CALM-Conjecture" を中心として、興味深い研究についての紹介を行う。

12:20-13:40 昼休憩

13:40-14:40 Hivemall: Apache Hiveを用いたスケーラブルな機械学習基盤
油井 誠 （独立行政法人産業技術総合研究所）

概要：
我々はApache Hive上で動作する機械学習ライブラリHivemallをオープンソース ソフトウェアとして公開している．Hivemallはオープンソースの機械学習 フ レームワークとしてデータ量に対するスケーラビリティが最も高いものの一つで あり，Hadoop Distributed Filesystem (HDFS）に格納されたデータを入力とし た機械学習処理を効率的に扱えるという特徴からHadoop/Hiveに精通する開発者 やデータ分析の専門家か ら注目を集めている．
本講演では，Hivemallによるスケーラブルな機械学習を実現する上で得られた実 践的な知見，及びその実現手法を紹介する．また，データベー ス研究者から見 て大規模データのための機械学習基盤を開発する上でどのような課題があるのか を述べる．

14:40-15:40 楽天におけるビッグデータとその活用について
平手 勇宇　（楽天株式会社 楽天技術研究所）
概要：
楽天では，楽天市場をはじめとする様々なサービスを運用しており，それらの サービスから日々，大量のデータが生成され続けている．これらの大規模 デー タを活用し，事業に貢献することを目的とした様々な取り組みが行われている． 本講演では，商品検索システムへの活用，およびレビューデータ解 析を用いた 新たなユーザナビゲーションの構築，購買履歴・検索履歴データを基にした日本 経済予測等の例を挙げながら，楽天におけるビッグデータ活 用事例について紹 介を行っていく．

15:40-15:55 休憩

15:55-16:55 大規模並列検索サービスGoogle BigQuery最新動向
佐藤 一憲　（Google）
概要：
Googleの大規模並列検索サービスであるGoogle BigQueryの最新機能であるUser Defined Function（UDF）等についてデモを交えて解説します。また、Googleが 考えるMapReduceの次のビッグデータ処理基盤のビジョンを紹 介します。

17:00 閉会