トップページに戻る

ACM SIGMOD日本支部 講演会(チュートリアル)

「オンデマンド情報抽出」

講演者:関根 聡(ニューヨーク大学)
日時:2006年08月02日(水) 17:30 - 18:30
開催場所東京大学生産技術研究所 E棟 会議室A(Ew-501)
主催:日本データベース学会・ACM SIGMOD日本支部 共催
支部長:北川 博之

Abstract

非構造化テキストから、特定の情報を抽出する情報抽出の技術は、1990年前後
から米国で行われていたMUCというプロジェクトを中心として、テキストの意味
を理解しようという技術として発展している。しかしながら、MUCで主に採用さ
れた手動で言語パターンや辞書を生成する方法やその後盛んに行われた機械学
習の手法では、タスク依存性という限界があり、情報抽出の技術を一般化させる
のが不可能な状態である。この問題を解決し、情報抽出にスケーラビリティを
導入しようとして、教師なし学習や幅広い知識をあらかじめ用意するという2本
柱で実現に取り組んでいるのが、オンデマンド情報抽出である。その概念、構成
等を説明した後、最初の実験結果が得られたのでそれを報告し、また、新たな
方向性として模索を始めたPreemptive(先制攻撃的)情報抽出について説明する。

また、講演者が日本で運営しているコンサルタント会社ランゲージクラフト研究
所(http://languagecraft.jp)の主な成果について説明する。
参加条件:どなたでもご参加頂けます.参加費は無料です.