ACM SIGMOD日本支部 講演会(チュートリアル) |
「オンデマンド情報抽出」 |
講演者:関根 聡(ニューヨーク大学) |
日時:2006年08月02日(水) 17:30 - 18:30 |
開催場所:東京大学生産技術研究所 E棟 会議室A(Ew-501) |
主催:日本データベース学会・ACM SIGMOD日本支部 共催 |
支部長:北川 博之 |
Abstract |
非構造化テキストから、特定の情報を抽出する情報抽出の技術は、1990年前後 から米国で行われていたMUCというプロジェクトを中心として、テキストの意味 を理解しようという技術として発展している。しかしながら、MUCで主に採用さ れた手動で言語パターンや辞書を生成する方法やその後盛んに行われた機械学 習の手法では、タスク依存性という限界があり、情報抽出の技術を一般化させる のが不可能な状態である。この問題を解決し、情報抽出にスケーラビリティを 導入しようとして、教師なし学習や幅広い知識をあらかじめ用意するという2本 柱で実現に取り組んでいるのが、オンデマンド情報抽出である。その概念、構成 等を説明した後、最初の実験結果が得られたのでそれを報告し、また、新たな 方向性として模索を始めたPreemptive(先制攻撃的)情報抽出について説明する。 また、講演者が日本で運営しているコンサルタント会社ランゲージクラフト研究 所(http://languagecraft.jp)の主な成果について説明する。 |
参加条件:どなたでもご参加頂けます.参加費は無料です. |