ACM SIGMOD 日本支部第14回支部大会

データマイニング・Ｗｅｂサーチエンジンの最新動向とデータベース先端技術国際会議ICDE2000やさしい技術紹介

日時：2000年4月24日(月)-25日(火)
開催場所：東京大学生産技術研究所　第一会議室(東京都港区六本木7-22-1)
主催：ACM SIGMOD Japan Chapter
支部長：喜連川優
プログラム

●4月24日(月曜日) 受付開始：9時00分
9時20分～9時30分
挨拶　　　　　　　　　 喜連川優（ACM SIGMOD J支部長）

9時30分～11時30分
◯Towards Learning-Based Web Query Processing
Lu Hongjun(Hong Kong University of Science and Technology)

◯経営データからの知識発見
矢田 勝俊(関西大学商学部)
[概要]
マネジメントの領域で、データベースからの知識発見は、今、最もホットな研
究領域の１つと言うことができるだろう。情報機器の普及、特にインターネッ
トの普及によって、膨大なデータが蓄積され、それらを戦略的に活用しようと
多くの企業が模索し始めているのである。我々は、データマイニングに関する
技術開発だけではなく、企業との共同研究を通じて、現実の経営データに適用
し、実践に結びつく研究を中心に行っている。特に我々は、顧客の購買行動を
説明する様々アプリケーションの開発を行い、企業へのフィードバックを試み
ている。

13時00分～15時00分
◯情報収集ロボット開発の現状
竹野 浩(NTT サイバーソリューション研究所)
[概要]
WWW 空間を巡回して網羅的に情報を収集する「情報収集ロボット」は，インター
ネット上の情報に対する検索サービスを提供する「サーチエンジン」を構築す
る上で不可欠なシステムである．
本講演では，「情報収集ロボット」の構成／動作等の一般的な話題から，
与えられた要求性能に対応するためのチューニング法，開発時のエピソード，
今後の課題等，情報収集ロボットの開発の現状を網羅的に述べる予定である．

◯日本語情報検索システムの評価：NTCIR Workshopとテストコレクション
神門 典子（国立情報学研究所）
[概要]
日本語情報検索システム評価会議NTCIR（エンティサイル）ワークショ
ップの概要を紹介する。また、TREC, TIDES, CLEF, Amaryllisなどの情
報検索研究と評価に関わる国際的動向、評価会議の意義、次回のNTCIRワー
クショップの予定について述べ、今後の方向を展望する。
　第１回ワークショップは、6カ国の28グループが、日本語検索・言語横
断検索・用語抽出に参加した。日本語検索と言語横断検索は、国際的にも
心が高まっている。今年は、NTCIRとIREXが合同してNTCIR Workshop 2を
開催する。伝統的な文書検索の評価とともに、文書中の回答箇所同定、要
約、複数文書の対比・分析など、新しい課題にも取り組んでいきたい。

15時30分～17時30分
◯分散型WWWロボットによる国内のWWWデータ収集実験
山名 早人(早稲田大学)
[概要]
WWWサーバ数は，2000年2月末には1,000万台を越え，サーバから発信
される情報量は、約17.8億URL(ページ)と推測される．この膨大な情
報に対する検索を実現するためには，インデックス化のために，こ
れらのデータを収集しなければならないが，日本国内のデータだけ
でも収集に一ヶ月以上の時間を要する．本報告では，現在進めている
ネットワーク上の複数の拠点からWWWデータを自動収集するWWWロボッ
トの実験について最新状況を報告する．

◯Hyperlink-aware mining and analysis of the web
Andrew Tomkins(IBM, Almaden)
[Abstract]
The approximately seven billion hyperlinks on the WWW, and the
anchortext surronding them, represent a valuable collection of
editorial information about web pages. We begin by discussing methods
for incorporating this link information into web search. Next, we
consider a follow-on question: is it possible to apply data mining
techniques to the link structure of the web in order to discover all
communities, including those that have only just formed and whose
members may not yet be aware of one another.
We also consider modeling and measurement of this hyperlink
structure. A recent analysis of the web graph indicates that the
macroscopic structure is considerably more intricate than suggested by
earlier experiments. We describe these results, and go on to discuss
some progress towards defining analytical models for graphs such as
the web.
The work described here is joint with Andrei Broder, Ravi Kumar,
Farzin Maghoul, Prabhakar Raghavan, Raymie Stata, Sridhar Rajagopalan,
Eli Upfal and Janet Wiener.

●4月25日(火曜日)
受付開始：10時00分
10時30分～12時00分
◯ICDE'2000国際会議報告 第一部
　　　　 有次 正義(群馬大学)

13時15分～15時15分
◯ICDE'2000国際会議報告 第二部
　　　　 有次 正義(群馬大学)
[概要]
2月28日から3月3日にかけて，サンディエゴで開催された第16回ICDE国際会議
の参加報告を行う．会議に参加していて気になったキーワードなどについて述
べるとともに，いくつかのトピックに焦点をあて会議の講演を紹介する．予定
しているトピックは以下の通り．
・Web information retrieval
・Multimedia retrieval
・System administration
・XML など．