研究紹介

提供: Ishikawa Laboratory

目次

研究目標

我々は、情報爆発時代におけるIT基盤技術の開発を目的として研究を行なっている。様々な社会的ニーズに応えるWeb、データベース、データマイニングの次世代の姿を幅広く探求している。当面の研究目標を以下に列記する。

  1. 次世代サーチエンジンの開発
  2. XMLフィルタリング・マイニング技術の開発
  3. ブログマイニング技術の開発

主な研究テーマ

  1. blog班
  2. Webサーチ班
  3. リアリティマイニング班
  4. XML班
  5. Web GIS班

主な研究成果

次世代サーチエンジンの開発

Web 上の情報を探すために使われる検索エンジンの多くはユーザに検索結果をスコア順のリストとして返すため、リストが長い場合に求める情報を探すのはきわめて難しい。そこで検索結果をカテゴリ表示するための新しいクラスタリング方法を提案した。クラスタリングする方法としてはWeb ページの持つリンク情報を基に行う。リンク情報の解析には、より緻密に結びついたリンク構造にあるページ集合を見つけるのに有効な最大流アルゴリズムを用いる。提案方法を定量的に評価するために、適合の正解があるNTCIR のデータを使い実験を行い良好な結果を得た。(情報処理学会論文誌(データベース),Vol.47, No.29,pp. 65-75(2006.3)).

XMLフィルタリング・マイニング技術の開発

大規模なXML配信に利用できるフィルタリング技術としてGuptaらのXPushマシンがある。しかしながら XPushマシン構築処理はフィルタ数に依存するためにその処理コストが高くなり、したがって再構築がXMLシステムのスループットをいちじるしく低下させるという問題点があった。そこで変更数が少ない場合には再構築より少ない応答時間で部分的にフィルタ構築を行う方法をサブXPushマシンの導入に基づいて開発した。(情報処理学会研究報告, Vol.2006, No.59, pp. 107-111(2006.5)).統計的手法によりサーチ時間の最適化を目的としたXMLデータのスキーマ発見の方式を提案した。(IADIS Intl. Conf. WWW/Internet (2006.10)).

ブログマイニング技術の開発

情報爆発を象徴するものの一つが、Webにおけるブログの出現である。ブログは現在から過去に遡って個人が関心に応じて書く日記風のページの集合である。ブログはWeb2.0という新概念にも含まれ、ブログ空間でコミュニティがどう形成され、テーマがどう成長し伝播していくかを解析すれば、サーチ結果の要約、世論のモニタリング、さらにWeb解析、ビジネスインテリジェンスなどへ応用できる。ブログに含まれるテキスト、リンク(URL)、トラックバックを利用してクラスタリングを行い、重要なトピックの抽出や有用なサイトの発見と推薦を行うための準備的研究を行った。(電子情報通信学会データ工学ワークショップに投稿中 (2007)).

今後の展開

我々は上記のように情報爆発時代におけるIT基盤技術の開発を目的としている。今後の研究展開としては、Web、 XML、ブログに関する次世代サーチとマイニング技術の開発とその産業応用に力を注いでいきたいと考えている。また、データベース・マイニング技術を生かし、周辺分野(センサネットワークなど)のテクノロジーを融合した幅広い研究にもチャレンジしていきたい。

その他

石川研究室
メンバー
他の言語
学内向け
おまけ
その他
ツールボックス