研究者総覧「情報知」
社会システム情報学専攻
- 氏 名
- 石川 佳治(いしかわ よしはる)
- 講座等
- 知識社会システム論講座
- 職 名
- 教授
- 学 位
- 博士(工学)
- 研究分野
- データベース / データ工学 / ウェブ情報システム
研究内容
大規模かつ動的なデータを扱うデータベース技術
■研究の概容■
主にデータベースおよびデータ工学の分野における研究を行っている。今日の社会では日々膨大な量のデータが生み出され、その管理、検索、分析、利用が重要な問題となっている。また、ネットワークにおける情報の流通やさまざまなシステム・デバイスからリアルタイムに生み出されるデータにより、動的な情報の管理も課題となっている。このような背景に基づいて、成長・発展を続けるデータベースに対する新しい技術開発を進めている。
■研究テーマ■
(1) 時空間データベース
時空間データベース(spatio-temporal database)とは、時間的・空間的な特性を持つようなオブジェクトを表現・管理するデータベースのことを指す。例としては、道路上を移動する自動車などの移動オブジェクトを管理する移動オブジェクトデータベースが挙げられる。そのようなオブジェクトは時空間的情報や頻繁な更新などの特徴を持つため、それに適したデータ管理手法が求められる。具体的には、位置に基づく情報サービス、大量の移動オブジェクトの移動状況の要約・マイニング、時空間データベースのためのデータモデリングに関する研究などを行っている。
(2) ウェブデータベース/文書データベース
1990年代半ばにおけるウェブの出現は世界を変えたと言われている。ウェブは依然として発展を続けており、社会にも大きな影響を与え続けている。この分野に関する研究としては、たとえば、ページ内容やリンク情報の分析による、特定の地域に関するウェブページの発見の研究を行っている。また、多様かつノイズを含んだウェブページの中から情報を抽出するための、情報源選択やデータクリーニングを統合した情報抽出手法を開発している。さらに、関連する分野である文書データベースに関する研究も行っている。ネットワーク上の情報交換のために重要な役割を果たしているXMLなどの電子文書の管理・検索を対象としたデータベース・データ工学技術の開発を進めている。
(3) 情報検索/テキストマイニング
従来の情報検索では、対象となる文書はデータベースに蓄積され、ユーザが問合せを対話的に発行するのが一般的であった。これに対し、今日のネットワーク社会では、ニュース記事などの多数の文書がネットワークを通じてリアルタイムに配信されるため、効率的な情報の選択や要約が重要となってきている。この領域に関する研究として、たとえば、新規性に基づくインクリメンタルな文書クラスタリング手法、および、そのインタフェースの開発を行っている。その手法の基本的な特徴は、新しい文書ほど重要度が高いものと考えて文書のクラスタリングを行う点にある。この手法は、ユーザに対し各時点における「ホットなトピック」を提示する際に特に有効である。このような研究を踏まえて、現在、テキストマイニングの領域への研究の展開を図っている。
(4) 新たな応用分野のためのデータマイニング
データマイニングとは、大量のデータから有用な知識を発見するための手法である。その当初のターゲットはリレーショナルデータベースであったが、XML、ウェブ、時空間情報、ストリームデータなどの異なるフォーマットやセマンティクスを持つ新たなデータが現れており、応用における新たな要求も生まれている。それらに対するデータマイニング技術の開発を行っている。上記の3つの研究テーマと連携した、先進的なデータマイニング技術の開発を進めている。
■今後の展開■
主にデータベースおよびデータ工学の分野における研究を行っている。今日の社会では日々膨大な量のデータが生み出され、その管理、検索、分析、利用が重要な問題となっている。また、ネットワークにおける情報の流通やさまざまなシステム・デバイスからリアルタイムに生み出されるデータにより、動的な情報の管理も課題となっている。このような背景に基づいて、成長・発展を続けるデータベースに対する新しい技術開発を進めている。
■研究テーマ■
(1) 時空間データベース
時空間データベース(spatio-temporal database)とは、時間的・空間的な特性を持つようなオブジェクトを表現・管理するデータベースのことを指す。例としては、道路上を移動する自動車などの移動オブジェクトを管理する移動オブジェクトデータベースが挙げられる。そのようなオブジェクトは時空間的情報や頻繁な更新などの特徴を持つため、それに適したデータ管理手法が求められる。具体的には、位置に基づく情報サービス、大量の移動オブジェクトの移動状況の要約・マイニング、時空間データベースのためのデータモデリングに関する研究などを行っている。
(2) ウェブデータベース/文書データベース
1990年代半ばにおけるウェブの出現は世界を変えたと言われている。ウェブは依然として発展を続けており、社会にも大きな影響を与え続けている。この分野に関する研究としては、たとえば、ページ内容やリンク情報の分析による、特定の地域に関するウェブページの発見の研究を行っている。また、多様かつノイズを含んだウェブページの中から情報を抽出するための、情報源選択やデータクリーニングを統合した情報抽出手法を開発している。さらに、関連する分野である文書データベースに関する研究も行っている。ネットワーク上の情報交換のために重要な役割を果たしているXMLなどの電子文書の管理・検索を対象としたデータベース・データ工学技術の開発を進めている。
(3) 情報検索/テキストマイニング
従来の情報検索では、対象となる文書はデータベースに蓄積され、ユーザが問合せを対話的に発行するのが一般的であった。これに対し、今日のネットワーク社会では、ニュース記事などの多数の文書がネットワークを通じてリアルタイムに配信されるため、効率的な情報の選択や要約が重要となってきている。この領域に関する研究として、たとえば、新規性に基づくインクリメンタルな文書クラスタリング手法、および、そのインタフェースの開発を行っている。その手法の基本的な特徴は、新しい文書ほど重要度が高いものと考えて文書のクラスタリングを行う点にある。この手法は、ユーザに対し各時点における「ホットなトピック」を提示する際に特に有効である。このような研究を踏まえて、現在、テキストマイニングの領域への研究の展開を図っている。
(4) 新たな応用分野のためのデータマイニング
データマイニングとは、大量のデータから有用な知識を発見するための手法である。その当初のターゲットはリレーショナルデータベースであったが、XML、ウェブ、時空間情報、ストリームデータなどの異なるフォーマットやセマンティクスを持つ新たなデータが現れており、応用における新たな要求も生まれている。それらに対するデータマイニング技術の開発を行っている。上記の3つの研究テーマと連携した、先進的なデータマイニング技術の開発を進めている。
■今後の展開■
現在の研究開発の方向をさらに発展させた形で、新たに2つの方面での研究の展開を進めている。第一はP2Pデータベースである。P2P(peer-to-peer)環境におけるデータベースは、自律的なピアが疎に結合してネットワーク上で情報を能動的に交換する。柔軟性とスケーラビリティを保持しつつデータベースの統合を図る技術が望まれている。第二は、センサネットワーク上のデータをモニタリングし問合せするためのセンサデータベースである。時空間データベースにおける技術を発展させて、センサデータベースの要求に適した問合せ処理技術、データ管理技術などについての研究を進めている。
移動ヒストグラム : 移動状況の集約と分析
経歴
- 1994年 筑波大学博士課程工学研究科単位取得退学。博士(工学)
- 1994年 奈良先端科学技術大学院大学情報科学研究科助手
- 1997年-1998年 米国メリーランド大学客員研究員
- 1999年 筑波大学電子・情報工学系講師
- 2003年 同助教授
- 2006年 名古屋大学情報連携基盤センター(後に組織改編により情報基盤センター)教授
- 2013年3月 名古屋大学大学院情報科学研究科教授、現在に至る。
所属学会
- 情報処理学会
- 電子情報通信学会
- 人工知能学会
- 日本データベース学会
- ACM
- IEEE
主要論文・著書
- あいまいな位置情報に基づく最近傍問合せの処理手法、電子情報通信学会論文誌、J93-D(6), 781-794 (2010).
- Query Processing in a Traceable P2P Record Exchange Framework, IEICE Transactions on Information and Systems, E93-D(6), 1433-1446 (2010).
- A Novelty-based Clustering Method for On-line Documents, World Wide Web Journal, 11(1), 1-37, Springer (2008).
- トピックを考慮した大規模文書情報源からのレコード抽出、情報処理学会論文誌:データベース 、48(SIG 14)(TOD 35), 107-123 (2007).
- マルコフ連鎖モデルに基づく移動ヒストグラムの動的構築法、電子情報通信学会論文誌、J90-D(2), 311-324 (2007).