2015年09月09日社会システム情報学専攻・知識社会システム論講座
石川研究室(石川 佳治 教授)
■ データベースの研究 ■
私たちの研究室では,データベースに関する研究を行っています. データベースとは,世の中で広く使われる言葉ですが,大まかには「電子化され共有されるデータ」を表します. 情報科学の立場で,データベースを研究するとはどういうことを意味しているのでしょうか?
一つには,「データを入れる入れ物」としてのデータベースシステムの研究です. 現在の情報社会では,さまざまな場面でデータベースシステムが裏方として活躍していて,大量のデータを管理し,高速に検索するために大いに役立っています. 私たちの研究室では,このようなデータベースシステムのさらなる効率化のための技術開発や,新たな種類のデータに対するデータベースシステムの拡張・高度化のための技術開発を行っています.
また,データそのものをどのように利活用するかという観点からの研究があり,これはしばしばデータ工学と呼ばれます. 特に,大規模かつ多様なデータに対して高度な分析を行うことで,有用な知識を抽出するデータマイニングが重要な研究課題となっています. 本研究室では,データベースシステムの技術を活用し,大規模なデータにも耐えうる,効果の高いデータ分析やデータマイニングの手法の開発を行っています.
さらに,データベースシステムやデータ工学の技術を基盤として,どのように新しいサービスやアプリケーションを実現していくかという,データベース応用に関する研究も行っています. データベースが情報社会のさまざまな場面で使われるようになり,扱うデータや使われ方も多様化していることから,データベース応用に関する研究トピックも次々と新しいものが生まれています.
■ 研究室の環境 ■
石川研究室は,スタッフと学生合わせておよそ20名ぐらいの研究室で,研究室はIB電子情報館南棟の3階にあります. 他の研究室と比べると留学生が比較的多いというのが特徴です.
■ 研究テーマ ■
具体的な研究テーマとしては,以下のようなものがあります.
1. 空間データベース・時空間データベース
地図や位置情報に基づくアプリケーションにはさまざまなものがありますが,それらのデータを蓄積・活用するためのデータベースが空間データベースです. また,さらに時間情報を付け加え,移動軌跡などの情報も扱うデータベースを時空間データベースといいます. 私たちの研究室では,これらのデータベースについて,問合せ処理・索引技術,モバイル環境での情報推薦などのアプリケーションに関する技術,データマイニングなどに関する研究を行っています.
以下に,携帯電話を持って移動するモバイルユーザの移動履歴の分析の事例を示します. 分析者は,上図にあるように,「オフィスからスーパーに行って,家に帰った人たちは?」といった移動パターンを指定します. すると分析システムは,大量の移動軌跡データの中から,そのようなパターンにマッチする移動軌跡群を抽出します. 下図は東京周辺での移動軌跡の実データに対する適用例で,「専門店から飲食店に移動した人たちは?」というパターンに対応するものです.
2. データストリーム処理,イベント処理
今日の情報社会では,蓄積されているデータだけでなく,インターネット上に時々刻々と出現するデータや,センサシステムなどから継続的にモニタリングされる情報が増大しています. このようなデータのことを,データストリームと呼びます. 本研究室では,データストリームに対する問合せ処理や,データストリームからのデータマイニングなどに関する研究を行っています. また,近年注目されている,データストリームから検出されるさまざまなイベントを組み合わせてアプリケーションを開発する複合イベント処理(CEP)に関する研究も行っています.
以下の図は,行動履歴データストリームから行動に関するイベントを抽出・蓄積し,問合せ可能とするイベントベースシステムの概念図を示しています. データストリームや複合イベント処理の機能に加え,人間の行動に関する背景知識(オントロジー)を活用する点が特徴となっています.
3. その他
他の研究テーマとしては,たとえば以下があります.
- クラウドコンピューティング:並列分散コンピューティング基盤を用いてスケーラブルなデータの管理や処理を行うための技術開発を行っています. たとえば,Hadoopを活用した大規模空間データの処理などの研究を行っています.
- ウェブ情報システムおよびウェブマイニング:ウェブをささえるウェブ情報システムの構成法に関する研究や,ウェブに出現するさまざまなデータの分析に関する研究を行っています. たとえば,多数のボランティアにより編集されるオンラインの百科事典であるWikipediaから,編集者間の意見の相違を抽出する研究などを行っています.
- E-サイエンス:科学の領域では,情報科学の技術を用いてさまざまな知見を導き出そうとするE-サイエンスが注目されており,ビッグデータの流れを受けて,今日では重要な研究領域となっています. 私たちの研究室では,科学分野の研究者と協力しながら,災害情報や環境情報に関する研究分野における大規模データの管理や利用に関する研究を進めています.
■ おわりに ■
石川研究室にご興味のある方は,http://www.db.ss.is.nagoya-u.ac.jp/をご覧ください.