2013年6月6日関浩之 教授(情報システム学専攻)2013/4/1着任
2013年4月に着任した関 浩之と申します。
私は形式言語理論、アルゴリズム論、プログラム理論などを使って、現実の問題をモデル化し問題解決を図るというアプローチを大切にしています。研究では、なぜ問題がうまく解けたのか(もしくは、解けなかったのか)を客観的に理解することも重要だと思うからです。理論にしっかり根ざした応用研究にはもう一つ、現実の問題を解く過程で得られた知見を通して、理論自体が進展するという面白さがあります。
図 研究の概要とアプローチ
前置きが長くなってしまいました。具体的なテーマを紹介します。
【言語ベースセキュリティ・プライバシ】
言語理論の知見をソフトウェアの信頼性向上、特にセキュリティに応用する研究を行ってきました。例を二つ紹介します。 現在、ネットワークからダウンロードしたプログラムを手元の計算機上で実行するということが日常的に行われていますが、それらの中には悪意あるコードが含まれている可能性があります。JDK等の実行時環境では、そのようなコードから情報を保護するためのアクセス制御機能が提供されています。しかし、アクセス制御をプログラムのどの部分でどのように行うのかは設計者の直観に委ねられています。そこで私達は、アクセス制御を含むプログラムが本当に安全かを検証する方法や、セキュリティ要求を満たすようにアクセス制御をプログラムに自動挿入する手法を提案し、ツールを実装してその有効性の評価も行ってきました。
また、共同研究者と協力し、XML文書変換の情報保存性や、XMLデータベースへの推論攻撃に対するセキュリティ耐性の研究を行っています。
最近、k-匿名性、量的情報流、差分プライバシーなど、セキュリティ強度・プライバシー保全の度合を計る新しい概念が提案されていますが、今後はこれらの概念を考慮に入れた研究を行いたいと考えています。
【形式言語理論とその生物ビッグデータ解析への応用】
多重文脈自由文法(MCFG)という文法を提案しその諸性質を解明してきました。MCFGの生成能力は文脈自由文法(CFG)よりも大きく文脈規定文法(CSG)よりも小さいこと、多項式時間構文解析可能性や言語演算に対する閉包性など、CFGのよい性質を受け継いでいることがわかっています。
さて、DNA、RNAといったいわゆる生物配列の機能の解明にはその立体構造を知ることが必須だといわれています。しかし、分子生物学における実験データは膨大で誤差も含まれており、それらから有意な情報を効率よく抽出するには優れたアルゴリズム設計が必要です。今風にいうと典型的なビッグデータ解析の問題です。RNAにはシュードノットとよばれる重要な部分構造が含まれますが、これはCFG では表現できないけれどMCFGを使えば自然に表現できることがわかっています。そこで、MCFGの構文解析法を利用して、RNAの2次構造予測アルゴリズムを開発しツールの実装も行いました。
今後も引き続き、シーケンシング(誤りを含む超多重マッチング、アセンブリ)や高次構造予測に関する研究を行う予定です。
学生さんとの議論を通し、10年後、20年後の研究潮流のさきがけとなるようなシンプルで独創的な研究を行いたいと思っています。どうぞよろしくお願いいたします。