生物多様性情報学分野

companyname
研究室基本情報
スタッフ名 伊藤 希 講師
研究分野 微生物学
研究テーマ 複数分類体系を扱い得るデータベース構造の設計
ラフ集合を用いた分類概念の同値性判定
分類体系の比較表示ユーザインタフェースの設計
研究のキーワード 生物多様性、情報学、バイオインフォマティクス、データベース、ユーザインタフェース、ラフ集合、形式概念分析、理論生物学
研究室URL
研究室TEL
E-Mail nozomi★biol.tsukuba.ac.jp (★を@に変えてください)

研究紹介

背景

主にモデル生物を対象としたいわゆる「バイオインフォマティクス」が発展しつつあります。一方、モデル生物から一歩踏み出すと、地球上には何種類の生物がいるのかといった基本的な情報さえ容易には得られません。その理由のうち大きなものは、そもそもの情報を提供できる研究者がモデル生物の研究者にくらべてずっと少ないこと、全生物の多様性を対象とするデータベースを構築する方法が確立していないこと、そういった大規模データベースを構築する動機付けを欠いてきたこと、の三点です。このうち、最後のものは地球規模生物多様性情報機構 (GBIF) に代表される活動が各国を巻き込んで展開しはじめ、徐々に解消しつつあります。そこで、二番目を解決することで一番目を改善することが現実的になってきました。

具体的には ?

GBIF では博物館等が構築している既存の複数のデータベースに分散アクセスするアプローチがとられています。 ここで問題となるのは、それぞれのデータベースが異なる分類体系を用いている、つまり、データベースによって同じ分類群に違う名前をつけたり、同じ名前なのに違う分類群を意味している場合です。これを扱うためには、分散アクセスする側が複数の分類体系を並列的に扱える必要があります。そのためのデータ構造の研究を行なっています。 次に必要になるのは検索で得られた分類群がデータベース毎に異なっているかどうかを判定する手法です。個々のデータベースで利用できるデータが異なるので、制限された情報でどこまで判定できるかという点が焦点になります。ラフ集合や形式概念分析といった方法を応用することで、少ないデータしか利用できなくても複数の分類概念を比較し、矛盾があるかどうか判定する手法を開発しています。 分類概念の比較手法を開発する過程で、利用できる情報が少なくなるほど分類概念と分類体系とが密接に関連してくることがわかりました。その場合、個々の分類概念の比較にはその分類概念を含む分類体系全体の比較が必要です。この比較を極力自動化する手法を開発するとともに、その結果を評価するためのユーザインタフェースを開発しています。 これらの研究と並行して、 GBIF や生物多様性データベースの標準策定にかかわる TDWG といった国際的活動にも貢献しています。