研究事例
AIMaP成果事例集
2017A011
研究テーマ
超高次元データの非スパースモデリング
研究者名 青嶋 誠 研究者所属 筑波大学数理物質系キーワード 高次元統計解析、非スパース、高次元小標本、次世代シークエンサ、ゲノム構造活性データ
研究内容
A:どんな諸分野・企業の、どんな問題や現象をターゲットにしたか。
近年、最先端ゲノム科学において、超高次元データの解析が進んでいる。しかし、それらのデータには、巨大で非スパースなノイズが包含され、従来の統計解析法では除去できず、間違った解析結果を導くことさえある。本研究は、ゲノム科学データの巨大なノイズ処理の問題とデータ解析の精度保証の問題に、新しい統計学「高次元統計解析」の立場からアプローチした。
B:どんな数学・数理科学をどのように使ったか。
研究代表者のチームが独自に考案・開発した、高度な数学に裏打ちされた理論「高次元統計解析」と、そこで導かれる方法論「非スパースモデリング」を用いて、非スパースなノイズを除去し、ゲノムデータの豊富な潜在情報を抽出することに成功した。
C:どんな成果が得られたか。(あるいは、どんな成果を目指しているか。)
例えば、下記の右図のように、加齢黄斑変性(AMD) に関する300万次元データ(40標本)について、非スパーモデリングを使い巨大なノイズを除去することで、AMD患者群の抽出に成功した。ノイズを除去しなければ、左図のように抽出は困難である。
D:どのようなきっかけでその諸分野・企業との連携が始まったか。
科学研究費補助金 基盤研究(A) 15H01678 (平成27年度~31年度) 「大規模複雑データの理論と方法論の総合的研究」 研究代表者: 青嶋 誠によるシンポジウムを、筑波大学を含め国内4カ所で毎年開催している。2017年の筑波大学での開催には、AIMaPからも支援を受け、全国の数学・数理科学研究者と諸科学分野や産業界の研究者・技術者との活発な議論の場となった。そのシンポジウムの講演者の一人であった計算生物学者の仲木氏(Rhelixa)と、今回の共同研究に至った。