RNA編集とは, 転写物へ位置特異的に一塩基置換を引き起こす転写後修飾の一種として知られ, アデニン(A)からイノシン(I)へのA-to-I編集がヒトやマウス, ショウジョウバエから多数報告されている。このA-to-I編集はADARと呼ばれるニ本鎖RNA結合タンパク質によって触媒されることが知られており, 翻訳の段階で置換されたイノシンはグアノシンとして認識されるため, 編集を受けた転写物は翻訳の過程において, 非同義置換によるスプライシングサイトの変化やタンパク質の高次構造の変化, miRNAやsiRNA編集を介した遺伝子発現の抑制など転写調節に幅広く関与していることが報告されている。近年, RNA-seqデ一夕を用いたゲノムワイドな編集サイトの同定が多数の組織およびセルラインを用いて行われ, ヒトでは数万箇所の編集サイトが報告されている。RNA編集サイトはゲノムと転写物の一塩基のミスマッチとして検出可能だが, シーケンシングやマッピングに起因した擬陽性を多く含むため, 真の編集サイトと擬陽性を高精度に分離する検出手法がこれまで多く提案されてきた。しかしながら, 解析に使用された手法の多くはソフトウェアとして公開されておらず, RNA-seqデータを対象とした編集サイトの検出ソフトウェアは現時点で一つ存在するのみである。そこで本研究では, 既存のソフトウェアよりも高精度かつ, 高速に動作するRNA編集サイトの検出ソフトウェアの開発を行った。開発したRNA編集サイトの検出ソフトウェアをグリア芽細胞腫由来のRNA-seqデータへ適用したところ, 既存のソフトウェアと比較して同等のメモリ効率で2倍程度高速に動作することが確かめられたほか, 全ての染色体において高い再現率を示す手法であることが明らかとなった。本研究は, 超並列シーケンサーデータを用いたRNA編集サイトの高精度かつ高速な検出手法の開発に貢献することが期待される。
|