予算上の制約から申請した研究計画を大幅に変更し、ナノポアシーケンサーMinIONを用いたRNA-seqの実験系の立ち上げに注力した。MinIONを用いたcDNA-PCR sequencingに必要なRNAを簡便に得るため、幼生の免疫細胞である間充織細胞ではなく成体の免疫細胞である体腔細胞を材料とした。
cDNA-PCR Sequencing Kitのマニュアルに従い、50 ngのpoly A+ RNAをテンプレートとして、逆転写反応とstrand switching、PCRによる全長転写産物の増幅、アダプター付加を行い、増幅したcDNAを精製してライブラリーとした。濃度を測定し、600 ngのcDNAをMinIONでのシーケンシングに供した。
シーケンシングのランは最大時間である48時間行い、およそ725万リードのデータを得た。ベースコールにはハイスペックなコンピュータが必要であったため、real timeでのベースコールは行わずに生データを出力した。これらの生データを、推奨ベースコーラーであるalbacore v2.3.4を搭載した最小必要スペックのコンピュータを用いてベースコールし、約13 GBのfastqファイルを得た。得られたリードのうち、Quality score ≥ 7のリードが約510万リード得られ、平均リード長は約1000 bp、最大リード長は約7500 bpであった。これらの結果は、シーケンシング前のライブラリーのQC結果とよく一致しており、出力されたデータ量も含め、良好なシーケンシングデータが得られたと判断できる。
続いて、Quality score ≥ 7のリードでfastqファイルを作成し、高速なアライナーであるminimap2を用いてde novoアセンブリを試みた。ところが、コンピュータのスペック上の問題からアラインメントを行うことが出来なかった。今後はよりハイスペックなコンピュータを用いて、再度de novoアセンブリを行う必要がある。
Due to the limitation of budget, we changed the research plan significantly and focused on the setup of the RNA-seq experiment system using the nanopore sequencer MinION. In order to simply obtain the RNA necessary for cDNA-PCR sequencing using MinION, the coelomocytes, which are adult immune cells of starfish rather than larval mesenchymal cells, were used as materials.
Using 50 ng of poly A RNA, we performed reverse transcription reaction, strand switching, amplification of full-length transcript by PCR, and adapter addition according to the manual of cDNA-PCR Sequencing Kit, and purified amplified cDNA as a library . The concentration was determined and 600 ng of cDNA was subjected to sequencing in MinION.
The sequencing run for 48 hours, which is the maximum time, and data of approximately 7.25 million reads were obtained. Since a base-call required a high-spec computer, we output raw data without making a base call in real time. These raw data were base-called using a computer with the minimum required specifications equipped with the recommended base caller albacore v2.3.4 to obtain a fastq file of about 13 GB. Among the obtained leads, about 5.1 million reads of Quality score ≥ 7 were obtained, the average read length was about 1000 bp, and the maximum read length was about 7500 bp. These results are in good agreement with the QC results of the library before sequencing, and it can be judged that good sequencing data was obtained, including the amount of data output.
Then, a fastq file was created with a lead of Quality score ≥ 7, and de novo assembly was tried using minimap 2 which is a high-speed aligner. However, due to problems with computer specifications, alignment could not be performed. It is necessary to do de novo assembly again using a more powerful computer.
|