NGSによるシーケンスで得られた配列は、FASTQというファイル形式で保存されます。この配列をスプライシングを考慮してゲノム配列にマッピングします。この結果は、BAM形式ファイルで保存され、IGV (Integrative Genomics Viewer)などのゲノムビューワーを用いて閲覧できます。
発現量は、リードカウント、または、補正値を用います。FPKM (Fragments Per Kilobase of exon per Million mapped fragments)やTPM (Transcripts per million)は、発現量をエクソン長と全マッピング数で補正した値です。CPM (Counts per Million mapped reads)は、発現量を全マッピング数で補正した値です。
2群間の比較解析では、発現量の比をlogスケールで表現した値、もしくはt検定による有意差P値がよく用いられます。
シングルセルRNAseqとは、細胞の遺伝子発現プロファイルを一細胞レベルで取得して観測する画期的な技術です。これまでのRNAseq解析では、観測対象が細胞集団であり、細胞集団における各遺伝子の”平均的な”遺伝子発現を測定していました。一方、scRNAseqは細胞集団内の個々のトランスクリプトームを捉え、細胞特異的な変化を同定することが可能になります。Science誌において2018年のBreakthrough of the Yearとしても選出された技術であり、近年盛んに研究に用いられています。
薬物耐性獲得のメカニズムの解明は、がんの薬物治療において不可欠な要素です。耐性獲得の背景は、様々あるとされていますが、がん組織の不均一性がその原因の一つであると考えられています。Kashimaらは、がん組織の不均一性における薬物耐性の発生機序解明にscRNAseq解析を利用しました(Kashima et al., Cancer Res, 2021)。
GeらはscRNAseq技術を用いて、様々な分化期におけるマウス背部皮膚から得られた細胞群に対して一細胞のトランスクリプトームを統合的に解析しました(Ge et al., Theranostics, 2020)。その結果、9つの主要な細胞集団の同定と、上皮/真皮細胞系の分化の軌跡を構築することに成功し、細胞の運命決定に関わる主要なレギュロンが順次活性化されていることを明らかにしました。
シングルセルレパトア解析は、細胞集団内の各細胞のトランスクリプトーム解析に加え、 T 細胞受容体 (TCR) や B 細胞受容体 (BCR) 遺伝子の配列を解析することで、T 細胞や B 細胞の多様性と動態をシングルセルレベルで解析できる最新の技術です。
免疫細胞のTCRやBCRは非常に多様な配列のレパートリー(=レパトア)を持つことが知られており、組織中で高頻度に存在している受容体は、がん細胞やウイルス等の標的抗原を認識する可能性が高いと言われています。
TCRやBCRの配列を決定するレパトア解析とシングルセルRNA解析を組み合わせることで、標的抗原特異的な免疫細胞の経時的な変化や、さまざまな組織における免疫細胞の発現プロファイルを解析することができます。
この技術を活用することにより、がんや感染症の予後を予測するマーカー遺伝子の探索や、標的抗原特異的な抗体医薬品の開発に繋がると期待されます。
発がんやがんの悪性化の直接的な原因となるような遺伝子をドライバー遺伝子と呼びます。既知のドライバー遺伝子に変異が存在するかを解析することで、がんの原因遺伝子を推測することができます。既知の遺伝子として、TCGA(The Cancer Genome Atlas)など公共データベースで取りまとめられているリストを用います。
NGSによるシーケンスで得られた配列は、FASTQというファイル形式で保存されます。この配列をスプライシングを考慮してゲノム配列にマッピングします。この結果は、BAM形式ファイルで保存され、IGV (Integrative Genomics Viewer)などのゲノムビューワーを用いて閲覧できます。
発現量は、リードカウント、または、補正値を用います。FPKM (Fragments Per Kilobase of exon per Million mapped fragments)やTPM (Transcripts per million)は、発現量をエクソン長と全マッピング数で補正した値です。CPM (Counts per Million mapped reads)は、発現量を全マッピング数で補正した値です。
2群間の比較解析では、発現量の比をlogスケールで表現した値、もしくはt検定による有意差P値がよく用いられます。