サーバ導入の決め手は、
初学者にも親切な「提案」と「ゲノムに特化した高い専門性」
機器の導入をゴールとせず、解析内容の理解や解析コマンドの習得に至るまで手をかけてくれる、手厚いサポートが非常に有効と感じています。
戸崎 先生(左)大沼葵 研究員(中央)田中徳子 研究補助員(右)
公益財団法人 競走馬理化学研究所
遺伝子分析部専門役
戸崎 晃明 先生 博士(薬学)、博士(農学)
商品名:データ解析サーバ(M004)、データ解析コンサルティング(E004)
イルミナ社「NextSeq500」を導入したが、WET出身のため「全ゲノム解析」といっても、何から始めてよいかわからなかった
Q.ご研究について教えてください。
A.競走馬の遺伝子ドーピング検査法の開発に取り組んでいます。WETからアプローチする既存の検出法だけではなく、「全ゲノム解析」で得た情報を利用し、網羅的に遺伝子ドーピングを検出するDRYからのアプローチも検討しています。
遺伝子ドーピングは、遺伝子治療の臨床研究が始まった2000年頃から問題になっていました。特に2012年にゲノム編集技術「CRISPR」が開発されたことで、遺伝子ドーピング物質を生体に注射するドーピングだけでなく、受精卵改変によって作製した遺伝子改変動物も競馬産業においては遺伝子ドーピングとして扱われ、国内・国際的にも喫緊の課題として対策が求められています。
このような中で、全ての遺伝子情報を決定したうえで、DRY的なアプローチから遺伝子ドーピングの痕跡をみつけられないかというコンセプトで研究を始めました。
Q.ご研究の課題はありましたか?
A.もともとWET研究をやってきたので、一言で「全ゲノム解読」と言っても、最初はどのような形で、何から実施すべきなのか全くわかりませんでした。次世代シーケンサ(NGS)を導入してデータを取得しても、その先の解析ができるのか?という不安もありました。
そのような中で、解析技術に強みを持つ企業との提携を検討しました。
イルミナ社では、ウマのゲノムに対応する解析パイプラインがなかったため自前でサーバを用意する必要がありました。その際に紹介いただいた企業の中に「アメリエフ」があり、ゲノム解析を得意にする企業とのことでしたので、サーバ構築などの解析環境の提案をお願いしました。
複数社検討した中で、具体的な提案と解析コマンドを習得するまでの手厚いサポートが良い
Q.計画から、弊社に決めていただくまでの期間はどれくらいでしたか?
A.プロジェクト全体の計画は1年間ほどかけて考えNextSeq500の導入までは決めていましたが、サーバを含む解析に必要な周辺機器は2~3ヶ月で決めました。
Q.その際のご苦労はありましたか?
A.言葉で「全ゲノム解析をしてSNPやIndelを検出」というのは容易ですが、実際に何をすべきかなどの詳しい知識はありませんでした。そのため、具体的にサーバ導入について交渉して決めるのには苦労しました。
複数社の担当者に訪問してもらい話を聞きましたが、各社得意な分野が異なっていました。その中で、ゲノム解析の経験が豊富であり、我々の研究ニーズから、NGSからのデータを受けるサーバ、解析サーバ、データ保管サーバの3つを使ってシステム構築、そして、解析パイプラインの提案および構築などを具体的に提示してくれた点がアメリエフを選ぶ決め手となりました。
Q.サーバ導入後は、保守契約を年単位でご契約頂いています。ご利用いただきよかった点はありますか。
A.保守契約では、所内のサーバにVPNでアクセスしてもらい、直接サーバ上でデータ解析してもらうことや、研究を進める中でデータ解析の解釈など困った際に相談にのってもらうという契約プランでした。
導入したサーバには、全ゲノム解析を実行するために必要なReseqパイプラインやトリオ解析において重要な、変異データ(VCF)の統合およびref/ref or NA判定が可能なQMergepyというソフトウェアが搭載されていました。ただ、稼働当時は、そのパイプラインが、そもそもどんなプロセスで、どのような結果を出力しているかなど、正直なところ全くわかりませんでした。
そういった不明点を一つずつ確認しながら、最初の1年間では、このような手順でコマンドを打つと解析ができて、どのような結果が得られるといったエデュケーションも含めて保守サービスを活用しました。最終的には、自分自身で各コマンドの意味を理解した上で、コマンドラインを用いた解析を実行できるようになりました。
保守担当者の方も、もともとは専門外からスタートしたということもあり、当時初学者だった私の目線に立って、わかりやすく説明していただいた点は本当に良かったです。
Q.今後のご研究の展望がございましたら教えてください。
A.現在は、遺伝子ドーピング対策のために、サラブレッド競走馬100頭以上の全ゲノムを対象にDNAバリアントデータベースを構築しています。データベースを構築することで、サラブレット(競走馬)が、品種として本来もつべきDNAバリアントを理解できます。検査対象個体の全ゲノム配列情報などがあれば、データベースと比較することでゲノム編集の痕跡を検出できるのではないかと考えています。データベース構築や解析パイプラインの構築についても、アメリエフに協力いただいています。
今後は、がんゲノム医療における「がん遺伝子パネル検査」の様に、効率的な遺伝子ドーピング検査を目的に「遺伝子ドーピングパネル検査」を構築し、日本のみならず海外の検査研究機関にも普及させたいと考えています。
WETとDRYを融合させて効果的な遺伝子ドーピング検出法を開発し、公正競馬に貢献したいです。
インタビュー:2019年12月