NOVEMBER 22, 2023 | SEQUENCING 101
シーケンシング入門:タンデムリピート
< Return to Japan blog | < Return to Main blog
遺伝学の分野において、タンデムリピート配列の概念は、科学的に魅力的であり、実験的に挑戦的であり、技術開発の動機付けとなってきました。DNAシーケンス技術や解析ツールの進化に伴い、科学者は現在、これらの反復配列に隠された秘密を明らかにし、ヒトや他の生物の遺伝学における重要性に光を当てることができるようになりました。PacBioシーケンサーを活用することで、反復配列の性質、重要性、そしてこれまで以上に効果的な研究を可能にする方法についてご紹介します。
タンデムリピートとは何ですか?
タンデムリピートとは、2つ以上のヌクレオチドからなるDNA配列のことで、染色体上で頭から尻尾まで連続して繰り返されます。このようなDNAの繰り返し単位は、反復モチーフとも呼ばれ、1つの染色体領域内で数個の繰り返しから数百個の繰り返しまで存在します。
タンデムリピートにはどのような種類があるのですか?
ミクロ、ミニ、マクロ。ショート、バリアブル、ロング。サテライト。タンデムリピートの種類をグーグルで検索すると、ゲノムに現れるタンデムリピートの種類を表す用語が、目もくらむほどたくさん、しかもしばしば同義語で出てきます。このような用語の不統一があるにもかかわらず、このような用語の不統一があるにもかかわらず、
タンデムリピートは一般的に2つのタイプに分類することができます:
ショートタンデムリピート(STR)
マイクロサテライトまたは単純反復配列(SSR)としても知られるショートタンデムリピートは、1~6塩基対(bp)の大きさのモチーフを持つDNAのタンデムリピートの単位です1。
可変数タンデムリピート(VNTR)
ミニサテライトやマクロサテライトと呼ばれることもある可変数タンデムリピートは、7 bp以上の大きさのモチーフを持つDNAのタンデムリピートの単位です1。タンデムリピートに関する文献の中には、100 bp以上のモチーフをマクロサテライトと呼ぶ例もあります。しかし、この用法は一貫性がなく、上記の定義に従えば、それらはやはりVNTRとみなされます。
タンデムリピートの分類は、反復配列のコピー数には依存しない
これらの定義は、繰り返し単位、つまりモチーフの大きさ、そして単位の大きさだけに基づいていることを指摘しておくことが重要です。モチーフが何回繰り返されるかとは無関係です。例えば、”ACG “のような3塩基対の長さのSTRは、10,000回(合計30,000塩基対)タンデムに繰り返されてもSTRに分類されます。同様に、50塩基長で3回(合計150塩基対)だけ繰り返されるモチーフは、最初の例の配列より全体的にはずっと短くても、依然としてVNTRとみなされます。
“サテライトDNA”という用語はどこから来たのか?
DNA塩基配列決定が今日のように正確で、手頃な価格で、どこにでもあるようになる以前は、研究者は生物のゲノム構成を推測するために別の方法を用いなければならなかった。 “サテライトDNA” という用語(およびそれに関連するマイクロ、ミニ、マイクロサテライトという用語)は、密度勾配遠心分離の際にゲノムDNAの特定の画分を特徴付けたことに由来します2。20世紀半ば、研究者たちは密度勾配遠心法を用いてDNAをその浮力密度に基づいて分離しました。彼らは、ゲノムDNAを遠心分離にかけると、様々な密度を持つ明瞭なバンドが形成されることを観察しました。中には、ゲノムDNAのメインバンドから離れたサテライトバンドとして現れるものもありました。研究者たちが最終的にこれらのサテライトバンドDNAの塩基配列を決定することができたとき、現在タンデムリピートと呼ばれている様々なサイズのDNAが含まれていることを発見しました。
それより小さいものは単にSTRと呼ばれるのに、なぜ7bp以上のタンデムリピートは “可変数 “タンデムリピートとみなされるのでしょうか?VNTRはより可変的であり、それゆえにこの名前があるのでしょうか?
このトピックに関する一連の研究を見る限り、VNTRとSTRは互いにそれ以上でもそれ以下でもありません。これには、与えられたSTRまたはVNTRモチーフ内の点突然変異の頻度や、STRまたはVNTRモチーフがゲノム中で何回繰り返されるかの可変性も含まれるます。
なぜタンデムリピートが重要なのか?
タンデムリピートは主に遺伝子の非コード領域に存在するにもかかわらず、その影響力は想像以上に大きいのです。タンデムリピートはヒトゲノム全体の3%以上を占め、生物学に大きな影響を与えています3,4。実際、タンデムリピートは、50塩基対より長い構造変異の大部分を担っています5。これらのタンデムリピート領域は顕著な変異性を示し、多くの真核生物において表現型に重要な役割を果たしていることが示されています。さらに、タンデムリピートはヒトの多くの遺伝性疾患に関与していることが示されており、生物医学研究の重要なテーマとなっています4。
タンデムリピートは、様々な癌における遺伝子発現の変化と関連しており、ALS、FXS、運動失調症、自閉症スペクトラム障害、統合失調症など50以上の神経系疾患と関連しています6-10。タンデムリピートを同定し、その配列を正確に捕捉してカタログ化することは、タンデムリピートがどのように病気を引き起こすかを理解するための第一歩であり、バイオマーカーや創薬ターゲットの発見、治療薬の開発につながる可能性があります。
タンデムリピートはどのように研究されているのか?
昔の密度勾配遠心法とは異なり、今日の科学者はDNAシーケンスを用いてタンデムリピートを同定し、その複雑さを研究しています。VNTRでは、PacBio HiFiシーケンスのようなロングリード・シーケンス技術が不可欠であ。しかし、シーケンスの化学的性質だけが、これらの新しい方法論の有効性を担っているわけではありません。
タンデムリピートの研究は、TRGT(Tandem Repeat Genotyping Tool)やTRVZ(Tandem Repeat Visualization Tool)のような、PacBio HiFiシーケンサーと相乗効果を発揮するように設計された革新的なソフトウェアツールによって革命的に変化しました。このアプローチでは、従来の方法がもたらす課題を排除し、研究者に広範な(>10,000塩基対)、高精度のリード(99.9%)と、タンデムリピートの研究の複雑性に合わせた特殊な解析ツール群を提供します。
TRGT + TRVZの機能は以下の通りです:
サイズジェノタイピングとモザイク推定
中断および複数リピートのある領域を含む配列構成解析
5mC CpGメチル化コール
ハプロタイプに分離されたリードのパイルアップとメチル化ステータスの視覚的表示
HiFiシーケンスとTRGTおよびTRVZを組み合わせることで、研究者は過去の数学的ハードルを克服し、形質進化から遺伝性疾患の生物学に至るまで、遺伝学の様々な側面においてこれらの重要なゲノム領域が果たす役割に関する重要な疑問に答えることができるようになります。
TRGTの可能性を探求する準備ができているなら、今すぐGitHubにアクセスし、PacBioの科学者でありTRGTの共同開発者であるEgor Dolzhenkoによるオンデマンドプレゼンテーションで、より詳細な情報を得ることも可能です。
タンデムリピートはショートリードで解析できか?
イエスでもありノーでもあります。実行可能なロングリードシーケンス技術(HiFiシーケンスなど)が登場するまで、VNTR配列は、その反復性の規模の大きさゆえに、正確な解析において本質的に克服不可能な課題となっていました。従来のショートリードシーケンス法(合成シーケンスやSBSシーケンスなど)では、リードが不正確で短すぎることが多く、リピートの全長にまたがって正しくコールすることができないため、このような反復領域を扱うのに苦労していました。その結果、リピート配列の小さなスナップショットをつなぎ合わせ、確実にアラインメントすることは、数学的にも計算的にも難しくなります。
南カリフォルニア大学のバイオインフォマティシャンであり、タンデムリピート解析の専門家であるMark Chaissonは、VNTRをSBSで解析することの非現実性を確認しています。このトピックに関する詳細な議論については、 Chaisson 博士の従来のショートリードを用いたリピート解析の課題と、VNTR解析のためにシーケンス技術を選択する際に「長く読む」ことで利点に関する講演をご覧ください:
しかし、コピー数の少ないSTR(マイクロサテライトとも呼ばれる)を調べるには、高精度のショートリードシーケンス技術が非常に有効ではあります。
SBBシーケンスは、短いタンデムリピートを得意とする最先端のショートリード技術
STRモチーフは非常に短い(≤6 bp)ため、その研究に使用されるシーケンス技術固有のエラーが、分析から導き出される結論に劇的な影響を与える可能性があります。したがって、STRプロジェクトの結果を最大限に信頼するためには、非常に高い読み取り精度を持つDNAシーケンス技術を使用することが極めて重要となります。 Sequencing By Binding (SBB)はまさにそれです。
SBBの完全な背景については、こちらの記事をご覧いただきたい。
SBBシーケンスとは、Q40+(1万塩基に1つのエラー!)のショートリードシーケンス技術で、蛍光標識したヌクレオチドがDNA鎖上のポリメラーゼに結合(取り込まれない)する際の光シグナルを測定することで機能します。他のショートリード技術とは異なり、SBBはシークエンシングプロセスの結合ステップとその後の伸長ステップを分離することで、分子アーティファクトによってもたらされるエラーを排除し、極めて高い精度を実現しています。
タンデムリピート研究にはPacBioが最適
これまで見てきたように、タンデムリピートは遺伝学において極めて重要な役割を果たしており、ショートタンデムリピート(STR)と可変長タンデムリピート(VNTR)の両方を含み、構造変異や遺伝性疾患に大きく影響しています。TRGTやTRVZのような革新的なソフトウェアによって強化されたPacBio HiFiシーケンスの精度は、科学者がこれらの配列を研究する際に並外れた精度と信頼性を提供します。VNTRの複雑さを解明するにせよ、SBBシーケンスの緻密さをSTRに適用するにせよ、PacBioはこれらの複雑なゲノム要素を解明するために不可欠なツールを提供します。タンデムリピートデータへの包括的なアクセスが画期的な洞察と発見への道を開くPacBioシーケンスで、ゲノム研究の未来に踏み出しましょう。
References
- Sulovari A, Li R, Audano PA, et al. Human-specific tandem repeat expansion and differential gene expression during primate evolution. Proc Natl Acad Sci U S A. 2019;116(46):23243-23253. (link)
- Tautz D. Notes on the definition and nomenclature of tandemly repetitive DNA sequences. EXS. 1993;67:21-28. (link)
- Lander ES, Linton LM, Birren B, et al. Initial sequencing and analysis of the human genome. Nature. 2001;409(6822):860-921. (link)
- Usdin K. The biological effects of simple tandem repeats: lessons from the repeat expansion diseases. Genome Res. 2008;18(7):1011-1019. (link)
- Chaisson MJP, Huddleston J, Dennis MY, et al. Resolving the complexity of the human genome using single-molecule sequencing. Nature. 2015;517(7536):608-611. (link)
- Cortese A, Simone R, Sullivan R, et al. Biallelic expansion of an intronic repeat in RFC1 is a common cause of late-onset ataxia. Nat Genet. 2019;51(4):649-658. (link)
- Hunter JE, Berry-Kravis E, Hipp H, Todd PK. FMR disorders. In: Adam MP, Feldman J, Mirzaa GM, et al., eds. GeneReviews®. University of Washington, Seattle; 1993. (link)
- Mojarad BA, Engchuan W, Trost B, et al. Genome-wide tandem repeat expansions contribute to schizophrenia risk. Mol Psychiatry. 2022;27(9):3692-3698. (link)
- Siddique N, Siddique T. Amyotrophic lateral sclerosis overview. In: Adam MP, Feldman J, Mirzaa GM, et al., eds. GeneReviews®. University of Washington, Seattle; 1993. (link)
- Trost B, Engchuan W, Nguyen CM, et al. Genome-wide detection of tandem DNA repeats that are expanded in autism. Nature. 2020;586(7827):80-86. (link)
PacBioに問い合わせる