DECEMBER 19, 2023 | SEQUENCING 101
シーケンシング入門:構造変異
< Return to Japan blog | < Return to Main blog
この50年間、遺伝学と生物学において多くの記念碑的業績が私たちの目の前で展開されてきました。DNAシーケンス技術の発明から、ヒトゲノム・プロジェクトの完了、そしてゲノム医療の出現に至るまで、私たちは生命の基本的な設計図に対する理解において、多くの知的・技術的飛躍を遂げてきました。しかし、知識が深まるにつれて、ゲノムにはまだ多くの秘密が隠されているという事実に対する理解も深まってきました。まだまだ多くのことがらが、解明されるのを待っているのです。遺伝学とゲノミクスの分野は、これまで隠されていた謎の解明が構造変異の理解にかかっているという、変革の時代の入り口に立っています。そして今、ようやく適切なツールと技術が利用できるようになり、構造変異を研究し理解する能力はかつてないほど向上しています。
構造変異とは何か?
SVと略される構造変異とは、DNA配列における個体間の差異、または変異のことで、その大きさはわずか50塩基対から100万塩基対を超えるものまであります。
1977年にDNA塩基配列の解読が始まって以来、遺伝学とゲノミクスの焦点は一塩基対の違い、すなわち一塩基変異(SNV)に置かれてきたと言えます。ヒトゲノムの99.9%は同一であるとか、ヒトとチンパンジーのゲノムは99%同じ遺伝物質を共有しているといった主張は、この「一塩基変異観」に基づいています1,2。一方、構造変異はもっと広い網を張っています。これらのゲノム変異は、逆位、平衡転座、挿入・欠失など、壮大なスケールの多様な遺伝的変化を包含しています。後者の2つは、コピー数多型(CNV)として知られるゲノムの不均衡につながる可能性があります。CNVとは、遺伝子やDNAセグメントのコピー数が個体間で異なるDNA領域のことです。このようなCNVが集団の1%以上に存在する場合、copy number polymorphism(CNP)とみなされます3。
しかし、構造変異の重要性は、現在わかっていることをはるかに超えています。この発展途上の研究状況において、課題となっていることは、構造変異の範囲を明らかにし、完全に理解することと、これらの多様な遺伝的変化を日常的にジェノタイピングすることにあります。構造変異は遺伝学における新たなフロンティアであり、ヒトの病気や複雑な形質から生命そのものの進化や多様化に至るまで、広範なトピックの理解に及ぼす影響を探る入り口を提供するものです。
構造変異にはどのような種類があるのか?
構造変異は多面的な現象であり、ゲノムにおける多様なタイプの変化を包含します。以下は最もよく知られているタイプの構造変異です。:
- 挿入: ゲノム上に新しい塩基が追加され、新規の配列が導入される
- 欠失: 遺伝コードの一部が欠失または削除され、DNAシーケンスが変化する
- 重複: 特定のDNAセグメントが複製され、類似の遺伝物質が複数コピーされる
- 逆位: 遺伝子領域が反転または逆さになり、塩基の順序が変わる
- 転座: DNA配列が異なる染色体間で交換され、遺伝物質の新しい組み合わせが生じる
- コピー数多型(CNV): ゲノムのコピー数が個体間で異なる領域で、ゲノムの不均衡を引き起こす
このような構造変異は共に、遺伝的多様性のグランド・アーキテクトであり、地球上の生命の複雑さ、豊かさ、多様性に寄与していると考えられています。また、ヒトの様々な遺伝性疾患の根本原因ともなりうるため、生物医学研究においてもその重要性が強調されています。
なぜ構造変異は重要なのか?
構造変異の研究は、遺伝学とゲノミクスにおけるエキサイティングな領域であり、ヒトの健康、農業、そして生物学の基本的な理解に対して、潜在的に広範囲な影響を及ぼします。これらの実質的なゲノム変化には、欠失、重複、挿入、逆位、転座が含まれ、しばしばDNAの獲得、喪失、再配列の複雑な組み合わせが編成されます。おそらく驚くことではありませんが、集団内に存在する遺伝的変異の多くがゲノムの構造レベルに存在するという証拠が増えつつあります4, 5。
構造変異が表現型に及ぼす影響
SVの最も興味深い側面の一つは、生物の表現型に観察可能な影響を及ぼす能力です。SVは遺伝子機能を破壊したり変化させたり、遺伝子制御機構を変更したり、さらには遺伝子量を再調整したりすることが示されています6。複数の研究により、集団や種にまたがって機能的変化を促すSVの極めて重要な役割に、スポットライトが当てられています2,7。同様に、SVの規模でのCAG配列の伸長は、ハンチントン病に関係している9。さらに、TAF1遺伝子内へのレトロトランスポゾンの挿入は、ジストニア・パーキンソン病の前段階に関連しています10。癌の文脈では、遺伝子の欠失や再配列、遺伝子の増幅、遺伝子の融合、遺伝子調節エレメントの入れ替えなど、様々なSVが原因として同定されています11, 12, 13。
ヒトにおけるメンデル遺伝性疾患および植物における構造変異の影響
メンデル遺伝学において、SVが遺伝子領域内の欠失や重複に関連する様々な疾患に大きな影響を与えることが証明されつつあります。例えば、ARID1B(Coffin-Siris症候群と関連)やCDKL5(早期小児てんかん性脳症とRett様特徴と関連)などの遺伝子に影響を及ぼす複雑なSVが観察されています14。これらの構造変異の影響により、重度の知的障害が生じます。もちろん、ほとんどのSVはヒトにとって厳密には劇症ではないようです。Nature誌に掲載されたヒトY染色体のパンゲノム解析から、Y染色体の大きさは個体によって2倍近く異なることが明らかになりました。さらに重要なことは、この解析で観察された塩基置換の量の低さから、Y染色体の変異のほとんどが構造的なものであることが示唆されたことです15。
植物学研究もSVの重要性を明らかにするのに役立っており、SVは表現型の形成に極めて重要な役割を果たしていることが示されています。SVは不利な条件に対する耐性を付与し、作物の収量や品質にプラスの影響を与えます。例えば、SVはトウモロコシのアルミニウム耐性、オオムギのホウ素毒性耐性、雑草のグリホサート耐性に関連している。
SVの重要性がますます認識されるようになっているにもかかわらず、特にSNVと比較して、SVはあまり研究されていません。SVを研究する上での主な課題は、ゲノム内のパターンが大きく、しばしば複雑に入り組んでいることや、ゲノム内の反復配列と関連していることから、SVを同定することが難しいことに起因している。この複雑さは、異なるタイプのSVが作りうる類似のパターンに加えて、配列決定やマッピングのエラーによってさらに複雑になっています。さらに、重複、入れ子になったSVが存在すると、ゲノムの景観がさらに不明瞭になります。しかし、PacBio HiFiシーケンスのようなハイスループットで高精度のロングリードシーケンス技術の登場により、SV研究は非常に容易になってきています。
HiFiシーケンスは構造変異に隠された答えを探索する機会を提供する
HiFiシーケンスはSV研究に革命をもたらし、この分野に新たな息吹を吹き込みました。ロングリード(最大20 kb)かつ非常に高精度(Q30+)なリードを生成する能力により、研究者にとってSVの検出と解析が格段に身近で効率的になりました。この画期的なロングリード技術は、Kinnexの全長トランスクリプトミクスを含む補完的なアプローチにも使用することができ、代替スプライシングやRNA融合を検出することで機能的なSVを同定することができます。
私たちは今、構造変異を検出し、理解する能力において重大な局面を迎えています。洞察力と想像力は、常に人類の技術革新を前進させてきました。しかし、技術の進歩こそが洞察力と想像力を可能にし、未知の領域に深く踏み込むことができるのです。その能力が進化するにつれて、生物学、遺伝学、疾病においてSVが果たす役割がより明確に理解されるようになります。ベンチマークと品質管理基準の開発における継続的な努力は、SVの同定精度を向上させています。拡大する検出方法とその重要性の理解を深めることで、われわれは構造変異の隠された多くの側面と、それが生物界に与える大きな影響を明らかにすることができるのです。
References
- The 1000 Genomes Project Consortium. A global reference for human genetic variation. Nature 526, 68–74 (2015). https://doi.org/10.1038/nature15393
- Zev N. Kronenberg et al. High-resolution comparative analysis of great ape genomes. Science 360, eaar6343(2018). DOI:1126/science. aar6343
- Eichler, E. E.(2008) Copy Number Variation and Human Disease. Nature Education 1(3):1
- Peter Ebert et al. Haplotype-resolved diverse human genomes and integrated analysis of structural variation. Science372, eabf7117(2021). DOI:1126/science.abf7117
- Liao, WW., Asri, M., Ebler, J.et al. A draft human pangenome reference. Nature 617, 312–324 (2023). https://doi.org/10.1038/s41586-023-05896-x
- Collins, R.L., Brand, H., Karczewski, K.J.et al. A structural variation reference for medical and population genetics. Nature 581, 444–451 (2020). https://doi.org/10.1038/s41586-020-2287-8
- Jeffares, D., Jolly, C., Hoti, M.et al. Transient structural variations have strong effects on quantitative traits and reproductive isolation in fission yeast. Nat Commun 8, 14061 (2017). https://doi.org/10.1038/ncomms14061
- Schüle, B., McFarland, K.N., Lee, K.et al. Parkinson’s disease associated with pure ATXN10 repeat expansion. npj Parkinson’s Disease 3, 27 (2017). https://doi.org/10.1038/s41531-017-0029-x
- McColgan, P. and Tabrizi, S.J. (2018), Huntington’s disease: a clinical review. Eur J Neurol, 25: 24-34.https://doi.org/10.1111/ene.13413
- Bragg DC, Mangkalaphiban K, Vaine CA, et al. Disease onset in X-linked dystonia-parkinsonism correlates with expansion of a hexameric repeat within an SVA retrotransposon inTAF1 [published correction appears in Proc Natl Acad Sci U S A. 2020 Mar 17;117(11):6277]. Proc Natl Acad Sci U S A. 2017;114(51):E11020-E11028. doi:10.1073/pnas.1712526114
- Stransky, N., Cerami, E., Schalm, S.et al. The landscape of kinase fusions in cancer. Nat Commun 5, 4846 (2014). https://doi.org/10.1038/ncomms5846
- Yi, K., Ju, Y.S. Patterns and mechanisms of structural variations in human cancer.Exp Mol Med 50, 1–11 (2018). https://doi.org/10.1038/s12276-018-0112-3
- Mahmoud, M., Gobet, N., Cruz-Dávalos, D.I.et al. Structural variant calling: the long and the short of it. Genome Biol 20, 246 (2019). https://doi.org/10.1186/s13059-019-1828-7
- Sanchis-Juan, A., Stephens, J., French, C.E.et al. Complex structural variants in Mendelian disorders: identification and breakpoint resolution using short- and long-read genome sequencing. Genome Med 10, 95 (2018). https://doi.org/10.1186/s13073-018-0606-6
- Hallast, P., Ebert, P., Loftus, M.et al. Assembly of 43 human Y chromosomes reveals extensive complexity and variation. Nature 621, 355–364 (2023). https://doi.org/10.1038/s41586-023-06425-6
- Maron LG, Guimarães CT, Kirst M, et al. Aluminum tolerance in maize is associated with higher MATE1 gene copy number. Proc Natl Acad Sci U S A. 2013;110(13):5241-5246. doi:10.1073/pnas.1220766110
- Tim Sutton et al. Boron-Toxicity Tolerance in Barley Arising from Efflux Transporter Amplification.Science 318,1446-1449(2007). DOI:1126/science.1146853
- Gaines TA, Zhang W, Wang D, et al. Gene amplification confers glyphosate resistance in Amaranthus palmeri. Proc Natl Acad Sci U S A. 2010;107(3):1029-1034. doi:10.1073/pnas.0906649107
- Soyk, S., Lemmon, Z.H., Sedlazeck, F.J.et al. Duplication of a domestication locus neutralized a cryptic variant that caused a breeding barrier in tomato. Plants 5, 471–479 (2019). https://doi.org/10.1038/s41477-019-0422-z
PacBioに問い合わせる