エピゲノミクス解析とは
エピゲノミクス解析とは、DNA配列そのものではなく、DNAやクロマチンに付加された制御情報をゲノム全体で網羅的に調べる解析です。
ゲノムが生物の持つ遺伝情報の総体であるのに対し、エピゲノムは「どの遺伝子が、どの細胞で、どのタイミングで使われやすい状態にあるか」を反映します。
代表的なエピゲノム情報には、DNAメチル化、ヒストン修飾、クロマチンアクセシビリティ、転写因子結合などがあります。
これらはDNA配列を変えずに遺伝子発現を調節する仕組みに関わります。
そのため、エピゲノミクス解析は、細胞分化、発生、がん、免疫応答、老化、環境応答など、さまざまな生命現象を理解するために利用されています。
ゲノム解析やトランスクリプトーム解析と組み合わせることで、遺伝子配列、遺伝子発現、遺伝子発現制御の関係を統合的に調べることができます。
エピゲノミクス解析でわかること
エピゲノム状態は、細胞種、発生段階、疾患状態、薬剤刺激、栄養条件、ストレス応答などによって大きく変化します。
同じゲノム配列を持つ細胞であっても、神経細胞、免疫細胞、上皮細胞、がん細胞では、使われる遺伝子やクロマチン状態が異なります。
エピゲノミクス解析では、このような細胞ごとの制御状態の違いを調べることができます。
主に解析できる内容は以下の通りです。
| 解析対象 | わかること |
|---|---|
| DNAメチル化 | 遺伝子発現抑制や細胞状態に関わるメチル化パターン |
| ヒストン修飾 | 活性化または抑制されたプロモーター、エンハンサー、クロマチン領域 |
| クロマチンアクセシビリティ | 転写因子が結合しやすい開いたクロマチン領域 |
| 転写因子結合 | 特定の転写因子がゲノム上のどこに結合しているか |
| エンハンサー活性 | 遺伝子発現を遠隔から制御する領域の活性 |
例えば、ある遺伝子の発現が上昇している場合、その原因はDNA配列の変異だけとは限りません。
プロモーターのDNAメチル化が低下している、近傍のエンハンサーが活性化している、転写因子が結合しやすいクロマチン状態になっている、といった可能性があります。
エピゲノミクス解析は、このような遺伝子発現制御の背景を調べるための重要な解析です。
エピゲノミクス解析の主な手法
DNAメチル化解析
DNAメチル化解析は、主にCpG配列におけるシトシンのメチル化状態を調べる手法です。
DNAメチル化は、プロモーター領域で遺伝子発現抑制と関連することが多く、発生、細胞分化、ゲノムインプリンティング、X染色体不活化、がんなどに関わります。
代表的な手法には、全ゲノムバイサルファイトシーケンス、RRBS、ターゲットメチル化解析、メチル化アレイなどがあります。
| 手法 | 主な対象 | 特徴 |
|---|---|---|
| WGBS | 全ゲノムのDNAメチル化 | ゲノム全体を高解像度に調べられる |
| RRBS | CpGが多い領域 | プロモーターやCpG islandを効率的に解析できる |
| targeted methyl-seq | 特定領域のDNAメチル化 | 目的領域を高深度で調べられる |
| メチル化アレイ | 既知CpG部位 | 多数サンプルの比較に向く |
ChIP-seq / CUT&RUN / CUT&Tag
ChIP-seq / CUT&RUN / CUT&Tagは、特定のヒストン修飾や転写因子がゲノム上のどこに存在するかを調べる手法です。
抗体を用いて目的のタンパク質またはヒストン修飾を含むDNA断片を回収し、シーケンスによってゲノム上の結合領域を同定します。
ヒストン修飾を対象とする場合、H3K4me3、H3K27ac、H3K27me3、H3K36me3などのマークから、プロモーター、エンハンサー、転写抑制領域、転写伸長領域などを推定できます。
転写因子を対象とする場合には、その転写因子が制御している可能性のある遺伝子群や結合モチーフを解析できます。
その中でもCUT&RUNおよびCUT&Tagは、ChIP-seqと比べて少ない細胞数で実施しやすく、背景ノイズが低いデータを得やすい場合があります。
少量サンプル、希少細胞、臨床検体などでヒストン修飾や転写因子結合を解析する際に有用です。
| ヒストン修飾 | 主な解釈 |
|---|---|
| H3K4me3 | 活性化したプロモーターと関連 |
| H3K27ac | 活性化したエンハンサーやプロモーターと関連 |
| H3K4me1 | エンハンサー領域と関連 |
| H3K27me3 | Polycombによる転写抑制領域と関連 |
| H3K9me3 | ヘテロクロマチンや反復配列抑制と関連 |
| H3K36me3 | 転写中の遺伝子領域と関連 |
ATAC-seq
ATAC-seqは、開いたクロマチン領域を調べる手法です。
Tn5トランスポザーゼがアクセスしやすいゲノム領域にアダプターを挿入し、その領域をシーケンスすることで、クロマチンアクセシビリティを測定します。
クロマチンが開いている領域は、転写因子が結合しやすく、プロモーターやエンハンサーなどの制御領域であることが多いです。
ATAC-seqは、細胞種特異的な制御領域の同定、転写因子モチーフ解析、疾患関連制御領域の探索、細胞分化に伴うクロマチン変化の解析などに利用されます。
DNase-seq
DNase-seqは、DNase Iにより切断されやすい開いたクロマチン領域を調べる手法です。
ATAC-seqと同様にクロマチンアクセシビリティを測定する方法ですが、より古くから利用されてきた手法です。
DNase hypersensitive siteは、プロモーター、エンハンサー、インスレーターなどの制御領域と対応することが多く、転写制御領域の同定に利用されます。
FAIRE-seq
FAIRE-seqは、ホルムアルデヒドで架橋したクロマチンから、ヌクレオソームが少ない開いたDNA領域を分離してシーケンスする手法です。
ATAC-seqやDNase-seqと同じく、クロマチンアクセシビリティを調べる手法の一つです。
現在ではATAC-seqが用いられることが多くなっていますが、過去の公共データや比較解析ではFAIRE-seqデータが利用されることもあります。
一細胞ATAC-seq (scATAC-seq)
scATAC-seqは、1細胞ごとのクロマチンアクセシビリティを測定する手法です。
bulk ATAC-seqでは細胞集団全体の平均的なクロマチン状態が得られますが、scATAC-seqでは細胞ごとの違いを解析できます。
細胞種同定、分化軌道推定、転写因子活性推定、希少細胞集団の検出、腫瘍内不均一性の解析などに利用されます。
一方で、1細胞あたりに得られるリード数が少ないため、データの疎性やノイズを考慮した解析が必要です。
目的別に見るエピゲノミクス解析手法の選び方
研究目的によって、適した手法は異なります。
| 研究目的 | 適した手法 |
|---|---|
| DNAメチル化状態を調べたい | WGBS / RRBS / targeted methyl-seq / メチル化アレイ |
| ヒストン修飾を調べたい | ChIP-seq / CUT&RUN / CUT&Tag |
| 転写因子結合部位を調べたい | ChIP-seq / CUT&RUN / CUT&Tag |
| 開いたクロマチン領域を調べたい | ATAC-seq / DNase-seq / FAIRE-seq |
| エンハンサーやプロモーターを推定したい | ATAC-seq / ChIP-seq / CUT&RUN / CUT&Tag |
| 細胞ごとの制御状態を調べたい | scATAC-seq / single-cell multiome |
エピゲノミクス解析の応用
エピゲノミクス解析は、基礎研究から疾患研究まで幅広く使われています。
発生生物学では、細胞分化に伴ってどの制御領域が開き、どの遺伝子が発現しやすくなるかを調べることができます。
がん研究では、腫瘍細胞におけるDNAメチル化異常、エンハンサー活性の変化、クロマチン構造の変化を解析することで、がんの発生機構や治療標的の探索に役立てられます。
免疫学では、免疫細胞の活性化や分化に伴うクロマチン状態の変化を調べることで、免疫応答や炎症性疾患の理解につながります。
神経科学では、神経細胞の分化、発達、老化、神経疾患に関わる遺伝子発現制御を解析できます。
また、エピゲノミクス解析は、ゲノム解析やトランスクリプトーム解析と組み合わせることでより有用になります。
ゲノム解析で疾患関連変異を見つけ、エピゲノミクス解析でその変異が制御領域に存在するかを調べ、トランスクリプトーム解析で遺伝子発現への影響を確認することができます。
このような統合解析により、単独の解析では見えにくい遺伝子発現制御の仕組みを明らかにできます。