Merck
ホームDNAシーケンシングChIC/CUT&RUNデータ解析ツール よくある質問(FAQ)

ChIC/CUT&RUNデータ解析ツール よくある質問(FAQ)

どのようなファイル形式のシーケンスリードが使用できますか?

イルミナ社プラットフォームのFASTQ(fastq.gz)フォーマットのシーケンスリードを使用できます。複数のFASTQファイルをtar.gzまたは.zip形式で圧縮し、ツールにアップロードすることもできます。

シングルエンドシーケンスまたはペアエンドシーケンスが適しています。

ヒト、マウス、ラットのゲノムリファレンスが利用できます。

本データ解析ツールではNarrow PeakまたはBroad Peakを選択することができます。

FastQC品質評価ツールを使用して、シーケンスデータ(生リードデータ)のQCを行います。このツールはさまざまな文献で幅広く利用されており、FASTQファイルの品質評価に関してサイエンスコミュニティで広く受容されています。その品質評価は、リードの個々の塩基のシーケンス品質に基づいて行われ、その結果に従ってレポートが作成されます。詳細についてはhttps://www.bioinformatics.babraham.ac.uk/projects/fastqc/をご覧ください。

  • 本データ解析ツールでは、replicateの有無に基づいて複数のアルゴリズムが使用されています。単一サンプルには、Peak CallにMACS2ツールを使用しています。Model-based Analysis of ChIP-Seq(MACS)は、ChIP-seqデータにより全ゲノムでの転写/クロマチン因子の結合またはヒストン修飾の位置を特定する計算アルゴリズムです。MACSは、4つのステップで構成されています:冗長なリードの削除、リード位置の調整、ピークエンリッチメントの計算、経験的false discovery rateの推定。詳細についてはhttps://www.nature.com/articles/nprot.2012.101をご覧ください。
  • 2つのreplicateがあるサンプルの場合、本データ解析ツールでは個々のreplicateのPeak CallにMACS2を使用し、全replicateでのPeak Callの一致については、Irreproducible Discovery Rate(IDR)を用います。IDRにより、ハイスループット試験のreplicate間の一致性を評価します。 また、本解析ツールは各replicateのピーク間のスコアランキングの再現性を用いて、有意性を示す最適なカットオフも決定します。
  • Mixture Model Clustering(JAMM)は、replicateで一致がみられるPeak Callを得るために使用します。詳細については、https://academic.oup.com/bioinformatics/article/31/1/48/2365061をご参照ください。

転写因子の結合位置を特定するときにNarrow Peakを使用し、ヒストン修飾の調査をするときにBroad Peakを使用することをお勧めします。

本データ解析ツールでは、バーコードなしのサンプルもバーコードありのサンプルも解析できます。「Peak Call & annotation」ページで「Un-Barcoded samples(バーコードなしのサンプル)」または「Barcoded samples(バーコードありのサンプル)」を選択してください。

単一サンプルの場合も複数replicateサンプルの場合も対応できるようにデザイン・構成されています。お客様が、いずれかのワークフローを選択して、データ解析を実行することができます。

お客様のサンプル(単一または複数replicateかなど)や解析方法に従って、次のような複数のレポートを作成することができ、ダウンロードすることが可能です。

  1. IGVによるピークとアラインメントの視覚化
    Integrative Genomics Viewer(IGV)によって、ユーザーはリファレンスゲノムに対するピークの位置とリードのアラインメントを把握することができます。Replicateなしのサンプルの解析では、ピークとアラインメントは別々のトラックに表示されます。Replicateありのサンプルの解析では、一致のみられるPeak Callのピークと、個々のreplicateのアラインメントが別々のトラックに表示されます。最終のトラックには、現在表示されているゲノムの位置に遺伝子アノテーションが記載されます。
  2. ピークレポート
    ピークレポートには、染色体番号、特定ピークの開始位置と終了位置、およびそれに対応する各ピーク関連の統計学的評価値が記載されます。複数のreplicateを使用して解析が行われた場合、ピークレポートには、すべてのreplicateを考慮に入れて得られる、一致がみられるピークの報告が示されます。 
  3. 遺伝子に対するピーク分布
    このレポートには、転写開始位置周辺および遺伝子構造全体における凝集したピーク分布が示されます。
  4. GO解析
    このレポートには、特定されたピークについてenrichmentが認められたGene Ontology(GO)termが示されます。Peak Callによって特定された各ピークには、個別遺伝子についてのアノテーションが付与され、その遺伝子リストはGO enrichment解析に使用されます。表示結果には、特定されたGO termそれぞれと関連する統計量を記載するカラムも含まれます。
  5. パスウェイ解析
    このタブには、特定されたピークについてenrichmentが認められたパスウェイ解析が示されます。Peak Callによって特定された各ピークには、個別遺伝子についてのアノテーションが付与され、この遺伝子リストはパスウェイenrichment解析に使用されます。表示結果には、特定されたパスウェイそれぞれと関連する統計量を記載するカラムも含まれます。 
  6. ベン図
    Replicateを用いた解析では、一致が見られるピークとともに、replicate間で重複するピーク数をベン図により視覚化します。各replicateのピーク領域には、遺伝子についてのアノテーションが付与され、この遺伝子リストがベン図プロットに使用されます。

ChIC/CUT&RUNキットを購入されたお客様は、キットのパッケージに記載されている説明書の手順に従って、データ解析ツールに無料でアクセスできます。データ解析ツールの概要はこちらからご覧いただけます。

ChIC/CUT&RUNデータ解析ツールには、こちらからアクセスしてください。お客様の注文IDは、出荷伝票または受注確認書に記載されています。カスタマーサービスへ電話でお問い合わせいただいても確認できます。

関連製品

ログインして続行

続きを確認するには、ログインするか、新規登録が必要です。

アカウントをお持ちではありませんか?