DNase-Seq
Le DNase-seq (séquençage des sites hypersensibles à la DNase I) est une méthode utilisée en biologie moléculaire pour identifier et localiser des régions régulatrices, à partir du sequençage à haut débit des régions sensibles au clivage par la DNase I[1],[2],[3]. Le FAIRE-Seq est un successeur du DNase-seq pour l'identification des régions d'ADN accessibles à l'échelle du génome. Ces deux protocoles, dédiés à l'identification de régions chromatiniennes ouvertes, sont sujets à certains biais dus aux structures nucléosomales sous-jascentes. Par exemple, le FAIRE-seq fournit un nombre de reads supérieur dans les régions régulatrices non-promotrices[4]. Cependant, le signal DNase-seq est supérieur aux régions promotrices, et il a été montré que le DNase-seq possède une sensibilité supérieure au FAIRE-seq et ce même aux régions régulatrices non-promotrices[4]. L'analyse bioinformatique de base des données générées par le biais du DNase-Seq est similaire à celle du Chip-Seq.
Identification d'empreintes génomiques à partir du DNase-Seq (DNase-Seq Footprinting)
Le DNase-seq requiert certaines analyses bioinformatiques de manière à identifier des empreintes génomiques à l'échelle du génome. Le principe y reste le même, à savoir l'identification de zones de protection du clivage par la DNase-I au sein de régions chromatiniennes accessibles, ce qui implique la présence de protéines liées à l'ADN à un endroit donné du génome. Cette information peut être utilisée pour inférer la fixation de facteurs de transcription à un site donné. Les outils informatiques déjà développés peuvent être divisés en deux classes : les approches segmentation-basées et les approches site-centrées. Les méthodes segmentation-basées utilisent des chaînes de Markov ou fenêtres glissantes pour segmenter le génome en régions chromatiniennes ouvertes ou fermées. Des exemples de telles méthodes sont HINT[5], la méthode Boyle[6] et la méthode Neph[7]. L'analyse des séquences correspondant à des empreintes génomiques permet d'identifier un ou des facteurs de transcription se liant potentiellement à ces sites, selon la présence de motifs d'ADN spécifiques leur correspondant (à partir d'informations telles que les Matrices poids-position). Les méthodes site-centrées, quant à elles, identifient des empreintes génomiques à partir de profils de chromatine accessible autour de motifs correspondant à des sites potentiels de fixation de facteurs de transcription, c'est-à-dire des régions régulatrices prédites à partir d'informations d'interactions potentielles ADN-protéine. CENTIPEDE[8] et la méthode Cuellar-Partida [9] sont des exemples de telles méthodes.
Notes et références
- AP Boyle, Davis S, Shulha HP, Meltzer P, Margulies EH, Weng Z, Furey TS et Crawford GE, « High-resolution mapping and characterization of open chromatin across the genome », Cell, vol. 132, no 2, , p. 311–22 (PMID 18243105, PMCID 2669738, DOI 10.1016/j.cell.2007.12.014)
- GE Crawford, Holt, IE, Whittle, J, Webb, BD, Tai, D, Davis, S, Margulies, EH, Chen, Y, Bernat, JA, Ginsburg, D, Zhou, D, Luo, S, Vasicek, TJ, Daly, MJ, Wolfsberg, TG et Collins, FS, « Genome-wide mapping of DNase hypersensitive sites using massively parallel signature sequencing (MPSS). », Genome Research, vol. 3, no 1, , p. 230 (PMID 16344561, PMCID 1356136, DOI 10.1101/gr.4074106)
- P Madrigal et Krajewski, P, « Current bioinformatic approaches to identify DNase I hypersensitive sites and genomic footprints from DNase-seq data. », Front Genet, vol. 16, no 1, , p. 123–31 (PMID 23118738, PMCID 3484326, DOI 10.3389/fgene.2012.00230)
- Vibhor Kumar Prabhakar S., Rayan NA, Kraus P, Lufkin T et Ng HH, « Uniform, optimal signal processing of mapped deep-sequencing data. », Nature Biotechnology, vol. 31, no 7, , p. 615–22 (PMID 23770639, DOI 10.1038/nbt.2596)
- EG Gusmao, Dieterich, C, Zenke, M et Costa, IG, « Detection of Active Transcription Factor Binding Sites with the Combination of DNase Hypersensitivity and Histone Modifications. », Bioinformatics, vol. 30, no 22, , p. 3143–51 (PMID 25086003, DOI 10.1093/bioinformatics/btu519)
- AP Boyle et al., « High-resolution genome-wide in vivo footprinting of diverse transcription factors in human cells. », Genome Research, vol. 21, no 3, , p. 456–464 (PMID 21106903, PMCID 3044859, DOI 10.1101/gr.112656.110)
- S Neph et al., « An expansive human regulatory lexicon encoded in transcription factor footprints. », Nature, vol. 489, no 7414, , p. 83–90 (PMID 22955618, DOI 10.1038/nature11212)
- R Pique-Regi et al., « Accurate inference of transcription factor binding from DNA sequence and chromatin accessibility data. », Genome Research, vol. 21, no 3, , p. 447–455 (PMID 21106904, PMCID 3044858, DOI 10.1101/gr.112623.110)
- G Cuellar-Partida et al., « Epigenetic priors for identifying active transcription factor binding sites. », Bioinformatics, vol. 28, no 1, , p. 56–62 (PMID 22072382, PMCID 3244768, DOI 10.1093/bioinformatics/btr614)
Liens externes
- Analyse d'emprientes génomiques à partir de donnés DNase-Seq avec R/Bioconductor (anglais)
- HINT : Tutoriel de détection d'empreintes génomiques avec HINE (anglais).
- Site web de CENTIPEDE (anglais)