1 / 62

SOFTWARE PER LO SVILUPPO DI MAPPE FISICHE

DiMI. SOFTWARE PER LO SVILUPPO DI MAPPE FISICHE. Università degli Studi di Udine Istituto agrario San Michele all’Adige. Simone Scalabrin. Studente di dottorato in Informatica www.dimi.uniud.it/scalabri. MAPPA FISICA. Insieme di contig

Download Presentation

SOFTWARE PER LO SVILUPPO DI MAPPE FISICHE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. DiMI SOFTWARE PER LO SVILUPPO DI MAPPE FISICHE Università degli Studi di Udine Istituto agrario San Michele all’Adige Simone Scalabrin Studente di dottorato in Informaticawww.dimi.uniud.it/scalabri

  2. MAPPA FISICA • Insieme di contig • Ogni contig è un insieme ordinato di frammenti di DNA parzialmente sovrapposti • Minimal tiling path

  3. Librerie di cloni BAC, copertura del genoma pari a 7-30x, inserti sono prodotti con diversi insiemi di enzimi di restrizione A B Clone BAC C Digestione Comparazione a coppie Assemblaggio a stringenza alta Separazione Rilevamento Dimensionam 20,000 bp 10,000 bp 4,000 bp 2,000 bp 1,200 bp 800 bp E D Verifica & Allineamento Riassemblaggio manuale con stringenza bassa Meyers, Scalabrin, Morgante 2004 Nature Reviews Genetics

  4. COME SI COSTRUISCE UNA MAPPA FISICA • Serie di cloni genomici parzialmente sovrapposti • Identificazione delle sovrapposizioni 1043_A23 1096_G08

  5. Clone BAC B Digestione Separazione Rilevamento Dimensionamento 20,000 bp 10,000 bp 4,000 bp 2,000 bp 1,200 bp 800 bp

  6. IDENTIFICAZIONEDISOVRAPPOSIZIONI Fingerprinting EcoRI

  7. IDENTIFICAZIONEDISOVRAPPOSIZIONI Fingerprinting

  8. IDENTIFICAZIONEDISOVRAPPOSIZIONI Fingerprinting

  9. IDENTIFICAZIONEDISOVRAPPOSIZIONI Fingerprinting

  10. Scelta degli enzimi • Numero di frammenti prodotti • Distribuzione delle bande prodotte • Composizione del genoma • Costo degli enzimi

  11. ENZIMI A BLUNT END 5’AATGCATAGTACACATGTACTACAGATACGTACACAT 3’ 3’TTACGTATCATGTGTACATGATGTCTATGCATGTGTA 5’ Estremità piatte

  12. TAGLIO BLUNT END 5’AATGCATAGT 3’ 5’ACACAT 3’ 3’TTACGTATCA 5’ 3’TGTGTA 5’ 5’ACACATGTACTACAGATACGT 3’ 3’TGTGTACATGATGTCTATGCA 5’

  13. ENZIMI A STICKY END 5’ACTGAATGCATACTTAAGACATAGAGT 3’ 3’TGACTTACGTATGAATTCTGTATCTCA 5’ Estremità appiccicose

  14. TAGLIO STICKY END 5’ACTGAATGCATACT 3’ 5’TAAGACATAGAGT 3’ 3’TGACTTACGTATGAAT 5’ 3’TCTGTATCTCA 5’

  15. IL FINGERPRINTING FLUORESCENTE 5’ACTGAATGCATACTT 3’ 3’TGACTTACGTATGAAT 5’ Marcatura fluorescente Colori differenti

  16. C Comparazione a coppie Assemblaggio a stringenza alta

  17. LA LOGICA DEL FINGERPRINTING A B Frammenti di uguale dimensione nel pattern di digestione Possibile sovrapposizione

  18. PROBLEMI NEL CONFRONTO TRA FINGERPRINT • Dimensionamentodei frammenti • Falsi positivi (caso, bande doppie) • Falsi negativi (eterozigosi, bande mancanti)

  19. TECNICHE DI FINGERPRINTING • Gel d’agarosio • Dimensionamento poco preciso 1. Digestione semplice 2. Digestione e marca- tura radioattiva • Gel di poliacrilammide • Dimensionamento più preciso • Gel di poliacrilammide • Dimensionamento più preciso • Meno falsi positivi grazie ai colori 3. Digestione e marca- tura fluorescente

  20. FALSO POSITIVO TECNICHE DI FINGERPRINTING A B A B Digestione e marcatura fluorescente Digestione semplice

  21. IL FINGERPRINTING FLUORESCENTE • Un enzima frequent cutter che produce estremità piatte • 4 enzimi che producono estremità appiccicose • Reazioni di estensione della singola basecon ddNTP fluoresceinati • Elettroforesi su poliacrilammide

  22. L’ANALISI DEI DATI SOFTWARE ATTIVITA’ Elettrocromatogrammi ABI Prism 3730 Individuazione dei picchi GeneMapper Rimozione background e bande vettore Script in PERL Genoprofiler Costruzione contig FPC

  23. Picco elettroforetico ELETTROCROMATOGRAMMI (fsa)

  24. ELETTROCROMATOGRAMMI

  25. INDIVIDUAZIONE DEI PICCHI Tabella in formato testo (GeneMapper)

  26. ELETTROCROMATOGRAMMI Composizione per colore: • Almeno 200 picchi • 30 – 50 bande vere • Altezza minima (livello minimo di background)

  27. Eletrocromatogrammi → testo • Dividere in colori • Massima sensibilità (FPC tratta 0-60000) • 4 colori → 4 zone 50 500 50 500 50 500 50 500 0 15000 30000 45000 60000

  28. Eletrocromatogrammi → testo 1028_B10 14 1526,7 1739,1 5867,4 6664,5 7170,6 7319,1 16500,0 18532,8 20370,9 20919,6 21139,5 22703,7 24783,3 50414,1 BLU VERDE ROSSO

  29. LA RIMOZIONE DEL BACKGROUND Bande vere Background

  30. Rimozione del rumore

  31. f(avg) LA RIMOZIONE DEL BACKGROUND 1

  32. Genoprofiler 1.10 http://wheat.pw.usda.gov/PhysicalMapping/tools/genoprofiler/genoprofiler.html

  33. f(ratio) LA RIMOZIONE DEL BACKGROUND 2 Scalabrin e Morgante

  34. UA UA UL UL fine LL LL LA LA LA RIMOZIONE DEL BACKGROUND 3 IG = UA1 – LA1 UL = UA – 0,3 * IG LL = LA + 0,15 * IG Scalabrin e Morgante Script in Perl

  35. LA COSTRUZIONE DEI CONTIG

  36. FPC 8.1 http://www.agcol.arizona.edu/software/fpc/ - FingerPrinted Contigs - 2 passi per assemblare i cloni in contigs: 1) Clustering: basato sul numero delle bande condivise 2) Ordinamento: trova la soluzione migliore che massimizzi le sovrapposizioni Due parametri chiave Tolerance = scarto accettato Cutoff: probabilità che il match tra due cloni sia dovuto puramente al caso (e non sia una vera sovrapposizione) Cutoff più basso → maggior stringenza

  37. Confronto tra due cloni • Sulston cutoff score Dove nL e nH sono il numero minimo e massimo di bande per i due cloni ed M è il numero minimo di bande condivise,p=(1-b)nH, b=2t/gellen, t è la tolleranza, gellen è la lunghezza del gel. t t 0 gellen b rappresenta la probabilità che una banda di un clone faccia il match con una banda dell’altro clone. p rappresenta la probabilità che nessuna delle nH bande del clone “più grande” facciano il match con una data banda del clone “più piccolo”.

  38. Mapping BACs within contigs

  39. CB Maps FPC prova a ordinare cloni basandosi su Consensus Bands Clone order Clone name Bands Extra bands + = shared band o = missing band x = 2 tolerance bin

  40. Cloni Q • numero sufficiente di bande per entrare in un contig • molte bande extra • non bene nella mappa 4 Tipi di Qs 1) Fingerprint di scarsa qualità 2) Clone in posizione errata - sequenza ripetuta 3) Soluzione non ottimale 4) Diversità allelica

  41. D Riassemblaggio semi-manuale a stringenza bassa

  42. E Verifica e allineamento

  43. Collegamento fra mappa fisica e genetica, considerazioni • Quanti contig ci aspettiamo di ottenere nella mappa fisica iniziale? • 1 per cromosoma!!! • Dipende dal genoma in questione • Ogni contig deve essere collegato alla mappa genetica • 1 marker per contig fornisce la posizione • 2 marker per contig forniscono anche l’orientamento

  44. RINGRAZIAMENTI • Prof. Michele Morgante • Dott. Riccardo Velasco • Dott. Marco Moroldo • Prof. Alberto Policriti • Dott. Giacomo Prete • Dott.sa Raffaella Marconi • P.Ch. Nicoletta Felice • Dott. Massimo Pindo • Dott.sa Michela Troggio • Dott.sa Cinzia Segala • Dott. Paolo Fontana

  45. APPENDICE

  46. LETTERATURA • Mapping and sequencing complex genomes: Let’s get physical!, Meyers, Scalabrin, Morgante, Nature Reviews Genetics, 2004 • FPC: a system for building contigs from restriction fingerprinted clones, Soderlund, Longden, Mott, 1997 • DNA markers in plant improvement: an overview, Kumar, 1999 • Nucleotide and aplotype diversity in wine cultivars of Grape, Prete, Cattonaro, Morgante, 2003

  47. L’IMPATTO DELL’ETEROZIGOSI 1200 CBu 2200 CBu 50% frammenti condivisi 50% frammenti condivisi e 4 cloni di tipo B mancanti

  48. Descrizione del processo A B B A C N. campioni 1600 1600 1600 1600 1600 • Giorno 1: precoltura cellulare • Giorno 2: coltura cellulare • Giorno 3: isolamento DNA • Giorno 4: frammentazione DNA • Giorno 5: marcatura DNA e separazione su sequenziatore Tutte 5 fasi avvengono simultaneamente 8000 campioni DNA diversi processati settimanalmente 3 persone

  49. Informatica

  50. Robotica

More Related