1 / 80

SELECCION DE “TEMPLATES” Y ALINEAMIENTO

SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía. X. Nativa. Búsqueda homólogos con estructura conocida Selección homólogos de interés (miembros más cercanos, criterios adicionales) Obtención del alineamiento de la secuencia con los homólogos Cálculo del modelo Contraste del modelo

garan
Download Presentation

SELECCION DE “TEMPLATES” Y ALINEAMIENTO

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. SELECCION DE “TEMPLATES” Y ALINEAMIENTO

  2. Energía X Nativa

  3. Búsqueda homólogos con estructura conocida • Selección homólogos de interés (miembros más cercanos, criterios adicionales) • Obtención del alineamiento de la secuencia con los homólogos • Cálculo del modelo • Contraste del modelo • Experimentación • “Feed-back” con el modelo

  4. Búsqueda de homólogos de estructura conocida

  5. SIMILITUD ENTRE SECUENCIAS INDICA SIMILITUD ENTRE ESTRUCTURAS Y FUNCION

  6. HOMOLOGIA Y COMPARACION DE SECUENCIAS SIMILITUD ENTRE SECUENCIAS HOMOLOGIA (Mismo orígen evolutivo)

  7. ALINEAMIENTO DE SECUENCIAS AGGVIIIQVG AGGVLIQVG AGGVIIIQVG AGGVL-IQVG

  8. IMPORTANCIA ALINEAMIENTO • Detección homólogos • Construcción modelo estructural

  9. Búsqueda de homólogos BASE DE DATOS DE SECUENCIAS AGLM...WTKR TCGGLMN..HICG WRKCPGL ... SECUENCIA INCOGNITA ATTVG...LMN

  10. COMPARACION SECUENCIAS • Construir alineamiento óptimo • Puntuar candidato

  11. COMPARACION DE SECUENCIAS • HOMOLOGIA ALTA: AWTRRATVHDGLMEDEFAA AWTRRATVHDGLCEDEFAA • HOMOLOGIA BAJA: AWTKLATAVVVFEGLCEDEWGG VHDGLMEDEFAA AWTRRAT

  12. Búsqueda de homólogos • PUNTUACION SECUENCIAS BASE DATOS (Proteínas estructura conocida) • LOCALIZACION CANDIDATO CON MAYOR PUNTUACION • PREDICCION FUNCIONAL/ESTRUCTURAL POR ASOCIACION/”HERENCIA”

  13. PROBLEMAS HABITUALES • Solo hay familiares remotos: • BAJA SIMILITUD DE SECUENCIA • DIFICIL TENER BUENOS ALINEAMIENTOS

  14. ALINEAMIENTO DE SECUENCIAS • OBTENER EL ALINEAMIENTO OPTIMO • NECESARIO: • METODO PARA PUNTUAR AMINOACIDOS COMPARADOS • METODO PARA CONSTRUIR LOS ALINEAMIENTOS

  15. A C D ...Y A 1 0 0 ...0 C 0 1 0 ...0 ..... Y 0 0 .....1 MATRIZ DE IDENTIDADES

  16. N + M N 10600 N = M = 1000 NUMERO TOTAL DE ALINEAMIENTOS DOS SECUENCIAS DE LONGITUD N Y M:

  17. HERRAMIENTAS BASICAS • MATRIZ COMPARACION AMINOACIDOS (Dayhoff, 1972) • ALGORITMOS DE COMPARACION DE SECUENCIAS (Needleman & Wunsch, 1970).

  18. MATRIZ DE DAYHOFF PUNTUACION DE LOS AMINOACIDOS ALINEADOS log(fij/qi.qj) fij: frecuencia de mutación de residuo i al j qi, qj: frecuencia de los residuos i, j

  19. MATRIZ DE DAYHOFF • REFLEJA LAS PROPIEDADES FISICO-QUIMICAS DE LOS AMINOACIDOS: propensidades de estructura secundaria hidrofobicidad volumen

  20. MATRICES COMPARACION SECUENCIAS • BLOSUM62 (Henikoff & Henikoff, 1992): derivada a partir de la comparación bloques de secuencias • GONNET (Gonnet et al, 1992): alineamiento masivo de secuencias

  21. R G F Q R 1 0 0 0 Y 0 0 0 0 G 0 1 0 0 Q 0 0 0 1 R G F Q R 3 1 1 0 Y 2 1 1 0 G 1 2 1 0 Q 0 0 0 1 ALGORITMO NEEDLEMAN & WUNSCH R_GFQ RYG_Q

  22. GAPS (INSERCIONES/DELECIONES) • LOCALIZADOS EN LOOPS

  23. Candidato ?

  24. GAPS (INSERCIONES/DELECIONES) • ESQUEMAS DE PUNTUACION: • DEPENDIENDO DE ESTRUCTURA 2a • VALOR CONSTANTE • FUNCION LINEAL go + n . gl

  25. PROGRAMACION DINAMICA • VENTAJAS: PROPORCIONA UN ALINEAMIENTO REPRODUCIBLE Y OPTIMO • DESVENTAJAS: ES LENTO

  26. METODOS SUBOPTIMOS • 10 – 100 MAS RAPIDOS • PROPORCIONAN ALINEAMIENTOS SUBOPTIMOS • BLAST, FASTA

  27. BLAST • BLAST (Altschul et al, 1990): • localiza pequeños fragmentos comunes • extenderlos hasta que la puntuación cae

  28. BLAST • RAPIDO, segundos EXPLORAR GENBANK, PDB • FILTROS BAJA COMPLEJIDAD • INDICES DE FIABILIDAD

  29. ESTADISTICA • INDICE DE REFERENCIA: E: número de falsos positivos esperado • Búsquedas esporádicas: 0.01 – 0.001 • Búsquedas masivas (anotación genoma) : 10-6

  30. LIMITES COMPARACION SECUENCIAS • EXISTENCIA DE PARENTESCOS INDETECTABLES • PREDICCIONES ESTRUCTURALES DE BAJA CALIDAD EN MUCHOS CASOS

  31. THE TWILIGHT ZONE • IDENTIDAD INFERIOR AL 25 % • SIMILITUD ESTRUCTURAL: HOMOLOGIA REMOTA Y ANALOGIA

  32. THE TWILIGHT ZONE • HOMOLOGIA REMOTA: ORIGEN EVOLUTIVO COMUN. E.G. HEMOGLOBINAS • ANALOGIA: CONVERGENCIA ESTRUCTURAL. E.G. HEMOGLOBINA Y COLICINA

  33. AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI GLFTAIDMHFFGRKPACEEYFTLVVDGLCNCI USO DE ALINEAMIENTOS MULTIPLES • SIMILITUD BAJA, DOS SECUENCIAS: • SIMILITUD BAJA, SECUENCIASMULTIPLES: GIFTDIDMHFYVKKPGLDEFFTLVLRTLCMAA ALTTGIDMWTTAKRPDMDDYYTIIIPGLMNCI AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI GVTTGLNMYFTARRPGLDEFYTLVLRTLCMCL GIFTDIDMHFYVKKPGLDEFFTLVLRTLCMAA AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCI GLFTALNMHFFGRKPACEEYFTLVVDGLCNCI

  34. ALINEAMIENTOS MULTIPLES • RESIDUOS CONSERVADOS: RELEVANTES PARA FUNCION O ESTRUCTURA • PUNTUACION PONDERA LA CONSERVACION

  35. PSI-BLAST • BUSQUEDA UTILIZANDO ALINEAMIENTOS MULTIPLES: • BUSQUEDA BASE DE DATOS • CONSTRUCCION POSITION-SPECIFIC SCORE • ITERAR

  36. PSI-BLAST • PSI-BLAST NO ENCUENTRA LO QUE NO HAY EN LA PRIMERA BUSQUEDA BLAST • DEFINIR E PARA LA INCLUSION DE SECUENCIAS (0.01)

  37. THREADING/FOLD RECOGNITION • ESTRATEGIA SIMILAR COMPARACION DE SECUENCIAS • USO BASE DE DATOS ESTRUCTURAL • DIFERENTE PUNTUACION CANDIDATOS

  38. CANDIDATO SELECCIONADO ATTWV....PRKSCT .......... 10.5 > .......... 5.2

  39. COMPARACION SECUENCIA-ESTRUCTURA • EVALUAR “EL GRADO DE AJUSTE DE LA SECUENCIA A LA ESTRUCTURA” • UTILIZAR PROPIEDADES DIVERSAS: DISTANCIAS INTERRESIDUO, ESTRUCTURA SECUNDARIA, ETC

  40. Selección templates: uso información adicional 1YTS, 2HNQ: TIROSINA-FOSFATASA ................ Proyecto: 2HNQ ....HYTTWPDFGVP... CANDIDATO: 1YTS ....HVGNWPDQTAV... Proyecto: 2HNQ .....HCSAGIGRS... CANDIDATO: 1YTS .....HSRAGVGRT...

  41. SELECCION “TEMPLATES” • Varios candidatos, similitudes bajas (30% - 35 %) • Bibliografía: sólo SSAO en H.Polymorpha y E.coli con TPQ en orientación correcta (modelos previos erróneos).

  42. RESTRICCIONES CENTRO ACTIVO

  43. SELECCION “TEMPLATES” • Preferible X-ray sobre NMR • Uso información experimental (e.g. centro activo) • Preferible sin ligandos unidos, o generar dos modelos • Vigilar la presencia de contactos en el cristal • Preferible nativo sobre mutante

  44. EL ALINEAMIENTO

  45. ALINEAMIENTOS • SECUENCIA - CANDIDATO • Entre candidatos estructurales

  46. ALINEAMIENTO ENTRE CANDIDATOS • Alineamientos estructurales, ya disponibles (HOMSTRAD), mediante software (SAP, Taylor & Orengo, 1989). • Mejor pocos candidatos estructurales, y similares

  47. ALINEAMIENTO TEMPLATES

More Related