220 likes | 309 Views
Performance de anotação automática com grupos de ortólogos KOG. Se vc conhece os grupos de ortólogos de MO E vc pode conhecer a anotação correta de ESTs de um MO Um experimento pode ser feito! Mas… vc tem que conhecer o cutoff para o alinhamento de uma EST com a sua proteína cognata
E N D
Performance de anotação automáticacom grupos de ortólogos KOG • Se vc conhece os grupos de ortólogos de MO • E vc pode conhecer a anotação correta de ESTs de um MO • Um experimento pode ser feito! • Mas… vc tem que conhecer o cutoff para o alinhamento de uma EST com a sua proteína cognata • (parece simples mas não é)
Seqüências de pUC reunidas por 82% de similaridade equivalem a 96% de identidade .93 82%
Os cutoffs se aproximam de 80% de similaridadepara alinhamentos EST-proteina correta 80% PROTEINA 78% 78% 84% EST 84%
O teste de anotação hsa dme KOG ath cel BLAST Cutoff 78% Assigned ESTs to desired KOGs dme ESTs
Elimine o KOG para um organismo por vez(transforme-o em um transcriptoma novo) hsa dme KOG ath cel BLAST • correct: same KOG • changed: distinct KOG • speculated: not assigned dme ESTs
correct especulated changed A especulação minimiza com o cutoff apropriado de “designação”
1,8% 1,2% 5,1% 5,5% 1,6% 2,4% 3,0% 5,2% 96,3% 89,3% 96,7% 91,9% A anotação correta é maior que 90% correct changed especulated
Picturing Discovering Quantas ESTs eu preciso para descobrir oKOG todo?(com ou sem o organismo cognato na base)
Por categoria funcional C. elegans picturing sampling D. melanogaster
Schistosoma mansoni KOG category
Sumarizando • 80% (EST-aa) equivale a cutoff de 96% (EST-nt) usado no UniGene • Anotação com KOG é acima de 90% correta • Clusters KOG de S. mansoni não foram completamente descobertos • Alguns podem estar faltando…
Níveis de expressão e amostragemem bibliotecas de EST • A chance de descobrir um gene dependerá • Da ocorrência • Da conservação • Ambos podem ser estimados em Organismos Modelo
KOG clusters ath cel dme hsa N Sampling athESTs {N} Conservation Computando amostragem e conservaçãode ESTs usando organismos modelo
Genes muito expressos são mais compartilhados que os pouco expressos
Resumindo • K-EST sugere a chance de descobrir um gene com quantidades crescentes de ESTs • Mostra o nível de variação da expressão entre as várias bibliotecas usando estatística de Steckel “R” • Amostragem conjugada a conservação, em organismos modelo, pode indicar ausência de genes