Clustal
Clustal es un programa de computadora ampliamente utilizado para realizar alineamientos múltiples de secuencias.[1] La última versión es la 2.0.12 (2009), cuya principal novedad es que fue completamente reescrita en C++.[2] Hay dos variantes:
- ClustalW: interfaz de línea de comandos
- ClustalX: esta versión tiene una interfaz gráfica. Está disponible para Unix/Linux, Mac OS y Windows.[3]
Clustal | ||
---|---|---|
Información general | ||
Tipo de programa | software libre | |
Autor | Desmond G. Higgins | |
Desarrollador | Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (University College Dublin) | |
Licencia | Libre para uso académico | |
Información técnica | ||
Programado en | C++ | |
Enlaces | ||
El programa está disponible en European Bioinformatics Institute ftp server o en www.clustal.org.
Entrada/Salida
Este programa acepta un amplio rango de formatos de entrada. Incluyendo NBRF/PIR, FASTA, EMBL/Swissprot, Clustal, GCC/MSF, GCG9 RSF y GDE.
El formato de salida puede ser alguno de los siguientes: Clustal, NBRF/PIR, GCG/MSF, PHYLIP, GDE o NEXUS.
Alineamiento múltiple de secuencias
Hay tres etapas importantes:
- Hacer un alineamiento por pares
- Crear un árbol filogenético (o usar un árbol definido por el usuario)
- Usar el árbol filogenético para llevar a cabo el alineamiento múltiple
Esto es hecho automáticamente cuando seleccionas "Do Complete Alignment" ("Hacer el alineamiento completo", en español). Otras opciones son "Do Alignment from guide tree" ("Hacer el alienamiento con el árbol guía") y "Produce guide tree only" ("Sólo producir el árbol guía).
Alineamientos de perfiles
Los alineamientos de parejas son computados con un método todos contra todos y las similitudes son guardadas en una matriz. Esta es luego convertida en una matriz de distancias, donde la longitud de la distancia refleja la distancia evolutiva entre cada par de secuencias.
De esta matriz de distancias, es creado un árbol de guía o filogenético utilizando un algoritmo de clustering neighbour-joining para determinar el orden en que los pares de secuencias serán alineados y combinados con alineamientos previos. Las secuencias son alineadas progresivamente en cada punto de ramificación empezando por los pares de secuencias más cercanos.
Configuraciones
Los usuarios pueden alinear las secuencias usando las configuraciones por defecto, pero ocasionalmente es más útil personalizar los parámetros. Los principales parámetros son la penalización por abrir huecos ("gaps") y por extenderlos.
Versión acelerada
Una versión basada en FPGA del algoritmo ClustalW es ofrecida por Progeniq, mostrando ser 20 veces más veloz que otras implementaciones.
Referencias
- Chenna, Ramu; Sugawara, Hideaki; Koike, Tadashi; Lopez, Rodrigo; Gibson, Toby J.; Higgins, Desmond G.; Thompson, Julie D. (1 de julio de 2003). «Multiple sequence alignment with the Clustal series of programs». Nucleic Acids Research 31 (13): 3497-3500. ISSN 1362-4962. PMID 12824352. doi:10.1093/nar/gkg500. Consultado el 14 de julio de 2023.
- Larkin, M. A.; Blackshields, G.; Brown, N. P.; Chenna, R.; McGettigan, P. A.; McWilliam, H.; Valentin, F.; Wallace, I. M. et al. (1 de noviembre de 2007). «Clustal W and Clustal X version 2.0». Bioinformatics (Oxford, England) 23 (21): 2947-2948. ISSN 1367-4811. PMID 17846036. doi:10.1093/bioinformatics/btm404. Consultado el 14 de julio de 2023.
- Thompson, J. D.; Gibson, T. J.; Plewniak, F.; Jeanmougin, F.; Higgins, D. G. (15 de diciembre de 1997). «The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools». Nucleic Acids Research 25 (24): 4876-4882. ISSN 0305-1048. PMID 9396791. doi:10.1093/nar/25.24.4876. Consultado el 14 de julio de 2023.
Enlaces externos
- ClustalW y ClustalX (descarga gratuita para Unix/Linux, Mac OS y Windows)
- "White Paper - Accelerating Intensive Applications at 10x-50x Speedup to Remove Bottlenecks in Computational Workflows". Progeniq Pte Ltd.