Método de uniéndose de vecinos

En bioinformática, el método de unión de vecinos es un método de agrupación de abajo hacia arriba para la creación de árboles fenéticos (fenogramas), creado por Naruya Saitou y Masatoshi Nei en 1987.[1] Por lo general, se utiliza para árboles de secuencias de ADN o de proteína, para lo cual, el algoritmo requiere del conocimiento de la distancia que existe entre cada par de taxones (por ejemplo, especies o secuencias) para formar el árbol.[2]

El algoritmo

El método de "Unión de vecinos" parte de una matriz de distancias, que indica la distancia entre cada par de taxones. El algoritmo comienza con un árbol completamente sin resolver, cuya topología corresponde a la de una red en estrella, y aplica los siguientes pasos hasta que el árbol está completamente resuelto y las longitudes de sus ramas se conocen:

  1. Basándose en la matriz de distancias actual calcula la matriz (definida abajo).
  2. A continuación, busca el par de taxones para los que tiene su valor más bajo. Estos taxones se unen para formar un nuevo nodo que se une al resto del árbol. «F» y «G» se unen al árbol por el nodo nuevo «U».
  3. Se calcula la distancia desde cada uno de los taxones del par a este nodo nuevo.
  4. Se calcula la distancia desde cada uno de los taxones que no pertenecen a este nuevo par al nodo nuevo.
  5. Se ejecuta el algoritmo otra vez, sustituyendo el par de taxones recién unidos por el nodo nuevo utilizando las distancias calculadas en el paso anterior.

La matriz Q

Basado en una matriz de distancia en relación con el taxón , se calcula como sigue:

donde es la distancia entre taxones y , y es cualquier otro nodo no ni respectivamente.

Distancia de los miembros del par al nodo nuevo

Para cada vecino del par que acaba de unirse, utilice la siguiente fórmula para calcular la distancia al nodo nuevo. (Taxones y son los taxones emparejado y es el nodo recién generado):

y, por la reflexión:

Distancia de los otros taxones al nuevo nodo

Para cada taxón no analizado en el paso anterior, se calcula la distancia hasta el nodo nuevo como sigue:

donde es el nodo nuevo, es el nodo para el que se desea calcular la distancia y y son los miembros del par acaba de unirse.

Complejidad

El cálculo del método de Unión de vecinos para un conjunto de taxones requiere iteraciones. En cada paso hay que construir y buscar una matriz .

Inicialmente la matriz tiene un tamaño , de manera que el siguiente paso es , etcétera. Esto conduce a un algoritmo con una complejidad de tiempo de .


Ejemplo

Se supone que tenga cuatro taxones (A, B, C, D) y la matriz de distancias como sigue:

A B C D
A 0 7 11 14
B 7 0 6 9
C 11 6 0 7
D 14 9 7 0

Se obtenía los siguientes valores para la matriz Q:

A B C D
A 0 40 34 34
B 40 0 34 34
C 34 34 0 40
D 34 34 40 0

En el ejemplo anterior, dos pares de taxones tienen el valor más bajo de 40. Se puede seleccionar cualquiera de ellos para la segunda paso del algoritmo. Se sigue el ejemplo, en el supuesto de que unimos los taxones A y B juntos. Si indique el nodo nuevo, entonces las longitudes de las ramas de los bordes de la y de la serían, respectivamente, 6 y 1, por la fórmula anterior.

Se procede a la actualización de la matriz de distancias, calculando de acuerdo con la fórmula anterior para cada nodo . En este caso se obtiene y . La matriz de distancias resultante es:

u C D
u 0 5 8
C 5 0 7
D 8 7 0

La topología del árbol se resuelve completamente en este punto, así que Q no necesita ser calculada ni es necesario buscar nuevos nodos. Sin embargo, estas distancias pueden ser utilizadas para obtener las longitudes restantes de las 3 ramas, como se muestra en la figura.

Referencias

  1. Saitou N, Nei M. "The neighbor-joining method: a new method for reconstructing phylogenetic trees." Molecular Biology and Evolution, volumen 4, expedición 4, pp. 406-425, julio 1987.
  2. Xavier Didelot (2010). «Sequence-Based Analysis of Bacterial Population Structures». En D. Ashley Robinson, Daniel Falush, Edward J. Feil, ed. Bacterial Population Genetics in Infectious Disease. John Wiley and Sons. pp. 46-47. ISBN 978-0-470-42474-2.
Este artículo ha sido escrito por Wikipedia. El texto está disponible bajo la licencia Creative Commons - Atribución - CompartirIgual. Pueden aplicarse cláusulas adicionales a los archivos multimedia.