Árbol 2-3

En las ciencias de la computación, los árboles-2-3 son estructuras de datos de árbol que se encuentran comúnmente en las implementaciones de bases de datos y sistemas de archivos. Los árboles 2-3 mantienen los datos ordenados y las inserciones y eliminaciones se realizan en tiempo logarítmico amortizado.

Definición

Son un tipo de árbol balanceado por altura (height balanced). Se define como un árbol en dónde todos los nodos no-terminales tienen 2 o 3 descendientes y todos los nodos hoja tienen la misma longitud (path length) o distancia desde la raíz.

Fueron introducidos con el objetivo de mejorar el tiempo de acceso en estructuras de datos manejados en memoria secundaria, donde el número de consultas a un registro influye de manera determinante en el tiempo de respuesta de la operación.

La estructura de árbol 2-3 exige que el crecimiento no se haga a nivel de las hojas (aunque la inserción sigue siendo en las hojas), sino a nivel de la raíz, ya que todas las hojas se deben mantener siempre en el mismo nivel. El proceso global de inserción comienza por localizar la hoja en la cual se debe agregar el elemento.

Propiedades

Un árbol 2-3 permite que un nodo tenga dos o tres hijos. Esta característica le permite conservar el balanceo tras insertar o borrar elementos, por lo que el algoritmo de búsqueda es casi tan rápido como en un árbol de búsqueda de altura mínima. Por otro lado, es mucho más fácil de mantenerlo.

En un árbol 2-3, los nodos internos han de tener 2 ò 3 hijos y todas las hojas han de estar al mismo nivel. De forma recursiva se pueden definir como:

A es un árbol 2-3 de altura h si:

  • A es un árbol vacío (un árbol 2-3 de altura 0), o
  • A es de la forma (r, I, D), donde r es un nodo e I y D son árboles 2-3 de altura h − 1, o
  • A es de la forma (r, I, C, D), donde r es un nodo e I, C y D son árboles 2-3 de altura h-1.

Para usar estos árboles de forma eficiente en las búsquedas, hay que introducir un orden entre los elementos por lo que un árbol A es un árbol 2-3 de búsqueda de altura h si:

  • Todos los elementos de I son menores que r y todos los elementos de D son mayores que r.
  • A es de la forma (r1, r2,I, C, D), donde r1 _ r2, I, Ac y D son árboles 2-3 de búsqueda de altura h-1 y todos los elementos de I son menores que r1, todos los elementos de C son mayores que r1 y menores que r2 y todos los elementos de D son mayores que r2.

Esta definición implica que el número de hijos de un nodo es siempre uno más que el número de elementos que contiene ese nodo. En el caso de las hojas se permiten uno o dos elementos en el nodo. Desde ahora nos referiremos a los árboles 2-3 de búsqueda simplemente como árboles 2-3.

La especificación del tipo ARBOL23 es muy similar a la de otros árboles con una diferencia que es la definición de tres operaciones generadoras en lugar de dos. arbolVacìo es la operación que genera un árbol sin elementos, como en los otros tipos y hay una operación, consArbol, que genera un árbol 2-3 cuya raíz tiene un solo elemento y dos hijos y otra, cons3Arbol, que genera un árbol 2-3 cuya raíz tiene dos elementos y tres hijos. Estas dos últimas operaciones son los generadores que se mantienen ocultos al usuario.

Inserción

A la hora de insertar un nuevo dato en un árbol 2-3 se hace de forma que se mantenga el equilibrio en el árbol. La capacidad de tener uno o dos elementos en cada nodo ayuda a conseguirlo.

Pseudo código de inserción en un árbol 2-3

Si el árbol está vacío
  Entonces crea un nuevo nodo y colocar el en el lado izquierdo del nodo.
Si ya hay un elemento y existe espacio en el nodo hacer 
  Si r1 es menos que el elemento 
    Entonces el elemento 0 se coloca a la derecha.
  Sino 
    Si r1 es mayor que el elemento entonces el elemento se coloca del lado izquierdo y r1 del lado derecho.
Sino 
    Si el nodo esta lleno se parte en dos nodos del mismo nivel, se crea un nuevo nodo
y se reparten los tres elementos (dos elementos del nodo y el nuevo elemento)

Ejemplos

A continuación se ofrecen ejemplos concretos para ilustrar el mecanismo de inserción:

Especificación en C tipos

   tipo_elmto = registro
        clave:tipo_clave; 
        {los demás campos necesarios} 
    freg; 
tipos_nodo = (hoja, interior); 
nodo_dos_tres = 
     registro
       clase:tipos_nodo; 
       selección
          clase=hoja:(elmto:tipo_elmto); 
          clase=interior:(primer_hijo,segundo_hijo, tercer_hijo: diccionario; 
                                   menor_de_segundo, menor_de_tercero:tipo_clave) 
       fsel
     freg
diccionario = ↑nodo_dos_tres 

Inserción

algoritmo inserta1(e/s nodo:diccionario; 
              ent x:tipo_elmto; {x se insertará en el subárbol de nodo} 
              sal pt_nuevo:diccionario; 
                 {puntero al nodo recién creado a la derecha de nodo} 
sal menor:tipo_clave) {elmto más pequeño del subárbol al que apunta pt_nuevo} 

programa principal :

principal
     pt_nuevo:=nil; 
     si nodo es una hoja entonces
        si x no es el elmto que está en nodo entonces
            crea un nodo nuevo apuntado por pt_nuevo; 
            pone x en el nodo nuevo; 
            menor:=x.clave 
        fsi
     sino {nodo es un nodo interno} 
        sea w el hijo de nodo a cuyo subárbol pertenece x; 
        inserta1(w, x,pt_atrás,menor_atrás); 
        si pt_atrás≠nil entonces
           inserta el puntero pt_atrás entre los hijos de nodo justo a la derecha de w; 
           si nodo tiene cuatro hijos entonces
               crea un nodo nuevo apuntado por pt_nuevo; 
               da al nuevo nodo los hijos 3º y 4º de nodo; 
               ajusta menor_de_segundo y menor_de_tercero en nodo y el nodo nuevo; 
               coloca menor como la menor clave entre los hijos del nodo nuevo  
           fsi
        fsi
     fsi
fin

Código en Maude :

eq insertar (E, arbolVacio) = consArbol (E, arbolVacio, arbolVacio) .
eq insertar (E, consArbol(E2, arbolVacio, arbolVacio)) =
      if E < E2 then
         cons3Arbol(E, E2, arbolVacio, arbolVacio, arbolVacio)
      else
         cons3Arbol(E2, E, arbolVacio, arbolVacio, arbolVacio)
      fi .
eq insertar (E, cons3Arbol(E2, E3, arbolVacio, arbolVacio, arbolVacio)) =
         consArbol (medio(E, E2, E3), consArbol (mínimo(E, E2), arbolVacio, arbolVacio),
         consArbol (máximo(E, E3), arbolVacio, arbolVacio)) .
eq insertar (E, consArbol(E2, I, D)) =
      if E < E2 then
         equilibrar (consArbol(E2, insertar (E, I), D))
     else
         equilibrar (consArbol(E2, I, insertar (E, D)))
     fi .
eq insertar (E, cons3Arbol(E2, E3, I, C, D)) =
     if E < E2 then
         equilibrar(cons3Arbol(E2, E3, insertar (E, I), C, D))
     else
         if E < E3 then
            equilibrar(cons3Arbol(E2, E3, I, insertar (E, C), D))
         else
            equilibrar(cons3Arbol(E2, E3, I, C, insertar (E, D)))
         fi
   fi .

Ejemplo de eliminar :

Vamos a eliminar 65 de este árbol, 65 es un nodo interno, por lo que hay que dejarlo en la base.

65 se encuentra ahora en una ubicación no válida, lo vamos a eliminar

Ahora haremos lo mismo para eliminar 70 que es un nodo interno

70 se encuentra ahora en una ubicación no válida, porque vamos a eliminarlo

La eliminación de la hoja nos deja con un 2-3 árbol no valido

Combinar para fijar los nodos del árbol

ahora eliminamos,100 es hoja ya se puede quitar

Árbol 2-3-4

Definición

Como una forma de eliminarlas búsquedas exhaustivas de los árboles binarios existen los árboles 2-3-4. Estos son árboles en cuyos nodos se permite tener más de una clave al mismo tiempo. Los árboles binarios tienen máximo 2 hijos (derecho e izquierdo). Si se le permite al nodo tener 2 valores, este podrá tener 3 ligas a subárboles y uno con 3 valores podrá tener 4 ligas. Un árbol con estas características puede contener entonces nodos con 2, 3 o 4 ligas, de ahí que se les llama árboles 2-3-4. En los árboles 2-3-4 todos los subárboles tienen la misma altura y están siempre balanceados. Estos árboles son muy atractivos para el almacenamiento y recuperación de claves, sin embargo son un tanto complicados de implementar. Operaciones básicas:

  • Búsqueda (similar a los árboles multicamino de búsqueda)
  • Inserción (se realiza en las hojas. Se pueden producir reestructuraciones del árbol)
  • Borrado (se realiza en las hojas. Se pueden producir reestructuraciones del árbol)


Propiedades

  • En un árbol 2-3-4 de altura h tenemos:

2h - 1 elementos si todos los nodos son del tipo 2-nodo 4h - 1 elementos si todos los nodos son del tipo 4-nodo por lo que la altura de un árbol 2-3-4 con n elementos se encuentra entre los límites: log4 (n+1) y log2 (n+1)

  • Las reestructuraciones se realizan desde la raíz hacia las hojas

Inserción

Existen 3 situaciones en las que se puede encontrar un 4-nodo:

Es la raíz de un árbol 2-3-4:(DIVIDERAIZ (p))

Su padre (q) es un 2-nodo(DIVIDEHIJODE2 (p, q) )

Su padre (q) es un 3-nodo:(DIVIDEHIJODE3 (p, q) )

Algoritmo de inserción

ALGORITMO insertar (A: TArb234, y: item)
 VAR p, q: TNodo234*; noencontrado: Boolean; B: TArb234; FVAR
         p = A.farb; q = p;
         si EsVacío( A ) entonces A = ENRAIZAR (A, y, B)
         sino
            si p es 4-nodo entonces DIVIDERAIZ( A ) fsi
            noencontrado = VERDADERO;
            mientras noencontrado hacer
               si p es 4-nodo entonces
                   si q es 2-nodo entonces DIVIDEHIJODE2( p, q );
                   sino DIVIDEHIJODE3( p, q ); fsi
                   p = q;
               fsi
               caso de COMPARAR( y, p ):
                 0:// Clave de y coincide con clave en p
                    ERROR, ETIQUETA EXISTENTE;
                 1:// p apunta a un nodo hoja
                    PONER( y, p ); noencontrado = FALSO;
                 2:// clave( y ) < ItemIz.clave( p )
                    q = p; p = p -> HiIz;
                 3:// ItemIz.clave (p)<clave (y)<ItemMe.clave (p)
                    q = p; p = p -> HiMeIz;
                 4://ItemMe.clave (p)<clave (y)<ItemDe.clave (p)
                    q = p; p = p-> HiMeDe;
                 5:// clave (y) > ItemDe.clave (p)
                    q = p; p = p -> HiDe;
               fcaso
            fmientras
         fsi
fin

Ejemplo de insertar:

Borrar

  • Se reduce al borrado de un elemento en una hoja
  • En el movimiento de búsqueda, cuando pasemos a un nodo en el siguiente nivel, éste nodo debe ser 3-nodo ó 4-nodo; si no es así (es 2-nodo) hay que reestructurar.

p = nodo donde estamos q = siguiente nodo en la búsqueda r = uno de los nodos adyacentes a q (si hay dos adyacentes, escogemos r según criterio –hermano de la izquierda o hermano de la derecha–)

  • Casos:
    • . p es una hoja: p sólo puede ser 2-nodo si es la raíz
    • . q es 3-nodo ó 4-nodo: la búsqueda continúa en q sin reestructurar.
    • . q es 2-nodo y r es 2-nodo.

Enlaces de interés

Este artículo ha sido escrito por Wikipedia. El texto está disponible bajo la licencia Creative Commons - Atribución - CompartirIgual. Pueden aplicarse cláusulas adicionales a los archivos multimedia.