Cadena de Márkov

En la teoría de la probabilidad, se conoce como cadena de Márkov o modelo de Márkov a un tipo especial de proceso estocástico discreto en el que la probabilidad de que ocurra un evento depende solamente del evento inmediatamente anterior. Esta característica de incluir una memoria reciente recibe el nombre de propiedad de Markov en contraste con los eventos independientes que no tienen memoria de ningún evento anterior. En un primer artículo de 1906 A. A. Markov definió la "cadena simple" como "una secuencia infinita $x_{1},x_{2},...,x_{k},x_{k+1}$ de variables conectadas de tal modo que $x_{k+1}$ para cualquier $k$ es independiente de $x_{1},x_{2},...,x_{k},x_{k-1}$ , en el caso de que $x_{k}$ sea conocida”. Markov llamó a la cadena "homogénea" si la distribución condicional de $x_{k+1}$ dado $x_{k}$ fuese independiente de $k$ . También consideró cadenas "complejas (complex en inglés)" en las que "cada número está conectado directamente no sólo con uno, sino con varios números anteriores".[1]

Cadena simple biestable de Markov

Recibe su nombre del matemático ruso Andréi Márkov (1856-1922), que lo introdujo en 1906.[1]

Estos modelos estadísticos cuentan con un gran número de aplicaciones reales.

Definición

En matemáticas, una Cadena de Markov es un proceso estocástico a tiempo discreto $\{X_{n}:n=0,1,2\dots \}$ con espacio de estados discreto $S$ que para cualquier entero $n\geq 0$ y para cualesquiera $x_{0},x_{1},\dots ,x_{n+1}\in S$ satisface

P[X_{n+1}=x_{n+1}|X_{0}=x_{0},X_{1}=x_{1},\dots ,X_{n}=x_{n}]=P[X_{n+1}=x_{n+1}|X_{n}=x_{n}]

a esta propiedad se le conoce como propiedad de Markov.

Características

Cadenas homogéneas y no homogéneas

Se dice que una Cadena de Markov es homogénea si la probabilidad de ir del estado $i$ al estado $j$ en un paso no depende del tiempo en el que se encuentra la cadena, esto es:

P[X_{n+1}=j|X_{n}=i]=P[X_{1}=j|X_{0}=i]

para todo $n\geq 0$ y para cualquier $i,j\in S$ .

Si para alguna pareja de estados y para algún tiempo $n$ la propiedad antes mencionada no se cumple entonces diremos que la Cadena de Markov es no homogénea.

Probabilidades de Transición

Sean $i$ y $j$ dos estados de una Cadena de Markov. La probabilidad de ir del estado $i$ en el tiempo $n$ al estado $j$ en el tiempo $n+1$ se denota por

p_{ij}(n,n+1)=\operatorname {P} [X_{n+1}=j|X_{n}=i]

.

Cuando la cadena es homogénea, esta probabilidad se denota por

p_{ij}=\operatorname {P} [X_{n+1}=j|X_{n}=i]

,

que representa la probabilidad de pasar del estado $i$ al estado $j$ en una unidad de tiempo.

Matriz de Probabilidades de Transición

Teniendo las probabilidades de transición en un paso , $p_{ij}$ , si variamos los índices $i,j$ sobre el espacio de estados $S=\{0,1,2,\dots \}$ obtenemos la matriz $P$ llamada matriz de probabilidades de transición en un paso, es decir:

P={\begin{bmatrix}p_{00}&p_{01}&p_{02}&\cdots \\p_{10}&p_{11}&p_{12}&\cdots \\p_{20}&p_{21}&p_{22}&\cdots \\\vdots &\vdots &\vdots \end{bmatrix}}

donde la entrada $(i,j)$ representa la probabilidad de pasar del estado $i$ al estado $j$ en un paso.

La matriz $P$ es una matriz estocástica pues satisface

$p_{ij}\geq 0$
$\sum _{j\in S}p_{ij}=1$

Similarmente se define la matriz de probabilidades de transición en $n$ pasos, esta se denota por $P(n)$ y está dada por

P(n)={\begin{bmatrix}p_{00}(n)&p_{01}(n)&p_{02}(n)&\cdots \\p_{10}(n)&p_{11}(n)&p_{12}(n)&\cdots \\p_{20}(n)&p_{21}(n)&p_{22}(n)&\cdots \\\vdots &\vdots &\vdots \end{bmatrix}}

donde la entrada $(i,j)$ representa la probabilidad de pasar del estado $i$ al estado $j$ en $n$ pasos.

Ecuación de Chapman-Kolmogorov

Para cualesquiera $r,n\in \mathbb {Z}$ tales que $0\leq r\leq n$ y para cualesquiera estados $i,j\in S$ se cumple

p_{ij}(n)=\sum _{k\in S}p_{ik}(r)p_{kj}(n-r)

Como consecuencia de este resultado, la probabilidad de transición en $n$ pasos, $p_{ij}(n)$ , está dada por la entrada $(i,j)$ de la $n$ -ésima potencia de la matriz de probabilidades de transición en un paso, es decir

p_{ij}(n)=(P^{n})_{ij}

Con lo anterior, el problema de calcular las probabilidades de transición en $n$ pasos se convierte en halla la $n$ -ésima potencia de la matriz de probabilidades de transición en un paso, esto es

{\begin{aligned}P(n)&={\begin{bmatrix}p_{00}(n)&p_{01}(n)&\cdots \\p_{10}(n)&p_{11}(n)&\cdots \\\vdots &\vdots \end{bmatrix}}\\&={\begin{bmatrix}p_{00}&p_{01}&\cdots \\p_{10}&p_{11}&\cdots \\\vdots &\vdots \end{bmatrix}}^{n}\\&=P^{n}\end{aligned}}

Clases de comunicación

Para dos estados $i$ y $j$ en el espacio de estados $S$ , diremos que el estado $j$ es accesible desde el estado $i$ y escribiremos $i\rightarrow j$ si $\exists \,n\in \mathbb {Z} ^{+}$ tal que

p_{ij}(n)>0

si $i\rightarrow j$ y $j\rightarrow i$ entonces diremos que el estado $i$ se comunica con el estado $j$ y escribiremos $i\longleftrightarrow j$ .

La propiedad " $\longleftrightarrow$ " es una relación de equivalencia. Esta relación induce una partición del espacio de estados. A estas clases de equivalencia las llamaremos clases de comunicación.

Dado un estado $i\in S$ , denotaremos a su clase de comunicación como $C(i)$ , por lo que $i\longleftrightarrow j$ si y sólo si $C(i)=C(j)$ .

Si $C(i)=S$ entonces se dice que la cadena es irreducible.

Periodicidad

El periodo de un estado $i\in S$ se define como:

d(i)={\rm {mcd}}\{n\geq 1:p_{ii}(n)>0\}

donde ${\rm {mcd}}$ denota el máximo común divisor.

Si $d(i)=1$ diremos que $i$ es un estado aperiódico.
Si $d(i)=k\geq 2$ diremos que $i$ tiene periodo $k$ .

Una cadena de Márkov se dice aperiódica si todos sus estados son aperiódicos, es decir, sí $d(i)=1\quad \forall \;i\in S$ .

Tiempos de Primera Visita

Si $C\subset S$ , definimos el tiempo de primera visita a $C$ como la variable aleatoria

\tau _{C}={\begin{cases}\min\{n>0|X_{n}\in C\}&{\mbox{si }}\{n>0|X_{n}\in C\}\neq \emptyset \\1&{\mbox{si }}\{n>0|X_{n}\in C\}=\emptyset \end{cases}}

esto es, $\tau _{C}$ denota la primera vez que la cadena entra al conjunto de estados $C$ .

Probabilidad de Primera Visita

Se define

f_{ij}(n)=\operatorname {P} [X_{n}=j,X_{n-1}\neq j,\dots ,X_{1}\neq j|X_{0}=i]

como la probabilidad de que una cadena que inicia en el estado $i$ llegue al estado $j$ por primera vez en $n$ pasos, donde $f_{ij}(0)=0$ .

En particular, cuando $i=j$ , $f_{ii}(n)$ denota la probabilidad de regresar por primera vez al estado $i$ en $n$ pasos.

Y se definen

f_{ij}=\sum _{n=1}^{\infty }f_{ij}(n)

como la probabilidad de una eventual visita a partir del estado $i$ al estado $j$ y

f_{ii}=\sum _{n=1}^{\infty }f_{ii}(n)

como la probabilidad de partir del estado $i$ y regresar a él mismo en un tiempo finito.

Recurrencia

En una cadena de Markov con espacio de estados $S$ , diremos que:

$i$ es un estado recurrente si $f_{ii}=1$ .
$i$ es transitorio si $f_{ii}<1$ .

o utilizando las probabilidades de transición en $n$ pasos:

$i$ es recurrente si $\sum _{n=1}^{\infty }p_{ii}(n)=\infty$
$i$ es transitorio si $\sum _{n=1}^{\infty }p_{ii}(n)<\infty$

La recurrencia es una propiedad de clase pues

Si $i$ es recurrente e $i\longleftrightarrow j$ entonces $j$ es recurrente.
Si $i$ es transitorio e $i\longleftrightarrow j$ entonces $j$ es transitorio.

Tiempo Medio de Recurrencia

Se define como el tiempo medio de recurrencia de un estado recurrente $j$ a partir del estado $i$ como la esperanza de

\tau _{ij}=\min\{n\geq 1:X_{n}=j|X_{0}=i\}

y se denota por $\mu _{ij}$

\mu _{ij}=\operatorname {E} [\tau _{ij}]=\sum _{n=1}^{\infty }nf_{ij}(n)

,

Esta esperanza representa el número de pasos promedio que a la cadena le toma regresar al estado recurrente $j$ .

En particular, cuando $i=j$ escribimos $\mu _{i}$ en lugar de $\mu _{ij}$ .

Se dice que un estado recurrente $i$ es

recurrente nulo si $\mu _{i}=\infty$ .
recurrente positivo si $\mu _{i}<\infty$ .

La recurrencia positiva es una propiedad de clase pues

Si $i$ es recurrente positivo e $i\longleftrightarrow j$ entonces $j$ es recurrente positivo.
Si $i$ es recurrente nulo e $i\longleftrightarrow j$ entonces $j$ es recurrente nulo.

Distribuciones Estacionarias

Se dice que el vector $\pi =(\pi _{0},\pi _{1},\dots )$ es una distribución de probabilidad si

$\pi _{i}\geq 0$
$\sum _{i}\pi _{i}=1$

Se dice que una distribución de probabilidad $\pi =(\pi _{0},\pi _{1},\dots )$ es estacionaria para una Cadena de Markov con matriz de probabilidades de transición $P=(p_{ij})$ si

\pi _{j}=\sum _{i\in S}\pi _{i}p_{ij}

En forma matricial lo anterior es equivalente a $\pi =\pi P$ y significa que si una variable aleatoria inicial $X_{0}$ tiene una distribución $\pi$ entonces la distribución de $X_{n}$ también es $\pi$ , es decir, esta distribución no cambia con el paso del tiempo.

Para encontrar una posible distribución estacionaria de una cadena con matriz $P$ , un método consiste en resolver el sistema de ecuaciones

\left\{{\begin{array}{cc}\pi =\pi P\\{\text{Sujeto a:}}\\&\sum _{j\in S}\pi _{j}=1\\&\pi _{j}\geq 0\end{array}}\right.

La distribución estacionaria puede no ser única o incluso no existir.

Existencia y Unicidad

Si una Cadena de Markov es irreducible y recurrente positiva entonces tiene una única distribución estacionaria y esta está dada por

\pi _{j}={\frac {1}{\mu _{j}}}

donde $\mu _{j}$ es el tiempo medio de recurrencia del estado $j$ .

Convergencia a la distribución estacionaria

Si una cadena de Markov es

Irreducible
Aperiódica
Con distribución estacionaria $\pi$

entonces para cualesquiera $i,j\in S$

\lim _{n\to \infty }p_{ij}(n)=\pi _{j}

Convergencia para Cadenas de Markov

Si una cadena de Markov es

Irreducible
Recurrente positiva
Aperiódica

entonces las probabilidades límite

\pi _{j}=\lim _{n\to \infty }p_{ij}(n)

existen, están dadas por

\pi _{j}={\frac {1}{\mu _{j}}}

y constituyen la única solución al sistema de ecuaciones

\left\{{\begin{array}{cc}\pi =\pi P\\{\text{Sujeto a:}}\\&\sum _{j\in S}\pi _{j}=1\\&\pi _{j}\geq 0\end{array}}\right.

Tipos de Cadenas de Markov

Cadenas irreducibles

Una cadena de Markov se dice irreducible si se cumple cualquiera de las siguientes condiciones (equivalentes entre sí):

Desde cualquier estado de $S$ se puede acceder a cualquier otro.
Todos los estados se comunican entre sí.
$C(i)=S$ para algún $i\in S$ .
$C(i)=S$ para todo $i\in S$ .
El único conjunto cerrado es el total.

La cadena de Ehrenfest o la caminata aleatoria sin barreras absorbentes son ejemplos de cadenas de Márkov irreducibles.

Cadenas Recurrentes Positivas

Una cadena de Markov se dice recurrente positiva si todos sus estados son recurrentes positivos. Si la cadena es además irreducible es posible demostrar que existe un único vector de probabilidad invariante y está dado por:

\pi _{j}={\frac {1}{\mu _{j}}}

Cadenas Regulares

Una cadena de Márkov se dice regular (también primitiva o ergódica) si existe alguna potencia positiva de la matriz de transición cuyas entradas sean todas estrictamente mayores que cero.

Cuando el espacio de estados $S$ es finito, si $P$ denota la matriz de transición de la cadena se tiene que:

\lim _{n\to {\mathcal {1}}\,}P^{n}=W

donde $W$ es una matriz con todos sus renglones iguales a un mismo vector de probabilidad w, que resulta ser el vector de probabilidad invariante de la cadena. En el caso de cadenas regulares, este vector invariante es único.

Cadenas Absorbentes

Una cadena de Márkov con espacio de estados finito se dice absorbente si se cumplen las dos condiciones siguientes:

La cadena tiene al menos un estado absorbente.
De cualquier estado no absorbente se accede a algún estado absorbente.

Si denotamos como A al conjunto de todos los estados absorbentes y a su complemento como D, tenemos los siguientes resultados:

Su matriz de transición siempre se puede llevar a una de la forma

P={\begin{pmatrix}Q&R\\0&I\end{pmatrix}}

donde la submatriz Q corresponde a los estados del conjunto $D$ , $I$ es la matriz identidad, $0$ es la matriz nula y $R$ alguna submatriz.

$P_{x}(T_{A}<{\mathcal {1}}\,)=1$ , esto es, no importa en donde se encuentre la cadena, finalmente terminará en un estado absorbente.

Cadenas de Markov a tiempo continuo

Si en lugar de considerar una secuencia discreta $X_{1},X_{2},\dots ,X_{i},\dots$ con $i$ indexado en el conjunto $\mathbb {N} \;\!$ de números naturales, se consideran las variables aleatorias $X_{t}$ con $t$ que varía en un intervalo continuo del conjunto $\mathbb {R} \;\!$ de números reales, tendremos una cadena en tiempo continuo. Para este tipo de cadenas en tiempo continuo la propiedad de Márkov se expresa de la siguiente manera:

P(X(t_{n+1})=x_{n+1}|X(t_{n})=x_{n},\ldots ,X(t_{1})=x_{1})=P(X(t_{n+1})=x_{n+1}|X(t_{n})=x_{n})

tal que

t_{n+1}>t_{n}>t_{n-1}>\dots >t_{1}

Para una cadena de Márkov continua con un número finito de estados puede definirse una matriz estocástica dada por:

\mathbf {P} (t_{1},t_{2})=[p_{ij}(t_{1},t_{2})]_{i,j=1,\dots ,N},\qquad p_{ij}(t_{1},t_{2})=P[X(t_{2})=j|X(t_{1})=i],\ 0\geq t_{1}<t_{2}

La cadena se denomina homogénea si $\mathbf {P} (t_{1},t_{2})=\mathbf {P} (t_{2}-t_{1})$ . Para una cadena de Márkov en tiempo continuo homogénea y con un número finito de estados puede definirse el llamado generador infinitesimal como:[2]

\mathbf {Q} =\lim _{h\to 0^{+}}{\frac {\mathbf {P} (h)-\mathbf {I} }{h}}

Y puede demostrarse que la matriz estocástica viene dada por:

\mathbf {P} (t)=e^{\mathbf {Q} t}=\sum _{n=0}^{\infty }{\frac {\mathbf {Q} ^{n}t^{n}}{n!}}

Aplicaciones

Meteorología

Si consideramos el tiempo atmosférico de una región a través de distintos días, es posible asumir que el estado actual solo depende del último estado y no de toda la historia en sí, de modo que se pueden usar cadenas de Markov para formular modelos climatológicos básicos. Por ejemplo, se han desarrollado modelos de recurrencia de las lluvias basados en cadenas de Markov.[3]

Modelos epidemiológicos

Una importante aplicación de las cadenas de Markov se encuentra en el proceso Galton-Watson. Este es un proceso de ramificación que se puede usar, entre otras cosas, para modelar el desarrollo de una epidemia (véase modelaje matemático de epidemias).

Internet

El pagerank de una página web (usado por Google en sus motores de búsqueda) se define a través de una cadena de Markov, donde la posición que tendrá una página en el buscador será determinada por su peso en la distribución estacionaria de la cadena.

Simulación

Las cadenas de Márkov son utilizadas para proveer una solución analítica a ciertos problemas de simulación, por ejemplo en teoría de colas el Modelo M/M/1[4] es de hecho un modelo de cadenas de Markov.

Juegos de azar

Son muchos los juegos de azar que se pueden modelar a través de una cadena de Márkov. El modelo de la ruina del jugador (Gambler's ruin), que establece la probabilidad de que una persona que apuesta en un juego de azar finalmente termine sin dinero, es una de las aplicaciones de las cadenas de Márkov en este rubro.

Economía y finanzas

Las cadenas de Márkov se pueden utilizar en modelos simples de valuación de opciones para determinar cuándo existe oportunidad de arbitraje, así como en el modelo de colapsos de una bolsa de valores o para determinar la volatilidad de los precios. En los negocios, las cadenas de Márkov se han utilizado para analizar los patrones de compra de los deudores morosos, para planear las necesidades de personal y para analizar el reemplazo de equipo.

Genética

Se emplean cadenas de Márkov en teoría de genética de poblaciones, para describir el cambio de frecuencias génicas en una población pequeña con generaciones discretas, sometida a deriva genética. Ha sido empleada en la construcción del modelo de difusión de Motō Kimura.

Música

Diversos algoritmos de composición musical usan cadenas de Márkov, por ejemplo el software Csound o Max. Uno de los compositores que usó esta técnica en sus composiciones fue Iannis Xenakis con su obra Analoguique A et B (1958–59).

Operaciones

Se emplean cadenas de Márkov en inventarios, mantenimiento y flujo de proceso.

Redes neuronales

Se utilizan en las máquinas de Boltzmann.

Referencias

Basharin, Gely P.; Langville, Amy N.; Naumov, Valeriy A. (2004). «The Life and Work of A. A. Markov». Linear Algebra and its Applications (en inglés) 386: 3-26. Consultado el 31 de marzo de 2010.
Masaki Kijima, 1997, p. 175
R. Gabriel & J. Neumann (2006): A Markov chain model for daily rainfall occurrence at Tel Aviv
Masaki Kijima, 1997, pp. 287-290.

Bibliografía

A.A. Márkov. "Rasprostranenie zakona bol'shih chisel na velichiny, zavisyaschie drug ot druga". Izvestiya Fiziko-matematicheskogo obschestva pri Kazanskom universitete, 2-ya seriya, tom 15, pp. 135–156, 1906.
A.A. Markov. "Extension of the limit theorems of probability theory to a sum of variables connected in a chain". reprinted in Appendix B of: R. Howard. Dynamic Probabilistic Systems, volume 1: Markov Chains. John Wiley and Sons, 1971.
Classical Text in Translation: A. A. Markov, An Example of Statistical Investigation of the Text Eugene Onegin Concerning the Connection of Samples in Chains, trans. David Link. Science in Context 19.4 (2006): 591–600. Online: http://journals.cambridge.org/production/action/cjoGetFulltext?fulltextid=637500
Leo Breiman. Probability. Original edition published by Addison-Wesley, 1968; reprinted by Society for Industrial and Applied Mathematics, 1992. ISBN 0-89871-296-3. (See Chapter 7.)
J.L. Doob. Stochastic Processes. New York: John Wiley and Sons, 1953. ISBN 0-471-52369-0.
S. P. Meyn and R. L. Tweedie. Markov Chains and Stochastic Stability. London: Springer-Verlag, 1993. ISBN 0-387-19832-6. en línea: . Second edition to appear, Cambridge University Press, 2009.
S. P. Meyn. Control Techniques for Complex Networks. Cambridge University Press, 2007. ISBN 978-0-521-88441-9. Appendix contains abridged Meyn & Tweedie. en línea: https://web.archive.org/web/20100619011046/https://netfiles.uiuc.edu/meyn/www/spm_files/CTCN/CTCN.html
Booth, Taylor L. (1967). Sequential Machines and Automata Theory (1st edición). Nueva York: John Wiley and Sons, Inc. Library of Congress Card Catalog Number 67-25924. Extensive, wide-ranging book meant for specialists, written for both theoretical computer scientists as well as electrical engineers. With detailed explanations of state minimization techniques, FSMs, Turing machines, Markov processes, and undecidability. Excellent treatment of Markov processes pp. 449ff. Discusses Z-transforms, D transforms in their context.
Kemeny, John G.; Mirkil, Hazleton; Snell, J. Laurie; Thompson, Gerald L. (1959). Finite Mathematical Structures (1st edición). Englewood Cliffs, N.J.: Prentice-Hall, Inc. Library of Congress Card Catalog Number 59-12841. Classical text. cf Chapter 6 Finite Markov Chains pp. 384ff.
Kijima, Masaaki (1997). Markov Processes for Stochastic Modeling (1st edición). Cambridge: Chapman & Hall. ISBN 0 412 60660 7.
E. Nummelin. "General irreducible Markov chains and non-negative operators". Cambridge University Press, 1984, 2004. ISBN 0-521-60494-X

Enlaces externos

Cadenas de Markov en tiempo discreto Archivado el 31 de enero de 2010 en Wayback Machine.
Ejemplo de una Cadena de Markov en timpo discreto
Techniques to Understand Computer Simulations: Markov Chain Analysis (en inglés)
Desambiguación mediante Cadenas de Markov
Una explicación visual por Victor Powell

a

Datos: Q176645
Multimedia: Markov chains / Q176645

Este artículo ha sido escrito por Wikipedia. El texto está disponible bajo la licencia Creative Commons - Atribución - CompartirIgual. Pueden aplicarse cláusulas adicionales a los archivos multimedia.

[:0-1] Basharin, Gely P.; Langville, Amy N.; Naumov, Valeriy A. (2004). «The Life and Work of A. A. Markov». Linear Algebra and its Applications (en inglés) 386: 3-26. Consultado el 31 de marzo de 2010.

[2] Masaki Kijima, 1997, p. 175

[3] R. Gabriel & J. Neumann (2006): A Markov chain model for daily rainfall occurrence at Tel Aviv

[4] Masaki Kijima, 1997, pp. 287-290.