El problema de la probabilidad conjunta
Consideremos tres variables \(X\), \(Y\), \(Z\) de las que conocemos sus funciones de probabilidad marginales \(P_X\), \(P_Y\) y \(P_Z\) y las funciones de probabilidad conjunta por pares \(P_{X,Y}\), \(P_{X,Z}\) y \(P_{Y,Z}\). ¿Existe entonces al menos una función de probabilidad conjunta \(P_{X,Y,Z}\)? La respuesta es no y existe un contraejemplo sencillo:
Consideremos las funciones de probabilidad \(P_{X,Y}\), \(P_{X,Z}\), \(P_{Y,Z}\) sobre el espacio muestral \((\{-1,1\}, \mathcal{P}(\{-,1\}^2))\) dados por: \[ P_{X,Y}(x,y) = \begin{cases}\frac{1}{2} & \text{ si }x=y \\0 & \text{ en caso contrario}\end{cases} \] \[ P_{Y,Z}(y,z) = \begin{cases}\frac{1}{2} & \text{ si }y=z \\0 & \text{ en caso contrario}\end{cases} \] \[ P_{X,Z}(x,z) = \begin{cases}\frac{1}{2} & \text{ si }x \neq z \\0 & \text{ en caso contrario}\end{cases} \]
Supongamos que existe una función de probabilidad \(P\) en \((\{-1,1\}^3, \mathcal{P}(\{-1,1\}^3))\) tal que sus probabilidades marginales sean \(P_{X,Y}\), \(P_{X,Z}\) y \(P_{Y,Z}\)? Esto es:
\[ P_{X,Y}(x,y) = P(x,y,-1) + P(x,y,-1) \] \[ P_{Y,Z}(y,z) = P(-1,y,z) + P(-1,y,z) \] \[ P_{X,Z}(x,z) = P(x,-1,z) + P(x,-1,z) \]
Ahora bien, observando ciertos valores de \((x,y,z)\) tenemos las siguientes ecuaciones:
\[ P_{X,Z}(-1,-1) = 0 = P(-1,-1,-1) + P(-1,1,-1) \] \[ P_{X,Y}(-1,1) = 0 = P(-1,1,-1) + P(-1,1,1) \] \[ P_{Y,Z}(-1,1) = 0 = P(-1,-1,1) + P(1,-1,1) \] \[ P_{X,Y}(1,-1) = 0 = P(1,-1,-1) + P(1,-1,1) \] \[ P_{Y,Z}(1,-1) = 0 = P(-1,1,-1) + P(1,1,-1) \] \[ P_{X,Z}(1,1) = 0 = P(1,-1,1) + P(1,1,1) \]
Como \(P\) debe ser positivo, se deduce \(P(x,y,z)=0\) para todo \((x,y,z) \in \{-1,1\}^3\). Hemos llegado entonces a un absurdo, pues \(P\) no puede ser función de probabilidad si es constante \(0\).
Que no existe función de probabilidad conjunta significa entonces que no podemos ver las tres variables \(X\), \(Y\), \(Z\) como variables de un único espacio de probabilidad \((\{-1,1\}, \mathcal{P}(\{-1,1\}), P)\).
La desigualdad de Bell
La desigualdad de Bell fue derivada por Bell para mostrar la imposibilidad de una que explicara los resultados predichos por la teoría cuántica. Para el caso, no vamos a entrar a definir lo que es una variable oculta, pero no está muy alejado plantearlo como la probabilidad conjunta de la sección anterior. La desigualdad en sí se puede expresar por:
\[ |E[S_1S_2] - E[S_1S_3]| \leq 1 - E[S_2S_3] \]
donde \(S_1, S_2, S_3\) son tres variables aleatorias en un espacio de probabilidad \((\{-1,1\}, \mathcal{P}(\{-1,1\}), P)\) y \(E[\cdot]\) es la esperanza de una variable aleatoria. La demostración es sencilla:
\[\begin{align*} |E[S_1S_2] - E[S_1S_3]| & = |E[S_1S_2 - S_1S_3]| \\ & = |E[(S_2-S_3)S_1]| \\ & = |E[(S_2-S_3)S_2^2S_1]| && \text{ pues }S_i^2\ \forall i\\ & = |E[(1-S_2S_3)S_2S_1]| && \text{ de nuevo por }S_2^2=1\\ & \leq E[|(1-S_2S_3)||S_2S_1|] \\ & \leq E[|(1-S_2S_3)|] && \text{ pues }|S_2S_1|\leq 1 \\ & = E[(1-S_2S_3)] && \text{ pues }1-S_2S_3\text{ es positivo} \\ & = 1-E[S_2S_3] \end{align*}\]
Así pues, la desigualdad de Bell es una consecuencia del hecho de que las tres variables estén definidas sobre el mismo espacio de probabilidad. La desigualdad de Bell es entonces una condición necesaria para la existencia de una probabilidad conjunta.
Veamos que nuestro ejemplo con \(X\), \(Y\), \(Z\) no cumple la desigualdad de Bell:
\[ E[XY] = (-1)^2\cdot P_{X,Y}(-1,-1) + 1^2\cdot P_{X,Y}(1,1) = 1 \] \[ E[YZ] = (-1)^2\cdot P_{Y,Z}(-1,-1) + 1^2\cdot P_{Y,Z}(1,1) = 1 \] \[ E[XZ] = (-1)\cdot P_{X,Y}(-1,1) + (-1)\cdot P_{X,Y}(1,-1) = -1 \]
Por lo tanto:
\[ |E[XY]-E[XZ]| = 2 \not\leq 1 - E[YZ] = 0 \] Obsérvese que lo podemos interpretar como una violación de transitividad de la covarianza entre las variables. Como \(X\), \(Y\), \(Z\) tienen media \(0\), la esperanza de \(E[XY]\) es la covarianza de \(X\) e \(Y\). Lo que tenemos entonces es que \(X\) está perfectamente correlacionado con \(Y\) e \(Y\) está perfectamente correlacionado con \(Z\), pero \(X\) está inversamente correlacionado con \(Z\), cuando por transitividad esperaríamos que \(X\) debería estar correlacionado positivamente con \(Z\).
Como nota final al post, véase que para probar que no existía una función de probabilidad conjunta, úsabamos que la función de probabilidad si existiera sería positiva. Si admitimos probabilidad con valores negativos o incluso si usamos probabilidad sobre un cuerpo de números \(p\)-ádicos, deja de tener validez lo aquí visto.
Más información aquí y en la sección de referencias: https://ncatlab.org/nlab/show/Bell’s+inequality.