Глава 6: Спектральные свойства цепей Маркова
В этой главе мы сосредоточимся на цепях Маркова с конечным числом состояний, так что линейный оператор \(P\) может быть просто представлен матрицей, и мы можем использовать некоторые известные спектральные свойства конечномерных линейных операторов. Мы видели, что \(P\mathbf{1}=\mathbf{1}\), то есть собственное значение \(1\) принадлежит спектру \(P\). И действительно, \(P\) также допускает левый собственный вектор, инвариантная вероятность \(m\) такая, что \(mP=m\).
Теорема 1 (Теорема Перрона-Фробениуса для стохастических матриц) Пусть \(P\) — матрица переходных вероятностей цепи Маркова с конечным пространством состояний \(S\). Тогда:
- Постоянная функция \(\mathbf{1}\) (рассматриваемая как вектор со всеми элементами, равными \(1\)) является собственным вектором с собственным значением \(\lambda_0=1\). Любая инвариантная вероятность является левым собственным вектором матрицы \(P\) с положительными компонентами, ассоциированным с тем же собственным значением.
- Любое собственное значение \(\lambda \in \mathrm{Spec}(P)\) удовлетворяет \(|\lambda|\le 1\).
Предположим теперь, что цепь неприводима.
- Собственное значение \(\lambda_0=1\) простое, и поэтому соответствующий левый собственный вектор является с точностью до постоянного множителя единственной инвариантной вероятностной мерой \(m\). Все компоненты \(m\) строго положительны.
Предположим теперь, что цепь также апериодична.
- Все остальные собственные значения \(\lambda\) матрицы \(P\) удовлетворяют \(|\lambda|<1\).
Доказательство.
- следует непосредственно из \(\sum_y p_{x,y}=1\) для всех \(x\in S\), что означает \(P \mathbf{1}=1 \,\mathbf{1}\). Аналогично \(mP=1\,m\) для любой инвариантной вероятности \(m\).
- Пусть \(\lambda\in \mathrm{Spec}(P)\) — произвольное собственное значение и \(v\) — соответствующий собственный вектор (возможно, с комплексными компонентами), \(Pv=\lambda v\). Для \(t\ge 0\) имеем \(P^t v= \lambda^t v\) и поэтому (мы рассматриваем произвольное \(t\) для дальнейшего использования этого неравенства, иначе мы могли бы просто взять \(t=1\) здесь) \[ |\lambda^t v_x |= |(P^{t}v)_x| = \left| \sum_{y\in S} p^{(t)}_{x,y} v_y \right| \le \sum_{y\in S} p^{(t)}_{x,y} \sup_{z} |v_z| = \sup_{z} |v_z| \tag{1}\] Оптимизируя по \(x\) получаем \(|\lambda^t| \sup_x |v_x| \le \sup_{z} |v_z|\), то есть \(|\lambda|\le 1\), так как \(v\neq 0\). Иными словами, спектральный радиус \(P\) равен \(1\).
- Зафиксируем собственный вектор \(v\), ассоциированный с собственным значением \(\lambda_0=1\). Выберем \(x\) такое, что \(|v_x|=\sup_{z}|v_z|\), и нормируем собственный вектор так, чтобы \(v_x=1\). Тогда имеем для каждого \(x\in S\) \[ 1= v_x = (P^t v)_x = \sum_{y \in S}p^{(t)}_{x,y} v_y \le \sup_z |v_z| =1 \tag{2}\] Таким образом, все неравенства обращаются в равенства, поэтому \(v_y=v_x=1\) всякий раз, когда \(p^{(t)}_{x,y}>0\). Но цепь неприводима, поэтому для каждого \(y\in S\) существует некоторое \(t\ge 0\), для которого это выполняется, и значит \(v=\mathbf{1}\).
- Зафиксируем теперь собственный вектор \(v\), ассоциированный с собственным значением \(|\lambda|=1\). Как и в п. c., мы можем нормировать \(v\) так, чтобы \(v_x=\sup_z |v_z|=1\). Мы хотим доказать (предполагая неприводимость и апериодичность), что \(v=\mathbf{1}\), в частности \(\lambda=1\). Последнее неравенство в п. b. дает, для \(|\lambda|=1\), \(1 \le \sup_{z} |v_z|=1\), поэтому все неравенства в Уравнение 1 становятся равенствами. Но тогда, всякий раз когда \(p^{(t)}_{x,y},p^{(t)}_{x,z}>0\), имеем \(v_y=v_x\). Поскольку цепь апериодична и неприводима, для достаточно большого \(t\) все переходные вероятности строго положительны, и поэтому \(v_y=v_x=1\) для всех \(y\in S\).
Теорема Перрона-Фробениуса предоставляет мощный альтернативный способ понять сходимость к стационарному распределению. Если \(P\) диагонализуема, мы можем записать её спектральное разложение. Для любого начального распределения \(\pi\) распределение в момент времени \(t\) равно \(\pi P^t\). Теорема подразумевает, что при \(t\to\infty\) слагаемые, ассоциированные с собственными значениями \(|\lambda|<1\), экспоненциально быстро стремятся к нулю, оставляя только проекцию на стационарное распределение.
Экспоненциальная сходимость для цепей с конечным числом состояний
Мы видели, что для неприводимых положительно-возвратных апериодических цепей закон \(X_t\) сходится к инвариантной мере при \(t\to \infty\). В частности, это имеет место для неприводимых конечных (следовательно, положительно-возвратных) апериодических цепей. Для конечных цепей, однако, мы можем получить более точный результат о сходимости. Следующее предложение показывает, что если \(\lambda_1\) — собственное значение (отличное от \(\lambda_0=1\)) матрицы \(P\) с наибольшим абсолютным значением, то \[ \sum_y |\mathbb{P}_x(X_t=y)-m_y| \simeq |\lambda_1|^{t(1+o(1))} \] то есть, чем меньше \(|\lambda_1\), тем быстрее закон \(X_t\) сходится к \(m\).
Теорема 2 Пусть \(P\) — матрица переходных вероятностей неприводимой апериодической цепи Маркова с конечным пространством состояний \(S\) (содержащим по крайней мере два элемента) с инвариантной мерой \(m\), и пусть \(\mu_t^x:= (\delta_x P^t)\) — закон \(X_t\) когда \(X_0=x\). Пусть \(\varrho:= - \sup_{\lambda \in \mathrm{Spec}(P)\setminus \{1\}} \log |\lambda| >0\). Тогда \[ \sup_x \lim_{t\to\infty} \tfrac{1}{t} \log \| \mu_t^x - m\|_{TV}:=\sup_x \lim_{t\to\infty} \tfrac{1}{t} \log \left( \sum_y |p^{(t)}_{x,y}-m_y| \right) = \varrho \]
Доказательство. Поскольку \(\lambda_0=1\) простое, мы можем записать \(P=P_0+Q\), где \(P_0\) — оператор проектирования ранга 1, удовлетворяющий \(\mu P=m\) для всех \(\mu \in \mathcal{P}(S)\), и \(P_0Q=QP_0=0\). Иными словами, мы можем записать \(P\) в жордановой форме как \[ P = V \begin{pmatrix} 1 & 0 \\ 0 & J \end{pmatrix} V^{-1} , \qquad P_0 = V \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} V^{-1}, \qquad Q = V \begin{pmatrix} 0 & 0 \\ 0 & J \end{pmatrix} V^{-1}. \] и ясно, что \(P_0\) и \(Q\) удовлетворяют упомянутым свойствам. В частности, \(P^t=P_0+Q^t\) для \(t\ge 1\) и \(|Q^t_{x,y}| \le C t^{|S|} e^{-t \varrho}\), так как \(e^{-\varrho}\) — модуль наибольшего собственного значения \(Q\). Получаем \(\delta_x P^t = \delta_x P_0 + \delta_x Q^t=m+\delta_x Q^t\). Таким образом, \[ \sup_x \lim_{t\to\infty} \tfrac{1}{t} \log \| \mu_t^x - m\|_{TV} \le \sup_{x} \lim_{t\to\infty} \tfrac{1}{t} \log (|S|\,\sup_y | Q^t_{x,y}|) \le \sup_{x,y} \lim_{t\to\infty} \tfrac{1}{t} \log \left( |S| C t^{|S|} e^{t \varrho} \right)=\varrho \tag{3}\] С другой стороны, множество \((\delta_x)_{x\in S}\) представляет \(|S|\) линейно независимых векторов. Таким образом (поскольку мы предположили \(|S|\ge 2\)) существует по крайней мере одно \(x\in S\), такое что \(\delta_x\) имеет ненулевую компоненту вдоль собственного вектора, ассоциированного с собственным значением \(\lambda_1\) максимального модуля. Нетрудно проверить, что для такого \(x\) равенство достигается в Уравнение 3, поскольку \(|\delta_xQ^t|\) ведёт себя как \(c |\lambda_1|^t\) в этом случае.
Дополнительные Задачи
Упражнение 1 Рассмотрите положительно-возвратную апериодическую цепь. Если \(f\colon S\to \mathbb{R}\) такова, что \(m(f)=0\), то \(m(Pf)=0\). Иными словами, ограничение \(\hat P\) оператора \(P\) на функции с нулевым \(m\)-средним корректно определено. Повторите предыдущее доказательство, используя напрямую оператор \(\hat P\).
Упражнение 2 Найдите пример цепи Маркова, для которой существует \(x\in S\), такое что \(\lim_{t\to\infty} \tfrac{1}{t} \log \| \mu_t^x - m\|_{TV}<\varrho\). Подсказка: достаточно рассмотреть пространство с \(3\) точками.
Упражнение 3 Пусть \(\mathbf{X}\) — апериодическая цепь Маркова с пространством состояний \(S\). Пусть \(\xi \in S\) — поглощающая точка, и пусть \(S'=S\setminus \{\xi\}\). Предположим, что \(x \leftrightarrow y\) для всех \(x,y\in S'\), \(x \rightarrow \xi\) для всех \(x\in S\), но \(p_{\xi,\xi}=1\), так что \(\xi \not \leftarrow x\) для \(x\in S'\). Например, \(\xi\) представляет состояние, в котором случайный алгоритм завершается.
Пусть \(\tau\equiv \tau_\xi\) — время достижения \(\xi\), и пусть \(Q:=(p_{x,y})_{x,y \in S'}\). Докажите, что существует вероятностная мера \(m \in \mathcal{P}(S')\), такая что для всех \(x,y\in S'\) \[ \lim_t \mathbb{P}_x( X_t=y| \tau>t)= m_y \]
Упражнение 4 Пусть \(P\) — марковский оператор неприводимой цепи Маркова на конечном пространстве состояний \(S\). Пусть \(m\) — её инвариантная мера, а \(P^\dagger\) — сопряжённый оператор к \(P\) в \(L^2(m)\).
- Проверьте, что если \(P\), \(Q\) — марковские операторы, то \(PQ\) и \(\alpha P+(1-\alpha)Q\) также являются марковскими операторами. В частности, \(PP^\dagger\) и \(P^2\) — марковские операторы.
- Найдите инвариантную меру для \(PP^\dagger\) и \(P^2\). Приведите пример, где \(P\) неприводима, но \(PP^\dagger\) и \(P^2\) не являются таковыми.
- Приведите пример, где \(P\) неприводима, но \(P^2\) и \(PP^\dagger\) не являются неприводимыми.
- Докажите, что если \(P\) неприводима и апериодична, то \(P^2\) неприводима и апериодична.
- Докажите, \(PP^\dagger\) апериодична и каждый класс общения закрыт.
- Предположим, что \(P\) неприводима и апериодична. Пусть \(X_t\) и \(Y_t\) — цепи Маркова с марковскими операторами \(P^2\) и \(PP^\dagger\) соответственно; докажите, что \(X_t\) сходится к своему «равновесию» быстрее, чем \(Y_t\), в следующем смысле. Пусть \(\mu_t^x\) (соответственно \(\nu_t^x\)) — закон распределения \(X_t\) при условии \(X_0=x\) (соответственно \(Y_t\) при \(Y_0=x\)). Докажите, что \[ \sup_x \lim_{t\to\infty} \tfrac{1}{t} \log \| \mu_t^x - m\|_{TV} \le \sup_x \lim_{t\to\infty} \tfrac{1}{t} \log \| \nu_t^x - m\|_{TV} \]
- Пусть \(R=PQ\), тогда \(r_{x,z}=\sum_y p_{x,y} q_{y,z}\). Меняя порядок суммирования, имеем \(r_{x,z}\ge 0\) и \(\sum_z r_{x,z}= \sum_y p_{x,y} \sum_z q_{y,z}=\sum_y p_{x,y}=1\). Что касается выпуклой комбинации, доказательство следует непосредственно из линейности.
- Инвариантной мерой всех этих операторов является \(m\). В общем случае, если \(P,Q\) имеют одну и ту же инвариантную меру, то \(m((PQ)f)=m(P(Qf))=m(Qf)=m(f)\). Таким образом, \(m\) инвариантна для \(PQ\).
- Мы можем взять единственный цикл \(S=\mathbb{Z}_{2k}\) с чётным числом точек, \(P\) соответствует движению по часовой стрелке с вероятностью \(1\), \(p_{x,x+1}=1\) (суммы понимаются \(\pmod{2k}\)). Тогда \(P\) неприводима, так как существует путь, соединяющий любые две точки. \(PP^\dagger\) соответствует выполнению одного шага по часовой стрелке и одного против часовой стрелки, то есть \(PP^\dagger=I\), блуждание просто не движется. \(P^2\) соответствует выполнению двух шагов по часовой стрелке \(p^{(2)}_{x,x+2}=1\). Таким образом, не существует пути, соединяющего точки с разной чётностью.
- Для неприводимой апериодической цепи на конечном пространстве состояний существует достаточно большое \(T\), такое что \(p^{(t)}_{x,y}>0\) для всех \(t>T\) и \(x,y\in S\). В частности, то же самое верно, если заменить \(T\) на \(T'=\lceil T/2 \rceil\), для элементов \(P^2\).
- Обозначим через \((q_{x,y})\) элементы \(Q=PP^\dagger\). \(q_{x,z}>0\) тогда и только тогда, когда существует \(y\in S\), такое что \(p_{x,y},p_{z,y}>0\). В частности, \(q_{x,z}>0\) тогда и только тогда, когда \(q_{z,x}>0\) и \(q_{x,x}>0\) для всех \(x\in S\) (так как каждая точка \(x\) имеет по крайней мере одного преемника \(y_x\), такого что \(p_{x,y_x}>0\)). В частности, каждый класс сообщающихся состояний \(Q\) замкнут.
- Согласно теореме об экспоненциальной сходимости, нам нужно проверить, что \(|\lambda_1(P^2)|\le |\lambda_1(PP^\dagger)|\), где \(\lambda_1(Q)\) — наибольшее (по модулю) собственное число неприводимого марковского оператора \(Q\), за исключением \(\lambda_0=1\); или, что эквивалентно, наибольшее собственное число \(Q\), ограниченного на функции \(f\) с \(m(f)=0\), где \(m\) — инвариантная мера \(Q\).
Для \(P^2\) имеем \(\lambda_1(P^2)=\lambda_1(P)^2=\overline{\lambda_1(P^\dagger)}^2\). Возьмём \(f_1\) — ассоциированную (комплексную) собственную функцию (с \(m(f_1)=0\)) оператора \(P^\dagger\), так что \(P^\dagger f_1=\overline{\lambda_1(P^\dagger)}f_1\). Тогда, так как \(PP^\dagger\) симметричен, \(\lambda_1(PP^\dagger)>0\), и, обозначая через \(\langle \cdot,\cdot \rangle\) эрмитово скалярное произведение в \(L^2(m)\), имеем \[ |\lambda_1(PP^\dagger)| = \sup_{f\,\st m(f)=0} \frac{\langle f, PP^\dagger f \rangle}{m(|f|^2)}=\sup_{f\,\st m(f)=0} \frac{\langle P^\dagger f, P^\dagger f \rangle}{m(|f|^2)} \ge \frac{\langle P^\dagger f_1, P^\dagger f_1 \rangle}{m(|f_1|^2)} = \overline{\lambda_1(P^\dagger)} \lambda_1(P^\dagger)= |\lambda_1(P^2)| \]
Если \(S\) счётно (или более общо, польское пространство), предыдущая теорема может оказаться неверной. Это связано с тем, что собственные значения могут накапливаться вокруг одной точки, или, иначе говоря, одно собственное значение может иметь бесконечную кратность. Важный класс операторов, для которых это не может произойти, — компактные операторы.
Рассмотрим неприводимую положительно-возвратную апериодическую цепь, где \(S\) — счётное пространство. Тогда она допускает единственную инвариантную вероятность \(m\), и \(P\) является сжатием на \(P\colon L^2(m)\to L^2(m)\). В частности, он отображает замкнутый шар \(B_1:=\{f \st \|f\|_{L^2(m)}\le 1\}\) в себя. \(P\) называется компактным (линейным оператором), если он отображает замкнутый шар \(B_1\) в компактное подмножество \(L^2(m)\) (это всегда имеет место, если \(S\) конечно, поскольку \(B_1\) сам по себе компактен в этом случае). Если \(P\) компактен, мы также имеем \(\varrho:= - \sup_{\lambda \in \mathrm{Spec}(P)\setminus \{1\}} \log |\lambda| >0\), и Теорема 2 переносится на случай счётного пространства состояний с компактным оператором \(P\) (поскольку спектр компактных операторов состоит из счётного множества собственных значений без точек накопления, кроме \(0\), каждое собственное значение имеет конечную кратность, поэтому доказательство в основном то же самое).
Расширения этого результата возможны; в частности, если \(P\) квазикомпактен, утверждение также остаётся верным. Это особенно полезно в динамических системах. Опишем быстро этот случай, предполагая \(S\) счётным, чтобы не обсуждать вопросы измеримости.
Если у нас есть отображение \(\phi \colon S\to S\), мы можем рассматривать \((X_0,X_1=\phi(X_0),X_2=\phi(X_1),\ldots)\) как цепь Маркова, хотя довольно специфическую: вся случайность исходит от \(X_0\), поскольку \(\phi\) просто детерминировано. Здесь переходная вероятность просто \[ p_{x,y}=\delta_{\phi(x)}(y)= \begin{cases} 1 & \text{если $y=\phi(x)$} \\ 0 & \text{иначе} \end{cases} \] Если \(m\) — инвариантная вероятность, мы знаем, что сопряжённый оператор \(P^\dagger\) также является оператором перехода цепи Маркова. Классический инструмент для изучения перемешивания динамических систем (например, экспоненциальной сходимости к инвариантной вероятности \(m\)) действительно — квазикомпактность \(P^\dagger\).