시작하기 앞서 Markov chain을 처음 들어보는 사람들을 위해 이를 간단하게 설명하고자 한다.
Markov chain은 시간이 흐르면서 변화가 어떻게 이루어지는 지에 대한 확률 과정인 stochastic process의 특수한 경우이다. 이때 Markov chain에서의 시간의 변화는 이산적이다. 예를 들어 동전을 계속 던지는 게임을 한다고 생각하자. 동전을 한 번 던지는 것을 한 라운드로 생각한다면, 여기서의 시간의 변화는 라운드의 변화로 생각할 수 있다. 즉
여기서 "변화"라는 것은 Markov chain의 용어로 설명하자면 "어떤 상태(state)에서 어떤 상태로 이동"하는 것이다. 즉 Markov chain은 시점(라운드)이 바뀜에 따라 현재의 state에서 다른 state로 이동할 확률에 대한 것이다. 여기에서 중요한 성질이 하나 더 있다. 바로 이 변화 확률이 현재 시점의 state에만 의존한다는 것이다. 수식적으로 표현해보자.
즉, 이제까지 거쳐온 state의 기록이
종종 이 matrix
이제 Fundamental Theorem of Markov Chain을 위한 설명을 하고자 한다.
우리는 finite한 state 수를 가지는 Markov chain에 대해서만 생각할 것이다. Markov chain의 state 수는 무한히 많을 수 있는데, 가령 동전 던지기를 계속하는 게임에서 "이제까지 앞면이 나온 수"를 state로 표현한다면 state 수는 무한히 많을 수 있다. 따라서 Markov chain의 엄밀한 정의에서는 state 수가 countably infinite하다는 것도 포함되어 있다. 어쨌든, Markov chain의 state의 수를
그러면 그 다음 시점에서의 분포
가 된다. 자연스럽게 초기 분포가
가 될 것이다.
여기서 논의 진행을 위해 정의를 하나 하도록 하겠다.
Definition. Stationary Distribution
만약 state 분포가 시간이 흘러도 변하지 않는다면, π 는 Markov chain π 의 stationary distribution이다. 즉, P 의 stationary distribution P 는 π 를 만족한다. πT=πT⋅P
갑자기 왜 stationary distribution에 관심을 갖는지 말하기 위해 Markov Chain Monte Carlo 기법을 소개하고자 한다. 이는 sampling을 해야 하는 타겟 분포
Markov Chain Monte Carlo
1. Stationary distribution이인 Markov chain을 만든다. π
2. 이 Markov chain을 적당히 많이 수행시키고 그때의 state를 출력한다.
우리는 이 Markov chain이 충분히 큰 (모든)
이기를 바라는 것이다. 그래야지 수행이 끝났을 때의 state를
그래서 Markov Chain Monte Carlo 기법과 관련해서 자연스러운 질문 중 하나는 다음과 같다. 어떤 분포가 주어졌을 때 그것을 stationary distribution으로 갖는 Markov chain을 만들 수 있는가? 이 질문에 대한 답은 다음 기회에 하는 것으로 하고, 우리는 이 질문의 (일종의) 역에 대해 답해보고자 한다.
과연 finite state space를 가지는 모든 Markov chain은
stationary distribution을 가질까?
이 질문에 대한 답을 시작하기 앞서 정답을 모르는 분들은 찍어보시길 바란다. 선택지를 좁혀보자면 (1) 그렇다 (2) 특정 조건에서만 그렇다 가 될 것이다.
일단 notaion부터 소개하도록 하겠다. 어떤 행렬
이제 질문의 답에 아주 유용한 정보를 주는 정리를 소개하도록 하겠다. 이는 바로 행렬 이론에서 유명한 것으로 추정되는 Perron-Frobenius 정리이다.
Perron-Frobenius Theorem.
Each nonnegative matrixhas a nonnegative real eigenvalue with , and has a corresponding nonnegative eigenvector.
갑자기 eigenvector, eigenvalue? 조금만 생각해보면 왜 이것에 관심을 가지는지 알 수 있다. Stationary distribution은
Perron-Frobenius 정리의 증명은 나중에 하고 이를 이용해 질문의 답을 먼저 해보도록 하겠다. 흐름은 다음과 같다.
[Step 1] 1은가 가질 수 있는 eigenvalue의 절댓값의 최댓값이다.
[Step 2]는 값이 1인 eigenvalue를 가진다.
[Step 3]와 의 eigenvalue들은 동일하다.
[Step 4]이고 이다. Perron-Frobenius 정리에 의해 eigenvalue 1에 해당하는 nonnegative eigenvector 가 존재한다.
[Step 5]는 stationary distribution이다.
즉, finite Markov chain은 항상 stationary distribution을 가진다는 것이다!
이제 각 스텝이 성립함을 보이도록 하자.
[Step 1]
우리는 nonnegative matrix
여기서
[Step 2]
간단하다.
[Step 3]
Characteristic polynomial을 소개하도록 하겠다. 어떤 matrix
우리는 어떤
우리는
[Step 4, 5]
Perron-Frobenius 정리가 맞다는 가정하에 두 스텝은 자명하다. 마지막에
Finite state space를 가지는 Markov chain이 stationary distribution을 가짐을 보였다. 그러면 그것은 unique 할까? Unique하다면 임의의 시작 분포
Fundamental Theorem of Markov Chains
If a finite Markov chain is irreducible and aperiodic, then it has a unique stationary distribution
. Moreoever, for any distribution ,
어떤 Markov chain이 irreducible 하거나 aperiodic 하다는 것을 정의하지 않았다. 다만 이것이 뭔지 모르더라도, "특정" 조건을 만족한다면 stationary distribution이 unique하고, 심지어 임의의 분포에서 시작하더라도 stationary distribution으로 수렴한다고 말하고 있다. 정의와 증명은 다음 글에서 하는 것으로 하고 여기서는 미뤄뒀던 Perron-Frobenius 정리를 증명하는 것으로 마무리하고자 한다.
이 증명을 위해 우선 nonnegativity가 positivity로 바뀐 버전에 대해 성립함을 보이고자 한다.
Perron-Frobenius Theorem for Positive Matrices
Each positive matrixhas a positive real eigenvalue with , and has a corresponding positive eigenvector.
proof. 우선
이제 진짜 유명한 선형 대수의 정리를 하나 소개하겠다. (이것의 증명은 생략하도록 하겠다. 위키피디아 참고)
Cayley-Hamilton Theorem.
즉, 모든 정방 행렬에 대해서 그것의 characteristic polynomial에 자기 자신을 집어넣으면 zero matrix가 된다는 것이다. 따라서, 우리의 경우
이제
(수식에 등장하는 항들이 벡터임을 기억하자. 부등식은 모든 index에 대해 부등호가 성립함을 나타낸다.) 따라서
모순을 가정해서
양 변에
가 된다.
이제 spectral radius에 관한 정리를 하나 소개하고자 한다. (증명은 위키피디아 참고)
Theorem (The convergence of the power sequence of a matrix).
따라서 우리는 위의 정리를 적용해서 다음의 결론을 낼 수 있다.
이것은
이제 본 증명을 하고자 한다. 그전에 Gelfand's formula를 소개하고자 한다.
Theorem (Gelfand's formula)
For any sub-multiplicative matrix norm,
proof sketch. 우리는 이 formula를 infinity norm에 대해서만 적용할 것이므로, sub-multiplicative norm을 infinity norm으로 생각해도 좋다.
Matrix의 power sequence의 수렴에 관한 정리에 의해
이 formula를 통해 다음 사실을 보일 수 있다.
Lemma For any matrix, if , then .
proof.
이제 원래 보이고자 했던 nonnegative 버전의 Perrron-Frobenius 정리를 증명해보겠다.
proof of Perron-Frobenius theorem. 증명 흐름을 설명하자면 다음과 같다. 먼저
여기서 실해석학에서 유명한 것으로 추정되는 Bolzano–Weierstrass theorem(위키피디아)을 사용할 것이다. 이 정리가 말하는 바는 bounded sequence는 convergent subsequence를 가진다는 것이다. 즉,
최종적으로
이번 글에선 finite Markov chain의 stationary distribution의 existence만 보였다. 다음 글에선 Fundamental Theorem of Markov Chains의 증명을 마무리 하고자 한다.
Reference - Lecture Notes Stochastic Processes (Spring 2022), Lecturer: Chihao Zhang
link: http://chihaozhang.com/teaching/SP2022spring/ (lecture 2)
comment. 어차피 증명에 등장하는 Cayley-Hamilton 정리나, Gelfand's formula나, Bolzano-Weierstrass 정리들은 건너 뛸 것이었으면 왜 Perron-Frobenius 정리는 열심히 증명했을까... 그나저나 다음 글도 이렇게 길 것같은 느낌이 든다.
Fundamental Theorem of Markov Chains (2) (0) | 2022.08.04 |
---|
댓글 영역