2012년 4월 2일 월요일

[텍사스홀덤 TIP] 홀덤, 블러핑

발췌 : 이태혁





텍사스홀덤 TIP 블러핑에 관하여..



역시 텍사스 홀덤에서 빼 놓을 수 없는 것이 블러핑이다. 블러핑은 홀덤의 묘미이자 고급 기술이다.
노벨 경제학상을 수상한 하버드 대학의 게임 이론의 대가 로버트 오먼 교수가 블러핑을 최고의 전략이라 평할 만큼 그 본질의 우수성은 증명되어 있다. 많은 사람들이 뻥카의 의미는 알고 있지만 원리는 쉽게 이해하지 못하는 것이 사실이다. 그 원리를 알기 쉽게 표현해주는 집단이 있다. 바로 북한이다. ‘서울 불바다’ ‘핵무기 보유’ 등의 발언을 통해서 협상을 유리하게 이끄는 작전이 여기에 속한다. 그런데 이 전략 에는 중요한 세 가지 포인트가 있다.
첫 번째는, 블러핑 전략이 성공할 때 분명한 이익이 있어야 한다는 것이다. 전쟁의 경우 수세에 몰리던 아군이 적군의 공격을 주춤하게 만든다거나 기업의 경우 경쟁사의 추격을 물리치거나 많은 수익을 취할 수 있다는 등의 확실한 이익이 보장되어야 한다.
두 번째는 내가 무엇을 가졌고 어떤 상황인지를 상대방이 몰라야 한다는 것이다. 최고의 블러프 플레이어인 북한이 블러핑에 성공하는 이유도 우리가 북한의 군사 상황을 정확히 파악할 수 없기 때문이다. 
세 번째로 블러핑 전략에 희소가치를 더해야 한다는 것이다. 블러핑 전략은 항상 성공하는 것이 아니며,가끔 했을 때 성공률이 높다는 사실을 알아야 한다.
블러핑 전략은 상대방이 나를 잘 모르고 나에게 명백한 이익이 있을 때 사용할 수 있는 충분히 매력적인 전략이다.
실제 게임에서는 블러핑을 시도하기 전에 위 3가지 포인트를 체크하는 것도 중요하지만 무엇보다 먼저 자신의 이미지를 살펴야한다. 호구로 보이는 이미지로는 아무리 위협적인 액수의 블러핑도 실패할 확률이 높다.
그리고 다수의 플레이어가 콜을 한 상황에서의 블러핑은 위험을 초래한다는 것이다. 앞에서 콜을 하고 판에 참여한 플레이어가 적으면 적을수록 좋다.
만약 6자회담이 아니고 20자 회담이었다면 북한은 새로운 국면에 처했을지 모른다.




블러핑의 기초 이론


피터 L. 번스타인은 자신의 저서 <리스크>에서는 포커를 다음과 같이 설명한다.
포커는 비밀스러운 흥정과 불후의 속임수, 계산된 전략과 열렬한 신념이 한데 어우러지는 게임으로 감각보다는 경험이 따르는 도박이다.
이런 포커의 세계에서 확률 계산은 무질서하게 총, 칼이 난무하는 전쟁터(포커 테이블)에서 자신을 보호해줄 유일한 실체로 여겨진다. 하지만 이런 확률 계산이 언제나 승리를 만들어주는 것은 아니다.
 포커 게임의 참가자는 좋은 핸드를 가졌을 때 콜을 하기도 하지만 나쁜 핸드를 가지고 콜을 하기도 한다.
이런 블러핑은 상대방으로 하여금 잘못된 판단을 내리게 하는 전술이다. 즉, 일종의 인위적 리스크를 만들게 하여 상대를 혼동에 빠뜨리게 하여 나쁜 핸드를 가졌음에도 불구하고 승리할 수 있게 하는 좋은 전략이다. 
블러핑의 기본 전략은 좋은 카드를 가진 사람이 취하는 행동을 모방하면서 좋은 카드를 가진 척하는 것이다.
그러므로 블러핑의 본질은 자신의 본체를 감추는 행동에 있으며, 상대가 착각할 수 있는 상황에서 블러핑을 하는 것에 있다. 이는 좋은 카드를 가졌을 때도 마찬가지이다. 좋은 카드를 가졌어도 좋은 내색을 하지 않고, 나쁜 카드를 가졌어도 우울한 내색을 하지 말아야 한다. 그리고 나쁜 카드를 가졌어도 때때로 콜함으로써 나의 카드에 대한 반응 패턴을 상대방의 예상을 다르게 하여 혼란을 만들어야 한다.
 넓은 개념으로 보자면, 좋은 패가 와서 상대를 혼란시키는 행위나, 나쁜 패로 블러핑을 
하건 그 본질적 의도는 동일하다 할 수 있다.
아래의 간단한 게임의 과정을 통해 포커에서의 블러핑과 그에 따른 이론을 살펴보자.
영철과 철수는 간단한 포커 게임을 한다고 가정해 보자. 게임의 규칙은 다음과 같다.


1. 처음에 판돈으로 영철은 1만원을, 철수는 3만원을 건다. 영철은 1부터 6까지의 숫자가 쓰인 카드 중에서 하나를 무작위로 뽑는다. 영철은 카드에 적힌 숫자를 자기만 본다. 철수는 영철의 카드에 적힌 숫자가 무엇인지 모른다.

2. 영철은 스톱을 하든지 고를 할 수 있다. 고를 하려면 추가로 판돈을 5만원을 걸어야 한다.
여기서 스톱을 하면 처음에 건 판돈 1만원을 잃을 수도 있다.
영철이 고를 하면 다음 단계로 넘어가 철수가 선택할 차례가 된다.

3. 철수는 스톱을 하든지 고를 할 수 있다. 고를 하려면 추가로 판돈을 5만원을 걸어야 한다.
 스톱을 하면 처음에 건 판돈 3만원을 잃을 수도 있다. 고를 하면 다음 단계로 넘어간다.

4. 영철이 스톱을 선택하여 영철의 카드를 공개한다. 영철의 카드에 적힌 숫자가 1이면 영철이 이기고 지금까지 철수가 건 판돈 8만원을 딴다.
영철의 카드에 적힌 숫자가 1이 아니면 철수가 이기고 지금까지 영철이 건 판돈 6만원을 철수가 딴다.

이 게임에서 영철은 뽑은 카드의 숫자가 1이면 항상 고를 하는 것이 유리하다. 즉 고를 하는 것이 우월 전략이다.
반면 카드의 숫자가 1이 아닌 경우에는 철수가 고를 하느냐 스톱을 하느냐에 따라 최적 전략이 바뀐다.
영철이 블러핑을 전혀 사용하지 않는다고 해보자. 즉 영철은 카드에 적힌 숫자가 1일 때는 고를 하고 그렇지 않을 때는 스톱을 한다고 하자. 이 경우 경기가 진행됨에 따라 상대방은 영철이 허세 부리기를 사용하지 않는다는 것을 알아채게 될 것이다.
 그리하여 영철이 고를 할 때는 영철의 카드에 적힌 숫자가 1임을 간파하고 스톱을 할 것이다.
 이 경우 영철은 3만원을 딴다. 반면 영철이 스톱을 하면 철수가 1만원을 딴다.
장기적으로 볼 때 1/6의 확률로 카드에 적힌 숫자가 1이고 5/6의 확률로 카드에 적힌 숫자가 1이 아니다.
 그러므로 영철은 여섯 번에 한 번은 이겨서 3만원을 따고 다섯 번은 1만원을 잃게 된다.
즉 게임을 6번 하면 평균적으로 볼 때 2만원의 손실을 본다. 한 게임당 금액으로 환산하면 2만원 / 6 = 3,333원의 손실을 보는 셈이 된다. 즉 영철의 게임당 평균 보수는 1/6 × 3만원 + 5/6 × (-1만원) = (-2만원)/6 이 된다.
이번에는 영철이 항상 블러핑을 한다고 가정하자. 즉 카드에 적힌 숫자가 1이 아닐 때에도 항상 고를 한다고 하자.
 이 경우 상대방은 경기가 진행됨에 따라 영철이 항상 블러핑을 사용함을 깨닫게 될 것이다. 따라서 철수는 영철이 고를 할 때 1/6의 확률로 1이 적힌 카드를 가지고 있고 5/6의 확률로는 1이 적히지 않은 카드를 가지고 있음을 예상하게 된다. 
이 경우 철수는 항상 고를 하는 것이 최선이므로 항상 고를 선택할 것이다.
따라서 영철은 여섯 번에 한 번 꼴로 이기고 8만원을 따지만 여섯 번에 다섯 번 꼴로 6만원을 잃는다.
그러므로 잭의 기대 보수는 1/6 × (8만원) +5/6 × (-6만원)= -22만원/6이다. 영철은 장기적으로 매 경기마다 평균 3만 6,666원의 손실을 보게 된다.

이번에는 영철이 일정 확률, 예컨대 1/10의 확률로 블러핑을 사용한다고 하자.
즉 카드에 적힌 숫자가 1이 아닐 때 1/10의 확률로 고를 한다고 하자. 이 경우 상대방 철수는 경기가 진행됨에 따라 영철이 1/10의 확률로 블러핑을 사용함을 깨닫게 될 것이다.
따라서 철수는 최적 전략을 선택하기 위해 우선 영철이 고를 했을 때 그가 1이 적힌 카드를 가졌을 확률을 추론해야 한다.
영철이 고를 했을 때 1이 적힌 카드를 가졌을 확률은 조건부 확률을 구하는 베이즈 공식에 의해 구할 수 있다.
즉, 영철이 고를 할 전체 확률은 1이 적힌 카드를 뽑고 고를 하는 경우의 확률과 1이 적히지 않은 카드를 뽑고 고를 하는 경우의 확률을 합한 것이다.

1/6 + (5/6 × 1/10) = 11/60

이중 영철이 1이 적힌 카드를 가지고 고를 할 확률은 1/6이다.
그러므로 영철이 고를 했다는 조건 하에서 영철이 1이 적힌 카드를 가졌을 조건부 확률은 1/6 ÷ 11/60 = 10/11이다.

영철이 3/10의 확률로 블러핑을 하는 경우 철수는 스톱을 선택한다. 왜냐하면 스톱을 하는 경우에 철수의 기대보수는 -3만원인 반면 고를 하는 경우의 기대보수는 (-8만원) × 10/11 + 6만원 × 1/11 = -74만원/11(약 -6만 7,272원)이기 때문이다. 
따라서 이때 영철의 기대보수는 1/6 × 3만원 + 5/6 × (1/10 × 3만원 +9/10 × (-1만원)) = 0 이다.
우리는 이로부터 영철이 1/10의 확률로 블러핑을 하는 경우의 보수가 블러핑을 전혀 사용하지 않거나 항상 블러핑을 하는 경우의 보수보다 큼을 알 수 있다. 왜 이런 결과가 나올까?
철수가 영철의 고에 대해 스톱을 하는 한, 영철은 고를 하는 것이 유리하다. 그런데 영철이 약간의 확률로 허세를 부리더라도 철수는 계속 영철의 고에 대해 스톱을 하는 것이 최적이다.

 그러므로 영철이 1이 아닌 카드를 받은 경우에 철수가 스톱을 하는 한 블러핑을 사용할 확률이 높아질수록 영철의 보수는 커지는 것이다. 영철이 블러핑을 사용할 확률이 일정 수준에 도달하면 철수는 스톱을 하든고를 하든 동일한 보수를 얻게 되며 이 이상의 확률로 블러핑을 사용한다면 철수는 고를 하는 것이 최적이 된다.
이러한 확률만 안다면 철수는 항상 안정적인 게임 운영을 할 수 있게 된다.
사람들은 포커나 혹은 여타 베팅 도박에서 블러핑을 거짓말을 하는 도구로 생각하고 그저 거짓말을 하는 데 집중한다. 하지만, 블러핑은 수학적 계산을 바탕으로 인위적인 리스크를 만들고 그 리스크를 측정함으로서 승리에 이끌게 하는 계산된 플레이다. 여기서 게임이론이란 단판의 블러핑이 아닌 장기적으로 블러핑을 하는 것까지 생각함으로서 최적의 승률을 도출하는 좋은 도구인 것이다.

댓글 없음:

댓글 쓰기