팃포탯 (문단 편집)

=== 팃포탯을 능가한 후속 전략들 ===
액셀로드의 대회 이후 이루어진 한 실험에서, [[http://www.todayhumor.co.kr/board/view.php?table=bestofbest&no=219423|팃포탯을 개량한 '''Gradual'''이라는 전략이 팃포탯을 제치고 1등을 차지했다]]고 한다. ([[http://www.lifl.fr/IPD/references/from_lifl/alife5/html/graduels.html|원문]]) 이 전략은 팃포탯과 다른 점은 모두 같지만, 상대방이 배신한 횟수를 기억했다가 그 횟수만큼 상대에게 연속으로 배반을 때린다고 한다. 상대방이 두 번째 배신한 것이면 자신은 두 번 연속으로 배반하고, 상대방이 세 번째 배신을 하면 세 번 연속으로 배반하고, 상대방이 백 번째로 배신하면 자신은 상대방을 100번 연속으로 배반하는 것. 이는 이후의 [[리뷰]]에서 '''팃포탯의 단순명료성을 포기한 사례'''로 평가되었다.

Gradual은 《The Iterated Prisoner's Dilemma》(2007)에서 그 잠재적 가치가 평가되었으며, 이 책에서는 '''"팃포탯이 항상 최고는 아닐 수 있음을 보여준 의의는 있으나, 이것이 팃포탯을 앞선다고 말하기도 어렵다, 몇몇 경우에는 팃포탯보다 못할 수 있다"'''[* 논지를 요약한 것으로, 원문은 다음과 같다. "However, it is efficient to demonstrate that TFT is not always the best, but not efficient to prove that Gradual always outperforms TFT. Gradual receives fewer points than TFT while interacting with AllD because Gradual forgives too many defections. Therefore, if there are lots of defecting strategies like AllD in the competition, it would be possible that TFT outperforms Gradual in this case."] 는 결론을 내렸다. 한편 다른 [[리뷰]]에서도[* Jurišić et al., 2012.] 이것이 [[재현성]]이 부족해 보인다는 평가를 내린 한 연구자의 웹 페이지를 인용한 바 있으며,[* 다른 연구자들의 보고에 대해서는 다음을 참고. Delahaye and Mathieu, 1996; Doebeli and Knowlton, 1998; Glomba, Filak, and Kwasnicka, 2005.] 실제로 [[2004년]]의 한 대회에서는 4위의 비교적 저조한 성적을 기록하기도 했다.

한편 '''Pavlov'''라는 프로그램도 있다. 이는 "Simpleton" 이라는 이명을 갖고 있으며, 흔히는 "win-stay, lose-shift"[* 이득 보는 상황에선 판단을 유지하고 손해보는 상황에선 판단을 바꾼다. 예를 들면 상호 협력과 자기혼자 배신 상황에선 자원이 추가되므로 판단을 유지한다. 상대 혼자 배신이나 서로 배신하는 경우엔 이득이 없거나 뺏기므로 앞선 판단을 바꾼다.]라는 요약으로 알려져 있다. 팃포탯과 달리, Pavlov는 '''상호작용에서의 노이즈가 발생하는 환경'''에서 특히 효과적이다. 서로간의 의향이 제대로 전달되기 힘든 노이즈 환경에서, 팃포탯은 상대방의 의도를 정확히 캐치하지 못하고 헤매는 반면, Pavlov는 노이즈로 인해 발생하는 혼란을 보다 잘 극복한다는 것. 이 전략의 요체를 쉽게 요약하면 자신의 판단과 상대방의 판단을 견주어서 '''똑같은 판단에는 앞 시행의 판단을 반복, 다른 판단에는 앞 시행의 판단을 교체.'''[* 즉, S(p1, p2, p3, p4)는 S(1, 0, 0, 1).] 상기된 2007년의 단행본에 따르면, 이 전략은 [[생태학]]적 시뮬레이션에서 주어진 환경의 불확실성( = 노이즈)이 치솟을수록 효과적이었으며, 40회의 시뮬레이션 중 33회를 지배했다. 파블로프가 특이한 것은 기존의 팃포탯 기반이 아니라서 서로간의 공통점이 상당히 적다는 것.

이런 유망주들의 출현에도 불구하고 팃포탯의 명성이 쉽게 바래지는 않을 것으로 보인다. 왜냐하면 이들은 최상의 퍼포먼스를 보여주기 위하여 일정한 조건이 붙지만, 팃포탯은 잘 모르겠으면 닥치고 골라도 될 만한 안정적이고 범용적이기 때문. 즉 팃포탯이 대부분의 상황에서는 우위를 차지하지만 어떤상황에서건 반드시 우위를 차지하는 만능의 전략이 아니라는 것을 보여주었다는 것이 중요하다고 봐야 할 것이다.

저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,
기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.
이 동의는 철회할 수 없습니다.

팃포탯 (문단 편집)

캡챠