Дилемата на затворника – част 12

Глава 12. Добрите момчета се класират първи

Този израз изглежда се е родил за първи път в света на бейзбола, въпреки че някои авторитети настояват, че обратното твърдение се появява дори по-рано. Американският биолог Гарет Хардин (Garret Hardin) използва тази фраза, за да формулира накратко идеята на това, което може да се нарече “социобиология” или “егоистичен генен механизъм“. Целесъобразността на такова използване е очевидна. Ако преведем общоприетото значение на думата “добро момче”, неговия дарвинов еквивалент, “добро момче” – е индивид, който помага на другите от вида си, в ущърб на себе си, за да се предадат техните гени на следващото поколение. По този начин, броят на “добрите момчета”, неизбежно ще бъде намален: добротата ще умре от дарвинова смърт. Съществува обаче и друга, техническа интерпретация на думата “добър”. Ако приемем това определение, което не е твърде далеч от разговорния смисъл, добрите момчета се класират първи. Именно на това по-оптимистично заключение е посветена тази глава.

Играта, която играят всички

Спомнете си Злопаметните от глава 10. Това бяха птици, които си помагат една на друга, е очевидно с алтруистични мотиви, но в същото време Злопаметните отказват помощ на индивиди, които преди това са отказали да помогнат на самите тях. Злопаметните в края на краищата заемат с доминиращо положение, тъй като предават на следващите поколения повече гени, от колкото Наивниците (безразборно помагащи на всички и сами подлагащи се на експлоатация) и Тарикатите (които искат да експлоатират безмилостно всеки и в крайна сметка се унищожат взаимно). Историята на Злопаметните илюстрира важен принцип, който Робърт Трайверс, нарекъл “реципрочен алтруизъм“. Както видяхме в примера за рибата-чистач, в реципрочния алтруизъм могат да участват и представители на различни видове. Той присъства във всички взаимоотношения, наречени симбиоза, като например взаимоотношения между мравките и техните “крави”- листни въшки, които те доят. След като глава 10 бе написана, американският политолог Робърт Акселрод (Robert Axelrod) с помощта на Уилям Хамилтън, чието име се споменава на толкова много страници на тази книга, използва идеята на реципрочен алтруизъм в много интересни нови посоки. Акселрод определя техническия смисъл на думата “добър”, както споменах в уводната част на тази глава.

Акселрод, подобно на много политолози, икономисти и психолози е бил очарован от простата хазартна игра, наречена “Парадокса на затворника“. Тя е толкова проста, че познавам умни хора, който не допускаха чак такава простота, съвсем неправилно я разбираха и се опитаха да търсят в нея още нещо друго. Но простотата е измамна. Цели рафтовете в библиотеките са запазени за варианти на тази увлекателна игра. Много влиятелни хора вярват, че в нея е ключа към стратегическо планиране на отбраната и че ние трябва да я изучим, ако искаме да предотвратим Трета световна война. Като биолог, аз съм съгласен с Акселрод и Хамилтън, че много диви животни и растения са ангажирани в една безкрайна игра в “Парадокса на затворника“, случваща се в еволюционни мащаби на времето.

В своята първоначална, човешка версия тази игра е както следва. Налице е “Банкер”, който ще съди играта и изплаща печалби на двамата играчи. Нека допуснем, че играя срещу вас. В ръцете на всеки играч има само по две карти с думите: “Кооперирам се” и “Отказвам се”. Всеки от нас избира една от своите две карти и я поставя на масата с лице надолу, така че никой от играчите не знае какво е избрал другия, в действителност, и двавата слагат картите си едновременно. Играчите след това очакват напрегнато Банкерът да обърне картите. Напрежението произтича от факта, че печалбата зависи не само от собствения ход (всеки играч знае каква карта е поставил), но и от хода на противника (който е неизвестен, докато банкерът не обърне картите).

Тъй като играта се играе от 2 x 2 карти, има четири възможни резултати (от уважение към американския произход на играта, наградите са дадени в долари):

Резултат I.

И двамата играем “Кооперирам се”.Банкерът плаща на всеки от нас по $ 300.Тази почтена сума се нарича “награда за взаимно сътрудничество”.

Резултат II.

И двамата играем “Отказвам се”. Банкерът глобява всеки от нас с $ 10. Това се нарича “наказание за взаимен отказ”.

Резултат III.
Вие сте играли “Кооперирам се”, а аз “Отказвам се”. Банкерът ми плаща $ 500 (Такса за риск) и глобява вас (Наивника) с $ 100.

Резултат IV

Вие играете “Отказвам се”, а аз “Кооперирам се”. Банкер ви плаща за риска от $ 500 и глобява мен (Наивника) с $ 100.

I II III IV
ход + - ход + - ход + - ход + -
A да 300 не 10 не 500 да 100
B да 300 не 10 да 100 не 500

(Това е моята обобщена таблица)

Ясно е, че резултатите от III и IV са огледални образи един на друг, единият играч побеждава, а другият губи. При резултати I и II се оказват наравно, но резултат I е по-изгоден за двамата, отколкото резултат II. Точната сума на печалбата няма значение. Не е важно и колко резултати са положителни (плащания) и колко отрицателни (глоби). Най-важното условие за да се гарантира, че играта е истински Парадокс на затворника е относителния ранг (цена) на резултатите. “Таблицата на ранговете” трябва да е следната:

  • Награда за риска.
  • Награда за взаимно сътрудничество,
  • Наказание за взаимен отказ.
  • Наказание за Наивника.

(Строго погледнато, има още едно условие, спазването на което е необходимо за признаването на играта за Парадокс на затворника, средната стойност между Наградата за риска и Глобата на Наивника да не надвишава Наградите Причината за това допълнително условие ще стане ясна по-късно.)

В какво се състои “парадокса”? За да разберем това, опитайте да си представите мислите, преминаващи през главата ми, когато играя срещу вас. Знам, че има само две карти, от които можете да изберете: “Кооперирам се” или “Отказвам се”. Нека да ги обсъдим една по една. Ако изберете: “Отказвам се” (това означава, че ние трябва да погледнем към дясната страна на матрицата), тогава най-доброто нещо, което мога да направя, е да играя “Отказвам се”. Вярно е, че ще се наложи да се плати глоба за взаимен отказ, но ако аз избера: “Кооперирам се”, щях да съм глобен като Наивник, което е по-лошо. Сега да се обърнем към лявата половина на матрицата, т.е. нека кажем, че вие сте избрали картата “Кооперирам се” . Отново е по-добре да играя “Отказвам се” . Ако бях избрал “Кооперирам се” и двамата щяхме да имаме доста висока печалба – по $ 300. Но ако избера “Отказвам се”, ще спечеля още $ 300 отгоре. Стигаме до извода, че независимо коя карта изберете, моята най-добра тактика е винаги да играя “Отказвам се”.

И така, по пътя на безупречни логически разсъждения, установих, че независимо от действията ви, трябва да отказвам. С помощта на същата безупречна логика, стигате до същото заключение и вие. По този начин, когато се срещнат двама разумни играчи, те и двамата ще играят “Отказвам се” и двамата в крайна сметка ще заплатят глоби или ще получат малка печалба. В допълнение, всеки от тях знае, че ако двамата играе само “Кооперирам се” , всеки ще получи сравнително по-висока награда за взаимно сътрудничество (в този случай $ 300). Ето защо играта се нарича парадокс и тя е толкова парадоксална, защото може да те доведе до изстъпление и затова имаше гласове да се издаде закон за забраната й.

“Затворниците” се отнасят за един въображаем пример. Валутата в този пример не са пари, а срока на присъдите. Двама души – нека ги наречем Питърсън и Мориарти – са в затвора по подозрение в съучастие в престъплението. На всеки от затворниците, в неговата отделна килия, му предлагат да предаде своя приятел (“Отказвам се”), давайки показания в съда срещу него. По-нататъшният ход на събитията зависи от начина, по който ще постъпят двамата затворници, при това, никой не знае как ще постъпи другия. Ако Питърсън стовари вината върху Мориарти, а Мориарти запази мълчание и по този начин той ще потвърди вината си (кооперирайки се със своя бивш и както се оказа, вероломен приятел), тогава Мориарти ще получи една дълга присъда, а Питърсън ще бъде освободен невредим, получавайки Награда за риска. Ако всеки от тях обвиняваше другия, то ще осъдят и двамата за престъплението, вменено им, но и двамата ще получат известна снизходителност за даването на показания и присъдата ще бъде Наказание за взаимно отхвърляне, въпреки че е донякъде смекчена. Ако и двамата престъпници се кооперират (един с друг, а не с властите), отказват да дадат показания, то доказателствата за вината им може да се окажат недостатъчни, за да осъдят който и да е от тях за основното престъпление, и ще получат по-малък срок на присъдата за по-дребно престъпление – Награда за взаимно сътрудничество. Едва ли може да бъде наречен затвора “награда”, но хора, които са застрашени от по-дълъг престой зад решетките, ще го възприемат така. Може би сте забелязали, че въпреки че разплащанията не са в долари, а в срокове на лишаване от свобода, основните характеристики на играта се запазват (обърнете внимание на относителния ранг на четирите резултата по тяхната привлекателност). Ако се поставите на мястото на всеки един от затворниците, приемайки че и двамата са движени от разумен егоизъм, и помнейки, че те нямат възможност да говорят помежду си за да се разберат, тогава ще разберете че никой от тях няма друг избор, освен да предаде другия.

Възможно ли е да се разреши този парадокс? И двамата знаят, че, независимо от действията на противника, най-доброто нещо, което могат да направят сами е изберат “Отказвам се”, но също така знаем, че ако и двамата се Кооперират, всеки от тях би бил в по-добра позиция. Ако само … Ако само … Ако само имаше някаква възможност да се споразумеят, по някакъв начин да се убеди всеки един от играчите, че на другият може да се вярва, че той няма да постъпи толкова егоистично, ако имаше някакъв начин да се контролира споразумението.

В най-простия вариант на играта “Парадоксът на затворника”, такъв метод липсва. Ако най-малко един от играчите не се окаже истински светец, а не от този свят, играта неминуемо ще приключи през взаимен отказ с парадоксално мизерен резултат и за двамата играчи. Но има и друга версия на тази игра. Тя се нарича Итериран или Многократен Парадокс на затворника. Итерираният вариант на играта е по-сложен и неговата сложност вселява надежда.

Итерираната игра – това е просто същата игра повторена безкрайно много пъти със същите играчи. Отново, ние сме седнали един срещу друг от двете страни на банкера. Отново, всеки от нас има две карти – “Кооперирам се” и “Отказвам се”. Отново, всеки един от нас избира една или друга от тези карти и банкерът плаща пари или взема глоби в съответствие с горепосочените правила. Но този път, вместо да завърши играта, ние отново вземаме картите и се подготвяме за следващото раздаване. Последователните раздавания, ни позволяват да определим дали можем да се доверим на противника или не, да се отвърнем на всеки удар или да се сдобрим, да простим или да отмъстим. В една безкрайно дълга игра е много важно да се уверите, че и двамата печелим от банкера, а не за сметка един на друг.

След десет партии, теоретично бих могъл да спечеля $ 5,000, но само ако вие сте изключително глупав (или праведен), и винаги сте играл “Кооперирам се”, въпреки факта, че през цялото време съм играл “Отказвам се”. По-реалистично е да се предположи, че всеки от нас ще получи по 3000 долара от банкера, ако и двамата и 10-те пъти играл “Кооперирам се”. За това ние не трябва да сме особено праведни, защото и двамата можем да се убедим въз основа на предишната игра на противника, че може да му се има доверие. Ние, всъщност, може да регулираме поведението си взаимно. Възможна е също така игра в друга посока: никой от нас не вярва на другия и двамата играем “Отказвам се” всичките десет пъти и банкерът получава от всеки от нас по 100 щатски долара под формата на глоби. По-скоро ние частично ще се доверяваме един на друг, всеки ще играе ту “Кооперирам се”, ту “Отказвам се” и в резултат ще получим някаква междинна сума пари.

Описаните в глава 10 птици, които почистваха една на друга акарите си, играеха итерирания вариант на Парадокса на затворника . Как се случва това? Ако си спомняте, за птицата е много важно да се отърве от акарите, но не може сама да стигне до върха на собствената си глава и тя се нуждаеше от някой да направи това за нея. Тя предполагаше, че справедливостта изисква, по-късно тя да върне същата услуга. Но процедурата по почистването на кърлежите изисква да отделите време и енергия, макар и не твърде много. Ако птицата може безнаказано да излъже, т. е., ако й е оказана услуга, а тя да откаже да направи същото, то тя ще се облагодетелства, без да плаща за това. Поставете на резултатите с оглед на тяхната “цена” и ще видите, че пред вас е типична игра на Парадокса на затворника. Когато и двете си сътрудничат (махайки си акарите една на друга), това дава достатъчно добри резултати, обаче остава изкушението да получиш повече, отказвайки да платиш стойността на ответната услуга. Ако и двамата играят “Отказвам се” (отказвам да махам кърлежи), тогава нищо хубаво не става, обаче още по-лошо е да изразходваш усилия да махаш кърлежи от друга глава, а самия ти да си оставаш заразен с кърлежи. Съответната платежна матрица е показана на схемата.

Илюстрация: bgchaos.com

Но това е само един пример. Колкото повече мисля за това, толкова повече осъзнавам, че не само живота на хората, но и живота на животните и растенията е пълен с игри като Парадокса на затворника. Живота на растенията? И защо не? Не забравяйте, че става дума не за осъзнати стратегии (въпреки че понякога може да се говори за такива), а за стратегии в “мейнардсмитовски” смисъл, стратегии от такъв тип, който може да бъде програмиран от гените. А сега да се заемем с по-задълбочено изучаване на това, в какво се състои важността на итерациите.

За разлика от простия вариант на играта, която е доста предсказуема, в смисъл, че “Отказвам се” е единствената разумна стратегия, итеративния вариант предлага много различни стратегии. В простия вариант са възможни само две стратегии: “Кооперирам се” и “Отказвам се”. Итерацията, обаче, дава възможност за множество стратегии и коя от тях е най-добрата от всички, в никакъв случай не е очевидно. Да покажем като пример един от хилядите: да се играе “Кооперирам се” в повечето от случаите, а в произволно избрани 10% от партиите - “Отказвам се”. Други стратегии може да зависят от начина, по който е протекла предишната игра. Пример за това е моя “Злопаметен”: той има добра памет за лица и макар че е склонен предимно да се кооперира, той отказва, ако друг играч му е отказвал в миналото. Други стратегии може да бъдат по-снисходителни и по-малко злопаметни.

Първи турнир на Акселрод

Условия

Броят на стратегиите, възможни в итеративната игра е ограничен единствено от нашата изобретателност. Възможно ли е да се определи коя от тях е най-добрата? Тази задача е поставил пред себе си Акселрод. Той имал интересната идея да организира конкурс и поканил експерти по теория на игрите, за да представят своите стратегии. В този случай, стратегиите са предварително разработени програми за действие и съответно, конкурентите са представили своите заявки на програмен език. Предложени са били четиринадесет стратегии. Акселрод добавил петнадесета, наричайки я Случайна, при която просто се играе без никаква система ту “Кооперирам се”, ту “Отказвам се” и служи като един вид базова “анти-стратегия”: стратегията, даваща по-лоши резултати от Случайната, следва да се признае за много лоша..

Акселрод описва 15-те стратегии на общ език за програмиране. Всяка стратегия се сравнява по ефективност последователно с всяка друга в играта (в това число и срещу себе си). Итериран Парадокс на затворника. Тъй като стратегиите са 15, компютърът проиграл 15 х 15, или 225, отделни игри. След като всяка двойка, направила по 200 хода, резултата се сумира и се обявява победител.

Тук не ни интересува коя именно стратегия е излязла победител в играта срещу всеки отделен противник. За нас е важно да се определи коя стратегия печели най-много “пари” за всичките 15 варианта. “Парите” са просто “точки” разпределени, както следва:

  • за взаимно Коопериране – 3 точки;
  • за Риск – 5 точки;
  • Наказание за взаимен отказ – 1 точка (в еквивалент на малката глоба в играта, описана по-рано),
  • Глоба за Наивника – 0 точки (еквивалент на голямата глоба в играта, описана по-рано).

Максималната възможна печалба, която може да получи при една или друга стратегия, е 15000 точки (200 партиди от пет точки средно на мач всяка от 15-те противника). Минималният резултат е 0. Излишно е да казвам, че нито един от тези крайни резултати не се случи. Най-голямата печалба, на която може реално да се надява дадена стратегия средно за 15-те турнира, не може значително да надвишава 600 точки. Това е всичко, което може да получи всеки един от двамата играчи, ако те и двамата играят през цялото време “Кооперирам се”, печелейки по 3 точки за всяка от 200-те изиграни игри. Ако един от тях се поддаде на изкушението да се откаже, броя на точките, вероятно щеше да е по-малък от 600, защото другият играч ще му отвърне със същото (в болшинството от представените стратегии е бил заложен в една или друга форма стремеж за ответен удар). Ние можем да използваме числото 600 като един вид база за сравнение за дадена игра и резултатите ще се изразяват като процент от това число. По тази скала теоретично е възможно да се достигне печалба до 166% (1000 точки), но практически ни една от стратегиите не заработва повече от средно 600 точки.

Не забравяйте, че “играчи” в турнира не са хора, а програми, по-точно – програмирани стратегии. Техните автори, т.е. хората, които са били в същата роля като гените, програмиращи тялата (глава 4).

Око за око

Били предложени няколко много хитроумни стратегии, въпреки че те със сигурност не са толкова умни, както техните автори. Интересното е, че печелившата стратегия е по-проста от останалите и на пръв поглед не е толкова сложна. Тя се нарича “Око за око” и е била представена от проф. Анатол Рапопорт (Anatol Rapoport), известен психолог и специалист по теория на игрите от Торонто. Според тази стратегия, първият ход трябва да бъде “Кооперирам се”, а по-нататък, просто се повтаря предишния ход на другия играч.

Как протича играта Око за око? Както винаги, развитието на събитията зависи от поведението на втория играч. Да приемем първо, че вторият играч е също стратегия за Око за око (да си припомним, че всяка стратегия се играе, не само срещу всяка от 14-те други стратегии, но и срещу копие на себе си). И двете стратегии Око за око започват с коопериране. Следващия ход на всеки играч повтаря предишния ход на противника, т. е., кооперира се. И двамата продължават да играят “Кооперирам се” до края на играта, която завършват достигайки на 100% от точките, взети като отправна точка, т.е. печелят по 600 точки.

Наивният Изпитател

Да приемем, че Око за око играе срещу стратегията, наречена Наивен Изпитател. Всъщност Наивен Изпитател не е взела участие в конкурса на Акселрод, но въпреки това, този пример е поучителен. Наивен Изпитател е по същество идентичен с програмата Око за око, освен че от време на време, да кажем веднъж на десет хода, без всякаква закономерност безпричинно играе “Отказвам се” и си взема неговите 5 точки полагащи му се за риск. Докато Наивният Изпитател не ще предприеме един от неговите сондиращи откази, и двамата играчи се държат в съответствие със стратегията на Око за око. Но изведнъж, без предупреждение, да речем на осмия ход, Наивният Изпитател играе “Отказвам се”. Око за око, разбира се, играе този път, “Кооперирам се” , и следователно получава 0 точки, както се полага на Наивник. Наивният Изпитател, както изглежда, има успех, печели за този ход 5 точки. Но на следващия ход, Око за око “отмъщава”. Тя играе “Отказвам се”, просто следвайки заложеното в нея правило да копира предишния ход на противника. В същото време, стратегия на Наивният Изпитател, следвайки правилото да копира противника, повторя хода му “Кооперирам се”. В резултат на това й се налага глоба Наивник, т.е. 0 точки, докато Око за око получава по-висока печалба – 5 точки. Със следващият си ход Наивният Изпитател доста несправедливо, може да се каже – “отмъщава” за отказа на стратегията Око за око. И това редуване продължава. В този случай двамата играчи получават средно по 2.5 точки на свой ход (средно между 5 и 0). Това е по-малко от 3-те точки на ход, които получават играчите, ако и двамата играят “Кооперирам се”. Така че, когато Наивният Изпитател играе срещу стратегията Око за око, както спечели по-малко, отколкото в играта Око за око срещу Око за око. Ако играта се играе между двама Наивни Изпитатели и за двамата нещате ще са дори още по-зле, тъй като серията на взаимни откази ще започне по-рано.

Разкайващият се Изпитател

Нека сега разгледаме друга стратегия, наречена Разкайващия се Изпитател. Разкайващият се Изпитател е подобен на Наивния Изпитател различава се от него само от това, че за да пусне поредицата от последователни отмъщения, трябва да е имало активни стъпки. За тази цел той се нуждае от малко по-дълга “памет” от стратегиите на Око за око или Наивният Изпитател. Разкайващия се Изпитател запомня дали отказа му е бил спонтанен и довело ли е това до бързо отмъщение. В този случай той, “изпълнен с разкаяние” дава на своя противник право на “един безплатен удар”, не последван от отмъщение. Това означава, че серията от взаимни отмъщения се прекъсва в зародиш. Ако сега продължим въображаемата игра между стратегиите на Разкайващия се Изпитател и Око за око, откриваме, че серия от мними взаимни отмъщения бързо прекъсва. През повечето време на играта противниците взаимно се кооперират, което дава и на двамата голяма печалба. Разкайващия се Изпитател е по-успешна стратегия срещу Око за око, отколкото Наивния Изпитател, макар и не толкова успешна колкото Око за око срещу себе си.

Някои от стратегиите, които участват в турнира на Акселрод, са далеч по-хитроумни от Разкайващия се Изпитател или Наивният Изпитател, но те също така имат средно на по-малко точки, отколкото простата стратегия на Око за око. В действителност най-малко успешна от всички стратегии (с изключение на Случайната) се оказа най-сложната, добре разработена стратегия. Тя беше представена под мотото “Авторът пожела да остане анонимен”, което послужи за повод за весели хипотези. Кой е авторът? Някой сив кардинал в Пентагона? Ръководителят на ЦРУ? Хенри Кисинджър? Самият Акселрод? Никога няма да узнаем.

Добронамерената стратегия

Подробният анализ на отделните стратегии не е толкова интересен. Целите на тази книга не включва обсъждане на изобретателността на програмистите. Много по-интересно е да се разпределят наличните стратегии по определени категории и да се изучи ефективността на тези по-големи подразделения. Най-важната от категориите е наречена “добронамерена“. Добронамерената стратегия се определя като стратегия, която никога не играе “Отказвам се” първа. Пример за това е Око за око. Тя може да играе “Отказвам се”, но го прави само като отмъщение. Както Наивният Изпитател както и Разкайващия се Изпитател са “недобронамерени” стратегии, защото те понякога, макар и рядко, играят “Отказвам се” без никаква причина. От 15-те стратегии, участващи в турнира, 8 са “добронамерени“. Показателно е, че същите тези осем стратегии събират най-голям брой точки, а седемте “недобронамерени” остават далеч назад. Стратегията Око за око събира средно по 504.5 точки, което представлява 84% от нашите контролни точки (600 точки) и може да се счита за добър резултат. Другите добронамерени стратегии събират само малко по-малко точки – от 83,4 до 78,6%, оставяйки далеч зад себе си най-успешната от всички непочтени стратегии – Грааскамп, събрала 66.8% точки.

Прошката

Друг технически термини на Акселрод е “прошката“. Прощаващата стратегия има кратка памет, въпреки че и тя може да отвърне на удара. Тя бързо забравя за минали грешки. Око за око е прощаваща стратегия. Той веднага бие през ръцете на Отказващия, но след това забравя за нанесената обида. Описаният в глава 10 Злопаметен никога не прощава. Той пази в паметта си всички събития до края на играта. Той никога не забравя, ако някой от играчите, най-малко веднъж играе срещу него “Отказвам се”. Стратегията, формално наречена Злопаметен, участва в турнира на Акселрод под името Фридман не постига особено добри резултати. Сред всички добронамерени стратегии (имайте предвид, че тя е добронамерена само в технически смисъл, но абсолютно нищо не прощава), двойката Злопаметен / Фрийдман е на предпоследно място. Причината заради която неспособните да прощават стратегии не постигат добри резултати е, че те не могат да прекъснат серията от взаимни отмъщения, дори и в случаите, когато противникът им се “разкайва”. Може да бъдем по-снизходителни, отколкото стратегията Око за око. Стратегията Око за две позволява на своите противници два последователни хода “Отказвам се” и след това отмъщава. Това може да изглежда твърде милостиво и щедро. Въпреки това, Акселрод установи, че ако някой беше представил стратегията Око за две, тя щеше да спечели турнира. Това се дължи на способността на тази стратегия да избягва поредицата от взаимни отмъщения.

…и все пак побеждава Доброто


По този начин определихме качествата на печелившите стратегии: добронамереност и умение да прощаваш. Това е почти утопично заключение, че добронамереността и всеопрощението се възнаграждават, предизвика удивление сред много експерти, които прибягваха до всевъзможни трикове, предлагайки стратегии, съдържащи в себе си скрити елементи на недобронамереност; дори тези, които предлагат добронамерени стратегии не са се решили на нещо толкова всеопрощаващо като Око за две.

Втори турнир на Акселрод

Акселрод обявява втори турнир. Получава 62 заявки за участие и отново добавя Случайната стратегия и стават общо 63 стратегии. Точният брой ходове за партията – 200 – е бил договорен предварително. Отново можем да изразим точките в процент от резултатите, получени при условие “винаги се кооперирам”, въпреки факта, че определението на тази мярка изисква по-сложни изчисления и не винаги е равна на 600 точки.

На всички програмисти, които са участвали във втория турнир, били представени резултатите от първия турнир, а също и анализа на Акселрод защо Око за око, и другите добронамерени и прощаващи стратегии имат такива добри резултати. Разбира се, участниците в турнира по някакъв начин трябваше да вземат предвид и тази информация. Бяха разделени в две групи. Едните смятали, че добронамереността и умението да прощаваш очевидно дават добри шансове за победа и съответно предлагат добронамерени и прощаващи стратегии. Джон Мейнард Смит отива толкова далеч, че представя всеопрощаващата стратегия Око за две очи. Другата група, изхождайки от това, че много от участниците, като прочетат анализа на Акселрод, ще предложат сега добронамерени и прощаващи стратегии. Затова те представят недобронамерени стратегии като се опитват да се възползват от тези предполагаеми идиоти!

Въпреки това, недобронамереността отново се оказва неизгодна. Отново стратегията Око за око, представена от Анатол Рапопорт печели и резултатът е цели 960/0 от 600. И отново добронамерените стратегии общо взето се оказват по-ефективни, отколкото непочтените. Всички 15 по-ефективни стратегии, с изключение на една, са били добронамерени, а 15-те събрали най-малко точки, всички с изключение на една са непочтени. Но, въпреки че праведната стратегия Око за две ако участваше в първия турнир щеше да спечели, то тя не излезе победител на втория. Това се обяснява с факта, че на втория турнир участваха още по-коварни стратегии, способни безмилостно да се разправят с толкова откровен наивник.

Този резултат се разкрива важен факт, характерен за тези турнири: успехът на една или друга стратегия зависи от това, какви други стратегии участват в турнира. Това е единственият начин да се обясни разликата между втория турнир, в който Око за две зае доста по-ниско място в класирането и първия турнир, в който щеше да спечели тази стратегия. Въпреки това, както казах, тази книга не е за това колко изобретателни могат да са програмистите. Има ли начин да се реши коя стратегия наистина може да се счита за най-добра в по-общ и по-малко произволен смисъл? Онези, които са прочели предишните глави, са готови да потърсят отговор на този въпрос в теорията на еволюционно стабилните стратегии.

Итерираният парадокс на затворника и еволюционни стабилните стратегии

Аз бях един от тези, на които Акселрод съобщи за ранните си резултати с молба да изпратя стратегия за втория турнир. Не съм направил това, но му дадох друго предложение да се свърже с Уилям Хамилтън и в резултатът от последвалата съвместна работа беше блестяща статия, публикувана в списание Science през 1981 г. и спечелила наградата Newcomb на Американската асоциация за напредък в науката. В допълнение към обсъжданите откъснати от живота биологични примери за Итерирани парадокси на затворника, Акселрод и Хамилтън дават според мен, правилния подход за оценка в светлината на теорията на ЕСС .

Една стратегия е ефективна тогава, когато остава ефективна и в среда, доминирана от нейните копия.

Да съпоставим този подход със “състезание всеки срещу всеки”, в съответствие с който бяха проведени двата турнира на Акселрод. Всяка стратегия се представя срещу всяка от останалите стратегии същия брой пъти. Окончателната оценка на стратегията се определя от общата сума точки “спечелени” в игрите с всички други стратегии. Акселрод нарича стратегията, която може да победи широк кръг от други стратегии, “силна” стратегия. Око за око е силна стратегия. Обаче наборът от стратегии, предложени от хората в този или друг случай е произволен. Това е, което ни притесняваше по-горе. По чиста случайност на първия турнир на Акселрод, около половината стратегии са били добронамерени. При тези обстоятелства, Око за око спечели и Око за две очи щеше да спечели, ако беше участвала в турнира. Да предположим обаче, че всички стратегии случайно се оказват недобронамерени. Такава ситуация би могла да се случи много лесно. Например от 14 предложени стратегии, 6 всъщност са били недобронамерени. Ако броят на недобронамерени стратегии е 13, то Око за око нямаше да спечели. Атмосферата щеше да е неподходяща за нея. Не само размера на печалбата, но също така и място в йерархичната стълбица, построена въз основа на постигнатия успех, определя това, какви стратегии бяха представени, с други думи, всичко зависи от такива произволни фактори като хрумването на този или онзи човек. Как можем да намалим тази случайност? Ако “мислим в духа на ЕСС”.

Както може би си спомняте от първите глави, важната характеристика на еволюционно стабилна стратегия , се състои в това, че тя продължава да бъде ефективна, когато тя вече е многочислена в дадена популация от стратегии. Наричайки я Око за око еволюционно стабилна стратегия, ние казваме, че Око за око е ефективна в ситуация, в която тази стратегия е доминираща. Това може да се разглежда като специален вид “власт”. Като еволюционисти ние сме изкушени да го разглежда като единствения вид сила, имаща съществено значение. Защо това е толкова важно? Защото в света на дарвинизма печалби се изплащат не в пари, а като потомство. За дарвиниста успешна стратегия е тази стратегия, която е станала многобройни в дадена популация от стратегии. За да остане една стратегия успешна, трябва да бъде ефективна тогава, когато е многочислена, когато тя действа в среда, където доминират нейните копия.

Meerkat

Снимка: Auckland Zoo

Трети кръг

Всъщност Акселрод провежда трети кръг на турнира, така, както би могъл да го води естествения отбор, стремящ се да намери някаква ЕСС. Въпреки това, той не го нарича трети кръг, защото не въвежда нови предложения, а използва същите 63 стратегии, като в предишния кръг.

Акселрод взе тези 63 стратегии и отново ги въведе в компютъра като “поколение 1″ на някаква еволюционна последователност. Поради това в “поколение 1″ равномерно са представени всичките 63 стратегии. В края на всяко поколение, на всяка стратегия победата не се плащала под формата на “пари” или “точки”, а в деца, идентични на техните (безполови) родителите. С течение на времето, поколение след поколение, някои стратегии стават редки и накрая изчезват напълно. Други стратегии започват да се срещат все по-често. След промяната на тези съотношения, се променя и “средата”, в която става по-нататъшното развитие на играта.

В крайна сметка, след около 1000 поколения по-нататъшните промени в ситуацията приключват. Стабилността е постигната. Преди това, благосъстоянието на различните стратегии се издигало и падало, точно както в компютърния модел на стратегията на Наивника, Тариката и Злопаметния. Някои стратегии са тръгнали надолу още от началото, а след 200-то поколение, по-голямата част от тях са загинали. Една или две от недобронамерените стратегии са станали все по-често срещани, но техния просперитет, както при Наивника в моя модел, е кратък. Единствената недобронамерена стратегия, запазила се след 200 поколения, е стратегия, наречена Харингтън. Победите на тази стратегия рязко нараствали през първите 150 поколения, а след това бавно намалели и стратегията почти изчезнала в 1000-то поколение. Стратегията на Харингтън е била успешна за известно време по същата причина, поради която и оригиналната ми стратегия на Тариката. Тя използвала глупаци като стратегията Окото за две очи, докато все още съществували. След като тези наивници били доведени до изчезване, стратегията Харингтън, лишена от лесна плячка, ги последвала. Арената се оказала свободна за такава добронамерени, но дръзки стратегии, като например Око за око.

Самата стратегия Око за око доминира в пет от шест партии от третия кръг, точно както е било и в кръг 1 и 2. Пет други добронамерени, но дръзки стратегии имат почти същия успех (висока честота на популацията), както Око за око, една от тях дори печели в шестата партия. След като всички недобронамерени стратегии бяха доведени до изчезване, нито една от добронамерените стратегии не може да бъдат разграничена от Око за око, или една от друга, защото всички те, бъдейки добронамерени, просто играели помежду си “Кооперирам се”.

Око за око или смес Око за две и Недоверчиво око за око

Тази невидимост в частност означава, че въпреки че Око за око напомня ЕСС, тя е, строго погледнато, не истинска ЕСС. Запомнете: За да бъде ЕСС една стратегия трябва, когато се разпространи, да бъде защитена срещу проникване на една или друга рядка мутантна стратегия. Що се отнася до стратегията Око за око, макар да не позволява проникване на недобронамерени стратегии, от други добронамерени стратегии не е защитена. Както току-що видяхме, в популация от добронамерени стратегии всички стратегии ще изглеждат и се държат еднакво: те ще играят “Кооперирам се”. По този начин, всяка друга добронамерена стратегия, като съвършено праведната “Винаги се кооперирам“, която вероятно има отделни положителни предимства пред стратегията Око за око, все пак може да проникне в популацията незабелязано. Така че технически Око за око не трябва да се счита за ЕСС.

Може да си помислите, че защото светът остава все такъв добронамерен, можем да разглеждаме Око за око като ЕСС. Но, Боже мой, вижте докъде води това! За разлика от Око за око, стратегията “Винаги се кооперирам” е неустойчива на навлизането на недобронамерени стратегии, като например “Винаги отказвам“. Стратегията “Винаги отказвам” се оказва ефективна срещу “Винаги се кооперирам“, защото всеки път, получава 5 точки за риск. Недобронамерените стратегии, като “Винаги отказвам” влизат в играта, поддържайки на ниско ниво броя на твърде добронамерените стратегии, като например “Винаги се кооперирам“.

Макар че Око за око, строго погледнато, не е истинска ЕСС, то вероятно е справедливо да се разглежда някаква смес от основно добронамерен, но отмъстителни “Око за око-подобни” стратегии като приблизително еквивалентни на ЕСС. Такава смес може да съдържа една малка добавка недобронамереност.

Робърт Бойд и за Джефри Лорбербаум (Robert Вoуd, Jeffrey Lorberbaum) в една от най-интересните си работи, продължаващи научните изследвания на Акселрод, разглеждат смес от стратегиите Око за око и стратегия, наречена Недоверчив око за око. Недоверчив око за око технически се отнася към недобронамерените, но тя не е твърде непочтена. Тя се държи точно както самата Око за око, след първата стъпка, но именно това я прави технически недобронамерена – тя играе “Отказвам се” на първия ход.

В условията на пълно доминиране на стратегията Око за око, стратегията Недоверчив око за око не може да просперира, защото нейния начален отказ дава началото на една непрекъсната верига на взаимни отмъщения. Ако тя се срещне с играч, приел стратегията Око за две, неговата прошка за първия отказ ще пресече потока на взаимни обвинения в зародиш. И двамата играчи ще завършат играта с резултат най-малко базовия (т.е. само тройки), а Недоверчивия око за око, ще получи награда за първоначалния си отказ.

Бойд и Лорбербаум доказват, че в популацията от стратегии Око за око може да проникне в еволюционен смисъл, смес от “Око за две и Недоверчив око за око” – двете стратегии, които процъфтяват в съчетание една с друга. Това почти със сигурност не е единствената комбинация, способна на подобни нашествия. Може да съществуват много смеси от леко непочтени стратегии с добронамерени и опрощаващи, които са способни на съвместна инвазия. Във всичко това може да се види отражение на добре познати ситуации, срещащи се в живота на хората.

Сътрудничество или отказ? Как може да се премине прага?

Снимка: Mail Online

Акселрод разбира, че Услуга за услуга, строго погледнато, не може да се счита ЕСС и следователно той я описва като “колективно стабилна стратегия“. Както и в случая на истински ЕСС колективно стабилни могат да бъдат едновременно няколко стратегии. Отново, доминирането в популацията зависи само от късмета. “Винаги отказвам” е също стабилна стратегия, както и Око за око.

В популация, в която “Винаги отказвам” вече е постигнал господстващо положение, нито една друга стратегия не може да я победи по ефективност. Ние можем да разглеждаме системата като имаща две точки на стабилност, едната от тях е “Винаги отказвам“, а другата – Око за око (или някаква смес от преобладаваща част добронамерени стратегии). Тази точка на стабилност, която първа заеме доминиращо положение в популацията, тя и остава доминантна.

Какво означава “доминирани” на количественото ниво? Какъв трябва да бъде броят на стратегиите Око за око, че да преодолее “Винаги отказвам“? Това зависи от конкретните ползи, които банкерът ще се съгласи да даде в тази игра. Като цяло можем да кажем, че има определена критична честота, определен праг. От едната страна на критичната честота стратегията Око за око расте и отборът все повече и повече благоприятства тази стратегия. От другата страна се превишава критичната честота на стратегията “Винаги отказвам” и отборът все повече благоприятства последната. Ние вече сме срещали тази ситуация в глава 10, когато разглеждахме стратегията на Тариката и Злопаметния.

Следователно е ясно, колко важно е това, от коя страна на прага ще се окаже дадена популация в самото начало. Необходимо е да разберем как популацията понякога може да премине от едната страна на прага на другата.

Да предположим, че започваме с популацията, която вече се намира на страната на “Винаги отказвам“. Малкото индивиди, придържащи се към стратегията Око за око, не се срещат достатъчно често, за да си бъдат взаимно изгодни.

Така естественият отбор избутва популацията още повече, до най-крайната точка на “Винаги отказвам“. Ако можеше тази популация просто по някакъв начин, в резултат на случаен дрейф да пресече прага, тя би могла да се хлъзне по склона на страната на стратегията Око за око и за всички щеше да бъде много изгодно и щеше да плаща банкерът (или “Природата”).

Но, разбира се, популацията няма нито воля, нито намерения или цели, които да са общи за цялата група. Те не могат да се стремят да преминат прага. Те ще го преминат, само ако ги поведат след себе си ненасочените сили на природата.

Как може да стане това? Може да се отговори: “случайно”. Обаче думата “шанс” просто скрива нашето незнание. Тя означава, “определя се от някакви все още неизвестни или неустановени фактори”.

Ние имаме възможност да отговорим малко по-добре. Можем да се опитаме да си представим как някакво малцинство от индивиди, използващи стратегията на Око за око, биха успели да увеличат броя си и да достигнат критична маса. Това е еквивалентно на намиране на възможен начин, по който индивиди Око за око могат да образуват достатъчно големи формации, така че всички заедно да спечелят за сметка на банкера.

Може ли да се премине критичния праг

Най-очевидната причина за образуването на такива групи в природата е генетичната близост, родство. Животните от повечето видове са склонни да живеят близо до своите роднини и братовчеди, а не до някакви случайни членове на дадена популация. Това не е задължително по техен собствен избор, а автоматично следва от присъщия на популацията “вискозитет”. Вискозитет означава всяка наблюдавана тенденция при индивидите да продължат да живеят в близост до мястото, където са родени. Например през по-голямата част от историята си и в повечето области на земното кълбо (въпреки че това не винаги е възможно да се каже за нашия модерен свят), хората рядко се отдалечават на повече от няколко километра от мястото, където са родени. Това води до формирането на локални групи на индивиди, свързани с генетична връзка. Спомням си, когато посетих един остров, доста отдалечен от западното крайбрежие на Ирландия, ме порази впечатлението, че почти всички негови жители имат огромни уши, напомнящи дръжки на делва. Едва ли обяснението е, че големите уши съответстват на климата (на острова духат силни ветрове от морето). Това е резултат на близкото родство между всички жители на острова.

Генетичната връзка се проявява не само във външната прилика (напр. чертите на лицето), но и в различни други аспекти. Например, хората свързани с генетичната връзка, си приличат помежду си по генетичната си склонност да играят (или не играят) Око за око. Следователно, дори ако тази стратегия е рядкост в общата популация, то може да бъде широко разпространена локално. В един локален участък индивидите, които използват на стратегията Око за око, може да се срещат достатъчно често така че взаимното коопериране да им осигури просперитет, въпреки факта, че според изчисленията, произтичащи само от глобалната честота в популацията като цяло, то може да се получи, че тяхната честота е под критичната.

В такива случаи индивидите Око за око, се кооперират помежду си в рамките на уютните малки територии, може да достигнат такъв разцвет, че от локални клъстери да станат по-големи локални клъстери. Понякога локалните клъстери нарастват толкова много, че се разпространяват в други области, в които преди числено са доминирали индивидите, придържащи се към стратегията “Винаги отказвам“.

Моят ирландски остров, очевидно не е много добър пример на споменатите малки участъци, защото той е физически откъснат. Представете си по-обширна популация, в която се стават съществени размествания, така че членове й повече приличат на своите непосредствени съседи, отколкото в по-отдалечените, въпреки непрекъснатото кръстосване (интербридинг) в мащабите на цялата област.

И така, завръщайки се обратно към нашия праг, трябва да признаем, че индивидите Око за око, може да го преодолеят. За това е необходимо само неголямо локално струпване от такива индивиди, подобно на тези, които по естествен начин възникват в природните популации. Око за око има способността да преодолее границата да наклони везните, дори ако честотата на тази стратегия е ниска. Като че ли под този праг има таен проход. Обаче тайната врата в този таен проход пропуска индивиди само в едната посока, т.е. има определена асиметричност. За разлика от стратегията Око за око, Винаги отказвам, въпреки, че е истинска ЕСС не може да използва локалните струпвания за да преодолее прага. Локалните струпвания от индивиди, които използват стратегията Винаги отказвам, когато са заедно, не само не се развиват, а функционират особено лошо. Вместо това спокойно да си помагат един на друг за сметка на банкера, те се топят един на друг.

И така, стратегията Винаги отказвам, за разлика от Око за око, не извлича полза ни от родствените връзки, ни от вискозитета на популацията.

Така, въпреки че Око за око, само с големи резерви може да бъде класифицирана като ЕСС, има известна стабилност от по-висш порядък. Ако чакаме достатъчно дълго, може би хиляди години. Око за око, в крайна сметка ще достигне числеността необходима за да пресече прага и популацията ще го направи с един скок. Обратното, обаче, не се случва. Стратегията Винаги отказвам, както видяхме, не може да се възползва от образуването на струпвания, така че тя не се възползва от преимуществата на тази стабилност от по-висш порядък.

Завист

Око за око е “добронамерена” стратегия, т.е. никога не отказва първа и е “незлопаметна”, т.е. бързо забравя миналите злодеяния. Тук искам да се въведа още един от очарователните технически термини на Акселрод: “Око за око независтлива“. Да бъдеш завистлив според Акселрод означава стремеж да се спечелят повече пари от другия играч, а не да се стремиш да получиш повече в абсолютно изражение от капитала на банкера. Да си независтлив означава да се чувстваш напълно удовлетворен, ако другият играч получава точно толкова пари, колкото и вие, при условие, че и двамата да печелите по този начин повече от банкера. Око за око никога истински не “печелят” играта. Помислете и ще осъзнаете, че тя не може да събере повече точки от “противника” във всяка отделна игра, защото отказва само като отмъщение. Тя може най-много да бъде наравно с противника си. Въпреки това, всяко равенство носи и на двамата играчи по много точки. Когато става дума за стратегията Око за око или за друга добронамерена стратегия, думата “враг” е неподходяща. Но за съжаление, когато психолозите провеждат играта Итериран Парадокс на затворника между реални хора, почти всички играчи се поддават на чувството на завист и затова в парично отношение успехите им са сравнително малки. Изглежда, че много хора, даже без да съзнават това са по-скоро готови да натопят другия играч, отколкото да се кооперират с тях, за да разорят банкера. Цялата заблуда на такава стратегия показва Акселрод.

Тази грешка засяга само определени типове игри. В теорията на игрите има игри с “нулева сума” и с “ненулева сума“. В игрите с нулева сума, които печели единия играч, това винаги се придружава със загубата на другия. Игра от този тип е шаха, тъй като целта на всеки играч е да спечели, т. е., другият играч да загуби. Обаче парадоксът на затворника е игра с ненулева сума. В него са участва банкера, изплащащ парите и двама играчи, които ако се обединят могат да разорят банката.

Игри с нулеви и ненулеви суми. Сянката на бъдещето

Разводи

По нататък следва пример как едно бракоразводно дело вместо игра с ненулева сума (ако двете страни се споразумеят), благодарение на адвокатите се превръща в игра с нулева сума, игра , в която се търси победител и победен. Но за самите адвокати играта е с ненулева сума, особено ако се споразумеят адвокатите на двете страни дружно да се възползват от клиентите си, протакайки делото.

А какво да кажем за другите игри, които играем? Кои от тях се отнасят към игрите с ненулева и кои – с нулева сума? И тъй като това не е едно и също нещо, кои аспекти от живота ни, приемаме за нулева или ненулева сума? Кои аспекти на човешкия живот насърчават развитието на “завист” и кои насърчават към коопериране срещу “банкера”? Помислете, например, за споровете около заплатите и диференцираното заплащане. Когато водим преговори за да ни повишат заплатите, дали сме мотивирани от завист или се кооперираме за да максимизираме нашите реалните доходи? Ние вярваме, че в реалния живот, както и в психологическите експерименти, че участваме в игра с нулев резултат, докато в действителност тя не е такава? Трудни въпроси. Отговорите са извън предмета на тази книга.

Уговорените футболни мачове – игри с ненулева сума

Друг интересен пример е футболния мач, който е типична игра с нулева сума, но понякога се случват мачове, в които равенството удовлетворява и двата отбора, т.е играта е с ненулева сума и отборите се “кооперират” и размотават по терена за неудоволствие на зрителите.

Зрелищните спортове като футбол, обикновено са игри с нулева сума, заради една много добра причина. На зрителите им е много по-интересно да гледат играчи, които страстно се противопоставят помежду си за победа, отколкото да ги наблюдават как приятелски постигат примирие. Въпреки това, реалния живот, дали човешки живот или на растения и животни, е създаден не за да забавлява зрители. Много ситуации в реалния живот по същество малко се различават от игри с ненулева сума. Природата често е “банкерът”, така че индивидите могат да извлекат изгода от съвместния успех. Няма нужда да стъпчат враговете си за да се постигнат благополучие. Без да отстъпваме от основните закони на егоистичния ген, можем да видим как кооперирането и взаимната помощ водят до просперитет, дори в един свят, доминиран от егоизъм. Можем да се убедим, че добрите момчета могат да финишират първи (в акселродовски смисъл).

Сянката на бъдещето

Всичко това обаче се реализира само в случай на итерирана игра. Играчите трябва да знаят (или “знаят”), че текущата игра не е последна за тях. “Сянката на бъдещето“, за която говори Акселрод, трябва да е дълга. Но колко дълга? От теоретична гледна точка продължителността на играта няма значение, важно е само никой от играчите да не знае кога ще свърши. Да приемем, че играем един срещу друг и двамата знаем, че тази в игра трябва да се играят 100 партии. И двамата разбираме, че 100-та партия, след като е последна е еквивалентна на обикновена еднократна игра на Парадокса на затворника. Следователно, единствената разумна стратегия за всеки от нас в 100-та партия, трябва да бъде Отказвам се и всеки от нас може да допусне, че другият играч ще си направи същата сметка и твърдо ще реши в последната партия да играе Отказвам сесъщо. Така че последната партия може да се отпише като предвидима. Но сега еквивалента на еднократна игра се превръща 99-та партия и единственият разумен избор за всеки играч в предпоследната игра е Отказвам се. До същото решение ще трябва да се прибегне и на 98-ата партия и така нататък в обратната посока. Два напълно рационално мислещи играчи, всеки от които предполага, че другият също е строго рационален може да играе само Отказвам се, ако и двамата знаят колко партии трябва да играят. Ето защо, експертите по теорията на игрите, разсъждавайки за Итерирания или Повторяем Парадокс на затворника, винаги изхождат от предположението, че краят на играта е непредсказуем или известен само на банкера.

Очаква се, че всеки играч ще се държи съобразно оценката си колко време ще продължи да играе. Колкото по-висока се окаже тази оценка, толкова по-дълго ще играе в съответствие с математическото очакване за истинска итерирана игра, с други думи, ще бъде по-добър и по-малко ревнив, по-склонен да прости. Колкото по-къса по негова оценка ще бъде играта, толкова повече ще е склонен да играе според математическите очаквания за еднократна игра: ще се държи недобронамерено и ще бъде злопаметен.

Живей и остави другите да живеят

Следва обширен разказ с многобройни цитати за един интересен феномен по време на Първата световна война, който Акселрод дава за пример колко важна може да бъде сянката на бъдещето. Разказва се за дружестките отношения, които са се установявали на отделни места по фронта. И двете страни са се придържали към политиката “живей и остави другите да живеят.”

В окопната война от онези времена сянката на бъдещето за всеки взвод била дълга. Това означава, че на всяка група от окопали се британски войници, по всяка вероятност, ще се наложи дълги месеци да вижда все една и съща окопана група немски войници. Сянката на бъдещето била достатъчно дълга и достатъчно неясна за да способства развитие на коопериране от типа Око за око. Разбира се, в този случай ситуацията е съответствала на играта Парадокс на затворника.

Нека ви напомня, че играта може да се счита за истински Парадокс на затворника, само ако плащанията могат да се разположат в определена последователност по ранг.

  • Отказ в случая, когато другата страна се кооперира (0K) (ако мине номера).
  • Двете страни предпочитат взаимното сътрудничество (КК)
  • Взаимно отхвърляне (00)
  • Предложение за сътрудничество, което другата страна отказва (К0), най-лош вариант.

Взаимно отхвърляне – това е, което би искал Генералния щаб.

Взаимното коопериране, от позицията на генералите, не е никак желателно, това няма да им помогне да спечелят войната. Обаче то е във висша степен желателно от гледна точка на отделните войници от двете страни. Те не искат да бъдат убити. Може да се предположи – и това ще обезпечи изпълнението на другите условия, необходими, за да превърне тази ситуация в истински Парадокс на затворника, че войниците, вероятно са били съгласни с генералите, предпочитайки да спечелят войната, вместо да я загубят. Въпреки това, всеки отделен войник не е изправен пред подобен избор. Резултатът на войната, едва ли съществено зависи от това, какво прави даден войник като индивид. Взаимното коопериране с конкретни неприятелски войници, стоящи срещу вас зад ничията ивица земя безусловно засяга собствената си съдба и то е, разбира се, далеч за предпочитане от взаимния отказ, независимо от това, че вие може би от патриотизъм или подчинявайки се на дисциплината – бихте предпочели да играете Отказвам се (0K), ако можеше да ви се размине. Изглежда, че дадената ситуация наистина представлява истински Парадокс на затворника. Следователно може да се очаква, че ще възникне нещо като стратегията Око за око, така и се е случило.

За всяка стратегия от семейството на Око за око е важно, играчите да понасят наказание за отказ. Заплахата от възмездие винаги трябва да присъства. Демонстрацията на способността да отмъстиш играе важна роля в системата “живей и остави другите да живеят”. Точни стрелци и от двете страни демонстрирали смъртоносната си виртуозност не да стрелят по вражеските войници, а по неодушевени цели близо до войниците – метод, използван в уестърните

Системата “живей и остави другите да живеят” може да бъде развита и чрез преговори около кръглата маса между здравомислещи стратези. Обаче това не се случи. Тя се разви като резултат от ред локални споразумения чрез реакцията на хората на поведението един на друг.

Програмите на Акселрод са отличен модел на поведението не само на животни и растения, но всъщност и на гените. Затова е естествено да си зададен въпроса не е ли приложимо и оптимистичното му заключение – успехът на независтливата, незлопаметна добронамереност и към природата. Да, разбира се, е приложимо. Природата понякога устройва игри в духа на Парадокса на затворника, като условието е сянката на бъдещето да е дълга и играта да бъде игра с ненулева сума. Тези условия определено са удовлетворени във всички царства на живите същества.

Малко примери от коеволюцията

В примера с бактерия-паразит и човек-гостоприемник, взаимоотношения им са стабилни, когато сянката на бъдещето е дълга, но когато човекът е например ранен, тази сянка се скъсява и бактериите се изкушават да играят Отказвам се. Естествено този избор не е съзнателен, а изработен в резултат на отбора и действащ по чисто биохимичен начин.

Другият пример съвпада с примера, който съм дала за коеволюция (която си е чисто коопериране) между смокинята и малката опрашваща я оса. Тяхното сътрудничество се състои в това, че осичките намират в плодовете защитено и хранително място, където да снесат ларвите си, като същевременно опрашват съцветията в кутийката. Има ли механизъм, с който да могат да си отмъстят при Отказ?

Според Акселрод и Хамилтън: “Оказа се, че в много случаи, когато смокиновата оса, проникваща в неузрели смокини, не опрашва достатъчен брой цветчета, т. е, не обезпечава образуването на семена, дървото спира развитието на плода на смокинята в ранен стадий. В резултат на това, всички потомци на насекомото умират. ”

Редуване на ролите при морския костур

Странен пример за това, което очевидно може да се счита за стратегия Око за око в природата, открива Ерик Фишер у хермафродитния вид риба – морски костур. За разлика от човека у този вид пола на даден индивид не се определя от хромозомите при зачеването. Всеки индивид е в състояние да функционира и като самка и като самец. По време на размножителния период на рибите, във всеки отделен случай, даден индивид може да произвежда или хайвер (яйца) или мляко (сперма). Морските костури образуват моногамни двойки, при това партньорите се редуват в ролята ту на самци, ту на самки. Нека сега приемем, че някаква риба, би “предпочел”, ако й се размине, през цялото време да действа като самец, защото така й е по-евтино. С други думи, един индивид, ако успее да убеди партньора си по-голямата част от времето си да играе ролята на самка, ще се възползва от плодовете “на нейния” икономически принос в яйцата, докато той “той” спестявайки част от своите ресурси е в състояние да ги използва по различен начин, например, да се чифтоса с друга риба.


Снимка: NatureGate

Всъщност, Фишър е открил, в системата на костура има доста строга последователност. Именно това е, което може да се очаква, ако те се придържат към стратегията Око за око. Това е правдоподобно, тъй като играта, която те играят – изглежда да е истински парадокс от затворника, макар и в малко по-сложна версия. Да поставиш карта “Кооперирам се” означава да влезеш в ролята на самка, когато дойде твоя ред да бъдеш самка. Да се опитваш да играеш ролята на самец, когато трябва да бъдеш самка, е равносилно да сложиш карта “Отказвам се“. Отказът се последва от отмъщение: “тя” може просто спре всички взаимоотношения. И наистина Фишър е наблюдавал, че двойките, в които ролите на самка и самец се изпълняват неравномерно, обикновено се разпадат.

Вампирски истории

Социолози и психолози понякога си задават въпроса: защо донорите (в страни като Англия, където не се заплаща), дават кръвта си? Трудно ми е да повярвам, че това се основава на някаква сметка за ответна услуга или на елементарен егоизъм в завоалирана форма. Защото на всички дарители, които даряват кръв редовно, не им се полагат никакви привилегии, дори когато самите те се нуждаят от преливане на кръв. Може би съм наивен, но аз бих искал да разглеждам това като пример на истински безкористен алтруизъм. Но ето прилепите-вампири, които споделят кръв помежду си, очевидно доста се вписват в модела на Акселрод. Научихме за това от работата на Г. Уилкинсън (G.S. Wilkinson).

Vampyrus spectrum
Снимка: wikipedia

Вампирите, както е добре известно, се хранят с кръв. Те ловуват през нощта и не е лесно да си набавят храна, но ако намерят жертва, обикновено кръвта й е предостатъчна за да се нахрани. На разсъмване, някои индивиди, на които не им е провървяло, се връщат с празни ръце, докато други, които са успели да намерят жертва, често се насмукват с кръв повече. Следващия път щастието може да се усмихвне на другите. Тази ситуация отваря възможността за реципрочен алтруизъм. Уилкинсън открил, че тези индивиди, които са имали късмет някоя вечер, понякога споделят кръвта с не толкова успелите техни братя, повръщайки част от нея. От 110 такива случаи, наблюдавани от Уилкинсън, в 77 от тях, съвсем естествено, кръвта била повръщана от майките за малки им, а в много други случаи, вампирите са споделяли кръвта с генетично близки роднини. Въпреки това, остават още няколко епизода, когато кръвта се повръщала за несвързани прилепи, т.е., е имало случаи, които не могат да бъдат обяснени с “Гласът на кръвта”. Характерно е, че в това са участвали индивиди, които често си почивали заедно през деня, т.е. те са имали пълната възможност многократно да комуникират един с друг, както се изисква за Итериран Парадокс на затворника.

Vampyrus spectrum

Снимка: wikipedia

Уилкинсън изучава скоростта на загуба на тегло в гладуващите вампири. Въз основа на тези данни, той изчислил за колко време ще умре от глад сит вампир, вампир с празен стомах и всички междинни ситуации. Това му позволява да изразят стойността на кръвта в “пари”, единица за което служи час удължен живот. Той открил, което не е изненадващо, че “обменния курс” може да варира, в зависимост от това колко е гладен прилепът. Дадено количество кръв продължава живота на силно изгладнелия вампир на за по-дълъг период, отколкото по-малко гладни животни. С други думи, въпреки че актът на даване на кръв ще увеличи шансовете за гибел на донора, но това увеличение е много по-малко в сравнение с увеличаването на шансовете за оцеляване на получателя. По този начин, трябва да признаем, че вампирите прилагат правилата на играта Парадокс на затворника. Кръвта, която дава донора, представлява за нея (социалните група, съставени от вампири се състоят от самки) по-ниска стойност, отколкото същото количество кръв за реципиента. Но изпълняват ли се останалите условия, необходими за еволюцията на стратегията Око за око?

По-специално, дали прилепите са способни да се разпознават един друг като отделни индивиди? В експеримент, проведен с прилепи, отглеждани затворени, Уилкинсън доказал, че те са способни на това. Експериментът се състои от следното: един от прилепите отделяли за една нощ от другите и не му позволявали да яде, докато всички останали хранели. Нещастния изгладнял прилеп Уилкинсън отново прехвърлят при другите, а след това наблюдавал ще му даде ли някой да яде и кой точно. Експериментът се провеждал много пъти и всички прилепи поред се оказвали в ролята на гладуващи жертви. Ключовият момент се състоял в това, че тази популация от пленени вампири била смес от две отделни групи, уловени в пещери, които са на разстояние една от друга на няколко километра.

В общо 13 случая са били наблюдавани случаи на хранене на гладно животно. В 12 от тези 13 случая, самката-донор била “стар приятел” на гладната жертва, уловени били в една и съща пещера. Разбира се, не можем да изключим възможността за съвпадение, но според изчисленията, шансовете за това са по-малко от 1:500. Имаме право да си извадим извода, че вампирите определено предпочитат да хранят стари приятели, а не непознати от друга пещера.

За вампирите има много легенди. В “черните романи” на Викторианската епоха, те се проявяват като тъмни сили, предизвикващи ужас през нощите, погубващи невинни създания, изсмуквайки от тях жизнените им сокове, само за да утолят жаждата си. Добавете към това и за другите митове на Викторианската епоха – за Природата с окървавени зъби и нокти, то не са ли вампирите истинско въплъщение на най-дълбоките страхове пред един свят, управляван от егоистичения ген? Що се отнася до мен, аз съм скептично настроен към всички митове. Ако в този или друг конкретен случай, искаме да знаем истината, ние трябва да я търсим. Дарвинизмът не ни дава детайлна информация за отделните организми, но ни дава нещо по-дълбоко и по-ценно – разбирането на принципа. Ако не не можем да минем без митове, истинските факти за вампирите може да влязат в един различен назидателен разказ. За самите тези животни работата не се ограничава с “кръвта вода не става”. Те са способни да се издигнат над семейните връзки, създавайки свои собствени силни братства, верността, в които е запечатана с кръв. Вампирите могат да вдъхновят за нов успокоителен мит – митът за равноправното взаимно сътрудничество. Те могат да бъдат предвестници на блажената идея, че добрите момчета, въпреки украсяващите шлема им егоистични гени, могат да се класират първи.

Прочети още ...

Докинс - Теория за егоистичния ген

4 отговора към “Дилемата на затворника – част 12”

  1. [...] (Силно препоръчвам!!!) Dawkins, Richard. Nice Guys Finish First. Документален филм на BBC. (Не пряко, а косвено отношение по темата. “Добрите момчета се класират първи” е глава от книгата “Себичният ген” на Ричард Докинс, която може да прочетете на български тук.) [...]

    • Vanya казва:

      Когато започнах превода на книгата на Докинс тук (в сайта)(преди 6-7г) не беше излязла на български. Е, да речем, че имаше смисъл заради интерактивните добавки като симулацията на “Парадокса на затворниците” в кази част. Но престанах , макар че ми остана 1/2 глава – всеки може да си я купи вече.
      Благодаря за препоръката и линка:)

      • Joker казва:

        Трябва да довършиш превода, не можеш да се откажеш, когато ти е останало толкова малко.

  2. Николай Николов казва:

    Довърши си работата,човече! Съдействай за разпространението на ” мема,,!

Вашият коментар

Or

Вашият email адрес няма да бъде публикуван Задължителните полета са отбелязани с *

*


Можете да използвате тези HTML тагове и атрибути: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>