Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

8
Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

Upload: twyla

Post on 05-Jan-2016

39 views

Category:

Documents


2 download

DESCRIPTION

Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση. Το δίλημμα του φυλακισμένου. Δύο παίκτες, καθένας παίζει C ή D Σκοπός κάθε παίκτη είναι να μεγιστοποιήσει το κέρδος του. C D. C. D. Στο Prisoner’s Dilemma κάθε παίκτης έχει συμφέρον να παίξει D Δε δικαιολογείται η συνεργασία - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

Page 2: Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

Το δίλημμα του φυλακισμένου

• Δύο παίκτες, καθένας παίζει C ή D

• Σκοπός κάθε παίκτη είναι να μεγιστοποιήσει το κέρδος του

3,3 0,5

5,0 1,1

C D

C

D

Page 3: Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

• Στο Prisoner’s Dilemma κάθε παίκτης έχει συμφέρον να παίξει D

• Δε δικαιολογείται η συνεργασία

• Το ίδιο και στο επαναλαμβανόμενο PD

3 0

5 1

C D

C

D

Page 4: Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

Στην πραγματικότητα παρατηρούμε συνεργασία. Γιατί όχι και στο PD;

• Τα πραγματικά προβλήματα δεν αντιπροσωπεύονται από το PD

• Δεν ισχύει πάντα η υπόθεση του απόλυτα εγωιστή παίκτη

• Τα σύνθετα πραγματικά παίγνια έχουν στη βάση τους το PD αλλά έχουν περισσότερα επίπεδα

Page 5: Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

1ο και 2ο Πρωτάθλημα του Axelrod

• Ένα σύνθετο παίγνιο με το PD στη βάση του

• Προσέγγιση με πειράματα με υπολογιστή

Page 6: Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

Κανόνες

• Παίζουν προγράμματα γραμμένα σε κάποια γλώσσα προγραμματισμού (πχ Basic, Fortran, C κλπ)

• Όλα τα προγράμματα παίζουν έναν αγώνα με όλα τα άλλα ανά δύο

• Ένας αγώνας είναι 200 επαναλήψεις του PD• Τα προγράμματα έχουν πρόσβαση σε όλη την ιστορία

του τρέχοντα αγώνα• Σκορ σε κάθε αγώνα είναι το άθροισμα των πόντων από

τις 200 επαναλήψεις PD• Συνολικό σκορ κάθε προγράμματος το άθροισμα των

επιμέρους σκορ των αγώνων• Νικητής το πρόγραμμα με το μεγαλύτερο συνολικό σκορ

Page 7: Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

• Και στα δύο πρωταθλήματα νικητής ήταν το πρόγραμμα ‘Tit for Tat’ («σου κάνω ό,τι μου κάνεις»)

• Παίζει ως εξής:- Στην πρώτη κίνηση παίζει C- Στη ν-οστή κίνηση παίζει ό,τι έπαιξε ο αντίπαλος στη (ν-1)-οστή κίνηση

• Άλλα προγράμματα:- Πάντα C- Πάντα D- Τυχαία κίνηση- Πάντα C μέχρι ο αντίπαλος να παίξει D, μετά πάντα D

• Όλα τα top προγράμματα έπαιζαν αρχικά C• Άρα είναι έξυπνη κίνηση να δηλώνεις εξαρχής πρόθεση

συνεργασίας

Page 8: Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

3ο (εξελικτικό) πρωτάθλημα του Axelrod

• 1000 γύροι• Κάθε γύρος είναι ένα απλό πρωτάθλημα (όπως τα

προηγούμενα)• Το ποσοστό εκπροσώπησης των προγραμμάτων σε

κάθε γύρο είναι ανάλογο του σκορ που συγκέντρωσαν στον προηγούμενο γύρο (Πήρε το όνομα από την εξέλιξη στη βιολογία)

• Μετά από 1000 γύρους το πρόγραμμα Tit for Tat είχε τη μεγαλύτερη εκπροσώπηση

• Τελικά η συνεργασία μπορεί να επικρατήσει εξελικτικά