Artemis.cslab.ece.ntua.gr:8080



Εθνικ? Μετσ?βιο Πολυτεχνε?ο165735-216535Σχολ? Ηλεκτρολ?γων Μηχανικ?ν και Μηχανικ?ν Υπολογιστ?νΕργαστ?ριο Τεχνητ?? Νοημοσ?νη? και Συστημ?των Μ?θηση?, Τομ?α? Τεχνολογ?α? Πληροφορικ?? και Υπολογιστ?νΧρ?ση ευφυ?ν τεχνικ?ν για τη μελ?τη παιχνιδιο? στρατηγικ?? με μερικ?? παρατηρ?σιμο περιβ?λλονΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑΧΑΡΑΛΑΜΠΟΣ Χ. ΑΣΗΜΑΚΟΠΟΥΛΟΣΕπιβλ?πων : Ανδρ?α?-Γε?ργιο? Σταφυλοπ?τη?Καθηγητ?? Ε.Μ.Π.Συνεπιβλ?πων : Γε?ργιο? Σι?λα?Ε.ΔΙ.Π. Ε.Μ.Π.Αθ?να, Δεκ?μβριο? 2019Εθνικ? Μετσ?βιο Πολυτεχνε?ο165735-216535Σχολ? Ηλεκτρολ?γων Μηχανικ?ν και Μηχανικ?ν Υπολογιστ?νΕργαστ?ριο Τεχνητ?? Νοημοσ?νη? και Συστημ?των Μ?θηση?, Τομ?α? Τεχνολογ?α? Πληροφορικ?? και Υπολογιστ?νΧρ?ση ευφυ?ν τεχνικ?ν για τη μελ?τη παιχνιδιο? στρατηγικ?? με μερικ?? παρατηρ?σιμο περιβ?λλονΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑΧΑΡΑΛΑΜΠΟΣ Χ. ΑΣΗΜΑΚΟΠΟΥΛΟΣΕπιβλ?πων : Ανδρ?α?-Γε?ργιο? Σταφυλοπ?τη?Καθηγητ?? Ε.Μ.Π.Συνεπιβλ?πων : Γε?ργιο? Σι?λα? Ε.ΔΙ.Π. Ε.Μ.ΠΕγκρ?θηκε απ? την τριμελ? εξεταστικ? επιτροπ? την 17η Δεκεμβρ?ου 2019..................................................................................................................................Ανδρ?α?-Γε?ργιο? Σταφυλοπ?τη?Παναγι?τη? Τσαν?κα?Γε?ργιο? Στ?μουΚαθηγητ?? Ε.Μ.Π.Καθηγητ?? Ε.Μ.Π.Αναπληρωτ?? Καθηγητ?? Ε.Μ.ΠΑθ?να, Δεκ?μβριο? 2019...........................................Χαρ?λαμπο? Χ. Ασημακ?πουλο?Διπλωματο?χο? Ηλεκτρολ?γο? Μηχανικ?? και Μηχανικ?? Υπολογιστ?ν Ε.Μ.Π.Copyright ? Χαρ?λαμπο? Χ. Ασημακ?πουλο?, 2019.Με επιφ?λαξη παντ?? δικαι?ματο?. All rights reserved.Απαγορε?εται η αντιγραφ?, αποθ?κευση και διανομ? τη? παρο?σα? εργασ?α?, εξ ολοκλ?ρου ? τμ?ματο? αυτ??, για εμπορικ? σκοπ?. Επιτρ?πεται η ανατ?πωση, αποθ?κευση και διανομ? για σκοπ? μη κερδοσκοπικ?, εκπαιδευτικ?? ? ερευνητικ?? φ?ση?, υπ? την προ?π?θεση να αναφ?ρεται η πηγ? προ?λευση? και να διατηρε?ται το παρ?ν μ?νυμα. Ερωτ?ματα που αφορο?ν τη χρ?ση τη? εργασ?α? για κερδοσκοπικ? σκοπ? πρ?πει να απευθ?νονται προ? τον συγγραφ?α.Οι απ?ψει? και τα συμπερ?σματα που περι?χονται σε αυτ? το ?γγραφο εκφρ?ζουν τον συγγραφ?α και δεν πρ?πει να ερμηνευθε? ?τι αντιπροσωπε?ουν τι? επ?σημε? θ?σει? του Εθνικο? Μετσ?βιου Πολυτεχνε?ου.Περ?ληψηΣτην παρο?σα διπλωματικ? εργασ?α, μελετ?ται η μοντελοπο?ηση εν?? μ?ρου? του μερικ?? παρατηρ?σιμου παιχνιδιο? καρτ?ν Tichu. Ειδικ?τερα, με τη χρ?ση ευφυ?ν τεχνικ?ν, μοντελοποιε?ται ?λο το αρχικ? στ?διο του παιχνιδιο?, δηλαδ? αυτ? που αφορ? τη δ?λωση Grand Tichu. Αναλ?ονται, αρχικ?, παλαι?τερε? ?ρευνε? σε ?λλα παιχν?δια με μερικ?? παρατηρ?σιμο περιβ?λλον, καθ?? και παλαι?τερε? ?ρευνε? που ?χουν εφαρμοστε? π?νω στο παιχν?δι Tichu, ? απλοποι?σει? αυτο?. Στη συν?χεια, παρουσι?ζεται η δικ? μα? πρ?ταση ευφυ?ν πρακτ?ρων ?σον αφορ? το Tichu, για την οπο?α δημιουργο?νται τα μοντ?λα τη? λογιστικ?? παλινδρ?μηση? και τη? μηχαν?? διανυσμ?των υποστ?ριξη? με παλινδρ?μηση. Αφο? μελετ?νται τα αποτελ?σματα τη? εκπα?δευση? των μοντ?λων αυτ?ν, αυτ? που θα χρησιμοποι?θει για καθ?ναν απ? του? ευφυε?? πρ?κτορ?? μα?. Τ?λο?, προτε?νονται μελλοντικ?? μελ?τε? π?νω στο συγκεκριμ?νο αντικε?μενο.Λ?ξει? κλειδι?Tichu, μερικ?? παρατηρ?σιμο περιβ?λλον, μηχανικ? μ?θηση, μηχαν?? διανυσμ?των υποστ?ριξη? με παλινδρ?μηση, λογιστικ? παλινδρ?μηση, επιλογ? χαρακτηριστικ?νAbstractThe purpose of the current dissertation is the modeling of the decision-making process called Grand Tichu, which is a part of the partially-observable card game Tichu. Older researches regarding partially-observable games are analyzed, including researches and applications that are based on the game of Tichu or simplified versions of it. Additionaly, our own smart Tichu agents are introduced, by use of the models which we create in this paper: a logistic regression and a support vector regression one. We select which of these models will be used for each one of our smart agents, depending on the results of the models’ training. Last but not least, we share our thoughts about potential future work in relation to this field which could be picked up by other researchers. Key wordsTichu, partially observable space, machine learning, support vector regression, logistic regression, feature extractionΕυχαριστ?ε?Η παρο?σα διπλωματικ? εργασ?α εκπον?θηκε στο πλα?σιο του προπτυχιακο? προγρ?μματο? σπουδ?ν τη? Σχολ?? Ηλεκτρολ?γων Μηχανικ?ν & Μηχανικ?ν Υπολογιστ?ν του Εθνικο? Μετσ?βιου Πολυτεχνε?ου και σηματοδοτε? την ολοκλ?ρωση των σπουδ?ν μου εν? συγχρ?νω? αποτελε? το ερ?θισμα για περαιτ?ρω ?ρευνα στο συγκεκριμ?νο αντικε?μενο.Προτο? ?μω? αναφερθ? στη περιγραφ? τη? εργασ?α? και στα αποτελ?σματα που προ?κυψαν, θα ?θελα να ευχαριστ?σω θερμ? του? ανθρ?που? οι οπο?οι μ?σω τη? συνεργασ?α? μα?, συν?βαλαν σημαντικ? στην ολοκλ?ρωση αυτ?? τη? εργασ?α?.Αρχικ? θα ?θελα να απευθ?νω τι? ευχαριστ?ε? μου στον επιβλ?ποντα κ. Ανδρ?α-Γε?ργιο Σταφυλοπ?τη, Καθηγητ? Ε.Μ.Π ο οπο?ο? μου προσ?φερε τη δυνατ?τητα να εκπον?σω την διπλωματικ? μου σε ?να αντικε?μενο ιδια?τερα ελκυστικ? και ενδιαφ?ρον για μ?να και να διευρ?νω τι? επιστημονικ?? μου γν?σει?. Παρ?λληλα θα ?θελα να ευχαριστ?σω του? κ.κ. Παναγι?τη Τσαν?κα, Καθηγητ? Ε.Μ.Π και Γε?ργιο Στ?μου, Αναπληρωτ? Καθηγητ? Ε.Μ.Π για την τιμ? που μου ?καναν να ε?ναι μ?λη τη? επιτροπ?? εξ?ταση? τη? διπλωματικ?? εργασ?α?. Επ?ση? οφε?λω ιδια?τερε? ευχαριστ?ε? στον συνεπιβλ?ποντα κ. Γε?ργιο Σι?λα, ΕΔΙΠ Ε.Μ.Π για το χρ?νο που αφι?ρωσε και την θεμελι?δη του συνεισφορ? στην εκπ?νηση τη? συγκεκριμ?νη? εργασ?α?. Η στ?ριξη του, επιστημονικ? και πνευματικ?, καθ?? και η καθοδ?γηση του σε ?λη τη δι?ρκεια τη? πορε?α? αυτ?? συν?βαλαν τα μ?γιστα στην επ?τευξη εν?? πολ? σημαντικο? για εμ?να στ?χου. Η προθυμ?α του να με βοηθ?σει μ?σω τη? εμπειρ?α? και των γν?σεων του σε οποιαδ?ποτε δυσκολ?α συν?ντησα στ?θηκαν καθοριστικ?? και η συνεργασ?α μα? θεωρ? πω? ?ταν ?κρω? επιτυχημ?νη και εποικοδομητικ?. Τ?λο?, με εξ?σου μεγ?λη θ?ρμη θ?λω να αναφερθ? και να ευχαριστ?σω την οικογ?νεια μου , η οπο?α με στ?ριξε ?λα αυτ? τα χρ?νια, καθ?? και του? φ?λου? και του? συμφοιτητ?? μου, οι οπο?οι στ?θηκαν δ?πλα μου σε ?λη τη δι?ρκεια τη? ακαδημα?κ?? μου πορε?α?, ο καθ?να? με τον δικ? του ξεχωριστ? τρ?πο, με ιδια?τερη μνε?α σε ?σου? με μ?ησαν στον κ?σμο του παιχνιδιο? Tichu το οπο?ο και εξετ?ζουμε στην εργασ?α αυτ?.Χαρ?λαμπο? Χ. Ασημακ?πουλο?,Π?νακα? περιεχομ?νωνΕισαγωγ? 12Μερικ?? παρατηρ?σιμα παιχν?δια καρτ?ν 16i) Μαρκοβιαν?? διαδικασ?ε? αποφ?σεων 16 ii) Μερικ?? Παρατηρ?σιμε? Μαρκοβιαν?? διαδικασ?ε? αποφ?σεων 17iii) Παιχν?δια που μπορο?ν να μοντελοποιηθο?ν ω? Μερικ?? Παρατηρ?σιμε? Μαρκοβιαν?? διαδικασ?ε? αποφ?σεων 20Το παιχν?δι Tichu 22i) Τι ε?ναι το Tichu; 22 ii) Το παιχν?δι 24 iii) Η τρ?πουλα25 iv) Ειδικ?? κ?ρτε? 26 v) Δυναμικ?τητα φ?λλων 30 vi) Συνδυασμο? 31 vii) Δηλ?σει? Grand Tichu και Tichu 33 viii) Ανταλλαγ?? 34 ix) Γενικο? Καν?νε? 34 x) Π?ντοι 35Εφαρμογ?? τεχνητ?? νοημοσ?νη? και μηχανικ?? μ?θηση? για το Tichu 36i) Το Mini Tichu και ευφυε?? υλοποι?σει? του 36ii) Χρ?ση ευφυ?ν τεχνικ?ν σε δι?φορα κομμ?τια του παιχνιδιο? Tichu 55iii) Εφαρμογ?? παιχνιδιο? Tichu 65Η προσ?γγιση μα? / Συλλογ? δεδομ?νων 66i) Διαβ?θμιση δυναμικ?τητα? παικτ?ν και ομ?δων στο Tichu με τη χρ?ση του συστ?ματο? αξιολ?γηση? Elo 67ii) Συλλογ? δεδομ?νων 72Η επιλογ? των χαρακτηριστικ?ν των ευφυ?ν συστημ?των73i) Μοντελοπο?ηση των συνδυασμ?ν Tichu 77ii) Επιλογ? επιπλ?ων χαρακτηριστικ?ν 80Η επιλογ? και η εκπα?δευση των ευφυ?ν συστημ?των82i) Επιλογ? ευφυ?ν συστημ?των 82ii) Επιλογ? επιπλ?ων μ?τρων απ?δοση? 83iii) Μηχαν?? διανυσμ?των υποστ?ριξη? 85 iv) Mηχαν?? διανυσμ?των υποστ?ριξη? με παλινδρ?μηση92v) Μοντ?λο μηχαν?ν διανυσμ?των υποστ?ριξη? με παλινδρ?μηση 90vi) Λογιστικ? παλινδρ?μηση 94vii) Μοντ?λο λογιστικ?? παλινδρ?μηση? 96Αποτελ?σματα των μοντ?λων μετ? την εκπα?δευση 98i) Αποτελ?σματα μοντ?λου Μηχαν?? Διανυσμ?των Υποστ?ριξη? με παλινδρ?μηση 98ii) Αποτελ?σματα Μοντ?λου Μηχαν?? Λογιστικ?? παλινδρ?μηση?104iii) Σ?γκριση των αποτελεσμ?των των δ?ο μοντ?λων109Επ?λογο? και προτ?σει? για μελλοντικ?? μελ?τε? 115Παρ?ρτημα - Επιλογ? χαρακτηριστικ?ν με β?ση του? επιτρεπτο?? συνδυασμο?? στο Tichu 118Βιβλιογραφ?α 125Π?νακα? γραφημ?των2-1 Μαρκοβιαν? Διαδικασ?α Απ?φαση? στην ενισχυμ?νη μ?θηση 163-1 Tichu logo 223-2 Τρ?πουλα Tichu 253-3 Ειδικ?? κ?ρτε? του Tichu 263-4 Mahjong 263-5 Τα σκυλι? 283-6 Ο δρ?κο? 293-7 Ο φο?νικα? 294-1 Απλ? αξιολ?γηση εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των καρτ?ν του κ?μβου 414-2 Απλ? αξιολ?γηση εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των συνδυασμ?ν του κ?μβου 414-3 Απλ? αξιολ?γηση εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν 424-4 Απλ? αξιολ?γηση εναντ?ον καμ?α? Αξιολ?γηση? (τυχα?ου πρ?κτορα) 424-5 Αξιολ?γηση με β?ση τον αριθμ? των καρτ?ν εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των συνδυασμ?ν του κ?μβου 434-6 Αξιολ?γηση με β?ση τον αριθμ? των καρτ?ν εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν 434-7 Αξιολ?γηση με β?ση τον αριθμ? των καρτ?ν του κ?μβου εναντ?ον καμ?α? Αξιολ?γηση? (τυχα?ου πρ?κτορα) 444-8 Αξιολ?γηση με β?ση τον αριθμ? των συνδυασμ?ν του κ?μβου εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν 444-9 Αξιολ?γηση με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν εναντ?ον καμ?α? Αξιολ?γηση? (τυχα?ου πρ?κτορα) 454-10 Συνολικ?? ν?κε? κ?θε συν?ρτηση? αξιολ?γηση? 454-11 Β?ματα διαδικασ?α? επιλογ?? MCTS 474-12 12 Ποσοστ? ν?κη? χωρ?? ντετερμινισμ? 484-13 MCTS και MC πρ?κτορε? εναντ?ον τυχα?ων πρακτ?ρων με διαφορετικ? αριθμ? πιθαν?ν κιν?σεων χωρ?? ντετερμινισμ?. 504-14 Ποσοστ? των σωστ? επιλεγμ?νων συνδυασμ?ν για τι? ?γνωστε? κ?ρτε? των υπολο?πων παικτ?ν με και χωρ?? ντετερμινισμ? για MC και MCTS πρ?κτορε?. 504-15 FSM για το παιχν?δι Mini Tichu ?ταν και ?λοι οι πα?κτε? ε?ναι ενεργο? σε ?ναν γ?ρο 544-16 Εξωτερικ?? κατανομ?? και το μ?σο τη? παραμ?τρου p 564-17 Εξωτερικ?? κατανομ?? και το μ?σο τη? παραμ?τρου p για ?να καλ? και ?να κακ? χ?ρι 574-18 Αποτελ?σματα του εμβαδο? τη? περιοχ?? κ?τω απ? την χαρακτηριστικ? καμπ?λη λειτουργ?α? του δ?κτη για ?λα τα μοντ?λα για το Grand Tichu 614-19 Χαρακτηριστικ?? καμπ?λε? ?λων των μοντ?λων με ε?σοδο 14 χαρακτηριστικ? συν τι? κ?ρτε? του χεριο?. 614-20 Συντελεστ?? για τα πιο σημαντικ? χαρακτηριστικ? για την πρ?βλεψη Grand Tichu 624-21 Αποτελ?σματα του εμβαδο? τη? περιοχ?? κ?τω απ? την χαρακτηριστικ? καμπ?λη λειτουργ?α? του δ?κτη για ?λα τα μοντ?λα για το Tichu 634-22 Χαρακτηριστικ?? καμπ?λε? ?λων των μοντ?λων με ε?σοδο 14 χαρακτηριστικ? συν τι? κ?ρτε? του χεριο?. 634-23 Συντελεστ?? για τα πιο σημαντικ? χαρακτηριστικ? για την πρ?βλεψη Tichu 634-24 Πιθαν?τητα επιτυχο?? δ?λωση? Grand Tichu 644-25 Εφαρμογ? Tichu για iOS 657-1 Διαχωριστικ? υπερεπ?πεδο 867-2 Απ?σταση μεταξ? κλ?σεων 867-3 Διαχωριστικ? υπερεπ?πεδο με χαλαρ?? μεταβλητ?? 877-4 Κλ?σει? γραμμικ?? διαχωρ?σιμε? στο χ?ρο R2, αλλ? μη γραμμικ?? διαχωρ?σιμε? στο χ?ρο R1 887-5 Παρ?δειγμα γραμμικο? πυρ?να, ?που τα σημε?α που περικλε?ονται με τετραγωνικ? πλα?σιο αποτελο?ν διαν?σματα υποστ?ριξη? 897-6 Παρ?δειγμα διαχωρισμο? μη-γραμμικο? προβλ?ματο? με χρ?ση SVMs γραμμικο? (διακεκομμ?νη γραμμ?) και πολυωνυμικο? πυρ?να (συνεχ?? γραμμ?) 907-7 Αριστερ? υπ?-εικ?να: Διαχωρισμ?? με ακτινωτ? πυρ?να στον αρχικ? χ?ρο. Δεξι? υπ?-εικ?να: Γραμμικ?? διαχωρισμ?? σε χ?ρο υψηλ?τερη? δι?σταση? με τη βο?θεια μετασχηματισμο? ακτινωτο? πυρ?να 907-8 Γρ?φημα εν?? μονοδι?στατου μοντ?λου μηχαν?? διανυσμ?των υποστ?ριξη? με παλινδρ?μηση 928-1 Το ποσοστ? ορθ?τητα? δηλ?σεων του μοντ?λου SVR αν? τιμ? κατωφλ?ου 998-2 Το ποσοστ? ακρ?βεια? δηλ?σεων του μοντ?λου SVR αν? τιμ? κατωφλ?ου 1008-3 Το ποσοστ? επιτυχο?? αν?κληση? του μοντ?λου SVR αν? τιμ? κατωφλ?ου 1018-4 Η βαθμολογ?α F1 του μοντ?λου SVR αν? τιμ? κατωφλ?ου 1028-5 Η καμπ?λη ROC του μοντ?λου SVR 1038-6 Το ποσοστ? ορθ?τητα? δηλ?σεων του μοντ?λου LR αν? τιμ? κατωφλ?ου 1048-7 Το ποσοστ? ακρ?βεια? δηλ?σεων του μοντ?λου LR αν? τιμ? κατωφλ?ου 1058-8 Το ποσοστ? επιτυχο?? αν?κληση? του μοντ?λου LR αν? τιμ? κατωφλ?ου 1068-9 Η βαθμολογ?α F1 του μοντ?λου LR αν? τιμ? κατωφλ?ου 1078-10 Η καμπ?λη ROC του μοντ?λου LR 1088-11 Σ?γκριση ποσοστ?ν ορθ?τητα? δηλ?σεων των μοντ?λων SVR και LR αν? τιμ? κατωφλ?ου 1098-12 Σ?γκριση ποσοστ?ν ακρ?βεια? δηλ?σεων των μοντ?λων SVR και LR αν? τιμ? κατωφλ?ου 1108-13 Σ?γκριση ποσοστ?ν επιτυχο?? αν?κληση? των μοντ?λων SVR και LR αν? τιμ? κατωφλ?ου 1118-14 Σ?γκριση βαθμολογ?α? F1 των μοντ?λων SVR και LR αν? τιμ? κατωφλ?ου 1128-15 Σ?γκριση καμπ?λη? ROC των μοντ?λων SVR και LR αν? τιμ? κατωφλ?ου 113Κεφ?λαιο 1Εισαγωγ?Τεχνητ? Νοημοσ?νη (TN) ε?ναι ο τομ?α? τη? επιστ?μη? των υπολογιστ?ν, που ασχολε?ται με τη σχεδ?αση ευφυ?ν υπολογιστικ?ν συστημ?των, δηλαδ? συστημ?των ικαν?ν για λειτουργ?ε? που αποδ?δονται σε ανθρ?πινη νοημοσ?νη. Τα τελευτα?α χρ?νια ?χει παρουσιαστε? ραγδα?α α?ξηση στη χρ?ση ευφυ?ν τεχνικ?ν για τη δημιουργ?α πρακτ?ρων σε δι?φορου? τομε??. Ειδικ?τερα, ο τομ?α? των παιχνιδι?ν, ?χει γ?νει αντικε?μενο πολλ?ν ερευν?ν και επενδ?σεων και οι πρ?κτορε? που ?χουν δημιουργηθε? για δι?φορα παιχν?δια, τ?σο ηλεκτρονικ? εν γ?νει ?σο και επιτραπ?ζια σε ηλεκτρονικ? μορφ?, παρουσι?ζουν σταδιακ? ?λο και μεγαλ?τερη επιτυχ?α. Ο τομ?α? των παιχνδι?ν αποτ?λεσε ξεχωριστ? πεδ?ο ερευν?ν τη? ΤΝ απ? τι? απαρχ?? τη? εμφ?νιση? τη?. ?να απ? τα πρ?τα παραδε?γματα, αποτελε? η ηλεκτρονικ? μορφ? του παιχνιδιο? Nim η οπο?α δημιουργ?θηκε το 1951 και δημοσιε?τηκε το 1952. Οι πρ?κτορε? που χρησιμοποι?θηκαν για την ηλεκτρονικ? μορφ? του παιχνιδιο? ?ταν ικανο? να νικο?ν συστηματικ? του? καλ?τερου? πα?χτε? του παιχνιδιο?. CITATION Gra52 \l 1032 (Grant, 1952) . Επ?ση?, το 1951, ο Christopher Strachey κατ?φερε χρησιμοποι?ντα? τη μηχαν? Ferranti Mark του πανεπιστημ?ου του Manchester, να χρησιμοποι?σει ευφυε?? πρ?κτορε? για το παιχν?δι checkers ?πω? αντ?στοιχα και ο Dietrich Prinz για το σκ?κι. CITATION ABr \l 1032 ("A Brief History of Computing" ) Αυτ?? ?ταν οι πρ?τε? απ?πειρε? χρ?ση? πρακτ?ρων σε παιχν?δια και ταυτ?χρονα απ? τα πρ?τα προγρ?μματα που γρ?φτηκαν ποτ? για υπολογιστ?. Οι πρ?κτορε? για το περιβ?λλον του παιχνιδ?ου checkers και για το σκ?κι,συν?χισαν να μελετ?νται και να βελτι?νονται καταλ?γοντα? στη δι?σημη ?ττα του πρωταθλητ? Garry Kasparov στο σκ?κι απ? τη μηχαν? Deep Blue τη? IBM το 1997. CITATION McC04 \l 1033 (McCorduck, 2004)Β?βαια, τα πρ?τα ηλεκτρονικ? παιχ?δια που εμφαν?στηκαν τι? δεκαετ?ε? του ’60 και του ’70 ?πω? το Spacewar!, το Pong και το Gotcha, ?θεταν αντιμ?τωπου? δ?ο πα?κτε? μεταξ? του? και ?ρα η χρ?ση πρακτ?ρων δεν ε?χε αρχικ? εφαρμογ?. Παιχν?δια που πρ?σφεραν τη δυνατ?τητα σε ?ναν πα?χτη να πα?ξει μ?νο? του εναντ?ον αντιπ?λων-πρακτ?ρων ?ρχισαν να εμφαν?ζονται τη δεκαετ?α του ’70 με πιο αξιοσημε?ωτα το Speed Race τη? Taito και τα Qwak και Pursuit τη? Atari , και καθιερ?θηκαν πλ?ον το 1978 με τη μεγ?λη επιτυχ?α του Space Invaders. ?κτοτε, ?ρχισαν να δημιουργο?νται παιχν?δια με ?λο και πολυπλοκ?τερα μοντ?λα ευφυ?ν πρακτ?ρων. Σ?μερα, η παρουσ?α των ευφυ?ν πρακτ?ρων ε?ναι αισθητ? σε ?λα τα ηλεκτρονικ? παιχν?δια και στι? προσομοι?σει? επιτραπ?ζιων παιχνιδι?ν σε υπολογιστ? και η μελ?τη του τομ?α αυτο? ?χει οδηγ?σει στην εμφ?νιση ?λο και επιτυχ?στερων πρακτ?ρων. Χαρακτηριστικ? αναφ?ρουμε τη ν?κη τη? ομ?δα? ευφυ?ν πρακτ?ρων τη? εταιρ?α? OpenAI εναντ?ον των παγκ?σμιων πρωταθλητ?ν στο παιχν?δι e-sports Dota 2 τη? εταιρ?α? Valve (OpenAI, 2019) , καθ?? και του AlphaGo που ?χει αναπτ?ξει η DeepMind τη? Google που κατ?φερε το 2016 να νικ?σει τον Κορε?τη πρωταθλητ? Lee Se-dol 4-1 σε ?να απ? τα περιπλοκ?τερα επιτραπ?ζια παιχν?δια στον κ?σμο , το Go CITATION Αλ?19 \l 1033 (Καρατζ??, 2019). Μ?λιστα, η DeepMind βελτ?ωσε κι ?λλο απ? τ?τε το πρ?γραμμ? τη? και η τελευτα?α εκδοχ? τη?, το AlphaGo Zero, κατ?φερε να νικ?σει το αρχικ? AlphaGo σε 100 συνεχ?μενα ματ?, οδηγ?ντα? τον Lee Se-dol στην ανακο?νωση πω? δε θα πα?ζει πλ?ον σε επαγγελματικ? επ?πεδο, αφο? η ΤΝ ε?ναι ουσιαστικ? αν?κητη. Η ?δια εταιρε?α κατ?φερε πρ?σφατα για πρ?τη φορ? να δημιουργ?σει πρ?κτορε? για ανταγωνιστικ? παιγν?δια πολλαπλ?ν παικτ?ν (multiplayer shooter videogames) που απαιτο?ν ομαδικ? συνεργασ?α. Οι πρ?κτορε? που εκπα?δευσε κατ?φεραν να συνεργ?ζονται για να πα?ξουν με επιτυχ?α το κλασσικ? βιντεοπαιγν?δι Quake III Arena, νικ?ντα? ?μπειρου? ανθρ?που? πα?κτε?. Επιπλ?ον, αποδε?χθηκε ?τι ?να? ευφυ?? πρ?κτορα? μπορε? να συνεργασθε? μια χαρ? με ?ναν ?νθρωπο πα?κτη. CITATION ToB19 \l 1032 (Τeam, 2019)Αντιλαμβαν?μαστε λοιπ?ν, με β?ση τα παραπ?νω ?τι το πεδ?ο εφαρμογ?? των ευφυ?ν πρακτ?ρων στα παιχν?δια ε?ναι διαρκ?? εξελ?ξιμο και ακ?μη υπ?ρχουν κομμ?τια και ε?δη που δεν ?χουν πλ?ρω? μελετηθε? με επιτυχ?α. ?να τ?τοιο πεδ?ο, ?που υπ?ρχει χ?ρο? περαιτ?ρω εξ?λιξη? των ευφυ?ν πρακτ?ρων που ?χουν δημιουργηθε? ε?ναι τα παιχν?δια με μερικ?? παρατηρ?σιμο περιβ?λλον, παιχν?δια δηλαδ?, στα οπο?α ?να κομμ?τι τη? πληροφορ?α? ε?ναι κρυφ? απ? τον πα?κτη κατ? τη δι?ρκεια του παιχνιδιο?. Τ?τε παρουσι?ζονται δυσκολ?ε? τ?σο στη μοντελοπο?ηση ?σο και στην εκπα?δευση πρακτ?ρων, μια? και τα μερικ?? παρατηρ?σιμα παιχν?δια ?χουν πολ? μεγαλ?τερο χ?ρο αναζ?τηση? απ? ?τι τα παρατηρ?σιμα παιχν?δια. ?χουν γ?νει β?βαια προσπ?θειε? δημιουργ?α? πρακτ?ρων και σε τ?τοια? φ?σεω? παιχν?δια. Πρ?σφατα, η DeepMind, ανακο?νωσε ?τι δημιο?ργησε την πρ?τη τεχνητ? νοημοσ?νη για το Starcraft 2, κ?τι το οπο?ο αποτελο?σε μεγ?λη πρ?κληση επειδ? ο πα?κτη? συχν? δεν βλ?πει τα κομμ?τια/μον?δε? του αντιπ?λου του CITATION Τεχ19 \l 1032 (Τεχνητ? νοημοσ?νη τη? DeepMind ?φτασε στο αν?τατο επ?πεδο παικτ?ν στο Starcraft 2, δημοφιλ?? παιχν?δι των esports, 2019) . Επ?ση?, ?χουν δημιουργηθε? πρ?κτορε? για παιχν?δια ?πω? το μπρ?τζ και το π?κερ, παιχν?δια καρτ?ν ?που ο πα?κτη?, ?χει γν?ση κατ? β?ση μ?νο των καρτ?ν που κρατ?ει στο χ?ρι του. Στο μπριτζ υπ?ρχουν τα προγρ?μματα Jack και Wbridge5 τα οπο?α κατατ?σσονται αρκετ? ψηλ? στι? εθνικ?? κατατ?ξει? παικτ?ν μπριτζ. Το Jack μ?λιστα το 2005 ?παιξε εναντ?ον 7 ζευγαρι?ν παικτ?ν υψηλο? επιπ?δου και κατ?φερε να κερδ?σει 3 απ? αυτ?. CITATION Com19 \l 1032 (Wikipedia, 2019) Αντ?στοιχα, στο π?κερ υπ?ρχουν δι?φορα μοντ?λα και ε?δη ευφυ?ν πρακτ?ρων με αποτ?λεσμα να υπ?ρχει ετ?σιο τουρνου? (The Annual Computer Poker Competition) ?που αυτ? ανταγων?ζονται μεταξ? του? και ?που δεν υπ?ρχει ω? τ?ρα σταθερ?? νικητ??. CITATION Ann19 \l 1033 (Annual Computer Poker Competition)?σον αφορ? λοιπ?ν τα παιχν?δια με μερικ?? παρατηρ?σιμο περιβ?λλον , οι ευφυε?? πρ?κτορε? που ?χουν δημιουργηθε? ?χουν ακ?μη μεγ?λα περιθ?ρια βελτ?ωση? , γι’ αυτ? και στην παρο?σα εργασ?α επιλ?χθηκε ?να παιχν?δι τη? εν λ?γω κατηγορ?α? για να μελετηθε? ω? προ? αυτ? την κατε?θυνση, το Tichu. Το παιχν?δι καρτ?ν Tichu αποτελε? ?να διαδεδομ?νο παιχν?δι αναρρ?χηση?, με μερικ?? παρατηρ?σιμο περιβ?λλον. Το παιχν?δι αυτ? παρουσι?ζει μεγ?λη πολυπλοκ?τητα και τερ?στιο ?γκο διαθ?σιμων επιλογ?ν αν? κ?νηση και ?ρα αποτελε? ?να πολ? ενδιαφ?ρον πεδ?ο ερευν?ν για τη μοντελοπο?ηση πρακτ?ρων και την επιλογ? χαρακτηριστικ?ν των μοντ?λων αυτ?ν. Επ?ση? στο παιχν?δι αυτ? συμμετ?χουν τ?σσερι? πα?κτε?, χωρισμ?νοι σε δ?ο ομ?δε?. Η εισαγωγ? τη? συνεργατικ?τητα? ω? παραμ?τρου, περιπλ?κει ακ?μα παραπ?νω τη μοντελοπο?ηση του εν λ?γω παιχνιδιο?.Στην παρο?σα διπλωματικ? εργασ?α επιχειρε?ται λοιπ?ν η μοντελοπο?ηση με χρ?ση ευφυ?ν τεχνικ?ν του παιχνιδιο? αυτο?. Η ?ρευνα μα? επικεντρ?θηκε σε ?να κομμ?τι του παιχνιδιο? Tichu, αυτ? τη? δ?λωση? Grand Tichu. Η δ?λωση Grand Tichu ε?ναι πολ? σημαντικ? για το παιχν?δι, καθ?? ε?ν ε?ναι επιτυχ?? δ?νει το μεγαλ?τερο δυνατ? βαθμολογικ? προβ?δισμα σε μ?α ομ?δα, εν? ε?ν ε?ναι ανεπιτυχ?? προκαλε? τη μεγαλ?τερη δυνατ? βαθμολογικ? απ?λεια για την ομ?δα αυτ?. Σκοπ?? μα? ε?ναι η δημιουργ?α τρι?ν πρακτ?ρων διαφορετικ?? επιθετικ?τητα?, δηλαδ? εν?? συντηρητικο?, εν?? ουδ?τερου και εν?? επιθετικο? πρ?κτορα. Αρχικ?, στο Κεφ?λαιο 2, αναλ?ονται οι Μαρκοβιαν?? διαδικασ?ε? αποφ?σεων καθ?? και ειδικ?τερα, οι μερικ?? παρατηρ?σιμε? Μαρκοβιαν?? διαδικασ?ε? αποφ?σεων. Αναφ?ρονται δι?φορε? ?ρευνε? και εργασ?ε? π?νω στη μοντελοπο?ηση μερικ?? παρατηρ?σιμων παιχνιδι?ν και εξετ?ζεται το π?? αυτ? μπορο?ν να μοντελοποιηθο?ν ω? Μερικ?? Παρατηρ?σιμε? Μαρκοβιαν?? διαδικασ?ε? αποφ?σεων. Στο Κεφ?λαιο 3, γ?νεται εκτεν?? αναφορ? στο παιχν?δι Tichu, τα χαρακτηριστικ? και του? καν?νε? του. Στο Κεφ?λαιο 4, καταγρ?φονται τα αποτελ?σματα ερευν?ν που ?χουν γ?νει π?νω σε δι?φορα κομμ?τια του παιχνιδιο? Tichu μ?χρι σ?μερα και οι εφαρμογ?? του παιχνιδιο? με χρ?ση ευφυ?ν πρακτ?ρων που ε?ναι διαθ?σιμε? για το ευρ? κοιν?. Στο Κεφ?λαιο 5 γ?νεται επεξ?γηση του πλ?ον επικρατ?στερου τρ?που βαθμολ?γηση? παιχνιδι?ν ?πω? το Tichu και το σκ?κι, τη? βαθμολ?γηση? Elo, με β?ση τον οπο?ο επιλ?ξαμε του? πα?κτε? τα δεδομ?να των οπο?ων χρησιμοποι?σαμε για την εκπα?δευση των ευφυ?ν μοντ?λων μα?. Στο Κεφ?λαιο 6, αναλ?ουμε τη διαδικασ?α εξ?ρυξη? χαρακτηριστικ?ν για τη μοντελοπο?ηση των δεδομ?νων μα? με σκοπ? τη δημιουργ?α εν?? μοντ?λου λ?ψη? αποφ?ση? για δ?λωση Grand Tichu. Τα μοντ?λα τα οπο?α επιλ?ξαμε ε?ναι αυτ? τη? λογιστικ?? παλινδρ?μηση? και τη? μηχαν?? διανυσμ?των υποστ?ριξη? με παλινδρ?μηση. Στο κεφ?λαιο 7, εξηγε?ται το μαθηματικ? υπ?βαθρο π?σω απ? τα μοντ?λα αυτ?, καθ?? και οι δι?φοροι παρ?μετροι αυτ?ν. Στο κεφ?λαιο 8, παρουσι?ζουμε τα αποτελ?σματα μετ? την εκπα?δευση των μοντ?λων αυτ?ν. Γ?νεται σ?γκριση μεταξ? των δ?ο μοντ?λων με β?ση τα μ?τρα απ?δοση? που ?χουμε επιλ?ξει και γ?νεται επιλογ? μοντ?λων για τον κ?θε ?να απ? του? 3 πρ?κτορε? που θ?λουμε να δημιουργ?σουμε. Τ?λο?, προτε?νονται δι?φορε? μελλοντικ?? μελ?τε? που μπορο?ν να διεξαχθο?ν χρησιμοποι?ντα? ω? β?ση τα αποτελ?σματα τη? παρο?σα? εργασ?α?.Κεφ?λαιο 2Μερικ?? παρατηρ?σιμα παιχν?δια καρτ?νΜαρκοβιαν?? διαδικασ?ε? αποφ?σεωνΜια Μαρκοβιαν? διαδικασ?α απ?φαση? (Markov Decision Process - MDP) ε?ναι μια διακριτο? χρ?νου στοχαστικ? διαδικασ?α ελ?γχου. Παρ?χει ?να μαθηματικ? πλα?σιο για τη μοντελοπο?ηση τη? λ?ψη? αποφ?σεων σε καταστ?σει? ?που τα αποτελ?σματα ε?ναι εν μ?ρει τυχα?α και εν μ?ρει υπ? τον ?λεγχο εν?? υπε?θυνου για τη λ?ψη αποφ?σεων. Τα MDPs ?ταν γνωστ? τουλ?χιστον απ? τη δεκαετ?α του 1950 και χρησιμοποιο?νται σε πολλο?? κλ?δου? ?πω? στη ρομποτικ?, στον αυτ?ματο ?λεγχο, στην οικονομ?α και στι? κατασκευ??. Το ?νομα του? προ?ρχεται απ? τον Ρ?σο μαθηματικ? Αντρ?ι Μ?ρκοβ. CITATION Zheng19 \p 1 \l 1033 (Zheng, 2019, p. 1)2-1 Μαρκοβιαν? Διαδικασ?α Απ?φαση? στην ενισχυμ?νη μ?θηση, CITATION Sutton15 \p 54 \l 1033 (Richard S. Sutton, 2015, p. 54)Η Μαρκοβιαν? διαδικασ?α απ?φαση? ε?ναι μια το?πλα <S, A, P, R, γ> ?που:S ε?ναι ?να αριθμ?σιμο σ?νολο καταστ?σεωνΑ ε?ναι ?να αριθμ?σιμο σ?νολο ενεργει?νP ε?ναι μια μ?τρα πιθανοτ?των μεταβατικ?ν καταστ?σεωνR ε?ναι μια συν?ρτηση ανταμοιβ?? γ ε?ναι ?να? συντελεστ?? ?κπτωση? ( γ∈0,1). CITATION Sil19 \p 10 \t \l 1033 (Silver, 2015, p. 10)Σε κ?θε χρονικ? β?μα, η διαδικασ?α βρ?σκεται σε κ?ποια κατ?σταση s, και ο υπε?θυνο? λ?ψη? αποφ?σεων μπορε? να διαλ?ξει οποιαδ?ποτε εν?ργεια a που ε?ναι διαθ?σιμη στην κατ?σταση s. Η διαδικασ?α απαντ? στο επ?μενο χρονικ? β?μα μεταβα?νοντα? τυχα?α σε μια ν?α κατ?σταση s? , και δ?νοντα? στον υπε?θυνο λ?ψη? αποφ?σεων την αντ?στοιχη ανταμοιβ?, ?πω? αυτ? προκ?πτει απ? τη συν?ρτηση ανταμοιβ?? Rα(s,s'). CITATION Sutton15 \p 54 \l 1033 (Richard S. Sutton, 2015, p. 54)H πιθαν?τητα η διαδικασ?α να μεταβε? στη ν?α κατ?σταση s? επηρε?ζεται απ? την επιλεγμ?νη εν?ργεια. Συγκεκριμ?να, αυτ? δ?νεται απ? τη μ?τρα πιθανοτ?των μεταβατικ?ν καταστ?σεων Pα(s,s'). Επομ?νω?, η επ?μενη κατ?σταση s? εξαρτ?ται απ? την τωριν? κατ?σταση s και την εν?ργεια του υπε?θυνου λ?ψη? αποφ?σεων α. Αλλ? δοθ?ντων των s και α, ε?ναι υπ? ?ρου? ανεξ?ρτητη απ? ?λε? τι? προηγο?μενε? καταστ?σει? και εν?ργειε?. Με ?λλα λ?για, οι μεταβ?σει? καταστ?σεων μια? MDP ικανοποιο?ν την Μαρκοβιαν? ιδι?τητα (στη θεωρ?α των πιθανοτ?των και τη? στατιστικ??, ο ?ρο? Μαρκοβιαν? ιδι?τητα αναφ?ρεται στην ιδι?τητα μια? στοχαστικ?? διαδικασ?α? να μην επηρε?ζεται απ? τη μν?μη τη?). CITATION MGL17 \p 1311 \l 1033 (Lagoudakis, 2017, p. 1311)Μερικ?? παρατηρ?σιμε? Μαρκοβιαν?? διαδικασ?ε? αποφ?σεωνΜια μερικ?? παρατηρ?σιμη Μαρκοβιαν? διαδικασ?α αποφ?σεων (Partially observable Markov decision process - POMDP) ε?ναι μια γεν?κευση των Μαρκοβιαν?ν διαδικασι?ν αποφ?σεων. Μ?α POMDP μοντελοποιε? τη διαδικασ?α απ?φαση? εν?? πρ?κτορα στην οπο?α υποτ?θεται ?τι η δυναμικ? του συστ?ματο? καθορ?ζεται απ? μ?α MDP, αλλ? ο πρ?κτορα? δε μπορε? να παρατηρ?σει ?μεσα την “κρυμμ?νη” κατ?σταση. Αντ’ αυτο?, πρ?πει να διατηρε? μια κατανομ? πιθαν?τητα? ?σον αφορ? το σ?νολο των πιθαν?ν καταστ?σεων, με β?ση ?να σ?νολο παρατηρ?σεων και ?να σ?νολο πιθανοτ?των παρατ?ρηση? καθ?? και την “κρυμμ?νη” MDP. Το πλα?σιο των POMDP ε?ναι αρκετ? γενικ? ?στε να μοντελοποιε? επιτυχ?? μια ποικιλ?α διαδικασι?ν διαδοχικ?ν αποφ?σεων στον πραγματικ? κ?σμο. Οι εφαρμογ?? περιλαμβ?νουν προβλ?ματα πλο?γηση? ρομπ?τ, συντ?ρηση? μηχαν?ν και γενικ?τερε? περιπτ?σει? προγραμματισμο? υπ? αβεβαι?τητα. Το γενικ? πλα?σιο των MDP με ελλιπε?? πληροφορ?ε? για το χ?ρο καταστ?σεων περιγρ?φηκε απ? τον Karl Johan ?str?m το 1965 για την περ?πτωση διακριτο? χ?ρου καταστ?σεων και στη συν?χεια μελετ?θηκε περαιτ?ρω απ? την ερευνητικ? κοιν?τητα των επιχειρ?σεων ?που δημιουργ?θηκε το ακρων?μιο POMDP. Αργ?τερα προσαρμ?στηκε για προβλ?ματα τεχνητ?? νοημοσ?νη? και για προβλ?ματα αυτοματοποιημ?νου σχεδιασμο? απ? του? Leslie P. Kaelbling και Michael L. Littman. Μια ακριβ?? λ?ση σε μ?α POMDP αποδ?δει τη β?λτιστη εν?ργεια για κ?θε πιθαν? πεπο?θηση π?νω στο σ?νολο καταστ?σεων. Η β?λτιστη εν?ργεια μεγιστοποιε? (? ελαχιστοποιε?) την αναμεν?μενη ανταμοιβ? (? κ?στο?) του πρ?κτορα σε ?ναν πιθαν?? ?πειρο ορ?ζοντα. Η ακολουθ?α β?λτιστων ενεργει?ν ε?ναι γνωστ? και ω? β?λτιστη πολιτικ? του πρ?κτορα. CITATION Wik19 \l 1033 (Wikipedia, 2019)Μια POMDP ε?ναι μια MDP με κρυφ?? καταστ?σει?. Ε?ναι ?να κρυφ? Μαρκοβιαν? μοντ?λο με εν?ργειε?. Μια POMDP ε?ναι μια το?πλα <S, A, Ο, P, R, Ζ, γ> ?που:S ε?ναι ?να αριθμ?σιμο σ?νολο καταστ?σεωνΑ ε?ναι ?να αριθμ?σιμο σ?νολο ενεργει?νΟ ε?ναι ?να αριθμ?σιμο σ?νολο παρατηρ?σεωνP ε?ναι μια μ?τρα πιθανοτ?των μεταβατικ?ν καταστ?σεωνR ε?ναι μια συν?ρτηση ανταμοιβ?? Ζ ε?ναι μια συν?ρτηση παρατ?ρηση?γ ε?ναι ?να? συντελεστ?? ?κπτωση? (γ∈0,1).Σε κ?θε χρονικ? περ?οδο, το περιβ?λλον βρ?σκεται σε κ?ποια κατ?σταση s∈S. Ο πρ?κτορα? επιλ?γει μια εν?ργεια a ∈A, η οπο?α προκαλε? μετ?βαση του περιβ?λλοντο? στην κατ?σταση s'∈S με πιθαν?τητα που δ?νεται απ? τη μ?τρα πιθανοτ?των μεταβατικ?ν καταστ?σεων P(s' | s,α). Την ?δια στιγμ?, ο πρ?κτορα? λαμβ?νει μια παρατ?ρηση ο ∈Ο η οπο?α εξαρτ?ται απ? τη ν?α κατ?σταση του περιβ?λλοντο? (s') και απ? την εν?ργεια που μ?λι? επιλ?χθηκε α με πιθαν?τητα Οο s',a). Ολοκληρ?νοντα?, ο πρ?κτορα? λαμβ?νει μια ανταμοιβ? r ?ση με R(s,a). Στη συν?χεια, η διαδικασ?α επαναλαμβ?νεται. Ο στ?χο? για τον πρ?κτορα ε?ναι να διαλ?γει αν? κ?θε χρονικ? στιγμ? εν?ργειε? οι οπο?ε? μεγιστοποιο?ν την εκτιμ?μενη μελλοντικ? ανταμοιβ? μετ? ?κπτωση? Et = 0∞ γtrt, ?που rt ε?ναι η ανταμοιβ? που λ?φθηκε τη χρονικ? στιγμ? t. Ο συντελεστ?? ?κπτωση? γ καθορ?ζει το κατ? π?σον προτιμ?με τι? ?μεσε? ανταμοιβ?? σε σχ?ση με τι? ανταμοιβ?? που ?ρχονται σε β?θο? χρ?νου. ?ταν γ= 0 ο πρ?κτορα? ενδιαφ?ρεται μ?νο για το ποια εν?ργεια θα αποφ?ρει την υψηλ?τερη εκτιμ?μενη ?μεση ανταμοιβ?, εν? ?ταν γ = 1 ο πρ?κτορα? ενδιαφ?ρεται για τη μεγιστοπο?ηση του εκτιμ?μενου αθρο?σματο? των μελλοντικ?ν ανταμοιβ?ν. CITATION Dav19 \p 51 \l 1033 (Silver, Computer Science, UCL, p. 51)Επειδ? ο πρ?κτορα? δε παρατηρε? ?μεσα την κατ?σταση του περιβ?λλοντο?, λαμβ?νει αποφ?σει? υπ? αβεβαι?τητα σχετικ? με την πραγματικ? κατ?σταση του περιβ?λλοντο?. Ωστ?σο, μ?σα απ? την αλληλεπ?δραση με το περιβ?λλον και τη λ?ψη παρατηρ?σεων, ο πρ?κτορα? μπορε? να ανανε?σει τι? τιμ?? π?στη? του στην πραγματικ? κατ?σταση μ?σω τη? ενημ?ρωση? τη? κατανομ?? πιθαν?τητα? για την τρ?χουσα κατ?σταση. Αποτ?λεσμα αυτ?? τη? ιδι?τητα? ε?ναι ?τι η β?λτιστη συμπεριφορ? μπορε? συχν? να περιλαμβ?νει εν?ργειε? οι οπο?ε? διαλ?γονται μ?νο επειδ? βελτι?νουν την εκτ?μηση του πρ?κτορα για την τρ?χουσα κατ?σταση, επιτρ?ποντ?? του ?τσι να λαμβ?νει καλ?τερε? αποφ?σει? στο μ?λλον.Ε?ναι χρ?σιμο να συγκρ?νουμε τον παραπ?νω ορισμ? με τον ορισμ? τη? διαδικασ?α? λ?ψη? αποφ?σεων σε μ?α MDP. Μ?α MDP δεν περιλαμβ?νει το σ?νολο παρατηρ?σεων, επειδ? ο πρ?κτορα? γνωρ?ζει π?ντα με βεβαι?τητα την τρ?χουσα κατ?σταση του περιβ?λλοντο?. Εναλλακτικ?, μ?α MDP μπορε? να αναδιατυπωθε? ω? μ?α POMDP ορ?ζοντα? το σ?νολο παρατηρ?σεων ?σο με το σ?νολο των καταστ?σεων και προσδιορ?ζοντα? τι? ενδεχ?μενε? πιθαν?τητε? παρατηρ?σεων ?στε να επιλ?γεται ντετερμινιστικ? η παρατ?ρηση που αντιστοιχε? στην πραγματικ? κατ?σταση. CITATION Wik19 \l 1033 (Wikipedia, 2019) Παιχν?δια που μπορο?ν να μοντελοποιηθο?ν ω? μερικ?? παρατηρ?σιμε? Μαρκοβιαν?? διαδικασ?ε? αποφ?σεωνΣτο CITATION Κρ?τηση_θ?ση?1 \l 1033 (Ishii, 2005), οι Shin Ishii, Hajime Fujita et al. δημιουργο?ν μια φ?ρμουλα απ?κτηση? αυτ?ματη? στρατηγικ?? για το παιχν?δι καρτ?ν “Hearts” ω? ?να πρ?βλημα ενισχυτικ?? μ?θηση?. Το παιχν?δι αυτ? μπορε? να μοντελοποιηθε? ω? μ?α POMDP, αλλ? λ?γω του τερ?στιου αριθμο? πιθαν?ν καταστ?σεων ε?ναι απαρα?τητο να γ?νουν περαιτ?ρω προσεγγ?σει? ?στε να καταστε? η επ?λυση του προβλ?ματο? εφικτ? απ? ?ναν υπολογιστ?. Το ?ρθρο αυτ? παρουσι?ζει μια μ?θοδο προσ?γγιση? που βασ?ζεται στην εκτ?μηση των μη παρατηρ?σιμων μεταβλητ?ν κατ?σταση? και στην πρ?βλεψη για τι? εν?ργειε? των ?λλων πρακτ?ρων και τα αποτελ?σματα των προσομοι?σεων δε?χνουν ?τι η μ?θοδο? ενισχυτικ?? μ?θηση? μπορε? να εφαρμοστε? σε ?να τ?σο δ?σκολο πρ?βλημα πολλαπλ?ν πρακτ?ρων. Στο CITATION Pet12 \l 1033 (Peter Cowling, 2012), οι Cowling, Ward et al. χρησιμοποιο?ν τον αλγ?ριθμο Monte Carlo με χρ?ση δ?ντρου αναζ?τηση? (Monte Carlo Tree Search - MCTS) για μ?α παραλλαγ? του παιχνιδιο? καρτ?ν Magic: The Gathering. Αυτ? επιτυγχ?νεται μ?σα απ? μ?α ευρε?α γκ?μα προσεγγ?σεων που χρησιμοποιο?ν ντετερμινισμ?, ?που ?λε? οι κρυφ?? και τυχα?ε? πληροφορ?ε? θεωρο?νται γνωστ?? σε ?λου? του? πα?κτε?, σε συνδυασμ? με τον αλγ?ριθμο MCTS και χρησιμοποι?ντα? ?να φ?σμα επιπ?δων πολυπλοκ?τητα?, εξειδικευμ?νων γν?σεων και με?ωση τη? ανταμοιβ?? ?στε να ενθαρρ?νεται το πιο επιθετικ? και ?μεσο παιχν?δι. Εξετ?ζονται επ?ση? δι?φορε? στρατηγικ?? κλ?δευση? προκειμ?νου να αυξηθο?ν οι πληροφορ?ε? που αποκτ?νται απ? κ?θε ντετερμινισμ?, παρ?λληλα με μεθ?δου? που αυξ?νουν τη συν?φεια των τυχα?ων επιλογ?ν. Τα παραπ?νω βοηθο?ν στην επ?τευξη βελτι?σεων στη δυναμικ?τητα των πρακτ?ρων.Στο CITATION Nob08 \l 1032 (Fujii, 2008), το 2008, οι Fujii, Hashida et al. ερευνο?ν το καθεστ?? που ισχ?ει για τα βιντεοπαιχν?δια ανταλλαγ?? καρτ?ν και παρουσι?ζουν ?να αυτ?ματο σ?στημα απ?κτηση? στρατηγικ?? για τα παιχν?δια αυτ?, με χρ?ση τεχνικ?? δειγματοληψ?α?, πρ?βλεψη εν?ργεια? και συν?ρτηση τιμ?? κατ?σταση? για τη λ?ψη μια? απ?φαση? σε ?να χ?ρο αναζ?τηση? με πολλ?? μη παρατηρ?σιμε? μεταβλητ??. Οι προσομοι?σει? του?, στι? οπο?ε? ο πρ?κτορα? του συστ?ματο? αυτο? ?παιξε εναντ?ον εν?? πρ?κτορα που χρησιμοποιε? ?να μοντ?λο βασισμ?νο σε καν?νε? για τη λ?ψη αποφ?σεων, ?δειξαν ?τι ο πρ?κτορα? που παρουσι?ζουν στο ?ρθρο του? ε?ναι πιο ισχυρ?? και προσαρμ?ζεται ευκολ?τερα στην στρατηγικ? του αντιπ?λου του. Στο CITATION Rob14 \l 1033 (Robiliard, 2014), οι Robilliard, Fonlupt et al. χρησιμοποιο?ν και αυτο? τον αλγ?ριθμο αναζ?τησε? δ?ντρου Monte-Carlo και συγκεκριμ?να τον Upper Confidence Bounds Monte-Carlo Tree Search, ο οπο?ο? ?χει προσφ?ρει μεγ?λε? βελτι?σει? στου? τεχνητο?? πρ?κτορε? πολλ?ν παιχνιδι?ν. Εδ? ο αλγ?ριθμο? χρησιμοποιε?ται σε ?να πιο περ?πλοκο παιχν?δι το παιχν?δι 7 Wonders. Αυτ? το παιχν?δι καρτ?ν συγκεντρ?νει πολλ?? ιδι?τητε? που ε?ναι γνωστ? πω? προκαλο?ν δυσκολ?ε? στην μοντελοπο?ηση του, ?πω? κρυμμ?νε? πληροφορ?ε?, πολλο?? πα?κτε? και στοχαστικ?τητα. Περιλαμβ?νει επ?ση? ?να στ?διο ανταλλαγ?? καρτ?ν μεταξ? παικτ?ν που χρησιμοποιε? συνδυαστικ? αναζ?τηση για να αποφασιστε? ποιε? αποφ?σει? ε?ναι επιτρεπτ??. Επιπλ?ον, ε?ναι δ?σκολο να δημιουργηθε? μια αποτελεσματικ? λειτουργ?α αξιολ?γηση? αφο? η αξ?α τη? κ?θε κ?ρτα? εξαρτ?ται σε μεγ?λο βαθμ? απ? το στ?διο του παιχνιδιο? και τι? αποφ?σει? των υπολο?πων παικτ?ν. Παρ? τι? προαναφερθε?σε? δυσκολ?ε? τα αποτελ?σματα ε?ναι ενθαρρυντικ?, αν και το συγκεκριμ?νο παιχν?δι δεν ε?ναι τ?σο συγγεν?? με τα κλασικ? αφηρημ?να παιχν?δια. Στο CITATION daS18 \l 1032 (da Silva, 2018) , οι Alysson Ribeiro da Silva και Luis Fabricio Wanderley Goes μελετο?ν το ψηφιακ? παιχν?δι συλλογ?? καρτ?ν HearthStone ω? ?να εν μ?ρει παρατηρ?σιμο παιχν?δι με εναλλασσ?μενου? γ?ρου?. Η κ?ρια πρ?κληση ε?ναι η δημιουργ?α στρατηγικ?ν ικαν?ν να υποδαυλ?ζουν τι? κιν?σει? του αντιπ?λου. Απ? τη σκοπι? τη? Τεχνητ?? Νοημοσ?νη? ο χ?ρο? ?λων των πιθαν?ν συνδυασμ?ν δρ?σεων ε?ναι τερ?στιο? και δυναμικ?? λ?γω του αριθμο? των καρτ?ν, αλλ? και τη? τυχαι?τητα?, γεγον?? που καθιστ? το σχεδιασμ? αποδοτικ?ν αυτ?νομων πρακτ?ρων ?να δ?σκολο πρ?βλημα. Στο CITATION daS18 \l 1032 (da Silva, 2018) προτε?νεται ?να προσαρμοστικ? νευρωνικ? δ?κτυο εμπνευσμ?νο απ? το ασαφ?? ARAM και ARTMAP καθ?? επ?ση? ?να? ν?ο? μηχανισμ?? για την ταξιν?μηση και την πρ?βλεψη πληροφορι?ν ?στε να αποφε?γεται η υπεργεν?κευση του προβλ?ματο? απ? αυτ? τα δ?κτυα. Επιπλ?ον, η προτειν?μενη λ?ση αξιολογ?θηκε εναντ?ον εν?? προσομοιωτ? HearthStone κι εν?? πρ?κτορα που χρησιμοποιε? αναζ?τηση δ?ντρου Monte Carlo. Τα αποτελ?σματα δε?χνουν ?τι η προτειν?μενη λ?ση κερδ?ζει 80% των φορ?ν εναντ?ον γνωστ?ν συνδυασμ?ν καρτ?ν και 70% εναντ?ον πιο σπαν?ων συνδυασμ?ν καρτ?ν. Κεφ?λαιο 3Το παιχν?δι TichuΤι ε?ναι το Tichu;3-1 Tichu logo. CITATION Fat13 \l 1032 (Fata Morgana, 2013)To Tichu ε?ναι ?να ομαδικ? παιχν?δι συγκομιδ?? π?ντων το ?ποιο πα?ζεται με κ?ρτε?. Εμπερι?χει στοιχε?α απ? το Bridge, το Poker και το Daifugō. Πα?ζεται απ? τ?σσερι? πα?κτε? οι οπο?οι χωρ?ζονται σε δ?ο ομ?δε? των δ?ο παικτ?ν. Υπ?ρχουν και παραλλαγ?? των τρι?ν ? ?ξι παικτ?ν, οι οπο?ε? ?μω? δε θα μα? απασχολ?σουν. Σκοπ?? κ?θε ομ?δα? ε?ναι η συγκομιδ? π?ντων, καθ?? η πρ?τη ομ?δα που θα φτ?σει ?να προκαθορισμ?νο σ?νολο π?ντων (συν?θω? του? 1000 π?ντου?) ε?ναι και η νικητ?ρια ομ?δα. Το παιχν?δι αυτ? προ?ρχεται απ? δ?ο κιν?ζικα παραδοσιακ? παιχν?δια, καθ?? ε?ναι μια παραλλαγ? του Dou Dizhu, Choi Dai Di ? Da Lao Er (δηλαδ? του κιν?ζικου παιχνιδιο? καρτ?ν “big two”) σε συνδυασμ? με το Zheng Fen (εν?? ?λλου κιν?ζικου παιχνιδιο? συγκομιδ?? π?ντων). CITATION Wik18 \l 1032 (Wikipedia, 2018) Ο ιδρυτ?? του Tichu ε?ναι ο Urs Hostettler και το παιχν?δι εμφαν?στηκε για πρ?τη φορ? το 1991. O Urs Hostettler τον?ζει πω? εμπνε?στηκε την ιδ?α για το Tichu απ? ?να παιχν?δι που ε?δε να πα?ζουν στην π?λη τη? Nanjing στην Κ?να οδηγο? λεωφορε?ων. Σ?μερα διαν?μεται απ? την ελβετικ? εταιρ?α παιχνιδι?ν Fata Morgana. CITATION Urs07 \l 1032 (Hostettler, 2004)Εντ?σσεται στην κατηγορ?α των Climbing Games (ιδια?τερα διαδεδομ?νη κατηγορ?α παιχνιδι?ν στην Ασ?α και ειδικ? στην Κ?να), αφο? κ?θε πα?κτη? στη σειρ? του πρ?πει να πα?ξει ?να υψηλ?τερο φ?λλο ? συνδυασμ? φ?λλων απ? τον προηγο?μενο πα?κτη. Αν ο πα?κτη? αυτ?? δε μπορε? ? δεν επιθυμε? να “χτυπ?σει” το προηγο?μενο φ?λλο ? συνδυασμ? φ?λλων μπορε? να δηλ?σει “π?σο”. CITATION Tab19 \l 1032 (Tabletopia, 2019)Στην Ελλ?δα το παιχν?δι αυτ? γ?νεται ?λο και πιο δημοφιλ??, κ?τι το οπο?ο διαφα?νεται απ? το πλ?θο? των δημοσιε?σεων στο διαδ?κτυο για το παιχν?δι αυτ? σε ελληνικ?? ιστοσελ?δε?, καθ?? και απ? τη συμμετοχ? Ελλ?νων παικτ?ν σε διαδικτυακ?? πλατφ?ρμε? παιχνιδι?ν ?που μπορο?ν να πα?ξουν Tichu διαδικτυακ? με ?λλου? πα?κτε?. Η πιο δημοφιλ?? πλατφ?ρμα για Tichu στο διαδ?κτυο ε?ναι το γερμανικ? CITATION Bre19 \l 1032 (BrettSpielWelt), το οπο?ο φιλοξενε? χιλι?δε? ?λληνε? πα?κτε? Tichu (π?νω απ? το 50% των συνολικ?ν παικτ?ν Tichu στην εφαρμογ?), καθ?? και το CITATION dod \l 1033 (dod) , το ?ποιο αποτελε? τη μεγαλ?τερη πλατφ?ρμα παιχνιδι?ν τη? ελληνικ?? κοιν?τητα? και ε?ναι και διαθ?σιμο μ?σα απ? το Facebook. ?λλε? λιγ?τερο διαδεδομ?νε? πλατφ?ρμε? ε?ναι το CITATION onl \l 1033 (Tichu) και το CITATION Tic \l 1033 (Pro) (πρ?ην TichuIQ). Επ?ση? ?λο και αυξαν?μενη συμμετοχ? παρατηρε?ται σε δι?φορα τουρνου? Tichu που διοργαν?νονται σε ?λε? τι? π?λει? τη? Ελλ?δα?.To παιχν?διΤο Tichu ε?ναι ?να παιχν?δι καρτ?ν. Πα?ζεται απ? τ?σσερι? πα?κτε? οι οπο?οι χωρ?ζονται σε δ?ο ομ?δε? των δ?ο παικτ?ν. Στ?χο? τη? κ?θε ομ?δα? ε?ναι η συγκομιδ? περισσ?τερων π?ντων απ? την ?λλη ομ?δα. ?ποια ομ?δα φτ?σει πρ?τη στου? χ?λιου? π?ντου? ε?ναι η νικ?τρια ομ?δα. Αν και οι δ?ο ομ?δε? ξεπερ?σουν του? χ?λιου? π?ντου? στον ?διο γ?ρο, η ομ?δα με του? περισσ?τερου? π?ντου? κερδ?ζει. Στ?χο? κ?θε πα?κτη ε?ναι να πα?ξει ?λε? τι? κ?ρτε? στο χ?ρι του. Σε κ?θε γ?ρο το σ?νολο των π?ντων που δ?νεται ε?ναι 100 π?ντοι, και αυτο? μοιρ?ζονται στι? δ?ο ομ?δε? αν?λογα με τη σειρ? που ?μειναν χωρ?? φ?λλα στα χ?ρια του? οι πα?κτε?. Ο παραπ?νω καν?νε? δεν ισχ?ει σε περ?πτωση που ?να? ? περισσ?τεροι πα?κτε? δηλ?σει (ε?τε με δ?λωση Grand Tichu, ? με δ?λωση Tichu) πω? πιστε?ει ?τι θα ξεφορτωθε? πρ?το? ?λε? τι? κ?ρτε? του. Τ?τε, για μια επιτυχ? δ?λωση, δηλαδ? αν ο πα?κτη? αυτ?? ?ντω? καταφ?ρει να ξεφορτωθε? πρ?το? το σ?νολο των καρτ?ν του, η ομ?δα του, π?ρα απ? το πω? ?χουν μοιραστε? οι 100 βαθμο? του γ?ρου, κερδ?ζει επιπλ?ον βαθμο?? (200 για μια επιτυχημ?νη δ?λωση Grand Tichu και 100 για μια επιτυχημ?νη δ?λωση Tichu). Αντ?στοιχα σε μια αποτυχημ?νη δ?λωση η ομ?δα του πα?κτη χ?νει βαθμο?? (π?λι 200 και 100 βαθμο?? αν?λογα με το αν ?χει δηλωθε? Grand Tichu ? Tichu). Υπ?ρχει επ?ση? η περ?πτωση οι πα?κτε? μια? ομ?δα? να ξεφορτωθο?ν τι? κ?ρτε? του? πριν και απ? του? δ?ο αντιπ?λου? του?. Στην περ?πτωση αυτ? η ομ?δα του? πα?ρνει 200 αντ? για 100 βαθμο??, εν? η αντ?παλη ομ?δα πα?ρνει 0 βαθμο??. Το παιχν?δι πα?ζεται δεξι?στροφα και η σειρ? των παικτ?ν στο τραπ?ζι ε?ναι τ?τοια που π?ντα μετ? απ? ?ναν πα?κτη τη? μια? ομ?δα? πα?ζει πα?κτη? τη? αντ?παλη? ομ?δα?. Σε κ?θε γ?ρο τι? κ?ρτε? μοιρ?ζει ?να? πα?κτη? με δεξι?στροφη φορ?, δ?νοντα? απ? μια κ?ρτα σε κ?θε πα?κτη ξεκιν?ντα? απ? τον αμ?σω? επ?μενο πα?κτη. Η διαδικασ?α επαναλαμβ?νεται μ?χρι να ?χουν μοιραστε? ?λε? οι κ?ρτε?. Στον επ?μενο γ?ρο μοιρ?ζει ο επ?μενο? πα?κτη?. Κ?θε γ?ρο? χωρ?ζεται σε τ?σσερα στ?δια. Αυτ? ε?ναι: το στ?διο του μοιρ?σματο? των πρ?των οκτ? φ?λλων σε κ?θε πα?κτη, το στ?διο τη? δ?λωση? του Grand Tichu, το στ?διο του μοιρ?σματο? των 14 φ?λλων και των ανταλλαγ?ν και το πα?ξιμο του γ?ρου. CITATION Tic12 \l 1032 (Tichurules Blogspot, 2012)H τρ?πουλα3-2 Τρ?πουλα Tichu, CITATION Pil \n \l 1033 (Pillow Fights, 2016)Η τρ?πουλα του Tichu αποτελε?ται απ? 56 κ?ρτε?. Οι κ?ρτε? χωρ?ζονται σε 52 κ?ρτε?, που ε?ναι αυτ?? που συναντ?με στα περισσ?τερα παιχν?δια καρτ?ν και σε τ?σσερι? ειδικ?? κ?ρτε?. Οι 52 κ?ρτε? αυτ?? ε?ναι οι αριθμο? 2,3,4,5,6,7,8,9,10 σε τ?σσερα διαφορετικ? χρ?ματα (κ?κκινο, μα?ρο, μπλε, πρ?σινο) και οι φιγο?ρε?. Φιγο?ρε? ε?ναι ο βαλ?? (Jack, απεικον?ζεται ω? J π?νω στην κ?ρτα), η ντ?μα (Queen, απεικον?ζεται ω? Q π?νω στην κ?ρτα) και ο ρ?γα? (King, απεικον?ζεται ω? Κ π?νω στην κ?ρτα). Επ?ση? υπ?ρχει και ο ?σσο? (Ace, απεικον?ζεται ω? A π?νω στην κ?ρτα). Οι φιγο?ρε? και οι ?σσοι ?χουν και αυτ?? τ?σσερα διαφορετικ? χρ?ματα (κ?κκινο, μα?ρο, μπλε, πρ?σινο), ?πω? συμβα?νει και με του? αριθμο??. Οι τ?σσερι? ειδικ?? κ?ρτε? του Tichu ε?ναι το Mahjong, τα σκυλι?, ο φο?νικα? και ο δρ?κο?. Ο ρ?λο? του? θα εξηγηθε? στην επ?μενη εν?τητα.Το κ?θε χρ?μα ?χει και το δικ? του σ?μβολο π?νω στι? κ?ρτε?. Το κ?κκινο ?χει το αστ?ρι, το μα?ρο ?χει το σπαθ?, το μπλε ?χει τη παγ?δα, εν? το πρ?σινο ?χει το διαμ?ντι.Ειδικ?? Κ?ρτε? 3-3 Ειδικ?? κ?ρτε? του Tichu, CITATION Lim14 \l 1032 (Lim, 2014)Η τρ?πουλα Tichu εμπερι?χει τ?σσερι? ειδικ?? κ?ρτε?, καθεμ?α απ? τι? οπο?ε? ?χει συγκεκριμ?νε? ιδι?τητε? που επηρε?ζουν τη ρο? του παιχνιδιο?. Οι κ?ρτε? αυτ?? ε?ναι το Mahjong, τα σκυλι?, ο φο?νικα? και ο δρ?κο?. CITATION Ach19 \l 1032 (Achro)To Mahjong 18097501035053-4 Mahjong, CITATION Fli \l 1033 (Jesta, 2015)Το Mahjong ε?ναι το μικρ?τερο φ?λλο τη? τρ?πουλα? και δρα σαν το νο?μερο ?να στο παιχν?δι. Μπορε? δηλαδ? να παιχτε? ε?τε στην αρχ? μια? κ?ντα? πριν απ? το δ?ο (κ?ντα 1-5) ε?τε σαν το πιο αδ?ναμο μον? φ?λλο. O πα?κτη? που ?χει το Mahjong στα φ?λλα του ε?ναι αυτ?? που ξεκιν?ει το γ?ρο. Μπορε? να ρ?ξει οποιοδ?ποτε συνδυασμ? θ?λει (χωρ?? απαρα?τητα να ξεκιν?σει με συνδυασμ? που περι?χει το Mahjong). Τη στιγμ? που κ?ποιο? πα?κτη? πα?ζει το Mahjong (ε?τε ω? μον? φ?λλο ε?τε ω? κ?ντα) δικαιο?ται να ζητ?σει ?να φ?λλο το οπο?ο ?μω? δεν ε?ναι μια ?λλη ειδικ? κ?ρτα. Η επιθυμ?ατου Mahjong πρ?πει να εκπληρωθε? ?μεσα, ?ταν β?βαια αυτ? ε?ναι δυνατ?ν.Για παρ?δειγμα, ?στω ?τι το Mahjong πα?ζεται ω? μον? φ?λλο και ο πα?κτη? που το ρ?χνει αποφασ?ζει να ζητ?σει την κ?ρτα 3. Ο επ?μενο? πα?κτη? ε?ναι υποχρεωμ?νο? να ρ?ξει 3 ε?ν ?χει ?στω και ?να φ?λλο 3 στη δι?θεσ? του. Ε?ν δεν ?χει τ?τε μπορε? να ρ?ξει ?τι θ?λει ? να π?ει π?σο. Ο τρ?το? στη σειρ? πρ?πει τ?ρα αυτ?? να ρ?ξει 3 ε?ν ?χει και μπορε? (δηλαδ? ε?ν προηγουμ?νω? δεν ?χει π?σει φ?λλο μεγαλ?τερο του 3) και ο?τω καθεξ??. Σε περ?πτωση που το Mahjong π?φτει σε κ?ντα και ζητε?ται ?να φ?λλο τ?τε αυτ? το φ?λλο πρ?πει να π?σει σε κ?ντα ?διου αριθμο? φ?λλων, ε?ν φυσικ? αυτ? ε?ναι δυνατ?ν.Η επιθυμ?α του Mahjong παραμ?νει ?ω? ?του ε?ναι δυνατ?ν να εκπληρωθε?.Να σημει?σουμε ?τι οι β?μβε? (συνδυασμ?? που θα αναφερθο?με στην εν?τητα vi αυτο? του κεφαλα?ου) μπορο?ν να παιχτο?ν αν? π?σα στιγμ? και π?νω σε οποιονδ?ποτε συνδυασμ? πρ?γμα που σημα?νει ?τι ε?ν κ?ποιο? ?χει β?μβα στο ζητο?μενο φ?λλο μπορε? να χρειαστε? να την πα?ξει. Στο προηγο?μενο παρ?δειγμα, αν ο τρ?το? πα?κτη? στη σειρ? ε?χε μια β?μβα στο 3 (δηλαδ? ε?χε στα φ?λλα του και τα τ?σσερα φ?λλα 3), τ?τε θα ?ταν αναγκασμ?νο? να ρ?ξει τη β?μβα αν ο δε?τερο? στη σειρ? ε?χε πα?ξει φ?λλο υψηλ?τερο του 3. Αλλι?? θα ε?χε την επιλογ? του να πα?ξει ?να φ?λλο 3 ? ολ?κληρη τη β?μβα μαζ?. Τα σκυλι? 3-5 Τα σκυλι?, CITATION Fli \l 1033 (Jesta, 2015)Τα σκυλι? ε?ναι η ειδικ? κ?ρτα η οπο?α μπορε? να παιχτε? απ? τον πα?κτη που ?χει ?π?ρει χ?ρι?, δηλαδ? αυτ?ν τον οπο?ο ορ?ζει τον συνδυασμ? που πρ?κειται να παιχτε?. Αντ? λοιπ?ν να ορ?σει ?ναν καινο?ριο συνδυασμ?, μπορε? να ρ?ξει τα σκυλι? δ?νοντα? τη θ?ση του στο συμπα?κτη του, ο οπο?ο? υποχρεο?ται πλ?ον να ορ?σει αυτ?? το συνδυασμ? που θα παιχτε?, ?πω? αυτ?? επιθυμε?.Ε?ν ο συμπα?κτη? ?χει βγει τ?τε αυτ?? που ορ?ζει τον ν?ο συνδυασμ? ε?ναι ο επ?μενο? πα?κτη? απ? τη θ?ση ?που βρισκ?ταν ο συμπα?κτη? του. Σε περ?πτωση που και αυτ?? ?χει βγει τ?τε το ν?ο συνδυασμ? τον διαλ?γει π?λι ο πα?κτη? που χρησιμοπο?ησε τα σκυλι?.Τα σκυλι? ε?ναι το μ?νο φ?λλο π?νω στο οπο?ο δεν μπορε? να χρησιμοποιηθε? μια β?μβα. Ο δρ?κο?3-6 Ο δρ?κο?, CITATION Fli \l 1033 (Jesta, 2015)Ο δρ?κο? ε?ναι το υψηλ?τερο μον? φ?λλο και μπορε? να παιχτε? μ?νο ?ταν πα?ζονται μον? φ?λλα. Μπορε? να χτυπηθε? μ?νο απ? β?μβα. ?ταν κ?ποιο? πα?κτη? πα?ρνει τη μπ?ζα με το δρ?κο, δηλαδ? πα?ξει το δρ?κο και μετ? ?λοι οι υπ?λοιποι πα?κτε? κ?νουν π?σο, τ?τε τη μπ?ζα αυτ? την δ?νει σε ?ναν απ? του? αντ?παλου? πα?κτε?, αυτ?ν που πιθανολογε? ?τι θα βγει τελευτα?ο? (σε αυτ?ν, δηλαδ?, που θα με?νει μ?νο? με φ?λλα π?νω του στο τ?λο? τη? παρτ?δα?). Ο φο?νικα? 3-7 Ο φο?νικα?, CITATION Fli \l 1033 (Jesta, 2015)Ο φο?νικα? χρησιμοποιε?ται ω? μπαλαντ?ρ. Μπορε? να χρησιμοποιηθε? στη θ?ση οποιουδ?ποτε κλασικο? φ?λλου (?χι δηλαδ? ειδικο?) και να συμπληρ?σει οποιονδ?ποτε συνδυασμ? εκτ?? απ? β?μβα. ?ταν πα?ζεται ω? μον? φ?λλο τ?τε η αξ?α του ε?ναι μισ? παραπ?νω απ? το τελευτα?ο μον? φ?λλο που ?χει παιχτε?. Ε?ν δηλαδ? παιχτε? π?νω απ? 6 τ?τε η αξ?α του ε?ναι 6+? , ε?ν παιχτε? π?νω απ? ?σσο τ?τε η αξ?α του ε?ναι Α+?. Ο φο?νικα? δεν μπορε? να παιχτε? π?νω απ? τον Δρ?κο στα μον? φ?λλα, και π?νω απ? την υψηλ?τερη δυνατ? κλασικ? κ?ντα (10,J,Q,K,A). Δυναμικ?τητα Φ?λλωνΠριν προχωρ?σουμε στην παρουσ?αση ?λων των συνδυασμ?ν που μπορο?ν να πα?ξουν οι πα?κτε? στο Tichu, θα αναλ?σουμε τη δυναμικ?τητα των διαφ?ρων φ?λλων.Το Mahjong, θεωρε?ται ω? το πιο αδ?ναμο μον? φ?λλο (?στω δυναμικ?τητα 1) ? η πιο αδ?ναμη αρχ? μια? κ?ντα? και δε μπορε? να χρησιμοποιηθε? ω? τ?ποτε ?λλο.Οι αριθμο? 2 ?ω? 10 ?χουν την δυναμικ?τητα που υποδηλ?νει ο αριθμ?? του?. Ο Βαλ?? (J) ε?ναι το αμ?σω? πιο δυνατ? φ?λλο απ? το 10 (?στω δυναμικ?τητα 11), η Ντ?μα (Q) το αμ?σω? πιο δυνατ? φ?λλο απ? το βαλ? (?στω δυναμικ?τητα 12) εν? ο Ρ?γα? (K) το αμ?σω? πιο δυνατ? φ?λλο απ? τη ντ?μα (?στω δυναμικ?τητα 13). Ο ?σσο? (A) ε?ναι πιο δυνατ?? απ? τον ρ?γα και γενικ? το πιο δυνατ? μη-ειδικ? φ?λλο (?στω δυναμικ?τητα 14). Ο φο?νικα? σαν μον? φ?λλο ?χει δυναμικ?τητα +0.5 π?νω απ? το φ?λλο που χτυπ?ει. Ε?ν δεν υπ?ρχει ?λλο φ?λλο κ?τω ?ταν π?σει, τ?τε ?χει δυναμικ?τητα 1.5. Ο φο?νικα? δε μπορε? να χτυπ?σει τον δρ?κο. Ο Δρ?κο? ε?ναι το πιο δυνατ? μον? φ?λλο (?στω δυναμικ?τητα 15).Συνδυασμο?Υπ?ρχουν διαφ?ρων ειδ?ν συνδυασμο? στο Tichu. Οι περισσ?τεροι απ? αυτο?? συναντιο?νται και σε ?λλα παιχν?δια και ε?ναι διαδεδομ?νοι στο ευρ? κοιν?. Οι συνδυασμο? αυτο? ε?ναι οι εξ??:Μονοφυλλ?α: ?να μον? φ?λλο. Η δυναμικ?τητα των φ?λλων περιγρ?φηκε στην αμ?σω? προηγο?μενη εν?τητα. Ο δρ?κο? μπορε? να παιχτε? μ?νο σαν μον? φ?λλο.Διφυλλ?α (ζευγ?ρι): Δ?ο φ?λλα μπορο?ν να παιχτο?ν σαν ?να ζευγ?ρι. Απαρα?τητη προ?π?θεση ε?ναι τα δ?ο φ?λλα αυτ? να ε?ναι ?δια (σε δυναμικ?τητα), ? ?να απ? αυτ? να ε?ναι ο φο?νικα?. Η δυναμικ?τητα των ζευγαρι?ν προκ?πτει απ? τη δυναμικ?τητα των φ?λλων που αποτελο?ν το ζευγ?ρι (ο φο?νικα? εδ? ?χει τη δυναμικ?τητα του ?λλου φ?λλου του ζευγαριο?, δηλαδ? το ζευγ?ρι 2-Φο?νικα? ε?ναι πιο αδ?ναμο απ? το ζευγ?ρι 3-3). Τριφυλλ?α (τριπλ?τα): Τρ?α φ?λλα μπορο?ν να παιχτο?ν σαν μια τριπλ?τα. Απαρα?τητη προ?π?θεση ε?ναι τα τρ?α φ?λλα αυτ? να ε?ναι ?δια (σε δυναμικ?τητα), ? ?να απ? αυτ? να ε?ναι ο φο?νικα?. Η δυναμικ?τητα των τριπλετ?ν προκ?πτει απ? τη δυναμικ?τητα των φ?λλων που αποτελο?ν την τριπλ?τα (ο φο?νικα? εδ? ?χει τη δυναμικ?τητα των ?λλων φ?λλων τη? τριπλ?τα?, δηλαδ? η τριπλ?τα 9-9-Φο?νικα? ε?ναι πιο αδ?ναμη απ? την τριπλ?τα 10-10-10).Κ?ντα: Κ?ντα ε?ναι π?ντε ? παραπ?νω φ?λλα διαδοχικ?? δυναμικ?τητα?. Η κ?ντα ορ?ζεται απ? το πλ?θο? των φ?λλων τη? και τη δυναμικ?τητα του μεγαλ?τερου τη? φ?λλου. Μια κ?ντα ?ξι φ?λλων (?στω 4-5-6-7-8-9) ε?ναι πιο αδ?ναμη απ? την κ?ντα ?ξι φ?λλων 9-10-J-Q-K-A. Μια κ?ντα n-φ?λλων (?που n≥5) μπορε? να νικηθε? μ?νο απ? μια κ?ντα n-φ?λλων ?που το μεγαλ?τερο φ?λλο τη? ?χει υψηλ?τερη δυναμικ?τητα απ? το υψηλ?τερο φ?λλο τη? πρ?τη?.Full House: Το Full House ε?ναι ?να? συνδυασμ?? π?ντε φ?λλων που αποτελε?ται απ? μια τριπλ?τα και ?να ζευγ?ρι. Προφαν?? η τριπλ?τα και το ζευγ?ρι ε?ναι διαφορετικ?? δυναμικ?τητα?. Η δυναμικ?τητα του Full House ορ?ζεται απ? τη δυναμικ?τητα τη? τριπλ?τα? αυτο?. Δηλαδ? ?να Full House 4-4-4-2-2 ε?ναι πιο δυνατ? απ? ?να Full House 3-3-3-A-A, μια? και η τριπλ?τα 4-4-4 ε?ναι πιο δυνατ? απ? την τριπλ?τα 3-3-3. Steps: ?να? πα?κτη? μπορε? να πα?ξει επ?ση? ?σα συνεχ?μενη? δυναμικ?τητα? ζευγ?ρια ?χει σαν ?ναν κοιν? συνδυασμ?. Τα διαδοχικ? ζευγ?ρια, ?πω? και οι κ?ντε?, ορ?ζονται και αυτ? απ? το πλ?θο? των ζευγαρι?ν και τη δυναμικ?τητα του μεγαλ?τερου ζευγαριο?. Για παρ?δειγμα τα διαδοχικ? ζευγ?ρια 6-6-7-7-8-8 ε?ναι πιο αδ?ναμα απ? τα διαδοχικ? ζευγ?ρια 7-7-8-8-9-9, αφο? το 9 ?χει υψηλ?τερη δυναμικ?τητα απ? το 8. ?πω? και στι? κ?ντε? n το πλ?θο? διαδοχικ? ζευγ?ρια μπορε? να νικηθε? μ?νο απ? n το πλ?θο? διαδοχικ? ζευγ?ρια ?που το μεγαλ?τερο ζευγ?ρι ?χει υψηλ?τερη δυναμικ?τητα απ? το μεγαλ?τερο ζευγ?ρι των πρ?των.Β?μβα: Η β?μβα ε?ναι ?να? ιδια?τερο? συνδυασμ?? στο Tichu, με την ?ννοια ?τι μπορε? να παιχτε? ακ?μα και εκτ?? σειρ?? του πα?κτη (δηλαδ? ακ?μα και ?ταν δεν πα?ζει ο ?διο? κ?ποιον συνδυασμ?) π?νω σε οποιοδ?ποτε φ?λλο (εκτ?? απ? την ειδικ? κ?ρτα Σκυλι?) και κερδ?ζει οποιοδ?ποτε απ? του? παραπ?νω συνδυασμο?? - εκτ?? β?βαια απ? β?μβα υψηλ?τερη? δυναμικ?τητα?. Μια β?μβα αποτελε?ται ε?τε απ? τ?σσερα ?δια? δυναμικ?τητα? φ?λλα (για παρ?δειγμα 2-2-2-2 και ονομ?ζεται Β?μβα Καρ?) ? απ? μια κ?ντα φ?λλων ?διου χρ?ματο? (για παρ?δειγμα 3-4-5-6-7 κ?κκινου χρ?ματο?). Η δυναμικ?τητα των βομβ?ν ορ?ζεται με τον εξ?? τρ?πο: μια β?μβα με τ?σσερα ?δια φ?λλα ε?ναι λιγ?τερο δυνατ? απ? οποιαδ?ποτε β?μβα κ?ντα? ?διου χρ?ματο?, εν? για τι? β?μβε? κ?ντα? ?διου χρ?ματο? ?διων φ?λλων ισχ?ει ?τι και για τι? κανονικ?? κ?ντε? (δηλαδ? η β?μβα κ?ντα ?διου χρ?ματο? ?που ?χει υψηλ?τερη δυναμικ?τητα το μεγαλ?τερο φ?λλο τη? υπερτερε?). Αν?μεσα σε μια β?μβα κ?ντα ?διου χρ?ματο? n φ?λλων και μια β?μβα κ?ντα ?διου χρ?ματο? m φ?λλων, ?που m>n , πιο δυνατ? ε?ναι η β?μβα με τα m φ?λλα. Για παρ?δειγμα η β?μβα 2-2-2-2 ε?ναι λιγ?τερη δυνατ? απ? τη β?μβα 4-4-4-4, η οπο?α με τη σειρ? τη? ε?ναι λιγ?τερη δυνατ? απ? τη β?μβα 8-9-10-J-Q ?διου χρ?ματο?, η οπο?α με τη σειρ? τη? ε?ναι λιγ?τερο δυνατ? απ? τη β?μβα 10-J-Q-K-A ιδ?ου χρ?ματο?, η οπο?α με τη σειρ? τη? ε?ναι λιγ?τερο δυνατ? απ? τη β?μβα 5-6-7-8-9-10 ?διου χρ?ματο?. Δηλ?σει? Grand Tichu και TichuΤο Grand Tichu και το Tichu ε?ναι οι δ?ο δηλ?σει? με τι? ?ποιε? κ?ποιο? πα?κτη? μπορε? να μαζ?ψει παραπ?νω π?ντου? για την ομ?δα του. Το ρ?σκο το οπο?ο εν?χουν, μια? και σε περ?πτωση που ο πα?κτη? που τα δηλ?σει δε ξεφορτωθε? πρ?το? τι? κ?ρτε? του η ομ?δα του θα δεχτε? ποιν? αρνητικ?ν π?ντων ?ση με του? παραπ?νω π?ντου? που θα ?παιρνε η ομ?δα αν ξεφορτων?ταν πρ?το? τι? κ?ρτε? του, σε συνδυασμ? με το μεγ?λο προβ?δισμα το οπο?ο αυτ?? οι δηλ?σει? μπορο?ν να δ?σουν, καθιστο?ν τι? δηλ?σει? αυτ?? κομβικ?? για την πορε?α του παιχνιδιο? και την αν?δειξη τη? νικητ?ρια? ομ?δα?.Grand Tichu μπορε? να δηλ?σει κ?ποιο? πα?κτη?, ?ταν ?χει δει μ?νο τα οκτ? πρ?τα τουφ?λλα. Απ? τη στιγμ? λοιπ?ν που θα μοιραστο?ν απ? οκτ? φ?λλα σε ?λου? του? πα?κτε? μ?χρι τη στιγμ? που θα δουν τα υπ?λοιπα φ?λλα του?, ?να? ? και περισσ?τεροι πα?κτε? μπορο?ν να δηλ?σουν Grand Tichu. O πα?κτη? που κ?νει τη δ?λωση Grand Tichu πιθανολογε? πω? θα ε?ναι ο πρ?το? που θα με?νει χωρ?? φ?λλα. Οι π?ντοι που προστ?θενται ? αφαιρο?νται στο τ?λο? του γ?ρου αν καταφ?ρει να με?νει πρ?το? χωρ?? φ?λλα ? ?χι αντ?στοιχα ε?ναι 200 π?ντοι.Κ?θε πα?κτη? οποιαδ?ποτε στιγμ? πριν πα?ξει το πρ?το του φ?λλο (δηλαδ? ?σο ?χει 14 φ?λλα στο χ?ρι του) μπορε? να δηλ?σει Tichu. Αυτ? σημα?νει ?τι πιθανολογε? πω? θα ε?ναι αυτ?? ο οπο?ο? θα με?νει πρ?το? χωρ?? φ?λλα. Ε?ν αυτ? γ?νει τ?τε η ομ?δα του κερδ?ζει επιπλ?ον 100 π?ντου?. Σε αντ?θετη περ?πτωση η ομ?δα του χ?νει 100 π?ντου?. Εδ? αξ?ζει να τον?σουμε ?τι οι π?ντοι του Grand Tichu και του Tichu ε?ναι επιπλ?ον π?ντοι που προστ?θενται στου? 100 π?ντου? του κ?θε γ?ρου.Ανταλλαγ?? Μετ? τη δ?λωση ? μη Grand Tichu και αφο? μοιραστο?ν και στου? τ?σσερι? πα?κτε? τα 14 φ?λλα ακολουθε? η φ?ση των ανταλλαγ?ν. Σε αυτ?ν τη φ?ση κ?θε πα?κτη? ε?ναι αναγκασμ?νο? να δ?σει απ? ?να φ?λλο σε κ?θε ?λλον πα?κτη (?να στο συμπα?κτη του και απ? ?να σε κ?θε αντ?παλ? του) και να λ?βει αντ?στοιχα τρ?α φ?λλα (?να απ? το συμπα?κτη του και ?να απ? κ?θε αντ?παλο του). Σε ?λη αυτ? τη διαδικασ?α ο κ?θε πα?κτη? δεν ?χει καμ?α πληροφορ?α για τα φ?λλα που θα λ?βει, μ?χρι? ?του δ?σει φ?λλα στου? ?λλου? πα?κτε?.Γενικο? Καν?νε? Αφο? τελει?σει η φ?ση των ανταλλαγ?ν, ξεκιν?ει η φ?ση του παιχνιδιο?. Αρχ?ζει πρ?το? ο πα?κτη? που ?χει το Mahjong. Μπορε? να πα?ξει (? ρ?ξει) οποιοδ?ποτε συνδυασμ? θ?λει. Οι υπ?λοιποι πα?κτε? πα?ζουν με δεξι?στροφη φορ? και μπορο?ν να ρ?ξουν ε?τε υψηλ?τερο ?διο συνδυασμ? ? β?μβα ? να πουν π?σο. Ο πα?κτη? ο οπο?ο? “κερδ?ζει” ε?ναι αυτ?? ο οπο?ο? θα πετ?ξει τελευτα?ο? συνδυασμ? και οι υπ?λοιποι τρει? πα?κτε? θα π?νε π?σο. Τ?τε, ο πα?κτη? αυτ?? μαζε?ει τα παιγμ?να φ?λλα στη μπ?ζα του (μ?νο στη περ?πτωση που κερδ?σει χ?ρι με το Δρ?κο δ?νει τη μπ?ζα αλλο?, ?πω? εξηγ?θηκε παραπ?νω) και πα?ζει πρ?το? οποιοδ?ποτε συνδυασμ? θ?λει. Στ?χο? του παιχνιδιο? για κ?θε πα?κτη ε?ναι να απαλλαγε? απ? ?λα του τα φ?λλα μαζε?οντα?, ταυτ?χρονα, ?σο το δυνατ?ν παραπ?νω π?ντου?. Ο γ?ρο? τελει?νει ε?τε ?ταν οι δ?ο πα?κτε? τη? ?δια? ομ?δα? ξεφορτωθο?ν ?λα τα φ?λλα του? πριν και απ? του? δ?ο πα?κτε? τη? αντ?παλη? ομ?δα? - ε?τε ?ταν τρει? απ? του? τ?σσερι? πα?κτε? ξεφορτωθο?ν ?λα τα φ?λλα του?. ?στω ?να παρ?δειγμα, οπο? οι πα?κτε? 1 και 3 ε?ναι συμπα?κτε? και οι πα?κτε? 2 και 4 ε?ναι οι αντ?παλο? του? και ξεκιν?ει ο Πα?κτη? 2 ε?ναι το εξ??: ο Πα?κτη? 2 πα?ζει ζευγ?ρι 4-4, ο Πα?κτη? 3 πα?ζει 6-6, ο Πα?κτη? 4 πα?ζει 9-9, ο Πα?κτη? 1 πα?ζει Q-Q, ο Πα?κτη? 2 Κ-Κ και ο Πα?κτη? 3 πα?ζει Α-φο?νικα (αντιστοιχε? σε ζευγ?ρι Α-Α). Οι πα?κτε? 4,1 και 2 π?νε π?σο διαδοχικ? και ο Πα?κτη? 3 πα?ρνει ?λα τα φ?λλα που πα?χτηκαν στη μπ?ζα του. ?πειτα, ε?ναι σειρ? του να ρ?ξει ?ποιον συνδυασμ? θ?λει.Π?ντοιΟ γ?ρο? σταματ?ει σε δ?ο περιπτ?σει?. Η πρ?τη περ?πτωση ε?ναι ?ταν οι τρε?? απ? του? τ?σσερι? πα?κτε? ξεφορτωθο?ν ?λα του? τα φ?λλα. Τ?τε μετριο?νται οι π?ντοι των φ?λλων τη? συνολικ?? μπ?ζα? τη? κ?θε ομ?δα?. Οι π?ντοι απ? τι? κ?ρτε? στο Tichu ε?ναι 100 και ε?ναι οι παρακ?τω:Πεντ?ρι (5): 5 π?ντοιΔεκ?ρι (10): 10 π?ντοιΡ?γα? (Κ): 10 π?ντοιΔρ?κο?: 25 π?ντοιΦο?νικα?: -25 π?ντοι?λα τα υπ?λοιπα φ?λλα δεν ?χουν π?ντου?.Ο τελευτα?ο? πα?κτη? δ?νει του? π?ντου? που ?χει στο χ?ρι του στην αντ?παλη ομ?δακαι του? π?ντου? που ?χει στη μπ?ζα του στην ομ?δα που αν?κει ο πα?κτη? που ξεφορτ?θηκεπρ?το? ?λα του τα φ?λλα (μπορε? δηλαδ? να ε?ναι και ο συμπα?κτη? του).Η δε?τερη περ?πτωση ε?ναι ?ταν βγουν πρ?το? και δε?τερο? οι δ?ο πα?κτε? μια? ομ?δα? (λ?γεται και “?να – δ?ο”). Τ?τε δεν μετριο?νται οι π?ντοι και η ομ?δα αυτ? πα?ρνει αυτ?ματα 200 π?ντου? εν? η ?λλη 0.Κεφ?λαιο 4Εφαρμογ?? τη? Τεχνητ?? Νοημοσ?νη? και τη? Μηχανικ?? Μ?θηση? για το TichuΣε ?τι αφορ? το παιχν?δι Tichu, ?χουν γ?νει προσπ?θειε? δημιουργ?α? ευφυ?ν τεχνικ?ν (χρ?ση τεχνητ?? νοημοσ?νη? και μηχανικ?? μ?θηση?) ε?τε στη λ?ψη αποφ?σεων, ε?τε στην υλοπο?ηση εν?? ευφυο?? πα?κτη Tichu. Το παιχν?δι Mini Tichu και ευφυε?? υλοποι?σει? τουΤο παιχν?δι Mini Tichu (?πω? ονομ?στηκε απ? την Μ?ρθα Βλ?χου-Κογχυλ?κη) ε?ναι μια απλοποιημ?νη μορφ? του Tichu. Στο Mini Tichu δεν περιλαμβ?νονται οι τ?σσερι? ειδικ?? κ?ρτε?. Αυτ? διευκολ?νει την αν?πτυξη ευφυ?ν τεχνικ?ν υλοπο?ηση? του παιχνιδιο? μια? και το πλ?θο? των διαφορετικ?ν επιλογ?ν μει?νεται. Μια? και δεν υπ?ρχει το φ?λλο Mahjong για να καθορ?σει ποιο? πα?ζει πρ?το?, αυτ? γ?νεται μ?σω μια? τυχα?α? συν?ρτηση?.Για το παιχν?δι αυτ? ?χουν παρουσιαστε? δ?ο διαφορετικ?? προσεγγ?σει? για τη δημιουργ?α ευφυ?ν πρακτ?ρων. Η μ?α ε?ναι αυτ? τη? Μ?ρθα? Βλ?χου-Κογχυλ?κη στο CITATION Βλ?15 \l 1032 (Βλ?χου-Κογχυλ?κη, 2012), εν? η δε?τερη του Koen-Castelein στο CITATION Koe17 \l 1032 (Castelein, 2017). Αν?πτυξη Παιχνιδιο? Στρατηγικ?? Μερικ?? Πληροφ?ρηση? για το παιχν?δι Mini Tichu Στο CITATION Βλ?15 \l 1032 (Βλ?χου-Κογχυλ?κη, 2012) η διαδικασ?α δημιουργ?α? εν?? ευφυο?? πρ?κτορα ξεκιν? με την ε?ρεση ?λων των πιθαν?ν συνδυασμ?ν που μπορο?ν να προκ?ψουν απ? τι? κ?ρτε? τι? οπο?ε? ?χει στο χ?ρι του τη στιγμ? που καλε?ται να π?ρει την απ?φαση (δηλαδ? να πα?ξει). Μ?σα απ? αυτ?ν τη διαδικασ?α δημιουργε?ται ?να δ?ντρο αναζ?τηση?. Κ?θε κ?μβο? του δ?ντρου αυτο? αποτελε?ται απ? τρ?α στοιχε?α. Πρ?το στοιχε?ο ε?ναι οι κ?ρτε? οι οπο?ε? δεν αν?κουν σε κ?ποιο συνδυασμ?. Δε?τερο στοιχε?ο ε?ναι μια λ?στα με συνδυασμο?? που προκ?πτουν απ? τι? κ?ρτε? που ?χει στο χ?ρι του ο πα?κτη? και τρ?το ?να? δε?κτη? στον πατ?ρα του κ?μβου αυτο?. Η δημιουργ?α του δ?ντρου γ?νεται αναδρομικ?, δηλαδ? για κ?θε κατ?σταση (κ?ρτε? τι? οπο?ε? ?χει στο χ?ρι του εκε?νη τη στιγμ? ο πα?κτη?) δημιουργο?νται τ?σα παιδι? ?σα το πλ?θο? των διαφορετικ?ν λιστ?ν συνδυασμ?ν και καρτ?ν που δεν αν?κουν σε κ?ποιο συνδυασμ?, που μπορο?ν να δημιουργηθο?ν. ?ταν η αναζ?τηση ολοκληρωθε? διαγρ?φονται οι κ?μβοι που ε?ναι ?διοι και στη συν?χεια οι κ?μβοι βαθμολογο?νται αν?λογα με την κεντρικ? αξ?α κ?θε συνδυασμο?, με το πλ?θο? των φ?λλων των συνδυασμ?ν, με το ειδικ? β?ρο? των συνδυασμ?ν και κανονικοποιο?νται με β?ση το πλ?θο? των συνδυασμ?ν του κ?μβου ? το πλ?θο? των καρτ?ν που ?χει ο πα?κτη? εκε?νη τη στιγμ?. ?να? τελευτα?ο? τρ?πο? αξιολ?γηση? ε?ναι η μ?τρηση των πιθαν?ν συνδυασμ?ν που απομ?νουν στο παιχν?δι και το π?σο δυνατο? ε?ναι οι συνδυασμο? του κ?μβου σε σχ?ση με αυτο??. Για τη φ?ση των ανταλλαγ?ν χρησιμοποιε?ται ο εξ?? τρ?πο? ε?ρεση? των τρι?ν φ?λλων. Στο συμπα?κτη δ?νεται το μεγαλ?τερη? δυναμικ?τητα? φ?λλο εκτ?? συνδυασμο? και ε?ν αυτ? δεν υπ?ρχει, τ?τε δ?νεται απλ?? το φ?λλο με τη μεγαλ?τερη δυναμικ?τητα. Για τα δ?ο φ?λλα που δ?νονται στου? αντιπ?λου?, αυτ? προκ?πτουν απ? του? πιθανο?? κ?μβου? που προκ?πτουν απ? την αφα?ρεση κ?θε πιθαν?? δυ?δα? φ?λλων δυναμικ?τητα? απ? 2 ?ω? και J (Βαλ?). O πα?κτη? τελικ? επιλ?γει το δ?ντρο στο οπο?ο αν?κει ο καλ?τερο? τερματικ?? κ?μβο? και δ?νει στου? αντιπ?λου? τι? κ?ρτε? που αφαιρ?θηκαν για να καταλ?ξει σε αυτ?ν. Το ε?ν ?να? πα?κτη? θα πα?ξει ? ?χι ?ναν επιτρεπ?μενο συνδυασμ? εξαρτ?ται απ? τη διαφορ? που θα προκ?ψει αν?μεσα στον καλ?τερο δυνατ? τερματικ? κ?μβο και σε αυτ?ν που θα προκ?ψει ?μα ο πα?κτη? πα?ξει τον συνδυασμ?. Αυτ? γ?νεται πολλαπλασι?ζοντα? την τιμ? του καλ?τερου κ?μβου με ?ναν συντελεστ? μικρ?τερο τη? μον?δα? (πολλαπλασιαστ?? ανεκτικ?τητα?). Ε?ν η αξ?α του ελαττωμ?νου κ?μβου ε?ναι μεγαλ?τερη του κατωφλ?ου που προκ?πτει απ? τον προηγο?μενο πολλαπλασιασμ? και ικανοποιο?νται τα κριτ?ρια τη? συνεργατικ?τητα? τ?τε ο συνδυασμ?? μπορε? να αφαιρεθε?. Ο πρ?κτορα?, δηλαδ?, πα?ζει αυτ?ν τον συνδυασμ?. Σε διαφορετικ? περ?πτωση, ο πρ?κτορα? θα π?ει π?σο. Τα β?ρη των διαφ?ρων συνδυασμ?ν, η συνεργατικ?τητα μεταξ? των συμπαικτ?ν (π?τε δηλαδ? απαγορε?εται ?να? συμπα?κτη? να πα?ξει π?νω απ? ?ναν συνδυασμ?, ?ταν ο τελευτα?ο? συνδυασμ?? που ?χει παιχτε? ε?ναι απ? το συμπα?κτη του) και το ?ριο ανεκτικ?τητα? του πρ?κτορα ε?ναι παρ?μετροι των οπο?ων οι τιμ?? ορ?ζονται αυθα?ρετα και μπορο?ν να αλλ?ζουν ?στε να επιτευχθο?ν καλ?τερα αποτελ?σματα. Τ?λο? μπορε? να επιλεχθε? ?να? απ? του? παρακ?τω τρ?που? αξιολ?γηση? των κ?μβων αν?μεσα στου?: καμ?α αξιολ?γηση (τυχα?ο? τρ?πο? παιξ?ματο?), απλ? αξιολ?γηση κ?μβων, αξιολ?γηση με β?ση τον αριθμ? των καρτ?ν του κ?μβου, αξιολ?γηση με β?ση τον αριθμ? των συνδυασμ?ν του κ?μβου και αξιολ?γηση με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν.Στη συν?χεια, για κ?θε συνδυασμ? (κ?ντα, τ?σσερα ?μοια φ?λλα, full house, διαδοχικ? ζευγ?ρια, ζευγ?ρια) το ειδικ? β?ρο? εν?? εκ των συνδυασμ?ν ?λλαξε απ? 0.2 ?ω? και 1.6, εν? τα β?ρη των ?λλων συνδυασμ?ν ?μειναν σταθερ? στι? αρχικοποιημ?νε? τιμ?? του? ?πω? φα?νονται παρακ?τω.Συνδυασμ??Ειδικ?? Β?ρο? Συνδυασμο?Μον? φ?λλο0.5Ζευγ?ρι φ?λλων0.4Τριπλ?τα φ?λλων0.3Διαδοχικ? Ζευγ?ρια φ?λλων0.4Full House0.5Κ?ντα0.5Β?μβα Καρ?4Β?μβα Κ?ντα ?διου χρ?ματο?4Ρ?γα?0.7?σσο?0.8?πειτα καταγρ?φηκε το πλ?θο? των εμφαν?σεων του συνδυασμο? αυτο? στον καλ?τερο κ?μβο μ?σα σε 500 διαφορετικ? μοιρ?σματα φ?λλων (παρτ?δε?). Η συν?ρτηση αξιολ?γηση? των κ?μβων που χρησιμοποι?θηκε ?ταν η απλ?: Αξ?α Κ?μβου =i = 1# συνδυασμ?ν κεντρικ? αξ?α συνδυασμο?×# φ?λλων συνδυασμο? ×ειδικ? β?ρο? συνδυασμο?Για τον υπολογισμ? τη? κεντρικ?? αξ?α? συνδυασμο? χρησιμοποι?θηκε ο εξ?? π?νακα? τιμ?ν:Συνδυασμ??Κεντρικ? Αξ?α Συνδυασμο?Μον? φ?λλοΑξ?α μονο? φ?λλουΖευγ?ρι φ?λλωνΑξ?α εν?? φ?λλου του ζευγαριο?Τριπλ?τα φ?λλωνΑξ?α εν?? φ?λλου τη? τριπλ?τα?Διαδοχικ? Ζευγ?ρια φ?λλωνΑξ?α εν?? φ?λλου απ? το υψηλ?τερο ζευγ?ριFull HouseΑξ?α εν?? φ?λλου απ? την τριπλ?τα του Full HouseΚ?νταΑξ?α του υψηλ?τερου φ?λλου τη? κ?ντα?Β?μβα Καρ?Αξ?α εν?? φ?λλου απ? το καρ?Β?μβα Κ?ντα ?διου χρ?ματο?Αξ?α του υψηλ?τερου φ?λλου τη? κ?ντα? ?διου χρ?ματο?Ρ?γα?Αξ?α του Ρ?γα?σσο?Αξ?α του ?σσουΠαρατηρ?θηκε ?τι ?σο αυξ?νεται ο συντελεστ?? τ?σο η εμφ?νιση του συνδυασμο? στονκαλ?τερο κ?μβο πλησι?ζει την πιθαν?τητα εμφ?νιση? του συνδυασμο? στο χ?ρι τουπα?κτη. Μπορε? με αυτ?ν τον τρ?πο να επιλεχθε? το β?ρο? που χρει?ζεται ?να?συνδυασμ?? για να ε?ναι π?ντα η επιλογ? του πρ?κτορα, διαλ?γοντα? απλ? την τιμ? ειδικο? β?ρου? συνδυασμο? στην οπο?α η επιλογ? του συνδυασμο? στον καλ?τερο κ?μβο φτ?νει ? τε?νει να φτ?σει την πιθαν?τητα εμφ?νιση? του συνδυασμο? στο χ?ρι του πα?κτη.Να σημειωθε? ?τι στι? παραπ?νω μετρ?σει? υπ?ρχουν σφ?λματα λ?γω του μικρο? πλ?θου? των παρτ?δων που καταγρ?φηκαν. Συνεπ??, λ?γω τη? μικρ?? πιθαν?τητα? εμφ?νιση? του συνδυασμο? κ?ντα-χρ?μα τα αποτελ?σματα που θα εμφαν?ζονταν για 500 μοιρ?σματα φ?λλων θα ε?χαν μεγαλ?τερη απ?κλιση απ? την πραγματικ?τητα σε σχ?ση με του? ?λλου? συνδυασμο?? οι οπο?οι ?χουν μεγαλ?τερη πιθαν?τητα εμφ?νιση?. Για το λ?γο αυτ? δεν ?χουν γ?νει μετρ?σει? για την εμφ?νιση του συνδυασμο? αυτο?.Μετ? εξετ?στηκε η επιθετικ?τητα του πα?κτη. Το αποτ?λεσμα που προ?κυψε ε?ναι ?τι ?σο μικρ?τερο? ε?ναι ο συντελεστ?? ανεκτικ?τητα? του πρ?κτορα, τ?σο πιο επιθετικ?? γ?νεται ο πρ?κτορα? (δηλαδ? πα?ζει περισσ?τερε? φορ?? απ? ?τι π?ει π?σο).Τ?λο? μελετ?θηκε το ποσοστ? νικ?ν δ?ο ομ?δων οι οπο?ε? ?παιξαν ω? αντ?παλε? χρησιμοποι?ντα? του? τρ?που? αξιολ?γηση? που αναφ?ρθηκαν παραπ?νω. Το μ?γεθο? του δε?γματο? ?ταν 100 γ?ροι. Σε κ?θε ομ?δα οι δ?ο πα?κτε? χρησιμοποιο?ν τον ?διο τρ?πο αξιολ?γηση? των καρτ?ν του?. Τα ον?ματα των ομ?δων δ?θηκαν με β?ση τον τρ?πο αξιολ?γηση? που χρησιμοποιο?σαν εκε?νη τη στιγμ?. ?ρα ?χουμε την ομ?δα Simple η οπο?α χρησιμοποιε? την απλ? αξιολ?γηση κ?μβων, την ομ?δα Normalization by Cards η οπο?α χρησιμοποιε? την αξιολ?γηση με β?ση τον αριθμ? των καρτ?ν του κ?μβου, την Normalization by Combinations η οπο?α χρησιμοποιε? την αξιολ?γηση με β?ση τον αριθμ? των συνδυασμ?ν του κ?μβου και την Normalization by Possibilities η οπο?α αξιολογε? του? κ?μβου? με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν. Τα αποτελ?σματα κ?θε ομ?δα? παρουσι?ζονται στα παρακ?τω σχ?ματα. Απλ? αξιολ?γηση εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των καρτ?ν του κ?μβου4-1 Απλ? αξιολ?γηση εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των καρτ?ν του κ?μβου, CITATION Βλ?15 \p 73 \l 1033 (Βλ?χου-Κογχυλ?κη, 2012, p. 73)Απλ? αξιολ?γηση εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των συνδυασμ?ν του κ?μβου4-2 Απλ? αξιολ?γηση εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των συνδυασμ?ν του κ?μβου, CITATION Βλ?15 \p 74 \l 1033 (Βλ?χου-Κογχυλ?κη, 2012, p. 74)Απλ? αξιολ?γηση εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν4-3 Απλ? αξιολ?γηση εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν, CITATION Βλ?15 \p 74 \l 1033 (Βλ?χου-Κογχυλ?κη, 2012, p. 74)Απλ? αξιολ?γηση εναντ?ον καμ?α? Αξιολ?γηση? (τυχα?ου πρ?κτορα)4-4 Απλ? αξιολ?γηση εναντ?ον καμ?α? Αξιολ?γηση? (τυχα?ου πρ?κτορα), CITATION Βλ?15 \p 75 \l 1033 (Βλ?χου-Κογχυλ?κη, 2012, p. 75)Αξιολ?γηση με β?ση τον αριθμ? των καρτ?ν εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των συνδυασμ?ν του κ?μβου4-5 Αξιολ?γηση με β?ση τον αριθμ? των καρτ?ν εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των συνδυασμ?ν του κ?μβου, CITATION Βλ?15 \p 75 \l 1033 (Βλ?χου-Κογχυλ?κη, 2012, p. 75)Αξιολ?γηση με β?ση τον αριθμ? των καρτ?ν εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν4-6 Αξιολ?γηση με β?ση τον αριθμ? των καρτ?ν εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν, CITATION Βλ?15 \p 76 \l 1033 (Βλ?χου-Κογχυλ?κη, 2012, p. 76)Αξιολ?γηση με β?ση τον αριθμ? των καρτ?ν του κ?μβου εναντ?ον καμ?α? Αξιολ?γηση? (τυχα?ου πρ?κτορα)4-7 Αξιολ?γηση με β?ση τον αριθμ? των καρτ?ν του κ?μβου εναντ?ον καμ?α? Αξιολ?γηση? (τυχα?ου πρ?κτορα), CITATION Βλ?15 \p 76 \l 1033 (Βλ?χου-Κογχυλ?κη, 2012, p. 76)Αξιολ?γηση με β?ση τον αριθμ? των συνδυασμ?ν του κ?μβου εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν4-8 Αξιολ?γηση με β?ση τον αριθμ? των συνδυασμ?ν του κ?μβου εναντ?ον Αξιολ?γηση? με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν, CITATION Βλ?15 \p 77 \l 1033 (Βλ?χου-Κογχυλ?κη, 2012, p. 77)Αξιολ?γηση με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν εναντ?ον καμ?α? Αξιολ?γηση? (τυχα?ου πρ?κτορα)4-9 Αξιολ?γηση με β?ση τον αριθμ? των κρυφ?ν συνδυασμ?ν εναντ?ον καμ?α? Αξιολ?γηση? (τυχα?ου πρ?κτορα), CITATION Βλ?15 \p 78 \l 1033 (Βλ?χου-Κογχυλ?κη, 2012, p. 78)Συνολικ?? ν?κε? κ?θε συν?ρτηση? αξιολ?γηση?4-10 Συνολικ?? ν?κε? κ?θε συν?ρτηση? αξιολ?γηση? Ντετερμινιστικ?τητα στον αλγ?ριθμο αναζ?τηση? δ?ντρου Monte Carlo για το παιχν?δι καρτ?ν Mini Tichu Στο CITATION Koe17 \l 1032 (Castelein, 2017) εξετ?στηκε η χρ?ση διαφ?ρων πρακτ?ρων με β?ση τον αλγ?ριθμο Monte Carlo για το παιχν?δι Mini Tichu. Τα ε?δη των πρακτ?ρων που χρησιμοποι?θηκαν ?ταν ο τυχα?ο? πρ?κτορα?, ο πρ?κτορα? που χρησιμοποιε? τον αλγ?ριθμο Monte Carlo στη βασικ? του μορφ? και ο πρ?κτορα? που χρησιμοποιε? τον αλγ?ριθμο Monte Carlo με δ?νδρο αναζ?τηση? (Monte Carlo Tree Search – MCTS). Ο πρ?κτορα? ο οπο?ο? χρησιμοποιε? τον αλγ?ριθμο Monte Carlo στη βασικ? του μορφ?, χρησιμοποιε? τυχα?ε? προσομοι?σει? του παιχνιδιο? και συγκρ?νει τα αποτελ?σματα των προσομοι?σεων αυτ?ν για να βρει ?να καλ? αποτ?λεσμα. Αυτ? γ?νεται παρατηρ?ντα? το αποτ?λεσμα ?λων των τυχα?ων προσομοι?σεων του παιχνιδιο? ?ταν γ?νει μια κ?νηση. ?πειτα επιλ?γει την κ?νηση η οπο?α ?χει το μεγαλ?τερο ποσοστ? νικ?ν. Ε?ν υπ?ρχουν περισσ?τερε? απ? μια τ?τοιε? κιν?σει? τ?τε επιλ?γεται η πρ?τη κ?νηση που βρ?θηκε. Αυτ? η μ?θοδο? ε?ναι πολ? καλ? στο να βρ?σκει καλ?? κιν?σει? σε παιχν?δια, καθ?? οι υπολογιστ?? μπορο?ν ε?κολα να προσομοι?σουν εκατοντ?δε? παιχν?δια σε πολ? μικρ? χρονικ? δι?στημα. Στο Tichu οπο? το ποσοστ? νικ?ν δεν ε?ναι τ?σο σημαντικ?, το σκορ μπορε? επ?ση? να χρησιμοποιηθε? ω? παρ?μετρο?. Επιλ?χθηκε ?μω? το ποσοστ? των νικ?ν, γιατ? εμπειρικ? δ?νει τα καλ?τερα αποτελ?σματα.Ο πρ?κτορα? ο οπο?ο? χρησιμοποιε? τον αλγ?ριθμο MCTS, διαλ?γει “ενδιαφ?ρουσε?” κιν?σει? προ? αξιολ?γηση. Αυτ? επιτυγχ?νεται με τη δημιουργ?α εν?? δ?ντρου παιχνιδι?ν κατ? τη δι?ρκεια των προσομοι?σεων και επιλ?γοντα? του? κ?μβου? στου? οπο?ου? θα συνεχιστε? η προσομο?ωση. Xρησιμοποιο?νται τα β?ματα που φα?νονται παρακ?τω.4-11 Β?ματα διαδικασ?α? επιλογ?? MCTS, CITATION Koe17 \p 10 \l 1033 (Castelein, 2017, p. 10)Επιλογ? (Selection): Κατ? τη διαδικασ?α τη? επιλογ??, ο αλγ?ριθμο? ερευν? κ?θε πιθαν? παιδ? σ?μφωνα με ?να προκαθορισμ?νο πρωτ?κολλο και επιλ?γει ?να απ? αυτ?. Κανονικ?, αυτ? το πρωτ?κολλο εφαρμ?ζεται αναδρομικ?, ?ω? ?του καταλ?ξει σε ?να φ?λλο. Επειδ? ?μω? δεν υπ?ρχει τ?λεια γν?ση των καρτ?ν των ?λλων παικτ?ν, πρ?πει να σταματ?σει η αναζ?τηση ακ?μα και ?ταν ?να? κ?μβο? δεν ?χει επεκταθε? πλ?ρω?. Αυτ? γ?νεται, δι?τι δημιουργο?νται ν?ε? κ?ρτε? για του? υπ?λοιπου? πα?κτε? και αυτο? μπορε? να ?χουν ν?ε? επιλογ?? παιξ?ματο? διαθ?σιμε?. Απ? την ?λλη, μπορε? κ?ποιε? επιλογ?? παιξ?ματο? να μην ε?ναι διαθ?σιμε? και ?ρα εξετ?ζονται μ?νο οι κ?μβοι που ε?ναι διαθ?σιμοι αυτ?ν τη στιγμ? με τι? επιλεγμ?νε? κ?ρτε? για του? πα?κτε?.Επ?κταση (Expansion): Ο επιλεγμ?νο? κ?μβο? επεκτε?νεται πλ?ρω? με ?λε? τι? δυνατ?? επιλογ?? παιξ?ματο? αυτ? τη στιγμ?. Προσομο?ωση (Simulation): Ε?ν ?να? κ?μβο? δεν ε?ναι τερματικ??, τ?τε ξεκιν? μια προσομο?ωση ξεκιν?ντα? απ? τον συγκεκριμ?νο κ?μβο. Δι?δοση προ? τα π?σω (Back propagation): Χρησιμοποιε?ται το αποτ?λεσμα των προσομοι?σεων για να ανανεωθο?ν ?λε? οι τιμ?? των γονι?ν μ?χρι? ?του το δ?ντρο φτ?σει στην τωριν? κατ?σταση.Τα παραπ?νω β?ματα επαναλαμβ?νονται ?ω? ?του αποφασιστε? ο τερματισμ?? του αλγορ?θμου. Αυτ? γ?νεται, στην περ?πτωση τη? διατριβ?? αυτ??, μετ? απ? ?να συγκεκριμ?νο αριθμ? προσομοι?σεων. Ε?ναι πολ? σημαντικ? ?σον αφορ? το πρωτ?κολλο επιλογ?? να εξισορροπηθε? η ?ρευνα των ν?ων κ?μβων με το π?σο καλο? ε?ναι οι ?δη ερευνημ?νοι κ?μβοι. Εδ? χρησιμοποιε?ται η συνθ?κη η οπο?α προτ?θηκε στο CITATION Hye15 \l 1032 (Hyeong Soo Chang, 2015): wn+c*ln tn, ?που wiε?ναι η συνολικ? ποσ?τητα των φορ?ν που ο i-οστ?? κ?μβο? παιδ? οδ?γησε σε ν?κη, niε?ναι η συνολικ? ποσ?τητα των προσομοι?σεων που ?χουν γ?νει για τον i-οστ? κ?μβο παιδ?, c ε?ναι η παρ?μετρο? εξερε?νηση? και ε?ναι ?ση με 2 για ?λε? τι? δοκιμ?? και t ε?ναι ο συνολικ?? αριθμ?? των προσομοι?σεων που ?χουν γ?νει για τον κ?μβο πατ?ρα. Ο πρ?το? ?ρο? τη? συνθ?κη? εστι?ζει στο ?τι ?να? κ?μβο? ο οπο?ο? ?χει κερδ?σει συχν? ε?ναι πιο πιθαν? να επιλεχθε?. Ο δε?τερο? ?ρο? εστι?ζει στο ?τι ε?ν ?να? κ?μβο? παιδ? ?χει παιχτε? λιγ?τερε? φορ?? σε σχ?ση με ?λλου? κ?μβου? παιδι?, ε?ναι πιο πιθαν? να επιλεχθε?. O ντετερμινισμ?? ε?ναι ο τρ?πο? με τον οπο?ο καθορ?ζονται οι ?γνωστε? παρ?μετροι στην τωριν? κατ?σταση παιχνιδιο?. Για το Tichu, αυτ? σημα?νει τον καθορισμ? των καρτ?ν των ?λλων παικτ?ν. ?να? πρ?κτορα? ε?τε θα χρησιμοποιε? ντετερμινισμ?, δηλαδ? μ?α απ? τι? μεθ?δου? που θα περιγρ?φουν παρακ?τω, ? απλ? θα καθορ?ζει τι? ?γνωστε? κ?ρτε? των υπολο?πων παικτ?ν τυχα?α (τυχα?ο? ντετερμινισμ??). Για να βελτιωθε? ο τυχα?ο? ντετερμινισμ?? ?γινε σ?γκριση προηγο?μενων παιχνιδι?ν που ?χουν παιχτε? απ? αυτο?? του πρ?κτορε? με το τωριν? παιχν?δι. Αυτ? γ?νεται συγκρ?νοντα? τη κ?νηση για την οπο?α θα γ?νει η προσομο?ωση με προηγο?μενα παιχν?δια στα οπο?α πα?χτηκε μια παρ?μοια κ?νηση. Αυτ? η πληροφορ?α στη συν?χεια χρησιμοποιε?ται για να χωρ?σει τι? ?γνωστε? κ?ρτε? με ημιτυχα?ο τρ?πο αν?μεσα στου? υπ?λοιπου? πα?κτε?.Για το λ?γο αυτ? αποθηκε?ονται οι πληροφορ?ε? που θα χρησιμοποιηθο?ν στα επ?μενα παιχν?δια. Οι πληροφορ?ε? αυτ?? ε?ναι οι εξ??: α) ο συνδυασμ?? των καρτ?ν, β) η σειρ? τη? κ?νηση? για τι? πρ?τε? 90 σειρ?? (κ?θε γ?ρο? ?χει περ?που 70 σειρ?? κ?νηση? και μετ? απ? 90 σειρ?? οι κ?ρτε? που ?χουν με?νει ε?ναι πολ? λ?γε? και ?ρα λ?γε? ε?ναι και οι αξι?λογε? πληροφορ?ε? που πα?ρνουμε απ? αυτ? το στοιχε?ο), γ) ποιο? πα?κτη? ?κανε αυτ? την κ?νηση και δ) αν ε?χε ? ?χι ο πρ?κτορα? τι? κ?ρτε? που ντετερμινιστικ? επιλ?χθηκαν ω? οι ?γνωστε? κ?ρτε? του. Συνολικ? ?χουμε 7 συνδυασμο?? x 90 σειρ?? κ?νηση? x 4 πα?κτε? x 2 πιθαν?? καταστ?σει? (αν ε?χε ? ?χι τι? κ?ρτε? αυτ?? ο πρ?κτορα?) δηλαδ? 5040 π?ντου? δεδομ?νων. Οι π?ντοι αυτο? χρησιμοποι?θηκαν για την εξαγωγ? εν?? ποσοστο? πιθαν?τητα? ?να? πρ?κτορα? να ?χει ?ναν συνδυασμ?.Για τι? προσομοι?σει? οι ?ποιε? ?γιναν, κρατ?θηκε σαν ?ριο η εξ?ταση 20 δυνατ?ν κιν?σεων για ?ναν πρ?κτορα αν? κατ?σταση παιχνιδιο?. Κ?θε πα?κτη? θα μπορο?σε να ?χει διαφορετικ? πρ?κτορα, αλλ? χρησιμοποι?θηκε ο ?διο? πρ?κτορα? και για του? δ?ο πα?κτε? τη? ?δια? ομ?δα?. Καθ?? το Tichu ?χει πολλο?? γ?ρου?, παρατηρ?θηκαν μ?νο γ?ροι και το ε?ν η ομ?δα κ?ρδισε τον εκ?στοτε συγκεκριμ?νο. Για ?λα τα παρακ?τω αποτελ?σματα χρησιμοποι?θηκε ο μ?σο? ?ρο? 1000 γ?ρων. Συγκρ?θηκε το πλ?θο? των νικ?ν σαν ποσοστ? για κ?θε μια απ? τι? δ?ο ομ?δε?. Η φ?ρμουλα που χρησιμοποι?θηκε ε?ναι η εξ??: 100 ×winstotal games - ties . Αποφασ?στηκε να αφαιρεθο?ν οι ισοπαλ?ε? γιατ? ε?ναι ?να πολ? μικρ? ποσοστ? των αποτελεσμ?των, γ?ρω στο 3%.Στον παρακ?τω π?νακα παρουσι?ζονται τα αποτελ?σματα των ομ?δων που χρησιμοποιο?ν ?να ε?δο? πρακτ?ρων ?ταν πα?ζουν εν?ντια σε ομ?δε? που χρησιμοποιο?ν ?λλο ε?δο? πρακτ?ρων. Τα ποσοστ? π?νω στη διαγ?νιο του διαγρ?μματο? πρ?πει να συγκλ?νουν ακριβ?? στο 50% για περισσ?τερε? προσομοι?σει?, μια? και οι δ?ο ομ?δε? χρησιμοποιο?ν του? ?διου? πρ?κτορε? και οι κ?ρτε? που μοιρ?ζονται σε κ?θε ομ?δα αλλ?ζουν αν? κ?θε γ?ρο και ?ρα καμ?α ομ?δα δεν ?χει κ?ποιο πλεον?κτημα. 4-12 Ποσοστ? ν?κη? χωρ?? ντετερμινισμ?, CITATION Koe17 \p 14 \l 1033 (Castelein, 2017, p. 14)Για τα παραπ?νω αποτελ?σματα χρησιμοποι?θηκαν προσομοι?σει? 20 πιθαν?ν επ?μενων κιν?σεων αν? κατ?σταση παιχνιδιο?. Στο παρακ?τω δι?γραμμα φα?νεται το πω? η αλλαγ? του αριθμο? των πιθαν?ν κιν?σεων που εξετ?ζει ο αλγ?ριθμο? MC (Monte Carlo) και MCTS (Monte Carlo Tree Search) επηρε?ζει το ποσοστ? ν?κη? εν?ντια στου? πρ?κτορε? που πα?ζουν τυχα?α. Παρατηρε?ται επ?ση? ?να? κορεσμ?? μετ? απ? ?ναν αριθμ? πιθαν?ν κιν?σεων (πολ? μικρ? βελτ?ωση).4-13 MCTS και MC πρ?κτορε? εναντ?ον τυχα?ων πρακτ?ρων με διαφορετικ? αριθμ? πιθαν?ν κιν?σεων χωρ?? ντετερμινισμ?, CITATION Koe17 \p 15 \l 1033 (Castelein, 2017, p. 15)Στη συν?χεια εξετ?στηκε το ποσοστ? των σωστ? επιλεγμ?νων συνδυασμ?ν για τι? ?γνωστε? κ?ρτε? των υπολο?πων παικτ?ν. Π?νω απ? ?να δισεκατομμ?ριο επιλογ?? εξετ?στηκαν και τα αποτελ?σματα (των ντετερμινιστικ?ν και των μη-ντετερμινιστικ?ν MC και MCTS αλγορ?θμων αντ?στοιχα) εμφαν?ζονται στον παρακ?τω π?νακα:4-14 Ποσοστ? των σωστ? επιλεγμ?νων συνδυασμ?ν για τι? ?γνωστε? κ?ρτε? των υπολο?πων παικτ?ν με και χωρ?? ντετερμινισμ? για MC και MCTS πρ?κτορε?, CITATION Koe17 \p 17 \l 1033 (Castelein, 2017, p. 17)Για τον αλγ?ριθμο Monte Carlo φ?νηκε ?τι η χρ?ση τη? τεχνικ?? ντετερμινισμο? που περιγρ?φηκε παραπ?νω ε?ναι χειρ?τερη απ? την τυχα?α μ?θοδο. Για τον αλγ?ριθμο Monte Carlo με χρ?ση δ?ντρου αναζ?τηση? παρουσι?στηκε κ?ποια βελτ?ωση αν και μικρ?. Για να επιβεβαιωθε? ?τι η βελτ?ωση δεν ε?ναι τυχα?α και με την υπ?θεση ?τι αν δεν υπ?ρχε βελτ?ωση το ποσοστ? ν?κη? του μη-ντετερμινιστικο? αλγορ?θμου MCTS εναντ?ον του ντετερμινιστικο? αλγορ?θμου MCTS θα ?ταν 50%, τ?θηκαν ω? αντ?παλε? δ?ο ομ?δε? χρησιμοποι?ντα? τον μη-ντετερμινιστικ? αλγ?ριθμο MCTS και τον ντετερμινιστικ? αλγ?ριθμο MCTS ?πω? προ?κυψε μετ? απ? 100000 παιχν?δια προπ?νηση?. Ο ντετερμινιστικ?? αλγ?ριθμο? κ?ρδισε 24336 φορ?? και ?χασε 24212 φορ??. Η πιθαν?τητα να γ?νει αυτ? εν? το ποσοστ? ν?κη? ε?ναι 50% δ?νεται απ? τον τ?πο ?που n ε?ναι ο αριθμ?? των παιχνιδι?ν που πα?χτηκαν χωρ?? τι? ?ποιε? ισοπαλ?ε? και kο αριθμ?? των νικ?ν του ντετερμινιστικο? αλγορ?θμου MCTS. Ε?ν το ποσοστ? ν?κη? ε?ναι 50% τ?τε το να νικ?σει 24336 φορ?? και να χ?σει 24212 φορ?? ?χει πιθαν?τητα 28.8%. ?ρα μπορο?με να υποθ?σουμε ?τι πιθαν?? ο ντετερμινισμ?? με τι? παραμ?τρου? που παρουσι?στηκαν παραπ?νω ?χει κ?ποιο θετικ? αποτ?λεσμα, ?λλα αυτ? ε?ναι πολ? μικρ?. ?ρα ο ντετερμινισμ?? στη μορφ? που περιγρ?φηκε παραπ?νω δεν βελτι?νει αισθητ? καν?ναν απ? του? παραπ?νω πρ?κτορε? για το παιχν?δι Mini-Tichu.Στη διατριβ? αυτ? ?γινε και μια προσπ?θεια για την υλοπο?ηση του αλγορ?θμου Monte Carlo (αλλ? ?χι και του Monte Carlo με δ?ντρο αναζ?τηση?) και για το ολοκληρωμ?νο παιχν?δι του Tichu. Τα αποτελ?σματα ?ταν ενθαρρυντικ? ?ταν μια ομ?δα χρησιμοποιο?σε πρ?κτορε? με αλγ?ριθμο Monte Carlo εναντ?ον τυχα?ων πρακτ?ρων ( ποσοστ? νικ?ν 86% για την ομ?δα που χρησιμοποιο?σε αλγ?ριθμο MC). Η χρ?ση του μοντ?λου ντετερμινισμο? που περιγρ?φηκε παραπ?νω δε πρ?σφερε κ?ποια βελτ?ωση, ?πω? και για το Mini-Tichu. Συνδυασμ?? Διαβο?λευση? και Στρατηγικ?ν Αντ?δραση? για ευφυε?? πρ?κτορε? στο παιχν?δι Mini-Tichu Οι Μ?ρθα Βλ?χου-Κογχυλ?κη και Στα?ρο? Β?σσο? μελ?τησαν στο CITATION Mar13 \l 1032 (Martha Vlachou-Konchylaki, 2013) του? συνδυασμο?? διαβο?λευση? και στρατηγικ?ν αντ?δραση? για ευφυε?? πρ?κτορε? για το παιχν?δι Mini-Tichu.Το παιχν?δι Mini-Tichu ε?ναι ?να παιχν?δι μερικ?? παρατηρ?σιμο αφο? κ?θε πα?κτη? ξεκιν? γνωρ?ζοντα? μ?νο τι? δικ?? του κ?ρτε? (το ? ολ?κληρη? τη? τρ?πουλα?). Κ?θε γ?ρο? ε?ναι απολ?τω? παρατηρ?σιμο?, αφο? κ?θε κ?νηση αποκαλ?πτει κρυμμ?νε? κ?ρτε? οι οπο?ε? αφαιρο?νται απ? το παιχν?δι. Επ?ση?, το παιχν?δι ε?ναι πολ? δυναμικ? μια? και υπ?ρχει ισχυρ? αλληλεπ?δραση μεταξ? των παικτ?ν μια? και πα?ζουν σε ομ?δα με ?ναν ?λλον πα?κτη και πρ?πει συν?χεια να αξιολογο?ν τη θ?ση ?λων των παικτ?ν και να αλλ?ζουν τρ?πο παιχνιδιο? απ? αμυντικ? σε επιθετικ? και αντιστρ?φω?. Λ?γω του υψηλο? βαθμο? τη? ?γνωστη? πληροφορ?α? στην αρχ? του παιχνιδιο? και τον αριθμ? των παικτ?ν, ο χ?ρο? των καταστ?σεων που περιγρ?φει τι? πιθαν?? εξελ?ξει? του παιχνιδιο? ε?ναι αχαν??. Αυτ? ουσιαστικ? κ?νει απαγορευτικ? τη χρ?ση τεχνικ?ν αναζ?τηση? ?πω? δ?νδρα-ΑΒ ? του αλγορ?θμου Minimax μ?χρι τα τελευτα?α στ?δια του παιχνιδιο?, ?που πολλ?? κ?ρτε? ?χουν αφαιρεθε?. Απ? την ?λλη, οι στρατηγικ?? αντ?δραση? οι οπο?ε? βασ?ζονται στην τωριν? κατ?σταση του παιχνιδιο? και στι? τελευτα?ε? κιν?σει? που ?χουν γ?νει προσφ?ρουν μια διαφορετικ? προσ?γγιση για τη λ?ψη αποφ?σεων και ?χουν φανε? χρ?σιμε? σε ?λλα ε?δη παιχνιδι?ν με χαρακτ?ρε? που δεν χειρ?ζονται οι πα?κτε? (NPC - non-player characters). Συγκεκριμ?να, οι μηχαν?? πεπερασμ?νων καταστ?σεων (Finite State Machines ? FSMs) δ?νουν ?ναν απλ? τρ?πο προσδιορισμο? μια? συμπεριφορ?? αντιδρ?σεων. ?να FSM ορ?ζεται απ? ?ναν πεπερασμ?νο αριθμ? καταστ?σεων, κ?θε μια απ? τι? οπο?ε? εκφρ?ζει ?ναν συγκεκριμ?νο τ?πο προκαθορισμ?νων συμπεριφορ?ν. Αλλαγ?? μεταξ? καταστ?σεων συμβα?νουν μ?σα απ? συνθ?κε?, ?ταν αυτ?? εκπληρο?νται, που προκ?πτουν απ? διακριτ?? εν?ργειε? ? περιστατικ? κατ? τη δι?ρκεια του παιχνιδιο?.Τα κομμ?τια τη? προσ?γγιση? αυτ?? ε?ναι τα εξ??: α) ο προσδιορισμ?? ?λων των δυνατ?ν συνδυασμ?ν καρτ?ν για ?να δοσμ?νο χ?ρι, ?που μια δενδρικ? δι?ταξη δημιουργε?ται ?ταν το χ?ρι χωρ?ζεται σε δι?φορου? συνδυασμο?? καταλ?γοντα? στου? τερματικο?? κ?μβου? που περι?χουν ?λου? του? δυνατο?? συνδυασμο?? (για παρ?δειγμα, ?να χ?ρι 5 φ?λλων 5 5 5 3 3 θα δημιουργ?σει τρει? τερματικο?? κ?μβου?, ?ναν με 5 5 3 3 ζευγ?ρια και 5 μ?νο φ?λλο, ?ναν με 3 3 ζευγ?ρι και 5 5 5 τριπλ?τα και ?να Full House 5 5 5 3 3), β) υπολογισμ?? τη? δυναμικ?τητα? εν?? συγκεκριμ?νου συνδυασμο? με β?ση τι? κ?ρτε? που ?χουν παιχτε? ?δη, γ) εξ?ταση του ε?ν ?να? συνδυασμ?? μπορε? να “κερδ?σει” (για παρ?δειγμα αν ?χουν παιχτε? ?δη τρει? ?σσοι, τ?τε ?να ζευγ?ρι Ρηγ?δων μπορε? να “κερδ?σει” με απ?λυτη βεβαι?τητα στο παιχν?δι Mini-Tichu), δ) βαθμολ?γηση των διαφ?ρων τερματικ?ν κ?μβων που προκ?πτουν απ? την αν?λυση του χεριο?, χρησιμοποι?ντα? σαν παραμ?τρου? τη δυναμικ?τητα των συνδυασμ?ν, τον αριθμ? των καρτ?ν κ?θε συνδυασμο? και ?ναν εμπειρικ? πολλαπλασιαστ? για κ?θε τ?πο συνδυασμο? και ε) χρησιμοποι?ντα? διαφορετικ?? τεχνικ?? παιχνιδιο? αν?λογα με τι? τελευτα?ε? κιν?σει? των υπολο?πων παικτ?ν. Χρησιμοποιε?ται διαφορετικ? μηχαν? πεπερασμ?νων καταστ?σεων αν?λογα με τι? δι?φορε? φ?σει? του παιχνιδιο? (για παρ?δειγμα, ?ταν απομ?νουν τρει? πα?κτε? με κ?ρτε? στο χ?ρι του?). Οι καταστ?σει? οι οπο?ε? αντιστοιχο?ν στον πρ?κτορα τεχνητ?? νοημοσ?νη? καθορ?ζουν πληροφορ?ε? σχετικ? με τη στρατηγικ? του χρησιμοποι?ντα? ?λα τα υπ?λοιπα που αναφ?ρθηκαν παραπ?νω. Οι υπ?λοιπε? καταστ?σει? κ?θε διαγρ?μματο? χρησιμοποιο?νται σαν καταχωρητ?? μν?μη? για τι? εν?ργειε? των υπολο?πων παικτ?ν. Παρακ?τω φα?νεται ?να δι?γραμμα του FSM που χρησιμοποιε?ται ?ταν πα?ζουν και οι τ?σσερι? πα?κτε?. Κ?θε μετ?βαση δε?χνει την εν?ργεια κ?ποιου πα?κτη. Οι καταστ?σει? Πα?ξε (Play) και Π?γαινε π?σο (Pass) δε?χνουν συγκεκριμ?νου? τρ?που? παιξ?ματο? που πρ?πει να εκτελεστο?ν απ? τον πρ?κτορα τεχνητ?? νοημοσ?νη?. Τ, Ο1, Ο2 αντιστοιχο?ν στο συμπα?κτη, τον πρ?το και τον δε?τερο αντ?παλο του πρ?κτορα αντ?στοιχα. Οι μεταβ?σει? Pl και Pas αντιπροσωπε?ουν κιν?σει? παιξ?ματο? και κιν?σει? ?που ο πα?κτη? π?γε π?σο αντ?στοιχα. 4-15 FSM για το παιχν?δι Mini Tichu ?ταν και ?λοι οι πα?κτε? ε?ναι ενεργο? σε ?ναν γ?ρο, CITATION Mar13 \p 2 \l 1033 (Martha Vlachou-Konchylaki, 2013, p. 2)Με το π?ρα? κ?θε γ?ρου ?να ν?ο δ?νδρο αναζ?τηση? κατασκευ?ζεται και ο καλ?τερο? κ?μβο? επανεκλ?γεται. Κατ? τη δι?ρκεια του παιχνιδιο? και αν?λογα με τη θ?ση που βρ?σκεται ο πρ?κτορα? θα μπορε? να πα?ξει αμυντικ? (δηλαδ? να πα?ξει ?ναν συνδυασμ? μ?νο αν κρατ?ει σταθερ? τη μ?ση αξ?α του χεριο? του), να π?ει π?σο ? να πα?ξει επιθετικ? (δηλαδ? να πα?ξει με κ?ριο σκοπ? να κερδ?σει το συγκεκριμ?νο γ?ρο συνδυασμο?). Αυτ? η προσ?γγιση συμβ?λλει στη δημιουργ?α εν?? πολυδι?στατου και ικανο? ευφυ? πρ?κτορα που μπορε? και λαμβ?νει υπ?ψη πολλ? απ? τα χαρακτηριστικ? του παιχνιδιο?. Χρ?ση ευφυ?ν τεχνικ?ν σε δι?φορα κομμ?τια του παιχνιδιο? TichuBayes-ιαν? μοντ?λο Tichu για σ?γκριση δυναμικ?τητα? χερι?νΟ Paul Reid στο CITATION Pau15 \l 1032 (Reid, 2015) χρησιμοπο?ησε ?να Bayes-ιαν? στατιστικ? μοντ?λο για να συγκρ?νει τη δυναμικ?τητα, δηλαδ? την πιθαν?τητα του να ξεφορτωθε? ?να? πα?κτη? ?λε? τι? κ?ρτε? απ? το χ?ρι του πρ?το? σε ?ναν γ?ρο, διαφορετικ?ν συνδυασμ?ν καρτ?ν Tichu. Η Bayes-ιαν? φ?ση του μοντ?λου επιτρ?πει τη σ?γκριση τη? πιθαν?τητα? και τη? συνδεδεμ?νη? αβεβαι?τητα?. Χρησιμοποι?θηκαν 175000 χ?ρια Tichu ?που κ?θε χ?ρι ε?ναι οι 14 κ?ρτε? που μοιρ?ζονται σε ?ναν πα?κτη πριν ξεκιν?σει ?να? γ?ρο?. Τα χ?ρια αυτ? ε?ναι παρτ?δε? παιγμ?να στο BrettSpielWelt και βρ?θηκαν στο CITATION Tic19 \l 1032 (Tichumania).Η διαθ?σιμη πληροφορ?α ε?ναι οι κ?ρτε? σε κ?θε χ?ρι και ε?ν ο πα?κτη? που ε?χε αυτ? το χ?ρι ξεφορτ?θηκε ?λε? τι? κ?ρτε? του πρ?το? ? ?χι. Η Bayes-ιαν? αν?λυση ε?ναι ?να καλ? εργαλε?ο για την εκτ?μηση των πιθανοτ?των με αυτ? το σ?νολο δεδομ?νων, επειδ? υπ?ρχουν πολλο? τ?ποι χερι?ν και τα δεδομ?να ε?ναι σχετικ? αραι? και ?ρα η χρ?ση αυτο? του δε?γματο? ω? εκτιμητ? θα οδηγ?σει σε ακρα?α υψηλ?? και χαμηλ?? πιθαν?τητε? για του? τ?που? χερι?ν με λ?γε? παρατηρ?σει?. Το μοντ?λο χρησιμοποιε? ?ναν αλγ?ριθμο Monte Carlo με Μαρκοβιαν? Αλυσ?δα για να εκτιμηθε? η σχετικ? δ?ναμη χερι?ν που περι?χουν κ?θε ειδικ? κ?ρτα (Mahjong, Σκυλι?, Φο?νικα? και Δρ?κο?). Το να ξεφορτωθε? ο πα?κτη? πρ?το? ?λε? τι? κ?ρτε? του μοντελοποιε?ται σαν μια τυχα?α μεταβλητ? Bernoulli, F, με παρ?μετρο p. Στη συν?χεια αρχικοποιε?ται η παρ?μετρο? p για κ?θε ?να απ? τα 4 φ?λλα αυτ? με τον ?διο τρ?πο (ομοι?μορφη κατανομ?). Με εφαρμογ? στο σ?νολο των δεδομ?νων εξ?γονται οι εξωτερικ?? κατανομ?? και το μ?σο τη? παραμ?τρου p για κ?θε μ?α απ? τι? κ?ρτε? ?πω? φα?νεται παρακ?τω:4-16 Εξωτερικ?? κατανομ?? και το μ?σο τη? παραμ?τρου p , CITATION Pau15 \l 1032 (Reid, 2015) Παρατηρο?με ?τι οι εξωτερικ?? κατανομ?? ?χουν μικρ? ε?ρο? γ?ρω απ? το μ?σο, λ?γω των πολλ?ν παρατηρ?σεων που ?χουμε για κ?θε τ?πο χεριο?. Μια? και οι κατανομ?? δεν ?χουν κοιν? σημε?α, ε?ναι ξεκ?θαρο ?τι τα χ?ρια που περι?χουν την κ?ρτα Φο?νικα? ?χουν μεγαλ?τερη εκτιμ?μενη πιθαν?τητα να τα ξεφορτωθε? πρ?το? ο πα?κτη? απ? ?τι αυτ? που περι?χουν την κ?ρτα Δρ?κο?, ακ?μα και αν η διαφορ? ε?ναι μικρ?. Το μοντ?λο μπορε? να χρησιμοποιηθε? για να συγκρ?νει οποιοδ?ποτε αριθμ? διαφορετικ?ν χερι?ν και επειδ? ε?ναι Bayes-ιαν? μοντ?λο οι εκτιμ?σει? γ?νονται πιο αβ?βαιε? για μικρ?τερο αριθμ? παρατηρ?σεων. Για παρ?δειγμα δ?ο πολ? σπ?νια χ?ρια (Mahjong-2-3-4-5-6-7-8-9-10-J-Q-K-A και 2-2-2-3-3-3-4-4-4-5-5-5-7-7) εκ των οπο?ων το πρ?το αποτελε? μια κ?ντα 14 φ?λλων και ε?ναι σ?γουρο ?τι ο πα?κτη? που ?χει αυτ? το χ?ρι θα ξεφορτωθε? πρ?το? τα φ?λλα του, εν? στο δε?τερο ε?ναι αρκετ? δ?σκολο να συμβε? το ?διο. Αλλ? λ?γω του τερ?στιου πλ?θου? πιθαν?ν συνδυασμ?ν και τη? σπανι?τητα? των συγκεκριμ?νων χερι?ν δεν υπ?ρχουν αρκετ?? παρατηρ?σει? ?διε? με αυτ? τα δ?ο χ?ρια στο σ?νολο δεδομ?νων που χρησιμοποι?θηκε. ?τσι, εν? για το δυνατ? χ?ρι (που ?χει και μεγαλ?τερο αριθμ? δειγμ?των) η εξωτερικ? κατανομ? ε?ναι προ? τη σωστ? κατε?θυνση και το μ?σο ε?ναι κοντ?, η κατανομ? του κακο? χεριο? δεν ε?ναι κατανεμημ?νη σωστ? ?πω? φα?νεται παρακ?τω:4-17 Εξωτερικ?? κατανομ?? και το μ?σο τη? παραμ?τρου p για ?να καλ? και ?να κακ? χ?ρι, CITATION Pau15 \l 1032 (Reid, 2015)Απ?φαση για Δ?λωση Tichu με χρ?ση PerceptronΣτο CITATION Agu \l 1033 (Torres, 2016) μελετ?θηκε η διαδικασ?α τη? απ?φαση? για δ?λωση ? μη Tichu απ? ?ναν πα?κτη Tichu με τη χρ?ση Perceptron. Για την εκπα?δευση του Perceptron χρησιμοποι?θηκαν ?λε? οι παρτ?δε? των 45 καλ?τερων παικτ?ν του BrettSpielWelt. Στη συν?χεια δοκιμ?στηκαν πολλ? ε?δη διαφορετικ?ν χαρακτηριστικ?ν ?πω? ο αριθμ?? των καρτ?ν, ο αριθμ?? κ?θε υψηλ?? κ?ρτα?, ο συνολικ?? αριθμ?? των υψηλ?ν καρτ?ν, ο αριθμ?? των συνδυασμ?ν χαμηλ??, μεσα?α? και υψηλ?? δυναμικ?τητα?, ο αριθμ?? των ?σσων. Με τη χρ?ση των παραπ?νω ο αλγ?ριθμο? Perceptron ε?χε αποτελ?σματα με 71.64% ακρ?βεια και 55% F1-score, εν? το Perceptron που χρησιμοποιε? το μ?σο ?ρο των αποτελεσμ?των των χαρακτηριστικ?ν (averaged Perceptron) επ?στρεψε αποτελ?σματα με 87.62% ακρ?βεια και 65% F1-score. Στη συν?χεια χρησιμοποι?θηκαν χαρακτηριστικ? του τ?που υπ?ρχει ? δεν υπ?ρχει ?να? συνδυασμ?? στο χ?ρι που εξετ?ζεται. Τα χαρακτηριστικ? αυτ? ε?ναι τα εξ??: υπ?ρχει ζευγ?ρι, υπ?ρχει τριπλ?τα, υπ?ρχουν συνεχ?μενα ζευγ?ρια, υπ?ρχει Full House, υπ?ρχει Κ?ντα, υπ?ρχει Φο?νικα? και Δρ?κο?. Με τη χρ?ση μ?νο αυτ?ν των χαρακτηριστικ?ν ο αλγ?ριθμο? Perceptron επ?στρεψε αποτελ?σματα με 70.44% ακρ?βεια και 55% F1-score, εν? το Perceptron που χρησιμοποιε? το μ?σο ?ρο των αποτελεσμ?των των χαρακτηριστικ?ν (averaged Perceptron) επ?στρεψε αποτελ?σματα με 87.58% ακρ?βεια και 65% F1-score.?λλα χαρακτηριστικ? τα οπο?α προστ?θηκαν στη συν?χεια ε?ναι ο μ?σο? ?ρο? δυναμικ?τητα? του χεριο?, που προκ?πτει απ? το ?θροισμα τη? δυναμικ?τητα? ?λων των φ?λλων του χεριο? διαιρεμ?νο απ? τον αριθμ? των φ?λλων του χεριο?, και το μ?σο ?ρο των συνδυασμ?ν χαμηλ??, μεσα?α? και υψηλ?? δυναμικ?τητα? δια 18. Τα δ?ο αυτ? χαρακτηριστικ? δεν προκ?λεσαν κ?ποια βελτ?ωση στο αποτ?λεσμα. ?λλο ?να χαρακτηριστικ? που επιλ?χθηκε ε?ναι η διαφορ? του αριθμο? των ?σσων απ? το ?θροισμα των καρτ?ν που ε?ναι μικρ?τερε? του 4 σε δυναμικ?τητα. Απ? ?λα τα παραπ?νω χαρακτηριστικ? το χαρακτηριστικ? το οπο?ο ε?χε τα καλ?τερα αποτελ?σματα απ? ?λα ?ταν ο αριθμ?? των καρτ?ν. Αυτ? το χαρακτηριστικ? κρατ?ει σαν πληροφορ?α το π?σε? απ? κ?θε μ?α απ? τι? κ?ρτε? ?χει το χ?ρι που εξετ?ζουμε αυτ? τη στιγμ? και ?ρα δ?νει πολ? σημαντικ? διαχωριστικ? πληροφορ?α στο Perceptron.Αν χρησιμοποιηθε? μ?νο του ?χει ω? αποτ?λεσμα 80.44% ακρ?βεια και 62% F1-score με τον αλγ?ριθμο Perceptron, εν? το Perceptron που χρησιμοποιε? το μ?σο ?ρο των αποτελεσμ?των των χαρακτηριστικ?ν (averaged Perceptron) επ?στρεψε αποτελ?σματα με 87.26% ακρ?βεια και 64% F1-score.Στη συν?χεια ?γινε προσπ?θεια με επιλογ?? διαφ?ρων υποσυν?λων των διαθ?σιμων χαρακτηριστικ?ν να επιτευχθε? καλ?τερο αποτ?λεσμα. Το καλ?τερο αποτ?λεσμα που προ?κυψε ?ταν 88.68% ακρ?βεια και 68% F1-score.Σαν μελλοντικ? βελτ?ωση προτε?νεται η χρ?ση εν?? Perceptron ψηφοφορ?α?, ?που στη σταθμισμ?νη αυτ? ψηφοφορ?α θα συμμετ?χουν με διαφορετικ? β?ρο? ?λα τα Perceptrons. Το β?ρο? θα προκ?πτει αν?λογα με το π?σε? συνεχ?μενε? φορ?? ?να Perceptron ?χει δ?σει το σωστ? αποτ?λεσμα στι? προηγο?μενε? ψηφοφορ?ε?. Στρατηγικ? για Δηλ?σει? Tichu/Grand Tichu στο παιχν?δι καρτ?ν TichuΣτο CITATION Eri18 \l 1032 (Yang, 2018) γ?νεται προσπ?θεια να προβλεφτε? το αποτ?λεσμα του παιχνιδιο? με β?ση τι? αρχικ?? κ?ρτε? που μοιρ?ζονται. Συγκεκριμ?να, ο Yang προσπαθε? να βρει την πιθαν?τητα να δηλωθε? επιτυχ?? Tichu ? Grand Tichu με χρ?ση εν?? εκπαιδευμ?νου μοντ?λου για την πρ?βλεψη τη? πιθαν?τητα? του να πετ?χει κ?ποιο? πα?κτη? που ?χει δηλ?σει Tichu ? Grand Tichu να πα?ξει πρ?το? ?λε? τι? κ?ρτε? του. Με πρ?σβαση σε 84127 γ?ρου? πραγματικ?ν παιχνιδι?ν απ? τον online Tichu server CITATION Onl \l 1033 (Online Tichu) στου? οπο?ου? δηλ?θηκαν 20484 Grand Tichus και 38057 Tichus, γ?νεται προσπ?θεια να γ?νει ομαδοπο?ηση κ?θε χεριο? με χρ?ση αλγορ?θμων ομαδοπο?ηση? ?πω? του απλο? αλγορ?θμου Bayes (Naive Bayes), του αλγορ?θμου Logistic Regression, του αλγορ?θμου τυχα?ου δ?σου? και τη? τεχνικ?? τη? εν?σχυση?. Ο απλ?? αλγ?ριθμο? Bayes υποθ?τει ?τι ?λα τα χαρακτηριστικ? ε?ναι ανεξ?ρτητα του αποτελ?σματο? (ε?ν η δ?λωση ?ταν επιτυχ?? ? ?χι).Ο αλγ?ριθμο? Logistic Regression χρησιμοποιε? μια σιγμοειδ? συν?ρτηση για να καθορ?σει τη πιθαν?τητα κ?θε αποτελ?σματο? δοθ?ντο? εν?? σταθμισμ?νου β?ρου? ?λων των χαρακτηριστικ?ν. Ο αλγ?ριθμο? τυχα?ων δασ?ν (random forests algorithm) συνδυ?ζει πολλαπλ? δ?ντρα αποφ?σεων για να καταλ?ξει σε ?ναν εκτιμητ?. Σε κ?θε δ?ντρο απ?φαση?, χρησιμοποιο?νται διαφορετικ? δε?γματα εκκ?νηση? και σε κ?θε κ?μβο απ?φαση? χρησιμοποιο?νται διαφορετικ? υποσ?νολα χαρακτηριστικ?ν. Αυτ? η διαδικασ?α τε?νει να μει?σει τι? πιθαν?τητε? του overfitting. Η τεχνικ? τη? εν?σχυση? πα?ρνει μια σειρ? απ? αδ?ναμου? ομαδοποιητ?? και δ?νει συγκεκριμ?νο β?ρο? σε καθ?ναν απ? αυτο?? και τα αποτελ?σματ? του?, με σκοπ? να φτιαχτε? ?να? πιο δυνατ? ομαδοποιητ??. Στα δε?γματα που χρησιμοποιο?νται για την εκπα?δευση των ομαδοποιητ?ν χρησιμοποιε?ται η παραδοχ? ?τι ε?ν ?να? πα?κτη? τη? ομ?δα? Α δηλ?σει Tichu αλλ? ?να? πα?κτη? τη? ομ?δα? Β καταφ?ρει και ξεφορτωθε? ?λε? τι? κ?ρτε? του πρ?το?, τ?τε το δε?γμα καρτ?ν του πα?κτη τη? ομ?δα? Β θεωρε?ται σαν ?να δε?γμα που δ?λωσε Tichu και η δ?λωση του ?ταν επιτυχ??. Επ?ση? για τι? δηλ?σει? Grand Tichu χρησιμοποι?θηκαν σαν δε?γματα μ?νο τα χ?ρια στα ?ποια δηλ?θηκε Grand Tichu.Τα χαρακτηριστικ? τα οπο?α χρησιμοποι?θηκαν ?ταν ο αριθμ?? των ?σσων, ε?ν υπ?ρχει ο Φο?νικα? στο χ?ρι που εξετ?ζεται, ε?ν υπ?ρχει ο Δρ?κο? στο χ?ρι που εξετ?ζεται, ε?ν υπ?ρχουν τα σκυλι? στο χ?ρι που εξετ?ζεται, ο αριθμ?? των βομβ?ν, ο αριθμ?? των τριπλετ?ν, η υψηλ?τερη τριπλ?τα στο χ?ρι που εξετ?ζεται, ο αριθμ?? των ζευγαρι?ν, το υψηλ?τερο ζευγ?ρι στο χ?ρι που εξετ?ζεται, το μ?κο? τη? πιο μακρι?? κ?ντα? στο χ?ρι που εξετ?ζεται, η πιο υψηλ? κ?ντα στο χ?ρι που εξετ?ζεται, ο αριθμ?? των συνεχ?μενων ζευγαρι?ν και ο αριθμ?? των μον?φυλλων δυναμικ?τητα? μικρ?τερη? απ? τη ντ?μα.Για το Grand Tichu, ο Yang κατ?ληξε ?τι ο θ?ρυβο? ε?ναι αρκετ? μεγ?λο? και το να ψ?χνει ο αλγ?ριθμο? για ?λα αυτ? τα χαρακτηριστικ? δε βοηθ?ει αισθητ? την ακρ?βεια. Ο τρ?πο? με τον οπο?ο αξιολογ?θηκαν τα δι?φορα μοντ?λα ε?ναι το εμβαδ?ν τη? περιοχ?? (AUC) κ?τω απ? τη χαρακτηριστικ? καμπ?λη λειτουργ?α? του δ?κτη (receiver operating characteristic curve - ROC). Η ROC καμπ?λη προκ?πτει απ? τη γραφικ? παρ?σταση του ποσοστο? των αληθιν? θετικ?ν προβλ?ψεων προ? το ποσοστ? των ψευδ?? θετικ?ν προβλ?ψεων. Η καμπ?λη αυτ? δε?χνει πω? το μοντ?λο λειτουργε? κ?τω απ? διαφορετικ? κατ?φλια αποφ?σεων. Ε?ν το μοντ?λο αποφ?σιζε τυχα?α, το εμβαδ?ν τη? περιοχ?? αυτ?? θα ?ταν 0.5, εν? ε?ν το μοντ?λο ?ταν τ?λειο θα ?ταν 1. Η μοντελοπο?ηση του διαν?σματο? του χεριο? (raw hand) προβ?λει το χ?ρι που εξετ?ζεται σαν ?να δι?νυσμα μ?κου? 56 απ? 0 ? 1, που υποδεικν?ει αν το χ?ρι περι?χει μια κ?ρτα ? ?χι. Το συμπιεσμ?νο δι?νυσμα του χεριο? (compressed hand) μοντ?λο μετρ? τον αριθμ? των καρτ?ν αν? δυναμικ?τητα φ?λλου. Το minimal pattern μοντ?λο περι?χει μ?νο τ?σσερα χαρακτηριστικ? (αριθμ? ?σσων, ?παρξη Δρ?κου στο χ?ρι, ?παρξη Φο?νικα στο χ?ρι και αριθμ? βομβ?ν) τα οπο?α ε?χαν το μεγαλ?τερο συντελεστ? απ? τα 13 χαρακτηριστικ? που περιγρ?φηκαν παραπ?νω. Στον παρακ?τω π?νακα φα?νονται τα αποτελ?σματα του εμβαδο? τη? περιοχ?? κ?τω απ? την χαρακτηριστικ? καμπ?λη λειτουργ?α? του δ?κτη για ?λα τα μοντ?λα που περιγρ?φηκαν για την περ?πτωση του Grand Tichu, καθ?? και οι συντελεστ?? των τεσσ?ρων πιο σημαντικ?ν χαρακτηριστικ?ν (αριθμ?? ?σσων, αν υπ?ρχει ο Δρ?κο? στο χ?ρι, αν υπ?ρχει ο Φο?νικα? στο χ?ρι, ο αριθμ?? των βομβ?ν στο χ?ρι).4-18 Αποτελ?σματα του εμβαδο? τη? περιοχ?? κ?τω απ? την χαρακτηριστικ? καμπ?λη λειτουργ?α? του δ?κτη για ?λα τα μοντ?λα για το Grand Tichu, CITATION Eri18 \l 1033 (Yang, 2018)4-19 Χαρακτηριστικ?? καμπ?λε? ?λων των μοντ?λων με ε?σοδο 14 χαρακτηριστικ? συν τι? κ?ρτε? του χεριο?, CITATION Eri18 \l 1032 (Yang, 2018)4-20 Συντελεστ?? για τα πιο σημαντικ? χαρακτηριστικ? για την πρ?βλεψη Grand Tichu, CITATION Eri18 \l 1033 (Yang, 2018)Με στρογγυλοπο?ηση των συντελεστ?ν των τεσσ?ρων πιο σημαντικ?ν χαρακτηριστικ?ν φα?νεται ?τι ο Δρ?κο? και ο Φο?νικα? ε?ναι περ?που τρει? φορ?? πιο σημαντικο? απ? ?ναν ?σσο στη δ?λωση Grand Tichu. Τα παραπ?νω αποτελ?σματα οδηγο?ν στο ?τι αν στα πρ?τα 8 φ?λλα ?να? πα?κτη? ?χει ?ναν ?σσο, υπ?ρχει π?νω απ? 50% πιθαν?τητα να ξεφορτωθε? ?λα τα φ?λλα του πρ?το? στο γ?ρο αυτ?, αν δηλ?σει Grand Tichu, δηλαδ? π?νω απ? 50% πιθαν?τητα η δ?λωση Grand Tichu να ε?ναι επιτυχ??. Με την ?δια λογικ? δημιουργ?θηκαν και τα αντ?στοιχα μοντ?λα για τη δ?λωση Tichu. Μια? και πριν τη δ?λωση Tichu ο πα?κτη? ?χει στη δι?θεση του πληροφορ?α για ?λε? τι? κ?ρτε? του και ?χι μ?νο για τι? 8 που ?χει στο Grand Tichu, τα ελ?χιστα χαρακτηριστικ? που χρησιμοποι?θηκαν ε?ναι πλ?ον επτ?, τα τ?σσερα του Grand Tichu που περιγρ?φηκαν παραπ?νω, το ε?ν ο πα?κτη? ?χει τα σκυλι? στι? 14 κ?ρτε? του, ο αριθμ?? των κεντ?ν που υπ?ρχει στο χ?ρι του καθ?? και ο αριθμ?? των μον?ν φ?λλων δυναμικ?τητα? χαμηλ?τερη? τη? ντ?μα?. Τα χαρακτηριστικ? αυτ? αποκτο?ν παραπ?νω αξ?α στο Tichu μια? και η τυχαι?τητα ε?ναι λιγ?τερη, εξαιτ?α? των παραπ?νω γνωστ?ν καρτ?ν. Στο Tichu παρατηρ?θηκε πω? η ακρ?βεια των αποτελεσμ?των αυξ?θηκε ?ταν χρησιμοποι?θηκαν τα επιπλ?ον χαρακτηριστικ?. Τα 14 χαρακτηριστικ? που περιγρ?φηκαν παραπ?νω ?χουν εξ?σου καλ? αποτ?λεσμα με τα 14 χαρακτηριστικ? συν το δι?νυσμα των καρτ?ν του χεριο? σαν ε?σοδο στο μοντ?λο. Τα 6 ελ?χιστα χαρακτηριστικ? τα οπο?α περιγρ?φονται παραπ?νω ?χουν ελ?χιστα χειρ?τερα αποτελ?σματα, αλλ? καλ?τερα απ? το δι?νυσμα των καρτ?ν του χεριο? σαν ε?σοδο. ?λλη μια σημαντικ? παρατ?ρηση ε?ναι πω? το συμπιεσμ?νο δι?νυσμα του χεριο? (compressed hand) ?χει καλ?τερο αποτ?λεσμα σε σ?γκριση με το δι?νυσμα του χεριο? (raw hand). Αυτ? πιθαν?? προκαλε?ται απ? το ?τι το δι?νυσμα του χεριο? αναπαριστ? κ?θε κ?ρτα με τιμ?? 0 και 1 και δεν διαφοροποιε? τη τιμ? τη? κ?ρτα? απ? το χρ?μα τη?. Παρακ?τω φα?νονται τα αποτελ?σματα του εμβαδο? τη? περιοχ?? κ?τω απ? την χαρακτηριστικ? καμπ?λη λειτουργ?α? του δ?κτη για ?λα τα μοντ?λα που περιγρ?φηκαν για την περ?πτωση του Tichu, καθ?? και οι συντελεστ?? των επτ? πιο σημαντικ?ν χαρακτηριστικ?ν (αριθμ?? ?σσων, αν υπ?ρχει ο Δρ?κο? στο χ?ρι, αν υπ?ρχει ο Φο?νικα? στο χ?ρι, ο αριθμ?? των βομβ?ν στο χ?ρι, αν υπ?ρχει η κ?ρτα σκυλι? στο χ?ρι, ο αριθμ?? των κεντ?ν στο χ?ρι καθ?? και ο αριθμ?? των μον?ν φ?λλων δυναμικ?τητα? χαμηλ?τερη? απ? αυτ? τη? ντ?μα?).4-21 Αποτελ?σματα του εμβαδο? τη? περιοχ?? κ?τω απ? την χαρακτηριστικ? καμπ?λη λειτουργ?α? του δ?κτη για ?λα τα μοντ?λα για το Tichu, CITATION Eri18 \l 1033 (Yang, 2018)4-22 Χαρακτηριστικ?? καμπ?λε? ?λων των μοντ?λων με ε?σοδο 14 χαρακτηριστικ? συν τι? κ?ρτε? του χεριο?, CITATION Eri18 \l 1032 (Yang, 2018)4-23 Συντελεστ?? για τα πιο σημαντικ? χαρακτηριστικ? για την πρ?βλεψη Tichu, CITATION Eri18 \l 1033 (Yang, 2018)Με β?ση τα αποτελ?σματα προτε?νονται επ?ση? μνημονικο? καν?νε? σε κ?θε πα?κτη για τη δ?λωση ? μη Grand Tichu και Tichu.Τ?λο?, γ?νεται μια προσπ?θεια αποφυγ?? δ?λωση? Grand Tichu ?ταν οι πιθαν?τητε? να πει κ?ποιο? Grand Tichu ε?ναι ναι μεν π?νω απ? το 50%, αλλ? υπ?ρχει αυξημ?νη πιθαν?τητα οι επ?μενε? 6 κ?ρτε? να κ?νουν πολ? αδ?ναμο το χ?ρι του πα?κτη και ?ρα να μειωθο?ν εξαιρετικ? οι πιθαν?τητε? του να μπορε? ο πα?κτη? αυτ?? να ξεφορτωθε? ?λα τα φ?λλα του πρ?το?. ?γιναν 10000 προσομοι?σει? χερι?ν Grand Tichu σε κ?θε μ?α απ? τι? οπο?ε? ?γιναν 100 προσομοι?σει? με 6 διαφορετικ?? κ?ρτε? κ?θε φορ? για δ?λωση Tichu. Λ?φθηκε υπ?ψη η διαφορ? των 100 π?ντων που προκ?πτει ε?ν μια δ?λωση Grand Tichu θα ?ταν επιτυχ??, αλλ? ο πα?κτη? δηλ?σει απλ? Tichu αντ? για Grand Tichu και ?ρα προσφ?ρει 100 αντ? για 200 π?ντου? στην ομ?δα του. Ο Yang κατ?ληξε στο ?τι ?να Grand Tichu πρ?πει να δηλ?νεται ?ταν η πιθαν?τητα η δ?λωση του Grand Tichu να ε?ναι επιτυχ?? υπερβα?νει το 0.5 ×PTichu + 0.25, δηλαδ? ?ταν η μπλε κουκ?δα του παρακ?τω σχ?ματο? βρ?σκεται π?νω απ? την κ?τρινη κουκ?δα του παρακ?τω σχ?ματο?. 4-24 Πιθαν?τητα επιτυχο?? δ?λωση? Grand Tichu, CITATION Eri18 \l 1033 (Yang, 2018)Εφαρμογ?? παιχνιδιο? Tichu4-25 Εφαρμογ? Tichu για iOS, CITATION Boa \l 1033 (Board Game Geeek, 2011)Υπ?ρχουν δ?ο εφαρμογ?? Tichu, ?που οι πα?κτε? μπορο?ν να πα?ξουν εναντ?ον ευφυ?ν πρακτ?ρων που κ?νουν κιν?σει? χρησιμοποι?ντα? κ?ποιε? ευφυε?? τεχνικ??. Δυστυχ?? ο κ?δικα? που χρησιμοποιε?ται σε αυτ?? τι? εφαρμογ?? δεν ε?ναι διαθ?σιμο? στο ευρ? κοιν? (open-source) και ?ρα δε μπορο?με να εξ?γουμε συμπερ?σματα για το ποιε? μεθ?δου? ακολουθο?ν στη λ?ψη των αποφ?σεων των παικτ?ν. Οι εφαρμογ?? αυτ?? ε?ναι οι CITATION Holdren \l 1032 (Holdren) για Android και CITATION Hou19 \l 1032 (House Full of Games) για iOS. ?λλη μια προσπ?θεια για τη δημιουργ?α μια? εφαρμογ?? Tichu, ?που οι πα?κτε? μπορο?ν να πα?ξουν εναντ?ον ευφυ?ν πρακτ?ρων που κ?νουν κιν?σει? χρησιμοποι?ντα? κ?ποιε? ευφυε?? τεχνικ?? ?χει καταγραφε? και στο CITATION Ren13 \l 1032 (René Schwarz, 2013) . Εκε? οι René, Pfannkuch, et al., περιγρ?φουν την προσπ?θεια δημιουργ?α? μια? εφαρμογ?? Tichu σε Android. Δυστυχ?? δε γνωρ?ζουμε πολλ? σχετικ? με τι? ευφυε?? τεχνικ?? που χρησιμοποιο?νται, παρ? μ?νο την μεγ?λη υπολογιστικ? ισχ? που χρει?ζεται για να υποστηριχτο?ν, αφο? προκαλο?νται προβλ?ματα απ?δοση? σε πιο αδ?ναμε? συσκευ??.Κεφ?λαιο 5Η προσ?γγιση μα? / Συλλογ? δεδομ?νωνΣτην παρο?σα ?ρευνα μελετ?ται κυρ?ω? το κομμ?τι τη? δ?λωση? Grand Tichu. Το Grand Tichu ε?ναι το πιο σημαντικ? στοιχε?ο του παιχνιδιο? Tichu, δι?τι μια επιτυχ?? δ?λωση Grand Tichu δ?νει 200 π?ντου? στην ομ?δα του πα?κτη και αφο? οι υπ?λοιπε? κ?ρτε? δ?νουν 100 π?ντου? αν? γ?ρο αρκο?ν συν?θω? τ?σσερι? επιτυχε?? δηλ?σει? Grand Tichu για να αποκτ?σει μια ομ?δα 1000 π?ντου? και να ανακηρυχθε? νικ?τρια. Σκοπ?? τη? εν λ?γω ?ρευνα? ε?ναι με τη χρ?ση ευφυ?ν τεχνικ?ν να δημιουργ?σουμε δ?ο μοντ?λα τα οπο?α θα αποφασ?ζουν ε?ν ο πρ?κτορα? θα πρ?πει να δηλ?νει Grand Tichu ? ?χι με τα 8 φ?λλα που του ?χουν μοιραστε?. Τα μοντ?λα μα? δεν ε?ναι απλο? ομαδοποιητ??, δηλαδ? δεν απαντ?νε με ?να ναι ? ?να ?χι, αλλ? επιστρ?φουν τιμ?? μεταξ? του μηδ?ν και του ?να. Αυτ? μα? επιτρ?πει να ορ?σουμε και δι?φορα ε?δη πρακτ?ρων (περισσ?τερο ? λιγ?τερο επιθετικο?? πρ?κτορε?). ?να? πρ?κτορα? που ε?ναι πιο επιθετικ?? δηλ?νει Grand Tichu με χαμηλ?τερε? τιμ?? απ? ?τι ?να? πιο συντηρητικ?? πρ?κτορα?. Για την εκπα?δευση των μοντ?λων χρησιμοποι?θηκαν σαν δεδομ?να παρτ?δε? Tichu οι οπο?ε? ?χουν παιχτε? online στη γερμανικ? πλατφ?ρμα παιχνιδι?ν CITATION Bre19 \l 1033 (BrettSpielWelt). H πλατφ?ρμα αυτ? φιλοξενε? καθημεριν? πολλ? παιχν?δια Tichu τα αποτελ?σματα των οπο?ων ε?ναι διαθ?σιμα στην ιστοσελ?δα CITATION Tic17 \l 1032 (Tichulog BrettSpielWelt). Τα αποτελ?σματα αυτ? εμφαν?ζονται σε μια πιο ωραιοποιημ?νη μορφ? στην ιστοσελ?δα CITATION Tic19 \l 1032 (Tichumania). Η επιλογ? των παιχνιδι?ν δεν ?ταν τυχα?α. Επιλ?χθηκαν παρτ?δε? στι? οπο?ε? συμμετ?χουν πα?κτε? οι οπο?οι ε?ναι αναγνωρισμ?νοι στην κοιν?τητα του Tichu και ?χουν διακρ?σει? σε δι?φορα τουρνου? που λαμβ?νουν χ?ρα αν? καιρο?? στην Ελλ?δα και το σ?στημα βαθμολ?γηση? Elo που χρησιμοποιε? το CITATION Tic19 \l 1032 (Tichumania) για τον υπολογισμ? του σχετικο? επιπ?δου δεξι?τητα? των παικτ?ν σε παιχν?δια μηδενικο? αθρο?σματο? ?πω? το Tichu. Διαβ?θμιση δυναμικ?τητα? παικτ?ν και ομ?δων στο Tichu με τη χρ?ση του συστ?ματο? αξιολ?γηση? EloΤο παιχν?δι Tichu ε?ναι ?να παιχν?δι με μηδενικ? ?θροισμα (zero-sum game). Αυτ? σημα?νει ?τι το κ?ρδο? μια? ομ?δα? που αποτελε?ται απ? δ?ο πα?κτε? για μ?α ν?κη αντισταθμ?ζεται ακριβ?? απ? τι? απ?λειε? τη? αντ?παλη? ομ?δα? που χ?νει το παιχν?δι. Το Tichumania χρησιμοποιε? το σ?στημα αξιολ?γηση? Elo για να υπολογ?σει το σχετικ? επ?πεδο δεξιοτ?των τη? κ?θε ομ?δα? σε ?να παιχν?δι Tichu. Ονομ?στηκε ?τσι απ? το δημιουργ? του Arpad Elo, ?ναν Ουγγρο-Αμερικαν? καθηγητ? φυσικ??. Το σ?στημα Elo πρωτοεμφαν?στηκε ω? ?να βελτιωμ?νο σ?στημα βαθμολ?γηση? σκακιο? σε σχ?ση με το σ?στημα που χρησιμοποιο?νταν προηγουμ?νω?, το Harkness. Το σ?στημα Elo χρησιμοποιε?ται ?μω? και ω? σ?στημα διαβ?θμιση? του ανταγωνισμο? σε πολλ? βιντεοπαιχν?δια, για το Αμερικ?νικο ποδ?σφαιρο, για το μπ?σκετ, για το μπ?ιζμπολ, το πινγκ πονγκ, το Scrabble, για επιτραπ?ζια παιχν?δια ?πω? το “Διπλωματ?α” και για πολλ? ?λλα παιχν?δια. Η διαφορ? στι? βαθμολογ?ε? μεταξ? δ?ο παικτ?ν ? στην περ?πτωση του Tichu μεταξ? δ?ο ομ?δων χρησιμε?ει στο να προβλ?πεται η ?κβαση εν?? παιχνιδιο?. Δ?ο αντ?παλε? ομ?δε? με ισοτιμ?α στο σ?στημα αξιολ?γηση? Elo αναμ?νεται να κερδ?σουν ?σο αριθμ? παιχνιδι?ν. Μια ομ?δα που ?χει βαθμολογ?α 100 π?ντου? μεγαλ?τερη απ? την αντ?παλη αναμ?νεται να κερδ?σει το 64% των μεταξ? του? παιχνιδι?ν, εν? ε?ν αυτ? η διαφορ? ε?ναι 200 π?ντοι, τ?τε αναμ?νεται να κερδ?σει το 76%.Η βαθμολογ?α Elo εν?? πα?κτη αντιπροσωπε?εται απ? ?ναν αριθμ? ο οπο?ο? αυξ?νεται ? μει?νεται αν?λογα με το αποτ?λεσμα των παιχνιδι?ν μεταξ? των παικτ?ν που συμμετ?χουν στην κατ?ταξη Elo. Στην περ?πτωση του Tichu, η βαθμολογ?α Elo εν?? πα?κτη αυξ?νεται ? μει?νεται αν?λογα με το αποτ?λεσμα των παιχνιδι?ν μεταξ? των ομ?δων. Ε?ν ο πα?κτη? βρ?σκεται στην ομ?δα που θα κερδ?σει το παιχν?δι τ?τε η προσωπικ? του βαθμολογ?α Elo θα αυξηθε?, αλλι?? θα μειωθε?. Η διαφορ? αν?μεσα στι? βαθμολογ?ε? Elo τη? νικητ?ρια? και τη? ηττημ?νη? ομ?δα? πριν το παιχν?δι, καθορ?ζει το π?σου? π?ντου? θα χ?σει ? θα κερδ?σει μια ομ?δα μετ? απ? το παιχν?δι. Σε μια σειρ? παιχνιδι?ν αν?μεσα σε μ?α ομ?δα με υψηλ? και σε μ?α ομ?δα με χαμηλ? βαθμολογ?α η ομ?δα με την υψηλ? βαθμολογ?α προβλ?πεται να νικ?σει παραπ?νω φορ??. Ε?ν η ομ?δα με την υψηλ? βαθμολογ?α κερδ?σει, τ?τε μ?νο λ?γοι π?ντοι θα παρθο?ν απ? την ομ?δα με τη χαμηλ? βαθμολογ?α. Αντ?θετα, αν η ομ?δα με του? λ?γου? π?ντου? κερδ?σει (παρ? τα προγνωστικ?) τ?τε θα κερδ?σει πολλο?? π?ντου?, του? οπο?ου? θα χ?σει η ομ?δα με την υψηλ? βαθμολογ?α. Η ομ?δα με την χαμηλ? βαθμολογ?α θα κερδ?σει και λ?γου? π?ντου? στην περ?πτωση ισοπαλ?α? (ε?ν στην εκδοχ? αυτ? του Tichu, επιτρ?πεται η ισοπαλ?α, ?πω? γ?νεται στο CITATION Bre19 \l 1032 (BrettSpielWelt)). Αυτ? σημα?νει ?τι το σ?στημα Elo αυτοδιορθ?νεται και ?τι οι πα?κτε? που ?χουν χαμηλ?τερη βαθμολογ?α απ? το ταλ?ντο του? στο παιχν?δι, σε β?θο? χρ?νου, θα ?χουν καλ?τερα αποτελ?σματα απ? αυτ? που προβλ?πει το σ?στημα και ?τσι θα συλλ?ξουν π?ντου? στη βαθμολογ?α μ?χρι η βαθμολογ?α αυτ? να αντικατοπτρ?ζει την πραγματικ? του? αξ?α. CITATION Wik191 \l 1032 (Wikipedia, 2019)Στο CITATION Bre19 \l 1032 (BrettSpielWelt) η βαθμολογ?α Elo μια? ομ?δα? προκ?πτει απ? το μ?σο ?ρο τη? βαθμολογ?α? Elo των δ?ο παικτ?ν που απαρτ?ζουν την ομ?δα. Μετ? το τ?λο? του παιχνιδιο? η ομ?δα που κερδ?ζει πα?ρνει π?ντου? αν?λογα με τη διαφορ? στη βαθμολογ?α Elo μεταξ? αυτ?? και τη? αντ?παλη? ομ?δα? πριν το μεταξ? του? παιχν?δι. Οι π?ντοι αυτο? προστ?θενται στο ατομικ? Elo του κ?θε πα?κτη τη? νικητ?ρια? ομ?δα? και αφαιρο?νται απ? το ατομικ? Elo κ?θε πα?κτη τη? ηττημ?νη? ομ?δα?.Κ?θε πα?κτη? στο CITATION Bre19 \l 1032 (BrettSpielWelt) ξεκιν? με μια βαθμολογ?α 1500 Elo. Η απ?δοση εν?? πα?κτη δε μετρι?ται απ?λυτα, αλλ? συν?γεται απ? τι? ν?κε?, τι? ?ττε? και τι? ισοπαλ?ε? με τι? αντ?παλε? ομ?δε? (και κατ επ?κταση με του? αντ?παλου? πα?κτε?). Οι βαθμολογ?ε? των παικτ?ν εξαρτ?νται απ? τι? βαθμολογ?ε? των αντιπ?λων του? και τα αποτελ?σματα που σημει?νονται εναντ?ον του?. Η διαφορ? στη βαθμολογ?α μεταξ? δ?ο ομ?δων ορ?ζει μια εκτ?μηση για το αναμεν?μενο αποτ?λεσμα στο μεταξ? του? παιχν?δι. Τ?σο ο μ?σο? ?ρο? ?σο και η διασπορ? των βαθμολογι?ν μπορο?ν να επιλεγο?ν αυθα?ρετα. Ο Elo πρ?τεινε μια διαφορ? 200 βαθμ?ν στη βαθμολογ?α Elo στο σκ?κι να ισοδυναμε? σε πιθαν?τητα 75% ο ισχυρ?τερο? πα?κτη? (δηλαδ? αυτ?? που ?χει 200 βαθμο?? υψηλ?τερη βαθμολογ?α Elo απ? τον αντ?παλο του) να κερδ?σει το παιχν?δι. Στ?χο? τη? ομοσπονδ?α? σκακιο? ?ταν ο μ?σο? ?ρο? τη? βαθμολογ?α? να ε?ναι 1500, δηλαδ? ?να? μ?σο? πα?κτη? τη? λ?σχη? να ?χει βαθμολογ?α Elo 1500. Το αναμεν?μενο αποτ?λεσμα για ?ναν πα?κτη ε?ναι η πιθαν?τητα ν?κη? συν την μισ? πιθαν?τητα τη? ισοπαλ?α?. ?τσι, ?να? πα?κτη? με αναμεν?μενο αποτ?λεσμα 0.75 σημα?νει ε?τε 75% πιθαν?τητα ν?κη?, 0% πιθαν?τητα ισοπαλ?α? και 25% πιθαν?τητα ?ττα? ? 50% πιθαν?τητα ν?κη?, 0% πιθαν?τητα ?ττα? και 50% πιθαν?τητα ισοπαλ?α?. Η πιθαν?τητα ισοπαλ?α?, σε αντ?θεση με το να προκαλ?σει κ?ποιο συγκεκριμ?νο αποτ?λεσμα, δεν προσδιορ?ζεται στο σ?στημα Elo. Αντιθ?τω?, μια ισοπαλ?α θεωρε?ται σαν μισ? ν?κη και μισ? ?ττα. Στην πρ?ξη και δεδομ?νου ?τι οι πραγματικ?? δυνατ?τητε? κ?θε πα?κτη ε?ναι ?γνωστε?, οι πιθαν?τητε? ν?κη? υπολογ?ζονται χρησιμοποι?ντα? τι? τρ?χουσε? βαθμολογ?ε? Elo των παικτ?ν ω? εξ??: Ε?ν η ομ?δα Α ?χει βαθμολογ?α Elo RAκαι η ομ?δα Β ?χει βαθμολογ?α Elo RB, το εκτιμ?μενο αποτ?λεσμα για την ομ?δα Α ε?ναι:ΕΑ=11 + 10(RΒ-RΑ)/400 Με παρ?μοιο τρ?πο το εκτιμ?μενο αποτ?λεσμα για την ομ?δα Β ε?ναι:ΕΒ=11 + 10(RA-RB)/400 Τα παραπ?νω θα μπορο?σαν επ?ση? να εκφραστο?ν σαν:EA =QAQA + QB και ΕB=QBQA + QB, ?που QA= 10RA/400 και QΒ= 10RΒ/400.Απ? τι? παραπ?νω εκφρ?σει? και παρατηρ?ντα? πω? και οι δ?ο εκφρ?σει? ?χουν κοιν? παρονομαστ? ε?ναι προφαν?? πω? EA + ΕB = 1. Αυτ? σημα?νει ?τι μελετ?ντα? μ?νο του? αριθμητ??, παρατηρο?με ?τι το εκτιμ?μενο αποτ?λεσμα για την ομ?δα Α ε?ναι QAQBφορ?? μεγαλ?τερο απ? το εκτιμ?μενο αποτ?λεσμα για την ομ?δα Β. Μετ? βλ?πουμε ?τι για κ?θε 400 π?ντου? διαφορ? στη βαθμολογ?α των δ?ο ομ?δων, η ομ?δα με το πλεον?κτημα (με του? περισσ?τερου? δηλαδ? π?ντου?) βλ?πει το εκτιμ?μενο αποτ?λεσμα τη? να δεκαπλασι?ζεται σε σχ?ση με το εκτιμ?μενο αποτ?λεσμα τη? αντ?παλη? ομ?δα?. CITATION Mar96 \p 66-70 \l 1033 (Mark E. Glickman, 1996, pp. 66-70)?ταν τα πραγματικ? αποτελ?σματα μια? ομ?δα? ε?ναι καλ?τερα απ? τα εκτιμ?μενα αποτελ?σματα αυτ??, τ?τε το σ?στημα βαθμολ?γηση? Elo εκλαμβ?νει αυτ? τα αποτελ?σματα ω? πειστ?ρια ?τι η βαθμολογ?α Elo τη? ομ?δα? ε?ναι πολ? χαμηλ? και πρ?πει να προσαρμοστε? προ? τα π?νω. Παρομο?ω?, ?ταν τα πραγματικ? αποτελ?σματα μια? ομ?δα? ε?ναι χειρ?τερα απ? τα εκτιμ?μενα αποτελ?σματα αυτ??, τ?τε το σ?στημα βαθμολ?γηση? Elo εκλαμβ?νει αυτ? τα αποτελ?σματα ω? πειστ?ρια ?τι η βαθμολογ?α Elo τη? ομ?δα? ε?ναι πολ? υψηλ? και πρ?πει να προσαρμοστε? προ? τα κ?τω. Η αρχικ? πρ?ταση του Elo, η οπο?α εξακολουθε? να χρησιμοποιε?ται ευρ?ω?, ?ταν μια απλ? γραμμικ? προσαρμογ? αν?λογα με το π?σο μια ομ?δα υπερ?βαινε ? ?ταν κατ?τερη του εκτιμ?μενου αποτελ?σματ?? τη?. Η μ?γιστη δυνατ? αναδιαμ?ρφωση του εκτιμ?μενου αποτελ?σματο? μια? ομ?δα? αν? παιχν?δι ονομ?ζεται συντελεστ?? K και στο CITATION Tic19 \l 1032 (Tichumania) ορ?ζεται στο Κ = 15. CITATION Nat15 \l 1032 (Nate Silver, 2015) Υποθ?τοντα? πω? η ομ?δα Α ε?χε εκτιμ?μενο αποτ?λεσμα EA αλλ? πραγματικ? αποτ?λεσμα SA η σχ?ση με την οπο?α ανανε?νεται η βαθμολογ?α τη? ομ?δα? ε?ναι η εξ??:R'A = RA+K(SA-EA)Στο CITATION Tic19 \l 1032 (Tichumania) αυτ? η αναν?ωση γ?νεται μετ? απ? κ?θε παιχν?δι. Για παρ?δειγμα ?στω ?τι δ?ο ομ?δε?, η μ?α (ομ?δα Α) με βαθμολογ?α Elo 1700 (?στω ?τι αποτελε?ται απ? δ?ο πα?κτε?, ?που ο ?να? ?χει βαθμολογ?α Elo 1650 και ο ?λλο? 1750, ?ρα η βαθμολογ?α τη? ομ?δα? ε?ναι ? μ?σο? ?ρο? των βαθμολογι?ν Elo των παικτ?ν) και η ?λλη (ομ?δα Β) με βαθμολογ?α Elo 1400. Σε περ?πτωση ν?κη? τη? ομ?δα? Α οι ν?ε? βαθμολογ?ε? των ομ?δων προκ?πτουν ω? εξ??:EA=11 + 10(1400-1700)/400=0.849 και EΒ=11 + 10(1700-1400)/400=0.151R'A = RA+K(SA-EA) = 1700 + 15(1-0.849) =1702.265 ?1702R'Β = RΒ+K(SΒ-EΒ) = 1400 + 15(0-0.151) =1397.735 ?1398Σε περ?πτωση ν?κη? τη? ομ?δα? Β οι ν?ε? βαθμολογ?ε? των ομ?δων προκ?πτουν ω? εξ??:R'A = RA+K(SA-EA) = 1700 + 15(0-0.849) =1687.265 ?1687R'Β = RΒ+K(SΒ-EΒ) = 1400 + 15(1-0.151) =1412.735 ?1413?τσι και η βαθμολογ?α Elo κ?θε πα?κτη? τη? ομ?δα? θα αυξηθε??? θα μειωθε? τ?σο ?σο αυξ?θηκε ? μει?θηκε η βαθμολογ?α Elo τη? ομ?δα?.Τα μεγαλ?τερα μαθηματικ? προβλ?ματα που προκ?πτουν ?σον αφορ? την αρχικ? εργασ?α του Elo ε?ναι η ε?ρεση του ακριβ?στερου μοντ?λου διανομ?? και τη? ακριβ?στερη? τιμ?? του συντελεστ? Κ. ?λλο ?να πρ?βλημα ε?ναι ?τι πολ? πα?κτε? ωθο?νται στο να σταματ?σουν να πα?ζουν συχν? προσπαθ?ντα? ?τσι να προστατε?σουν τη βαθμολογ?α Elo του?.Το Elo χρησιμοποιε?ται σε πολλ? παιχν?δια και αθλ?ματα, ?πω? στο Αμερικ?νικο κολεγιακ? ποδ?σφαιρο, στο μπ?ιζμπολ, σαν ?να απ? τα συστ?ματα βαθμολ?γηση? στο τ?νι?, απ? τη FIFA στο ποδ?σφαιρο, στο χ?κε?, στο ρ?γκμπι και στο Korfball.Επιτραπ?ζια παιχν?δια τα οπο?α χρησιμοποιο?ν τη βαθμολογ?α Elo ε?ναι το Scrabble, το Lexulous, το τ?βλι σε διαδικτυακο?? server, το ευρωπα?κ? Go, το Magic: The Gathering, το Pokemon USA και τα παιχν?δια καρτ?ν για το Star Trek και το Star Wars και ?λλα. Βιντεοπαιχν?δια τα οπο?α χρησιμοποιο?ν τη βαθμολογ?α Elo ε?ναι το Overwatch, το Counter-Strike, το Guild Wars, το World of Warcraft, το League of Legends και ?λλα. CITATION Wik191 \l 1032 (Wikipedia, 2019)Συλλογ? δεδομ?νωνΓια τη συλλογ? δεδομ?νων χρησιμοποι?θηκαν τα καταγεγραμμ?να παιχν?δια μεταξ? παικτ?ν στην πλατφ?ρμα Tichu του CITATION Bre19 \l 1033 (BrettSpielWelt). Για διευκ?λυνση μα? χρησιμοποι?θηκε μ?α β?ση δεδομ?νων την οπο?α διατηρο?σε ο CITATION Mar \l 1033 (Steinacher) και η οπο?α μα? βο?θησε στο να ομαδοποι?σουμε τα παιχν?δια αν?λογα με του? πα?κτε? που συμμετ?χουν σε αυτ?. Οι παρτ?δε? οι οπο?ε? επιλ?χθηκαν ?ταν αυτ?? ?που συμμετε?χε τουλ?χιστον ?να? πα?κτη? με υψηλ? βαθμολογ?α Elo, συν παρτ?δε? στι? οπο?ε? συμμετε?χαν πα?κτε? με διακρ?σει? στα τουρνου? Tichu, ανεξαρτ?τω? τη? βαθμολογ?α? Elo που ε?χαν σε περ?πτωση που δεν ?ταν αρκετ? ενεργο? ?στε η βαθμολογ?α Elo του? να περιγρ?φει ικανοποιητικ? τη δεξι?τητα του? στο παιχν?δι Tichu. Επιλ?χθηκαν συνολικ? περ?που 1500 παιχν?δια για την εκπα?δευση των ευφυ?ν συστημ?των και 100 παιχν?δια για τον ?λεγχο τη? απ?δοση? του?. Απ? τα “χ?ρια” των παρτ?δων των παιχνιδι?ν αυτ?ν αφαιρ?θηκαν τα “χ?ρια” του συμπα?κτη του πα?κτη που δ?λωσε Grand Tichu σε κ?ποιον γ?ρο. Αυτ? γ?νεται γιατ? ε?ν δηλ?σουν στον ?διο γ?ρο Grand Tichu δ?ο συμπα?κτε? τ?τε η ομ?δα δε θα ?χει καν?να πλεον?κτημα ε?ν ?να? απ? του? δ?ο πετ?χει και ξεφορτωθε? πρ?το? ?λε? τι? κ?ρτε? του, μια? και η επιτυχ?? δ?λωση δ?νει 200 επιπλ?ον π?ντου? στην ομ?δα, αλλ? η ανεπιτυχ?? δ?λωση αφαιρε? 200 π?ντου? απ? την ομ?δα. ?τσι, ?ταν ?να? πα?κτη? δηλ?νει Grand Tichu, ο συμπα?κτη? του δε δηλ?νει Grand Tichu στον ?διο γ?ρο ανεξαρτ?τω? του αν πιστε?ει ?τι το “χ?ρι” του ε?ναι καλ? για δ?λωση Grand Tichu ? μη. ?ρα αυτ? τα “χ?ρια” δε βοηθο?ν στην αξιολ?γηση τη? δ?λωση? Grand Tichu ? ?χι και αφαιρ?θηκαν απ? τα δεδομ?να μα?. Κεφ?λαιο 6Η επιλογ? των χαρακτηριστικ?ν των ευφυ?ν συστημ?τωνΣτη μηχανικ? μ?θηση, στην αναγν?ριση προτ?πων και στην επεξεργασ?α εικ?νων, η εξαγωγ? χαρακτηριστικ?ν ξεκιν? απ? ?να αρχικ? σ?νολο δεδομ?νων και παρ?γει κ?ποια χαρακτηριστικ? που προσφ?ρουν μη περιττ? πληροφορ?α, διευκολ?νοντα? τα ακ?λουθα β?ματα μ?θηση? και γεν?κευση?, οδηγ?ντα?, σε μερικ?? περιπτ?σει?, σε καλ?τερε? ανθρ?πινε? ερμηνε?ε?. Η εξαγωγ? χαρακτηριστικ?ν σχετ?ζεται με τη με?ωση των διαστ?σεων.?ταν τα δεδομ?να εισ?δου σε ?ναν αλγ?ριθμο ε?ναι πολ? μεγ?λα για να υποστο?ν επεξεργασ?α και υπ?ρχει η υποψ?α ?τι ε?ναι περιττ? (π.χ. η ?δια μ?τρηση στα π?δια και τα μ?τρα ? η επαναληπτικ?τητα των εικ?νων που παρουσι?ζονται ω? pixels) τ?τε μπορο?ν να μετατραπο?ν σε ?να μειωμ?νο σ?νολο των χαρακτηριστικ?ν (ονομ?ζεται επ?ση? δι?νυσμα χαρακτηριστικ?ν). Ο προσδιορισμ?? εν?? υποσυν?λου των αρχικ?ν χαρακτηριστικ?ν ονομ?ζεται επιλογ? χαρακτηριστικ?ν. Οι επιλεγμ?νε? λειτουργ?ε? αναμ?νεται να περι?χουν τι? σχετικ?? πληροφορ?ε? απ? τα δεδομ?να εισ?δου, ?τσι ?στε η επιθυμητ? εργασ?α να μπορε? να εκτελεστε? με τη χρ?ση αυτ?? τη? μειωμ?νη? αναπαρ?σταση? αντ? των πλ?ρων αρχικ?ν δεδομ?νων. Οι τεχνικ?? επιλογ?? χαρακτηριστικ?ν χρησιμοποιο?νται για τ?σσερι? λ?γου?: απλοπο?ηση των μοντ?λων ?στε να διευκολυνθε? η ερμηνε?α του? απ? ερευνητ?? / χρ?στε?, συντομ?τεροι χρ?νοι εκπα?δευση?, για να αποφ?γουμε την κατ?ρα των διαστ?σεων, βελτιωμ?νη γεν?κευση με τη με?ωση του over fitting (τυπικ?, με?ωση τη? διακ?μανση? ).Η κεντρικ? προ?π?θεση ?ταν χρησιμοποιε?ται μια τεχνικ? επιλογ?? χαρακτηριστικ?ν ε?ναι τα δεδομ?να να περι?χουν ορισμ?να χαρακτηριστικ? που ε?ναι ε?τε περιττ? ε?τε ?σχετα και μπορο?ν συνεπ?? να αφαιρεθο?ν χωρ?? να υποστο?ν πολλ?? απ?λειε? πληροφορι?ν. Οι ?ννοιε? του περιττο? και του ?σχετου ε?ναι δι?φορε? μεταξ? του?, καθ?? ?να σχετικ? χαρακτηριστικ? μπορε? να ε?ναι περιττ? με την παρουσ?α εν?? ?λλου σχετικο? χαρακτηριστικο? με το οπο?ο σχετ?ζεται ?ντονα. CITATION Δαν14 \l 1032 (Γιαννο?λη, 2014)Στην περ?πτωση τη? δ?λωση? του Grand Tichu, η οπο?α εξετ?ζεται στο πλα?σιο αυτ?? τη? διπλωματικ??, κ?θε πα?κτη? ?χει 8 φ?λλα τη στιγμ? που καλε?ται να αποφασ?σει αν θα δηλ?σει ? ?χι Grand Tichu. Το ε?ν θα δηλ?σει Grand Tichu ? ?χι εξαρτ?ται απ? πολλο?? παρ?γοντε?. Τα χαρακτηριστικ? που εμε?? αποφασ?σαμε ?τι ε?ναι σημαντικ? και κρατ?σαμε ε?ναι:Τα 8 φ?λλα που ?χει ο πα?κτη?.Στο Tichu η τρ?πουλα αποτελε?ται απ? 56 φ?λλα, ?ρα αυτ? τα 8 φ?λλα μπορο?ν να μοντελοποιηθο?ν με πολλο?? τρ?που?. Εμε?? αποφασ?σαμε να χωρ?σουμε τα φ?λλα σε 17 χαρακτηριστικ?. Αυτ? ε?ναι:Υπ?ρχει ? ?χι το Mahjong στα 8 φ?λλα: με τιμ? 0 ? 1.Υπ?ρχουν ? ?χι τα Σκυλι? στα 8 φ?λλα: με τιμ? 0 ? 1.Υπ?ρχει ? ?χι ο Δρ?κο? στα 8 φ?λλα: με τιμ? 0 ? 1.Υπ?ρχει ? ?χι ο Φο?νικα? στα 8 φ?λλα: με τιμ? 0 ? 1.Τα παραπ?νω φ?λλα εμφαν?ζονται μ?νο μια φορ? στην τρ?πουλα, σε αντ?θεση με τα υπ?λοιπα φ?λλα (2 ?ω? και ?σσο) που εμφαν?ζονται απ? 4 φορ?? το καθ?να. Εδ? ε?χαμε την επιλογ? να διαλ?ξουμε να θεωρ?σουμε κ?θε φ?λλο ?δια? δυναμικ?τητα?, για παρ?δειγμα το κ?κκινο και το πρ?σινο δ?ο, ω? διαφορετικ? χαρακτηριστικ?. Αποφασ?σαμε ?μω? αντι για αυτ? να αψηφ?σουμε τη διαφορ? στο χρ?μα και ?τσι για κ?θε δυναμικ?τητα προκ?πτει ?να χαρακτηριστικ? - το π?σε? φορ?? εμφαν?ζεται φ?λλο αυτ?? τη? δυναμικ?τητα? στο χ?ρι. Για λ?γου? κανονικοπο?ηση? αποφασ?σαμε ?λα τα χαρακτηριστικ? να ?χουν τιμ? απ? 0 μ?χρι 1 και ?ρα:5. Αριθμ?? Δυαρι?ν: με τιμ? 0.25 ×#Δυαρι?ν6. Αριθμ?? Τριαρι?ν: με τιμ? 0.25 ×#Τριαρι?ν7. Αριθμ?? Τεσσαρι?ν: με τιμ? 0.25 ×#Τεσσαρι?ν8. Αριθμ?? Πενταρι?ν: με τιμ? 0.25 ×#Πενταρι?ν9. Αριθμ?? Εξαρι?ν: με τιμ? 0.25 ×#Εξαρι?ν10. Αριθμ?? Εφταρι?ν: με τιμ? 0.25 ×#Εφταρι?ν11. Αριθμ?? Οχταρι?ν: με τιμ? 0.25 ×#Οχταρι?ν12. Αριθμ?? Εννιαρι?ν: με τιμ? 0.25 ×#Εννιαρι?ν13. Αριθμ?? Δεκαρι?ν: με τιμ? 0.25 ×#Δεκαρι?ν14. Αριθμ?? Βαλ?δων: με τιμ? 0.25 ×#Βαλ?δων15. Αριθμ?? Νταμ?ν: με τιμ? 0.25 ×#Νταμ?ν16. Αριθμ?? Ρηγ?δων: με τιμ? 0.25 ×#Ρηγ?δων17. Αριθμ?? ?σσων: με τιμ? 0.25 ×#?σσωνΣτη συν?χεια σκεφτ?καμε πω? η ?παρξη κ?ποιων απ? του? συνδυασμο?? του παιχνιδιο? Tichu στο “χ?ρι” που εξετ?ζουμε πρ?πει να ε?ναι μ?ρο? των χαρακτηριστικ?ν. Αυτ? συμβα?νει, δι?τι η ?παρξη κ?ποιων δυνατ?ν συνδυασμ?ν στο χ?ρι εν?? πα?κτη αυξ?νει την αξ?α του “χεριο?” αυτο? και μπορε? να τον ωθ?σει σε μ?α δ?λωση Grand Tichu. Οι πιθανο? συνδυασμο? ε?ναι οι εξ??: ζευγ?ρια, τριπλ?τε?, full house,συνεχ?μενα ζευγ?ρια, κ?ντε?, κ?ντε? ?διου χρ?ματο? και καρ? (4 ?δια φ?λλα). Τα ζευγ?ρια και οι τριπλ?τε? αποφασ?σαμε ?τι εκπροσωπο?νται επαρκ?? απ? τα χαρακτηριστικ? Αριθμ?? Φ?λλων Δυναμικ?τητα? 2 ?ω? ?σσο. Η πληροφορ?α για την ?παρξη ζευγαρι?ν ? τριπλετ?ν εν?? φ?λλο ενθυλακ?νεται μ?σα στα χαρακτηριστικ? αυτ?, μια? και ε?ν ?να “χ?ρι” ?χει 3 πεντ?ρια, τ?τε το χαρακτηριστικ? 8 (Αριθμ?? Πενταρι?ν) θα ?χει την τιμ? 0.75. Αντ?θετα, αποφασ?σαμε να μην περιοριστο?με μ?νο στα παραπ?νω χαρακτηριστικ? για τα καρ? (4 φ?λλα ?δια? δυναμικ?τητα? στο “χ?ρι”). Αυτ? ?γινε γιατ? στο Tichu το καρ? αποτελε? μ?ρο? μια ειδικ?? κατηγορ?α? συνδυασμ?ν που ονομ?ζονται β?μβε?. Οι β?μβε? ε?ναι οι πιο δυνατο? συνδυασμο? στο παιχν?δι και ?ρα αποφασ?σαμε να δ?σουμε ειδικ? μνε?α στι? β?μβε? δημιουργ?ντα? επιπλ?ον χαρακτηριστικ? για την καταγραφ? τη? εμφ?νιση? του? σε ?να “χ?ρι”.Μοντελοπο?ηση των συνδυασμ?ν TichuΣυνεχ?μενα Ζευγ?ριαΤα συνεχ?μενα ζευγ?ρια μοντελοποιο?νται σαν μια λ?στα χαρακτηριστικ?ν. Το πρ?το χαρακτηριστικ? τη? λ?στα? ε?ναι το αν υπ?ρχουν συνεχ?μενα ζευγ?ρια ?που το μεγαλ?τερο ζευγ?ρι να ε?ναι δυναμικ?τητα? 3, εν? το τελευτα?ο χαρακτηριστικ? τη? λ?στα? ε?ναι το αν υπ?ρχουν συνεχ?μενα ζευγ?ρια ?που το μεγαλ?τερο ζευγ?ρι να ε?ναι δυναμικ?τητα? ?σσου. Η μοντελοπο?ηση των παραπ?νω απ? δ?ο συνεχ?μενων ζευγαρι?ν γ?νεται ω? εξ??: βρ?σκουμε το μεγαλ?τερο ζευγ?ρι και στο χαρακτηριστικ? του δ?νουμε τιμ? ?ση με το πλ?θο? των συνεχ?μενων ζευγαρι?ν πριν απ? αυτ? (δηλαδ? μικρ?τερη? δυναμικ?τητα?). Η διαδικασ?α συνεχ?ζεται μ?χρι να φτ?σουμε στο συνεχ?μενο ζευγ?ρι που ?χει μ?νο ?να ζευγ?ρι μικρ?τερη? δυναμικ?τητα? πριν απ? αυτ?. Για παρ?δειγμα αν το “χ?ρι” εν?? πα?κτη ε?ναι τα φ?λλα (αγνοο?με τα χρ?ματα): 2-2-2-3-3-4-4-4-5-5-6-7-8-9 τ?τε το χαρακτηριστικ? Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι τα Πεντ?ρια ?χει την τιμ? 3, το χαρακτηριστικ? Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι τα Τεσσ?ρια ?χει την τιμ? 2 και το χαρακτηριστικ? Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι τα Τρι?ρια ?χει την τιμ? 1. ?πω? και πριν, σκοπ?? ε?ναι να κανονικοποι?σουμε την τιμ? των χαρακτηριστικ?ν των συνεχ?μενων ζευγαρι?ν, ?στε να ?χουν μ?γιστη τιμ? το 1. Παρατηρο?με ?τι για το στ?διο τη? δ?λωση? Grand Tichu κ?θε “χ?ρι” αποτελε?ται απ? 8 φ?λλα και ?ρα τα μ?γιστα συνεχ?μενα ζευγ?ρια ε?ναι τ?σσερα συνεχ?μενα ζευγ?ρια. Με την μοντελοπο?ηση που περιγρ?ψαμε παραπ?νω τα τ?σσερα συνεχ?μενα ζευγ?ρια ?χουν μ?γιστη τιμ? 3 (?πω? ακριβ?? φ?νηκε και στο παραπ?νω παρ?δειγμα που ε?χαμε τ?σσερα συνεχ?μενα ζευγ?ρια). ?τσι για την κανονικοπο?ηση των χαρακτηριστικ?ν αυτ?ν αρκε? η μοντελοπο?ηση με τον παραπ?νω τρ?πο και στη συν?χεια δια?ρεση με το 3. ?τσι κανονικοποιο?με τα χαρακτηριστικ? αυτ? στο ε?ρο? τιμ?ν απ? 0 ?ω? 1. Τα χαρακτηριστικ? που προκ?πτουν μπορο?ν να βρεθο?ν στο τ?λο? τη? εργασ?α?. (Παρ?ρτημα - σελ. 118)Κ?ντε?Οι κ?ντε? (π?ντε ? παραπ?νω φ?λλα διαδοχικ?? δυναμικ?τητα?) μοντελοποιο?νται και αυτ?? σαν μια λ?στα χαρακτηριστικ?ν. Το πρ?το χαρακτηριστικ? τη? λ?στα? ε?ναι το αν υπ?ρχουν π?ντε συνεχ?μενα φ?λλα διαδοχικ?? δυναμικ?τητα? ?που το μεγαλ?τερο φ?λλο να ε?ναι δυναμικ?τητα? 5, εν? το τελευτα?ο χαρακτηριστικ? τη? λ?στα? ε?ναι το αν υπ?ρχουν π?ντε συνεχ?μενα φ?λλα διαδοχικ?? δυναμικ?τητα? ?που το μεγαλ?τερο φ?λλο να ε?ναι δυναμικ?τητα? ?σσου. Η μοντελοπο?ηση των κεντ?ν γ?νεται ω? εξ??: βρ?σκουμε το μεγαλ?τερο φ?λλο και στο χαρακτηριστικ? του δ?νουμε τιμ? ?ση με το πλ?θο? των συνεχ?μενων φ?λλων πριν απ? αυτ? (δηλαδ? μικρ?τερη? δυναμικ?τητα?) τα οπο?α ε?ναι υψηλ?τερα φ?λλα κ?ντα? αντ?στοιχα συν ?να. Η διαδικασ?α συνεχ?ζεται μ?χρι να φτ?σουμε στο μεγαλ?τερο φ?λλο που ?χει μ?νο τ?σσερα συνεχ?μενα μικρ?τερη? δυναμικ?τητα? φ?λλα πριν απ? αυτ?. Για παρ?δειγμα αν το “χ?ρι” εν?? πα?κτη ε?ναι τα φ?λλα (αγνοο?με τα χρ?ματα): 2-3-4-5-6-7-8-9-J-J-J-K-K-Dr τ?τε το χαρακτηριστικ? Συνεχ?μενη? Δυναμικ?τητα? Φ?λλων με μεγαλ?τερο φ?λλο το Εννι? ?χει την τιμ? 4, το χαρακτηριστικ? Συνεχ?μενη? Δυναμικ?τητα? Φ?λλων με μεγαλ?τερο φ?λλο το Οκτ? ?χει την τιμ? 3, το χαρακτηριστικ? Συνεχ?μενη? Δυναμικ?τητα? Φ?λλων με μεγαλ?τερο φ?λλο το Επτ? ?χει την τιμ? 2 και το χαρακτηριστικ? Συνεχ?μενη? Δυναμικ?τητα? Φ?λλων με μεγαλ?τερο φ?λλο το ?ξι ?χει την τιμ? 1. ?πω? και πριν, θ?λουμε να κανονικοποι?σουμε την τιμ? των χαρακτηριστικ?ν των συνεχ?μενων ζευγαρι?ν, ?στε να ?χουν μ?γιστη τιμ? το 1. Παρατηρο?με ?τι για το στ?διο τη? δ?λωση? Grand Tichu κ?θε “χ?ρι” αποτελε?ται απ? 8 φ?λλα και ?ρα η μεγαλ?τερη σε πλ?θο? φ?λλων κ?ντα που μπορε? να υπ?ρχει ε?ναι μια κ?ντα 8 φ?λλων. Με την μοντελοπο?ηση που περιγρ?ψαμε παραπ?νω οι κ?ντε? 8 φ?λλων ?χουν τιμ? 4 (?πω? ακριβ?? φ?νηκε και στο παραπ?νω παρ?δειγμα που ε?χαμε μια κ?ντα 2 ?ω? 9, δηλαδ? 8 φ?λλων). ?τσι για την κανονικοπο?ηση των χαρακτηριστικ?ν αυτ?ν αρκε? η μοντελοπο?ηση με τον παραπ?νω τρ?πο και στο τ?λο? δια?ρεση με το 4. ?τσι κανονικοποιο?με τα χαρακτηριστικ? αυτ? στο ε?ρο? τιμ?ν απ? 0 ?ω? 1. Να σημειωθε? ?τι επειδ? ε?ναι δυνατ?ν να χρησιμοποιηθε? και η ειδικ? κ?ρτα Mahjong για τη δημιουργ?α μια? κ?ντα? Mahjong ?ω? π?ντε τα χαρακτηριστικ? των κεντ?ν ξεκινο?ν απ? μ?α κ?ντα με υψηλ?τερο φ?λλο τη? κ?ντα? να ε?ναι το π?ντε. Στο παρ?δειγμα που περιγρ?ψαμε παραπ?νω καλο?με τι? κ?ντε? οι οπο?ε? ε?ναι μικρ?τερου μ?κου? και με μικρ?τερη υψηλ?τερη κ?ρτα απ? το Εννι?, αλλ? αποτελο?ν υποσ?νολο τη? κ?ντα? 2-9 (δηλαδ? τι? κ?ντε? 2-8, 2-7, 2-6) ω? υπο-κ?ντε?.Τα χαρακτηριστικ? που προκ?πτουν μπορο?ν να βρεθο?ν στο τ?λο? τη? εργασ?α?. (Παρ?ρτημα – σελ. 118)Full HousesΤα Full Houses (π?ντε φ?λλα που ε?ναι μια τριπλ?τα και ?να ζευγ?ριδιαφορετικ?? δυναμικ?τητα?) μοντελοποιο?νται και αυτ? σαν μια λ?στα χαρακτηριστικ?ν. Το πρ?το χαρακτηριστικ? τη? λ?στα? ε?ναι το αν υπ?ρχει ?να Full House ?που η δυναμικ?τητα τη? τριπλ?τα? να ε?ναι 2 και ?ρα και η δυναμικ?τητα του Full House να ε?ναι 2 μια? και η δυναμικ?τητα του Full House ισο?ται με τη δυναμικ?τητα τη? τριπλ?τα? αυτο?, εν? το τελευτα?ο χαρακτηριστικ? τη? λ?στα? ε?ναι το αν υπ?ρχει ?να Full House με δυναμικ?τητα ?σσου (δηλαδ? με τριπλ?τα στου? ?σσου?). Η μοντελοπο?ηση των Full Houses γ?νεται ω? εξ??: βρ?σκουμε την τριπλ?τα φ?λλων ?δια? δυναμικ?τητα? και δ?νουμε τιμ? ?ση με ?να στο αντ?στοιχο χαρακτηριστικ?. Για παρ?δειγμα αν το “χ?ρι” εν?? πα?κτη ε?ναι τα φ?λλα (αγνοο?με τα χρ?ματα): 2-3-4-4-4-6-6-9-9-J-J-K-K-Dr τ?τε το χαρακτηριστικ? Full House Δυναμικ?τητα? 4 ?χει την τιμ? 1. Αν δεν υπ?ρχαν ζευγ?ρια στο “χ?ρι” (για παρ?δειγμα 2-3-4-4-4-6-7-8-9-10-J-Q-K-Dr) τ?τε η τιμ? του χαρακτηριστικο? Full House Δυναμικ?τητα? 4 θα ?ταν ?ση με μηδ?ν.Τα χαρακτηριστικ? αυτ? δε χρει?ζονται περαιτ?ρω κανονικοπο?ηση για να ?χουν τιμ?? στο ε?ρο? τιμ?ν απ? 0 ?ω? 1 μια? και ε?ναι δυαδικ? χαρακτηριστικ? (υπ?ρχουν ? δεν υπ?ρχουν). Τα χαρακτηριστικ? που προκ?πτουν μπορο?ν να βρεθο?ν στο τ?λο? τη? εργασ?α?. (Παρ?ρτημα – σελ. 118 )Β?μβε?Οι β?μβε? (ε?τε καρ? ? κ?ντα ?διο χρ?μα) μοντελοποιο?νται και αυτ?? σαν μια λ?στα χαρακτηριστικ?ν. Τα χαρακτηριστικ? αυτ? προκ?πτουν απ? τα παραπ?νω ω? εξ??: Βρ?σκουμε χαρακτηριστικ? για τι? κ?ντε? ?διου χρ?ματο? με τον τρ?πο που περιγρ?ψαμε παραπ?νω για τι? κανονικ?? κ?ντε? απλ? λαμβ?νοντα? υπ?ψη και το χρ?μα. Στη συν?χεια δημιουργο?με ?λλο ?να χαρακτηριστικ? που ε?ναι ο συνολικ?? αριθμ?? βομβ?ν του “χεριο?” ?που λαμβ?νεται υπ?ψη και ο αριθμ?? των καρ? στο “χ?ρι” (μ?χρι 2 για τη στιγμ? τη? δ?λωση? Grand Tichu) και το οπο?ο κανονικοποιε?ται και αυτ? σε ε?ρο? τιμ?ν 0 ?ω? 1.Τα χαρακτηριστικ? που προκ?πτουν μπορο?ν να βρεθο?ν στο τ?λο? τη? εργασ?α? (βλ. Παρ?ρτημα 1 σελ. 118)Επιλογ? επιπλ?ων χαρακτηριστικ?νΣτο Tichu, ?πω? ?χει αναφερθε? και παραπ?νω, νικ?τρια ομ?δα ε?ναι η ομ?δα η οπο?α θα φτ?σει πρ?τη του? 1000 π?ντου? (? η ομ?δα που θα ?χει του? παραπ?νω π?ντου? ?μα και οι δ?ο ομ?δε? φτ?σουν του? 1000 π?ντου? στον ?διο γ?ρο). Αυτ? σημα?νει ?τι κατ? τη δι?ρκεια του παιχνιδιο? ?να? πα?κτη? μπορε? να ε?ναι περισσ?τερο ? λιγ?τερο δεκτικ?? στο να δηλ?σει Grand Tichu, ακ?μα και με το ?διο ?χ?ρι?, αν?λογα με τη φ?ση του παιχνιδιο? και τη διαφορ? στη βαθμολογ?α. Για παρ?δειγμα, αν οι π?ντοι τη? ομ?δα? Α ε?ναι 500 και οι π?ντοι τη? ομ?δα? Β ε?ναι 500 πριν τη δ?λωση Grand Tichu σε ?ναν γ?ρο ?να? πα?κτη? τη? ομ?δα? Α θα ε?ναι πιο διστακτικ?? στο να δηλ?σει Grand Tichu απ? ?τι θα ?ταν ε?ν οι π?ντοι τη? ομ?δα? Α ?ταν -100 και τη? ομ?δα? Β 700, ?που θα θεωρο?σε πιο δελεαστικ? να ρισκ?ρει με σκοπ? να μει?σει τη διαφορ? των π?ντων σε περ?πτωση επιτυχο?? δ?λωση?. Απ? την ?λλη, στο τελευτα?ο σεν?ριο ?να? πα?κτη? τη? ομ?δα? Β θα ?ταν πιο διστακτικ?? στο να δηλ?σει Grand Tichu γιατ? μια αποτυχημ?νη δ?λωση θα απομ?κρυνε την ομ?δα του πολ? απ? τον στ?χο των 1000 π?ντων. Με μ?α τ?τοια διαφορ? απ? την ομ?δα Α και με απ?σταση μ?λι? 300 π?ντων απ? του? 1000 ?να πιο συντηρητικ? στυλ παιχνιδιο?, ?που οι δηλ?σει? Grand Tichu μει?νονται και αυξ?νονται οι δηλ?σει? Tichu ? ακ?μα και καμ?α δ?λωση ε?ναι κ?τι το οπο?ο περιμ?νουμε απ? τον πα?κτη τη? ομ?δα? Β.Με β?ση τα παραπ?νω και την εμπειρ?α μα? στο παιχν?δι Tichu, αποφασ?σαμε να επιλ?ξουμε τη προσθ?κη δ?ο χαρακτηριστικ?ν για να περιγρ?ψουν το σκορ των δ?ο ομ?δων τη στιγμ? που κ?θε πα?κτη? καλε?ται να δηλ?σει ? ?χι Grand Tichu με ?να συγκεκριμ?νο “χ?ρι”. Τα χαρακτηριστικ? αυτ? ε?ναι οι π?ντοι τη? αντ?παλη? ομ?δα? και τη? ομ?δα? του πα?κτη αντ?στοιχα. Αφο? ?χουμε κανονικοποι?σει ?λα τα χαρακτηριστικ? με τιμ?? 0 ε?? 1, κ?ναμε το ?διο και εδ? θεωρ?ντα? ω? 0 το να βρ?σκεται μ?α ομ?δα στου? -1000 π?ντου?, καθ?? θεωρο?με ?τι οτιδ?ποτε πιο χαμηλ? απ? του? -1000 π?ντου? θα ?χει το ?διο αποτ?λεσμα στο να επηρε?σει ?ναν πα?κτη κατ? τη δι?ρκεια δ?λωση? Grand Tichu ?σο οι -1000 π?ντοι. Με το ?διο σκεπτικ? οι 1000 π?ντοι αντιστοιχο?ν στο 1 και ?ρα τα δ?ο χαρακτηριστικ? που προκ?πτουν ε?ναι:94. Σκορ αντ?παλη? ομ?δα?: #Π?ντ?ν αντ?παλη? ομ?δα? (min: -1000, max:1000) + 1000200095. Σκορ δικ?? μα? ομ?δα?: #Π?ντ?ν δικ?? μα? ομ?δα? (min: -1000, max:1000) + 10002000Αυτ? τα 95 χαρακτηριστικ? ε?ναι τα χαρακτηριστικ? τα οπο?α χρησιμοποιο?νται για την εκπα?δευση των ευφυ?ν συστημ?των που θα περιγρ?ψουμε στο κεφ?λαιο που ακολουθε?.Κεφ?λαιο 7Η επιλογ? και η εκπα?δευση των ευφυ?ν συστημ?τωνΕπιλογ? ευφυ?ν συστημ?των?πω? ?χει αναφερθε? παραπ?νω, σκοπ?? μα? ε?ναι η δημιουργ?α κ?ποιων ομαδοποιητ?ν που θα διαλ?γουν τη δ?λωση ? μη Grand Tichu δεδομ?νων των χαρακτηριστικ?ν που περιγρ?φηκαν παραπ?νω. Επ?ση? θ?λουμε να λ?βουμε ω? παρ?μετρο την επιθυμ?α μα? για τη δημιουργ?α τρι?ν στυλ πρακτ?ρων αν?λογα με την επιθετικ?τητα του?. ?τσι, ?να? πρ?κτορα? θα δηλ?νει Grand Tichu με μεγαλ?τερη ευκολ?α, ε?ν ε?ναι επιθετικ?? και με μεγαλ?τερη δυσκολ?α ε?ν ε?ναι διστακτικ??. Συνεπ??, η αναζ?τηση για την επιλογ? ευφυ?ν συστημ?των επικεντρ?θηκε στην ε?ρεση συστημ?των τα οπο?α θα μα? δ?νουν ω? αποτελ?σματα βαθμονομημ?νε? πιθαν?τητε?, που μπορο?ν να ερμηνευτο?ν ω? εμπιστοσ?νη σε μια απ?φαση. Με αυτ?ν τον τρ?πο θα μπορο?με να δημιουργ?σουμε δι?φορου? πρ?κτορε? οι οπο?οι για τιμ?? π?νω απ? διαφορετικ? κατ?φλια εμπιστοσ?νη? (τιμ?? εμπιστοσ?νη? αν?μεσα στο μηδ?ν και το ?να) θα δηλ?νουν Grand Tichu, εν? για τιμ?? κ?τω απ? αυτ? τα κατ?φλια δε θα δηλ?νουν Grand Tichu. Επιλ?ξαμε να χρησιμοποι?σουμε δ?ο μοντ?λα επιτηρο?μενη? μηχανικ?? μ?θηση?: το μοντ?λο τη? Λογιστικ?? Παλινδρ?μηση? (Logistic Regression Model) και το μοντ?λο των Μηχαν?ν Διανυσμ?των Υποστ?ριξη? με παλινδρ?μηση (Support Vector Regression Model). Οι αλγ?ριθμοι και ο τρ?πο? λειτουργ?α? αυτ?ν των δ?ο μοντ?λων θα περιγρ?φουν αναλυτικ? στη συν?χεια. Τα μοντ?λα αυτ? επιστρ?φουν μια τιμ? εμπιστοσ?νη? και ?ρα μπορο?ν να χρησιμοποιηθο?ν σαν ομαδοποιητ?? με τη χρ?ση εν?? κατωφλ?ου. Κ?θε τιμ? π?νω απ? το επιλεγμ?νο κατ?φλι οδηγε? σε δ?λωση Grand Tichu, εν? κ?θε τιμ? κ?τω απ? το επιλεγμ?νο κατ?φλι οδηγε? σε μη δ?λωση Grand Tichu για ?να συγκεκριμ?νο χ?ρι 8 καρτ?ν. Για την εκπα?δευση των παραπ?νω μοντ?λων χρησιμοποι?θηκαν τα ?δια δεδομ?να εκπα?δευση? και τα ?δια δεδομ?να δοκιμ??.Επιλογ? Μ?τρων Απ?δοση?Για τον ?λεγχο τη? απ?δοση? των μοντ?λων χρησιμοποι?θηκαν τ?σσερα μ?τρα απ?δοση?. Κ?θε μοντ?λο, αν?λογα με την επιλογ? του ? ?χι να δηλ?σει Grand Tichu σε ?να χ?ρι σε σχ?ση με το αν δ?λωσε ? ?χι Grand Tichu στο ?διο χ?ρι ο αληθιν?? ανθρ?πινο? πα?κτη?, ?χει τα εξ?? δυνατ? αποτελ?σματα για την επιλογ? του: ορθ?? θετικ? (true positive - TP), ψευδ?? θετικ? (false positive - FP), ορθ? αρνητικ? (true negative - TN) και ψευδ?? αρνητικ? (false negative - FN) δ?λωση. Δηλαδ? σε περ?πτωση που το μοντ?λο προβλ?ψει ?τι ?να? πα?κτη? δεν ?χει δηλ?σει Grand Tichu και αυτ?? ?χει δηλ?σει τ?τε το αποτ?λεσμα ε?ναι ψευδ?? αρνητικ? δ?λωση του μοντ?λου, μια? και θα ?πρεπε να ε?ναι θετικ?. Αν ο πα?κτη? δηλ?σει Grand Tichu και το μοντ?λο προβλ?ψει σωστ? τη δ?λωση αυτ? τ?τε το αποτ?λεσμα ε?ναι μια ορθ? θετικ? δ?λωση.Τα π?ντε μ?τρα απ?δοση? των μοντ?λων που χρησιμοποι?θηκαν ε?ναι τα εξ?? CITATION Εμμ16 \p 5-6 \l 1032 (Παπαδ?κη?, 2016, σσ. 5-6) : ορθ?τητα δηλ?σεων (accuracy), ακρ?βεια δηλ?σεων (precision), αν?κληση (recall), η βαθμολογ?α F1 (F1 score) και η χαρακτηριστικ? καμπ?λη λειτουργ?α? του δ?κτη (receiver operating characteristic curve - Καμπ?λη ROC) ?που:ορθ?τητα δηλ?σεων (accuracy):# ορθ?ν προβλ?ψεων # συνολικ?? αριθμ?? προβλ?ψεων = #(TP + TN)#(TP+FP+TN+FN)ακρ?βεια δηλ?σεων (precision):# ορθ?ν προβλ?ψεων # θετικ?ν προβλ?ψεων = #TP#(TP+FP) αν?κληση recall:# ορθ?ν προβλ?ψεων # ορθ?ν θετικ?ν και ψευδ?ν αρνητικ?ν προβλ?ψεων = #TP#TP+FΝβαθμολογ?α F1 (F1 score):2 ×αν?κληση × ακρ?βεια θετικ?ν δηλ?σεων αν?κληση + ακρ?βεια θετικ?ν δηλ?σεων = 2 ×recall × precision recall + precision Η βαθμολογ?α F1 δηλαδ? προκ?πτει απ? τον σταθμισμ?νο μ?σο ?ρο τη? ακρ?βεια? δηλ?σεων και τη? αν?κληση?. Επομ?νω?, αυτ? η βαθμολογ?α λαμβ?νει υπ?ψη τ?σο τα ψευδ?? θετικ? ?σο και τα ψευδ?? αρνητικ?. Διαισθητικ? δεν ε?ναι τ?σο ε?κολο να καταλ?βει κανε?? τη βαθμολογ?α F1, ?σο ε?ναι να καταλ?βει την ακρ?βεια των δηλ?σεων, αλλ? η βαθμολογ?α F1 ε?ναι συν?θω? πιο χρ?σιμη απ? την ακρ?βεια των δηλ?σεων, ειδικ? αν υπ?ρχει μια ανομοιογεν?? ταξικ? κατανομ?. Η χαρακτηριστικ? καμπ?λη λειτουργ?α? του δ?κτη προκ?πτει απ? τη γραφικ? παρ?σταση του ποσοστο? ψευδ?ν θετικ?ν προβλ?ψεων με το ποσοστ? των ορθ?ν θετικ?ν προβλ?ψεων για κ?θε τιμ? του κατωφλ?ου. ?να ?τ?λειο? μοντ?λο ταξινομε? σωστ? ?λε? τι? δηλ?σει?, δηλαδ? οι βαθμολογ?ε? που αποδ?δει στα χ?ρια ?που ?γινε δ?λωση Grand Tichu, ε?ναι π?ντα υψηλ?τερε? απ? τι? βαθμολογ?ε? στα χ?ρια ?που δεν ?γινε δ?λωση Grand Tichu. Για το μοντ?λο αυτ?, η καμπ?λη ROC ε?ναι μια ευθε?α παρ?λληλη στον ?ξονα x. Αντ?θετα, για ?να ανεπαρκ?? μοντ?λο η καμπ?λη ROC ε?ναι μια ευθε?α γραμμ? που ξεκιν? απ? την αρχ? των αξ?νων . Τ?λο?, η καμπ?λη ROC εν?? ικανοποιητικο? μοντ?λου βρ?σκεται στο ενδι?μεσο των δ?ο περιπτ?σεων.Κριτ?ριο για την αποτελεσματικ?τητα εν?? μοντ?λου λοιπ?ν, αποτελε? η μορφ? τη?καμπ?λη? ROC και συγκεκριμ?να το εμβαδ?ν τη? περιοχ?? κ?τω απ? την καμπ?λη(AUC, Area Under Curve). Προφαν?? το εμβαδ?ν κ?τω απ? την καμπ?λη για ?να?τ?λειο? μοντ?λο θα λαμβ?νει την τιμ? 1, εν? για ?να ανεπαρκ?? δεν θα υπερβα?νειτο 0.5. Για ?να ικανοποιητικ? μοντ?λο το εμβαδ?ν κ?τω απ? την καμπ?λη κυμα?νεταιμεταξ? του 0.5 και 1, με υψηλ?τερε? τιμ?? να υποδεικν?ουν υψηλ?τερηαποτελεσματικ?τητα. CITATION Κυρ14 \p 69-70 \l 1032 (Κυρ?τση?, 2014, σσ. 69-70)Μηχαν?? Διανυσμ?των Υποστ?ριξη? Οι Μηχαν?? Διανυσμ?των Υποστ?ριξη? (SVM) αποτελο?ν ?να εργαλε?ο για την επεξεργασ?α δεδομ?νων και βασ?ζονται στην στατιστικ? θεωρ?α εκμ?θηση?. Αναπτ?χθηκαν απ? τον Vapnik και την Cortes το 1995. Η αρχ? των SVM μπορο?με να πο?με ?τι ?γινε με το CITATION Vap79 \l 1032 (Vapnik V., 1979) π?νω στην θεωρ?α στατιστικ?? εκμ?θηση? (statistical learning theory) και ειδικ? με την περαιτ?ρω αν?πτυξη αυτ?? τη? θεωρ?α? απ? τον Vapnik. Η αρχ? τη? μεθ?δου ?γκειται στο διαχωρισμ? κλ?σεων (σ?νολο σημε?ων με ?δια ιδι?τητα) με επ?πεδα (υπερεπ?πεδα) και με β?ση αυτ?ν το διαχωρισμ? γ?νεται η κατ?ταξη εν?? ν?ου σημε?ου σε κ?ποια απ? τι? κλ?σει? που διαχωρ?στηκαν. Η τεχνικ? αυτ? ?ρχισε πολ? γρ?γορα να αναπτ?σσεται και απ? ?λλου? επιστ?μονε? σε ?ρθρα ?πω? στο CITATION JKA89 \l 1032 (J. K. Anlauf, 1989) ?που πρ?τειναν τα υπερεπ?πεδα διαχωρισμο? με μ?γιστο δι?κενο, στο CITATION TPo90 \l 1032 (T. Poggio, 1990) ?που μελετ?ται η χρ?ση των συναρτ?σεων κελ?φου? και στο CITATION Bos92 \l 1033 (Boser, 1992) ?που τα SVM περ?που με τη μορφ? που τα γνωρ?ζουμε προτ?θηκαν στο συν?δριο COLT. Η αν?πτυξη τη? μεθ?δου συνεχ?στηκε και στο CITATION Cor95 \l 1033 (Cortes C., 1995), χ?ρη στου? οπο?ου? ?χουμε την μελ?τη που αναπτ?σσει του? διαχωριστ?? “χαλαρο?” διακ?νου (soft margin classifiers) ?πω? επ?ση? καιτην επ?κταση των SVM στα προβλ?ματα προσ?γγιση? συν?ρτηση? (παλινδρ?μηση - regression) CITATION Vap95 \l 1033 (Vapniκ, 1995).Η αρχικ? ιδ?α των γραμμικ?ν SVM ταξινομητ?ν ε?ναι να χρησιμοποιηθε? ?να γραμμικ? διαχωριστικ? υπερεπ?πεδο για να δημιουργηθε? ?να? ταξινομητ?? που θα διαχωρ?ζει τι? δ?ο κλ?σει?. Πα?ρνοντα? ω? δεδομ?νο ?να σ?νολο διανυσμ?των xi, i = 1,...l μ?κου? n, και ?να δι?νυσμα y ?που το yi ?χει την τιμ? 1, αν το xi αν?κει στη κλ?ση ?να και -1 αν το xi αν?κει στη κλ?ση δ?ο. Ο SVM ταξινομητ?? προσπαθε? να βρει το διαχωριστικ? υπερεπ?πεδο με το μεγαλ?τερο περιθ?ριο μεταξ? των δ?ο κλ?σεων, που μετρ?ται κατ? μ?κο? μια? κ?θετη? προ? το υπερεπ?πεδο γραμμ??. Για παρ?δειγμα, στο παρακ?τω σχ?μα οι δ?ο κλ?σει? θα μπορο?σαν να διαχωριστο?ν πλ?ρω? απ? μια διακεκομμ?νη γραμμ? wTx + b = 0. Ζητο?μενο ε?ναι να βρεθε? η γραμμ? με το μεγαλ?τερο περιθ?ριο, δηλαδ? η απ?σταση μεταξ? των δ?ο κλ?σεων των δεδομ?νων εκπα?δευση? να ε?ναι ?σο το δυνατ?ν μεγαλ?τερη. CITATION Δαν14 \p 47-48 \l 1032 (Γιαννο?λη, 2014, σσ. 47-48)7-1 Διαχωριστικ? υπερεπ?πεδο, CITATION Δαν14 \p 48 \l 1032 (Γιαννο?λη, 2014, σ. 48)Η απ?σταση μεταξ? των wTx + b = 1 και wTx + b = -1 υπολογ?ζεται με τον ακ?λουθο τρ?πο:Θεωρο?με ?να σημε?ο xστο wTx + b = -1?στω wτο κ?θετο στο υπερεπ?πεδο wTx + b = -1 δι?νυσμα.Ξεκιν?ντα? απ? το x και κινο?μενοι κατ? μ?κο? τη? κατε?θυνση? w υποθ?τουμε ?τι x+ tw αγγ?ζει το επ?πεδο wTx + b = 1. Αφο? wT(x+ tw) + b = 1και wTx + b = -1 ?χουμε ?τι twTw =27-2 Απ?σταση μεταξ? κλ?σεων, CITATION Δαν14 \p 48 \l 1032 (Γιαννο?λη, 2014, σ. 48)Οπ?τε η απ?σταση (δηλαδ? το μ?κο? του tw) ε?ναι tw=2 wwTw =2 w. Η ελαχιστοπο?ηση του 2 w ε?ναι ισοδ?ναμη με τη μεγιστοπο?ηση του wTw2, επομ?νω? ?χουμε το ακ?λουθο πρ?βλημα: minw,b12wTw με yi(wTx + b) ≥ 1, i= 1,...,l. Πρ?πει λοιπ?ν τα δεδομ?να τη? κλ?ση? ?να να ε?ναι στη δεξι? πλευρ? του wTx + b = 0, εν? τα δεδομ?να τη? ?λλη? κλ?ση? στην αριστερ?. Σημει?νουμε ?τι ο λ?γο? τη? μεγιστοπο?ηση? τη? απ?σταση? μεταξ? wTx + b= ±1 βασ?ζεται στον Vapnik. Ωστ?σο, πρακτικ? προβλ?ματα μπορε? να μην ε?ναι γραμμικ? διαχωρ?σιμα με τον τρ?πο που περιγρ?φεται στην προηγο?μενη παρ?γραφο. ?τσι οι Cortes και Vapnik στο CITATION Cor95 \l 1032 (Cortes C., 1995) εισ?γαγαν τι? χαλαρ?? μεταβλητ?? ξi, i=1, ... ,l στο πρ?βλημα ελαχιστοπο?ηση? και ?ρα το πρ?βλημα πλ?ον μετατρ?πεται σε minw,b,ξ 12wTw +Ci = 1l ξi με yi(wTx + b) ≥ 1- ξi, i= 1,...,l , ?που “επιτρ?πεται” στα δεδομ?να εκπα?δευση? να μην ε?ναι στη σωστ? πλευρ? του διαχωριστικο? υπερεπ?πεδου wTx + b = 0. Αυτ? συμβα?νει ?ταν ξi ≥1και ?να παρ?δειγμα ε?ναι το παρακ?τω σχ?μα:7-3 Διαχωριστικ? υπερεπ?πεδο με χαλαρ?? μεταβλητ??, CITATION Δαν14 \p 51 \l 1032 (Γιαννο?λη, 2014, σ. 51)Το ν?ο πρ?βλημα ?πω? περιγρ?φηκε ε?ναι π?ντα εφικτ? αφο? για κ?θε w,b ?χουμεξi ≡max(0,1 -yi(wTx + b)), i = 1, ... , l και οδηγο?μαστε στο (w,b, ξ)που ε?ναι εφικτ? λ?ση.Χρησιμοποι?ντα? αυτ? τη ρ?θμιση, μπορε? να ανησυχο?με ?τι για γραμμικ? διαχωρ?σιμα δεδομ?να, κ?ποια ξi> 1 και ω? εκ το?του τα αντ?στοιχα δεδομ?να ε?ναι λ?θο? ταξινομημ?να. Στην περ?πτωση που τα περισσ?τερα δεδομ?να, εκτ?? απ? κ?ποια θορυβ?δη , μπορο?ν να διαχωριστο?ν απ? μια γραμμικ? συν?ρτηση, θα θ?λαμε το w x + b να ταξινομε? σωστ? την πλειοψηφ?α των σημε?ων. ?τσι, στην αντικειμενικ? συν?ρτηση προσθ?τουμε ?ναν ?ρο ποιν?? Ci = 1l ξi, ?που C> 0 ε?ναι μια παρ?μετρο? ποιν??. Για να ?χουμε την αντικειμενικ? αξ?α ?σο το δυνατ?ν μικρ?τερη, τα περισσ?τερα ξi πρ?πει να ε?ναι μηδ?ν, ?τσι ?στε ο περιορισμ?? να πα?ρνει την αρχικ? του μορφ?. Θεωρητικ? μπορο?με να αποδε?ξουμε ?τι αν τα δεδομ?να ε?ναι γραμμικ? διαχωρ?σιμα και το C ε?ναι μεγαλ?τερο απ? ?να συγκεκριμ?νο αριθμ? ?λα τα ξi ε?ναι μηδ?ν. Δηλαδ? για μεγ?λο C, το περιθ?ριο ε?ναι μικρ? και ?ρα τα λ?θη ε?ναι μικρ?, εν? για μικρ? C, το περιθ?ριο ε?ναι μεγ?λο και ?ρα τα λ?θη ε?ναι μεγ?λα. Δυστυχ?? μια τ?τοια ρ?θμιση δεν ε?ναι αρκετ?, γιατ? αν τα δεδομ?να καταν?μονται με ?να μη γραμμικ? τρ?πο, χρησιμοποι?ντα? μ?νο μια γραμμικ? συν?ρτηση πολλ? δεδομ?να εκπα?δευση? ε?ναι στη λ?θο? πλευρ? του υπερεπιπ?δου. ?τσι εμφαν?ζεται λ?θο? τοποθ?τηση και η συν?ρτηση απ?φαση? δεν αποδ?δει καλ?. Για να τοποθετ?σουμε τα δεδομ?να κατ?ρτιση? καλ?τερα, μπορο?με να σκεφτο?με τη χρ?ση μια? μη γραμμικ?? καμπ?λη?. ?λλη μια προσ?γγιση ε?ναι να χαρτογραφ?σουμε τα δεδομ?να σε ?να χ?ρο υψηλ?τερων διαστ?σεων, ?πω? φα?νεται στο επ?μενο σχ?μα. 7-4 Κλ?σει? γραμμικ?? διαχωρ?σιμε? στο χ?ρο R2, αλλ? μη γραμμικ?? διαχωρ?σιμε? στο χ?ρο R1, CITATION Δαν14 \p 52 \l 1032 (Γιαννο?λη, 2014, σ. 52)?τσι, μη γραμμικ?? μηχαν?? διανυσμ?των υποστ?ριξη? μετατρ?πουν τον αρχικ? χ?ρο εισ?δου σε ?ναν υψηλ?τερων διαστ?σεων χ?ρο των χαρακτηριστικ?ν. Πιο συγκεκριμ?να, το δεδομ?νο εκπα?δευση? xχαρτογραφε?ται σε ?να δι?νυσμα σε ?να χ?ρο υψηλ?τερων διαστ?σεων φ(x) = [φ(x1), φ(x2), ...]. Σε αυτ?ν το χ?ρο υψηλ?τερων διαστ?σεων, ε?ναι πιο πιθαν? τα δεδομ?να να μπορο?ν να διαχωριστο?ν γραμμικ?. CITATION Δαν14 \p 50-52 \l 1032 (Γιαννο?λη, 2014, σσ. 50-52)Οι πυρ?νε? ? συναρτ?σει? πυρ?νων που χρησιμοποιο?νται στι? μηχαν?? διανυσμ?των υποστ?ριξη? για χαρτογρ?φηση ε?ναι οι εξ??:Γραμμικ?? πυρ?να? (Linear Kernel): K(?,?) = ? * ? + γ, ?που η παρ?μετρο? γ καθορ?ζεται απ? το χρ?στη. Αυτ?? ο τ?πο? πυρ?να ?χει εφαρμογ? μ?νο σε γραμμικ?? διαχωρ?σιμα προβλ?ματα.7-5 Παρ?δειγμα γραμμικο? πυρ?να, ?που τα σημε?α που περικλε?ονται με τετραγωνικ? πλα?σιο αποτελο?ν διαν?σματα υποστ?ριξη?, CITATION Δαν14 \p 56 \l 1032 (Γιαννο?λη, 2014, σ. 56)Πολυωνυμικ?? πυρ?να? (Polynomial Kernel): K(?,?) = (?,?' + 1) p, ?που η παρ?μετρο? p καθορ?ζεται απ? τον χρ?στη. Στο παρακ?τω σχ?μα φα?νεται η σαφ?? μεγαλ?τερη διαχωριστικ? ικαν?τητα του SVM πολυωνυμικο? πυρ?να.7-6 Παρ?δειγμα διαχωρισμο? μη-γραμμικο? προβλ?ματο? με χρ?ση SVMs γραμμικο? (διακεκομμ?νη) και πολυωνυμικο? πυρ?να (συνεχ?? γραμμ?), CITATION Δαν14 \p 56 \l 1032 (Γιαννο?λη, 2014, σ. 56)Ακτινωτ?? πυρ?να? (Radial Basis Function (RBF) ? Gaussian Kernel): K(?,?) = e-? -?' 2 s2 , ?που η παρ?μετρο? σ καθορ?ζεται απ? τον χρ?στη.7-7 Αριστερ? υπ?-εικ?να: Διαχωρισμ?? με ακτινωτ? πυρ?να στον αρχικ? χ?ρο. Δεξι? υπ?-εικ?να: Γραμμικ?? διαχωρισμ?? σε χ?ρο υψηλ?τερη? δι?σταση? με τη βο?θεια μετασχηματισμο? ακτινωτο? πυρ?να, CITATION Δαν14 \p 57 \l 1032 (Γιαννο?λη, 2014, σ. 57)Σιγμοειδ?? πυρ?να? (Sigmoid Kernel): K(?,?) =tanh (κ * ? *?' + θ), ?που κ,θοι παρ?μετροι των πυρ?νων. CITATION Δαν14 \p 54-57 \l 1032 (Γιαννο?λη, 2014, σσ. 54-57)Μηχαν?? Διανυσμ?των Υποστ?ριξη? με παλινδρ?μησηΠαρ?μοια με την ταξιν?μηση μοντ?λων διανυσματικ?? υποστ?ριξη?, τα μοντ?λαπαλινδρ?μηση? με διαν?σματα υποστ?ριξη? (Support Vector Regression models - SVR) ?χουν ?ναν αριθμ? ελε?θερων παραμ?τρων που πρ?πει να ε?ναι συντονισμ?νε?. Αυτ?? οι παρ?μετροι ε?ναι οι πυρ?νε? Κ με τι? αντ?στοιχε? παραμ?τρου? λ, η παρ?μετρο? ε, και η σταθερ? κ?στου? C. Οι τεχνικ?? που ισχ?ουν στι? μηχαν?? διανυσμ?των υποστ?ριξη? μεταφ?ρονται στα μοντ?λα παλινδρ?μηση? με διαν?σματα υποστ?ριξη?, με τη διαφορ? ?τι η συν?ρτηση απ?λεια? 0-1 αντικαθ?σταται απ? μια συν?ρτηση απ?λεια? που υπολογ?ζει π?σο καλ? το μοντ?λο ταιρι?ζει με τι? παρατηρ?σει?. Δηλαδ?, αντ? να μετρ?με π?σο εσφαλμ?νη ε?ναι η ταξιν?μηση, μετρ?με π?σο διαφορετικ? ε?ναι η προβλεπ?μενη τιμ? απ? τηνπαρατηρο?μενη τιμ?. Η πιο κοιν? εκτ?μηση σφ?λματο? για τη συν?ρτηση παλινδρ?μηση? ε?ναι το μ?σοτετραγωνικ? σφ?λμα (MSE). Ορ?ζουμε μια συν?ρτηση απ?λεια? L2 που υπολογ?ζει το τετρ?γωνο του υπολο?που για μ?α παρατ?ρηση (x,y) δοθ?ντο? εν?? μοντ?λου f, L2(y,f(x)) = (y-f(x))2 και εν?? συν?λου εκπα?δευση? για την παλινδρ?μηση D ={(x1,y1),(x2,y2),...,(xl,yl)} ? Rn ×R ορ?ζουμε το μ?σο τετραγωνικ? σφ?λμα υπολογισμ?νο στο D, MSEDfdk,λ,ε,C=1li=1l L2(yi,fdk,λ,ε,C(xi)),(xi,yi) ∈D. Σε αυτ? την περ?πτωση μπορο?με να ερμηνε?σουμε το μ?σο τετραγωνικ? σφ?λμα ω? τη μ?ση απ?λεια L2του μοντ?λου fd, απ? τα δεδομ?να του συν?λου D. Θα πρ?πει να αναφερθε??τι μια ?λλη δημοφιλ?? μ?θοδο? προσδιορισμο? του σφ?λματο? εν?? μοντ?λουπαλινδρ?μηση? ε?ναι η ρ?ζα του μ?σου τετραγωνικο? σφ?λματο? (root-mean-squarederror) που προ?ρχεται απ? το μ?σο τετραγωνικ? σφ?λμα απλ? με τη λ?ψη τη?τετραγωνικ?? του ρ?ζα?. CITATION Δαν14 \p 72-73 \l 1032 (Γιαννο?λη, 2014, σσ. 72-73)Στο παρακ?τω σχ?μα, προβ?λλεται ?να μονοδι?στατο μοντ?λο SVR. Μ?νο τα σημε?α π?νω και κ?τω απ? τι? διακεκομμ?νε? γραμμ?? χρησιμοποιο?νται για την διαδικασ?α πρ?βλεψη?. 7-8 Γρ?φημα εν?? μονοδι?στατου μοντ?λου μηχαν?? διανυσμ?των υποστ?ριξη? με παλινδρ?μηση, CITATION Tan17 \p 8 \l 1033 (Tania Kleynhans, 2017, p. 8)Μοντ?λο Μηχαν?ν Διανυσμ?των Υποστ?ριξη? με παλινδρ?μησηΓια τη δημιουργ?α του μοντ?λου Μηχαν?? Διανυσμ?των Υποστ?ριξη? με παλινδρ?μηση (Support Vector Regression Model - SVR) χρησιμοποι?θηκε η βιβλιοθ?κη scikit learn τη? Python, και συγκεκριμ?να η κλ?ση sklearn.svm.SVR CITATION Sci19 \l 1032 (SciKit Learn SVM). Η κλ?ση αυτ? παρ?χει ?λε? τι? απαρα?τητε? μεθ?δου? για την εκπα?δευση του μοντ?λου με τη χρ?ση των δεδομ?νων εκπα?δευση?, αλλ? και για τη χρησιμοπο?ησ? του για εξαγωγ? αποτελεσμ?των π?νω στα δεδομ?να δοκιμ??. Με β?ση τι? μελ?τε? των CITATION Car03 \l 1032 (Staelin, 2003) και CITATION Chi03 \l 1032 (Chih-Wei Hsu, 2003) οι παρ?μετροι οι οπο?ε? χρησιμοποι?θηκαν για να διαφοροποι?σουμε τα δι?φορα μοντ?λα Μηχαν?ν Διανυσμ?των Υποστ?ριξη? που χρησιμοποιο?με ε?ναι οι υπερ-παρ?μετροι C και γ. Η παρ?μετρο? C ε?ναι η παρ?μετρο? τη? ποιν?? του ?ρου λ?θου? και η παρ?μετρο? γ ε?ναι ο συντελεστ?? πυρ?να για τον πυρ?να που επιλ?ξαμε, δηλαδ? τον πυρ?να Ακτινικ?? λειτουργ?α? β?ση? (Radial Basis Function kernel – RBF kernel). ?να γραμμικ? SVR, δηλαδ? ?να SVR χωρ?? πυρ?να, ?χει μ?νο μια ουσιαστικ? διαφορ? απ? το μοντ?λο γραμμικ?? παλινδρ?μηση? – το ?τι χρησιμοποιε? μ?νο το υποσ?νολο των δεδομ?νων που βρ?σκονται μακρι? απ? τη γραμμ? διαχωρισμο? και ?τι η βελτιστοπο?ηση του μοντ?λου SVR δεν εξαρτ?ται απ? τι? διαστ?σει? του χ?ρου εισ?δου.Διαισθητικ?, η παρ?μετρο? γ καθορ?ζει π?σο μεγ?λη ε?ναι η επιρρο? εν?? μ?νο παραδε?γματο? εκπα?δευση?. Χαμηλ?? τιμ?? του γ σημα?νουν μεγ?λη επιρρο?, εν? υψηλ?? τιμ?? σημα?νουν μικρ?τερη επιρρο?. Η παρ?μετρο? γ λοιπ?ν μπορε? να θεωρηθε? ω? το αντ?στροφο τη? ακτ?να? επιρρο?? των δειγμ?των που επιλ?γονται απ? το μοντ?λο ω? διαν?σματα υποστ?ριξη?. Η παρ?μετρο? C ανταλλ?σει τη σωστ? ταξιν?μηση των παραδειγμ?των εκπα?δευση? ?ναντι στη μεγιστοπο?ηση του περιθωρ?ου τη? συν?ρτηση? λ?ψη? τη? απ?φαση?. Για μεγαλ?τερε? τιμ?? του C, ?να μικρ?τερο περιθ?ριο θα γ?νει αποδεκτ? αν η συν?ρτηση λ?ψη? τη? απ?φαση? ε?ναι καλ?τερη στη σωστ? ταξιν?μηση ?λων των σημε?ων κατ?ρτιση?. Μια χαμηλ?τερη τιμ? τη? παραμ?τρου C ενθαρρ?νει ?να μεγαλ?τερο περιθ?ριο, επομ?νω? μ?α απλοποιημ?νη συν?ρτηση λ?ψη? αποφ?σεων, μει?νοντα? ?μω? την ακρ?βεια του μοντ?λου που εκπαιδε?ουμε. Παρατηρε?ται ?τι για κ?ποιε? ενδι?μεσε? τιμ?? τη? παραμ?τρου γ πα?ρνουμε εξ?σου αποτελεσματικ? μοντ?λα ?ταν η παρ?μετρο? C γ?νεται πολ? μεγ?λη. Δεν ε?ναι απαρα?τητο να επιβληθε? μεγαλ?τερο περιθ?ριο. Η ακτ?να του πυρ?να RBF λειτουργε? απ? μ?νη τη? ω? καλ?? διαρθρωτικ?? κανονιστ??. Στην πρ?ξη ?μω? θα ?ταν ενδιαφ?ρον να απλοποιηθε? η συν?ρτηση λ?ψη? αποφ?σεων με μια μικρ?τερη τιμ? τη? παραμ?τρου C ?στε να ευνοηθο?ν τα μοντ?λα που χρησιμοποιο?ν λιγ?τερη μν?μη και ε?ναι πιο γρ?γορα στο να επιλ?γουν αποτελ?σματα. Με β?ση τι? δ?ο μελ?τε? που αναφ?ρθηκαν παραπ?νω επιλ?ξαμε να γ?νει η εκπα?δευση των μοντ?λων με χρ?ση αναζ?τηση? δικτ?ου (grid search) με τι? παραμ?τρου? C και γ να πα?ρνουν τιμ?? log2C ∈{-5,-4,...,15}και log2γ ∈{-15,-14,...,3}.Επ?ση? χρησιμοποι?θηκε η διαδικασ?α διασταυρο?μενη? επικ?ρωση? 10-φορ?ν, δηλαδ? το δε?γμα κατανεμ?θηκε τυχα?α σε 10 ισ?ποσα υπ?-δε?γματα. Απ? τα υπo-δε?γματα αυτ?, διατηρ?θηκε ?να υπo-δε?γμα ω? δεδομ?νο επικ?ρωση? για τη δοκιμ? του μοντ?λου και τα υπ?λοιπα 9 υπo-δε?γματα ω? δεδομ?να εκπα?δευση?. Στη συν?χεια, η διαδικασ?α διασταυρο?μενη? επικ?ρωση? επαναλαμβ?νεται 10 φορ??, με καθ?να απ? τα 10 υπo-δε?γματα να χρησιμοποιε?ται ακριβ?? μια φορ? ω? δεδομ?νο επικ?ρωση?. Τα αποτελ?σματα μπορο?ν στη συν?χεια να υπολογιστο?ν κατ? μ?σο ?ρο και να παραχθε? μια ενια?α εκτ?μηση. Το πλεον?κτημα αυτ?? τη? μεθ?δου ?ναντι τη? επανειλημμ?νη? τυχα?α? υπo-δειγματοληψ?α? ε?ναι ?τι ?λε? οι παρατηρ?σει? χρησιμοποιο?νται τ?σο για την εκπα?δευση ?σο και για την επικ?ρωση και κ?θε παρατ?ρηση χρησιμοποιε?ται για την επαλ?θευση ακριβ?? μ?α φορ?. Το δι?νυσμα των χαρακτηριστικ?ν κανονικοποι?θηκε, ?στε κ?θε χαρακτηριστικ? να ?χει τιμ?? αν?μεσα στο μηδ?ν και στο ?να ?πω? περιγρ?φηκε στο προηγο?μενο κεφ?λαιο. Συνολικ? εκπαιδε?τηκαν 399 Μοντ?λα Μηχαν?ν Διανυσμ?των Υποστ?ριξη? με παλινδρ?μηση, δηλαδ? ?να για κ?θε πιθαν? συνδυασμ? των υπερ-παραμ?τρων C και γ.Για κ?θε συνδυασμ? C, γ επιλ?χθηκαν 2000 κατ?φλια (απ? το 0 μ?χρι το 1 με β?μα 0.0005). Τα κατ?φλια αυτ? αποτελο?ν την τιμ? εμπιστοσ?νη?. Για μεγαλ?τερε? τιμ?? εμπιστοσ?νη? απ? αυτ?ν, το συγκεκριμ?νο μοντ?λο ξεκιν? να δηλ?νει Grand Tichu, εν? για τιμ?? εμπιστοσ?νη? μικρ?τερε? αυτ?? το μοντ?λο δεν αποφασ?ζει να δηλ?σει Grand Tichu για το συγκεκριμ?νο χ?ρι.Λογιστικ? Παλινδρ?μησηΜ?α ?λλη κατηγορ?α παλινδρ?μηση?, μη γραμμικ?? για τη λ?ση προβλημ?των δυαδικ?? εξαρτημ?νη? μεταβλητ??, ε?ναι η λογιστικ? παλινδρ?μηση. Σε αντ?θεση με τη γραμμικ? παλινδρ?μηση που προσαρμ?ζει μ?α ευθε?α γραμμ? στα δεδομ?να, η λογιστικ? παλινδρ?μηση προσαρμ?ζει μ?α συν?ρτηση S στα δεδομ?να. ?στω Y=0,1 ?που Y=0 αντιστοιχε? στη μ?α κατ?σταση τη? μεταβλητ?? για παρ?δειγμα μη δ?λωση Grand Tichu και Y=1 αντιστοιχε? σε μ?α ?λλη κατ?σταση (δ?λωση Grand Tichu). ?στω επ?ση? ?τι p ε?ναι η πιθαν?τητα να συμβε? Y=1, δηλαδ? p=P(Y=1). Τ?τε το μοντ?λο τη? λογιστικ?? παλινδρ?μηση? επιχειρε? να λ?σει την ακ?λουθη εξ?σωση: ln(p(1-p)) = a + β ×X + ε, ? p(1-p)=eaeΒeε Ο λ?γο? p(1-p) λ?γεται λ?γο? των πιθανοτ?των τη? μεταβλητ?? Y, εν? η κατανομ? του νεπ?ριου λογ?ριθμου αυτ?? τη? ποσ?τητα? κυμα?νεται στο δι?στημα 0,1. Για να ελαχιστοποιηθο?ν οι παρατηρ?σει? που ταξινομο?νται εσφαλμ?να, θα πρ?πει να προβλ?ψουμε το Y=1 ?ταν p ≥0.5 και Y=0 ?ταν p ≤0.5. Αυτο σημα?νει ?τι μπορο?με να π?ρουμε ?ναν γραμμικ? ταξινομητ? με χρ?ση τη? λογιστικ?? παλινδρ?μηση?. Η λογιστικ? παλινδρ?μηση ?χι μ?νο δε?χνει που ε?ναι το ?ριο μεταξ? των τ?ξεων, αλλ? επ?ση? δε?χνει ?τι οι πιθαν?τητε? των κλ?σεων εξαρτ?νται απ? την απ?σταση απ? το ?ριο, με ?να συγκεκριμ?νο τρ?πο και ?τι πηγα?νουν πιο γρ?γορα προ? τα ?κρα ?ταν το μ?τρο του b ε?ναι μεγαλ?τερο.Ε?ναι αυτ?? οι δηλ?σει? σχετικ? με τι? πιθαν?τητε? που κ?νουν τη λογιστικ? παλινδρ?μηση κ?τι παραπ?νω απ? ?ναν ταξινομητ?. Κ?νει ισχυρ?τερε?, λεπτομερ?στερε? προβλ?ψει? και μπορε? να εκπαιδευτε? με διαφορετικ? τρ?πο, αλλ? ακ?μα και αυτ?? οι ισχυρ?? προβλ?ψει? μπορε? να ε?ναι λανθασμ?νε?.Η χρ?ση τη? λογιστικ?? παλινδρ?μηση? για την πρ?βλεψη πιθαν?ν κλ?σεων ε?ναι μια επιλογ? που ?χει να κ?νει με την μοντελοπο?ηση, ακριβ?? ?πω? ε?ναι μια επιλογ? μοντελοπο?ηση? το να προβλ?ψει? ποσοτικ?? μεταβλητ?? χρησιμοποι?ντα? γραμμικ? παλινδρ?μηση. Σε καμ?α απ? τι? δ?ο περιπτ?σει? η καταλληλ?τητα του μοντ?λου δεν ε?ναι εγγυημ?νη. Αρχικ? ξεκιν?με θ?τοντα? το μοντ?λο με σκοπ? να ?χουμε ?να αποτ?λεσμα το οπο?α να μπορο?με να μελετ?σουμε και στο τ?λο? να ελ?γξουμε ε?ν πραγματικ? ταιρι?ζει με τα δεδομ?να ? ε?ν ?χει συστημικ? ελαττ?ματα.Η λογιστικ? παλινδρ?μηση ε?ναι ?να απ? τα πιο συχν? χρησιμοποιο?μενα εργαλε?α στην εφαρμοσμ?νη στατιστικ? και τη διακριτ? αν?λυση δεδομ?νων. Οι τ?σσερι? κ?ριοι λ?γοι για του? οπο?ου? συμβα?νει αυτ? ε?ναι η παρ?δοση, το ?τι συχν? λειτουργε? εκπληκτικ? καλ? ω? ταξινομητ??, το ?τι ε?ναι στεν? συνδεδεμ?νη με κατανομ?? “εκθετικ?? οικογ?νεια?” οι οπο?ε? εμφαν?ζονται σε πολλ? πλα?σια στη στατιστικ? θεωρ?α και στη φυσικ? και ?ρα υπ?ρχουν πολλ? προβλ?ματα που μπορο?ν να μετατραπο?ν σε λογιστικ? παλινδρ?μηση και τ?λο?, η ευκολ?α που προκ?πτει ω? προ? την αν?λυση των πιν?κων των λογαριθμικ?ν αποδ?σεων. CITATION Cos13 \p 231-235 \l 1033 (Shalizi, 2013, pp. 231-235) Μοντ?λο Λογιστικ?? Παλινδρ?μηση?Για τη δημιουργ?α του μοντ?λου Λογιστικ?? Παλινδρ?μηση? (Logistic Regression - LR) χρησιμοποι?θηκε η βιβλιοθ?κη scikit learn τη? Python, και συγκεκριμ?να η κλ?ση sklearn.linear_model.Logistic Regression CITATION Sci191 \l 1032 (SciKit Learn Logistic Regression). Η κλ?ση αυτ? παρ?χει ?λε? τι? απαρα?τητε? μεθ?δου? για την εκπα?δευση του μοντ?λου με τη χρ?ση των δεδομ?νων εκπα?δευση?, αλλ? και για τη χρησιμοπο?ησ? του για εξαγωγ? αποτελεσμ?των π?νω στα δεδομ?να δοκιμ??. Η παρ?μετρο? C ε?ναι η παρ?μετρο? τη? αντ?στροφη? ισχ?? κανονικοπο?ηση? των αποτελεσμ?των (inverse regularization strength) και πρ?πει να ε?ναι μια θετικ? τιμ?. Για μικρ?? τιμ?? του C, αυξ?νουμε την ισχ? κανονικοπο?ηση? και δημιουργο?με απλ? μοντ?λα τα οπο?α υπο-προσαρμ?ζονται στα δεδομ?να. Για μεγ?λε? αξ?ε? του C, χαμηλ?νουμε την ισχ? κανονικοπο?ηση?, κ?τι το οπο?ο συνεπ?γεται ?τι το μοντ?λο επιτρ?πεται να αυξ?σει την πολυπλοκ?τητ? του και, ω? εκ το?του, να υπερ-προσαρμοστε? στα δεδομ?να εκπα?δευση? (overfitting). Επιλ?ξαμε να γ?νει η εκπα?δευση των μοντ?λων με χρ?ση αναζ?τηση? δικτ?ου (grid search) με την παρ?μετρο C να πα?ρνει τιμ?? C ∈{0,1,...,10} και αν?λογα με την τιμ? του C για την οπο?α το μοντ?λο ?χει την καλ?τερη απ?δοση να γ?νεται επανεκπα?δευση σε ?να ε?ρο? τιμ?ν C γ?ρω απ? την τιμ? αυτ?. Η διαδικασ?α αυτ? επαναλαμβ?νεται ?ω? ?του τα C γ?ρω απ? την τιμ? να π?ψουν πλ?ον να δ?νουν καλ?τερα αποτελ?σματα.Επ?ση? χρησιμοποι?θηκε η διαδικασ?α διασταυρο?μενη? επικ?ρωση? 10-φορ?ν, ?πω? αναλ?θηκε παραπ?νω για το μοντ?λο τη? μηχαν?? διανυσμ?των υποστ?ριξη? με παλινδρ?μηση.Το δι?νυσμα των χαρακτηριστικ?ν κανονικοποι?θηκε ?στε κ?θε χαρακτηριστικ? να ?χει τιμ?? αν?μεσα στο μηδ?ν και στο ?να ?πω? περιγρ?φηκε στο προηγο?μενο κεφ?λαιο. Συνολικ? εκπαιδε?τηκαν 50 Μοντ?λα Λογιστικ?? Παλινδρ?μηση?, δηλαδ? ?να για κ?θε τιμ? C μ?χρι να μη βρεθε? καλ?τερο αποτ?λεσμα για διαφορετικ? τιμ? C .Για το μοντ?λο που προ?κυψε για τη συγκεκριμ?νη, “β?λτιστη” τιμ? C επιλ?χθηκαν 2000 κατ?φλια (απ? το 0 μ?χρι το 1 με β?μα 0.0005). Τα κατ?φλια αυτ? αποτελο?ν την τιμ? εμπιστοσ?νη?. Για μεγαλ?τερε? τιμ?? εμπιστοσ?νη? απ? αυτ?ν, το συγκεκριμ?νο μοντ?λο ξεκιν? να δηλ?νει Grand Tichu, εν? για τιμ?? εμπιστοσ?νη? μικρ?τερε? αυτ?? το μοντ?λο αποφασ?ζει να μη δηλ?σει Grand Tichu για το συγκεκριμ?νο χ?ρι.Κεφ?λαιο 8Αποτελ?σματα των μοντ?λων μετ? την εκπα?δευσηΟ κ?δικα? για την επεξεργασ?α των δεδομ?νων, την επιλογ? και τον υπολογισμ? των τιμ?ν των χαρακτηριστικ?ν την εκπα?δευση των μοντ?λων και την εξαγωγ? των αποτελεσμ?των, μαζ? με τα δεδομ?να εκπα?δευση? και τι? γραφικ?? παραστ?σει? των αποτελεσμ?των μπορε? να βρεθε? στο αποθετ?ριο CITATION Cha19 \l 1032 (Asimakopoulos, 2019)Αποτελ?σματα μοντ?λου Μηχαν?? Διανυσμ?των Υποστ?ριξη? με παλινδρ?μησηΓια το Μοντ?λο Μηχαν?? Διανυσμ?των Υποστ?ριξη? με παλινδρ?μηση, επιλ?χθηκε για κ?θε τιμ? του κατωφλ?ου το μοντ?λο SVR με τιμ?? (C,γ) για το οπο?ο το εκ?στοτε μ?τρο απ?δοση? πα?ρνει τη μεγ?στη τιμ?. Ο χρ?νο? που χρει?στηκε ?στε να εκπαιδευτε? το μοντ?λο για ?λε? τι? τιμ?? (C,γ) που επιλ?χθηκαν με β?ση τι? προτ?σει? ερευνητ?ν που αναφ?ραμε παραπ?νω ?ταν πολ? μεγ?λο?. Αυτ? οφε?λεται γιατ? το χρονικ? κ?στο? για τον υπολογισμ? μια? απ?σταση? ε?ναι μεγ?λο, λ?γω του μη-γραμμικο? πυρ?να που χρησιμοποι?σαμε (RBF kernel). Ο πυρ?να? αυτ?? δημιουργε? ?ναν ομαδοποιητ? ?που η εκμ?θηση ε?ναι βασισμ?νη σε στιγμι?τυπα και ?ρα στη χειρ?τερη περ?πτωση αν ?χουμε n το πλ?θο? δεδομ?να εκπα?δευση?, η ταξιν?μηση εν?? μ?νο ν?ου στιγμι?τυπου ?χει υπολογιστικ? πολυπλοκ?τητα O(n). CITATION Stu03 \l 1033 (Norvig, 2003)Παρακ?τω παρουσι?ζονται τα αποτελ?σματα για τα μ?τρα απ?δοση? που περιγρ?φηκαν παραπ?νω.Ορθ?τητα Δηλ?σεων (Accuracy)Το μοντ?λο SVR παρουσι?ζει υψηλ? βαθμολογ?α στην ορθ?τητα δηλ?σεων για τιμ?? κατωφλ?ου που δεν ε?ναι ακρα?ε?, δηλαδ? βρ?σκονται μακρι? απ? το 0 και το 1. Για τιμ?? απ? 0.1 ?ω? και 0.9 η ορθ?τητα δηλ?σεων του μοντ?λου SVR ε?ναι π?νω απ? 80% με τη μ?γιστη τιμ? να ε?ναι 84.58% για (C = 2 , γ = 0.25, τιμ? κατωφλ?ου: 0.142).8-1 Το ποσοστ? ορθ?τητα? δηλ?σεων του μοντ?λου SVR αν? τιμ? κατωφλ?ουΑκρ?βεια Δηλ?σεων (Precision)Το μοντ?λο SVR παρουσι?ζει υψηλ? βαθμολογ?α στην ακρ?βεια δηλ?σεων για τιμ?? κατωφλ?ου που δεν ε?ναι κοντ? στο 0. ?σο το κατ?φλι πλησι?ζει την τιμ? 1, παρατηρο?με α?ξηση στην ακρ?βεια των δηλ?σεων. Οι τιμ?? 1 που παρουσι?ζονται για χαμηλ? κατ?φλια εξηγο?νται μια? και δεν πρ?κειται για το ?διο SVR μοντ?λο αν? κατ?φλι αλλ? για διαφορετικ? μοντ?λα με διαφορετικ?? τιμ?? παραμ?τρων C, γ ?στε να προκ?πτει το καλ?τερο δυνατ? αποτ?λεσμα αν? τιμ? κατωφλ?ου. Η μ?γιστη τιμ? ακρ?βεια? δηλ?σεων προκ?πτει για πολλ? κατ?φλια και τιμ?? C, γ και ε?ναι το ποσοστ? 100%.8-2 Το ποσοστ? ακρ?βεια? δηλ?σεων του μοντ?λου SVR αν? τιμ? κατωφλ?ουΑκρ?βεια Αν?κληση? (Recall)Το μοντ?λο SVR παρουσι?ζει υψηλ? βαθμολογ?α στην ακρ?βεια αν?κληση? για τιμ?? κατωφλ?ου που δεν ε?ναι κοντ? στο 1. ?σο το κατ?φλι πλησι?ζει την τιμ? 0, παρατηρο?με α?ξηση στην ακρ?βεια αν?κληση?. Η μ?γιστη τιμ? ακρ?βεια? αν?κληση? προκ?πτει για πολλ? κατ?φλια κοντ? στο 0 και τιμ?? C, γ και ε?ναι το ποσοστ? 100%.8-3 Το ποσοστ? επιτυχο?? αν?κληση? του μοντ?λου SVR αν? τιμ? κατωφλ?ουΑκρ?βεια Βαθμολογ?α? F1 (F1 Score)Το μοντ?λο SVR παρουσι?ζει υψηλ? βαθμολογ?α F1 για τιμ?? κατωφλ?ου που δεν ε?ναι ακρα?ε?, δηλαδ? για τιμ?? κατωφλ?ου που δεν ε?ναι κοντ? στο 0 και στο 1. ?σο το κατ?φλι πλησι?ζει την τιμ? 1, παρατηρο?με αισθητ? με?ωση στη βαθμολογ?α F1. Η μ?γιστη τιμ? ακρ?βεια? βαθμολογ?α? F1 προκ?πτει για τιμ? κατωφλ?ου 0.142 και τιμ?? C = 2, γ = 0.25 και ε?ναι ?ση με 81.67%.8-4 Η βαθμολογ?α F1 του μοντ?λου SVR αν? τιμ? κατωφλ?ουΟι μ?γιστε? τιμ?? που παρατηρ?θηκαν ε?ναι:Βαθμολογ?α F1: 81.67% για (C = 2 , γ = 0.25, τιμ? κατωφλ?ου: 0.142)Ορθ?τητα: 84.58% για (C = 2 , γ = 0.25, τιμ? κατωφλ?ου: 0.142)Αν?κληση: 100% για τιμ? κατωφλ?ου 0Ακρ?βεια Δηλ?σεων: 100% για τιμ? κατωφλ?ου 1Καμπ?λη ROC για (C = 2 , γ = 0.25)Για την καμπ?λη ROC επιλ?ξαμε τι? τιμ?? των υπερ-παραμ?τρων C, γ για τι? οπο?ε? η βαθμολογ?α F1 παρουσ?ασε τη μ?γιστη τιμ? (C = 2 , γ = 0.25). Παρατηρο?με ?τι η καμπ?λη ROC παρουσι?ζει πολ? θετικ? αποτελ?σματα και το εμβαδ?ν κ?τω απ? την καμπ?λη ROC (Area Under Curve – AUC) ?χει τιμ? 75.85%. 8-5 Η καμπ?λη ROC του μοντ?λου SVRΑποτελ?σματα Μοντ?λου Μηχαν?? Λογιστικ?? παλινδρ?μηση?Για το Μοντ?λο Μηχαν?? Λογιστικ?? παλινδρ?μηση? (LR), επιλ?χθηκε το Μοντ?λο με την τιμ? C το οπο?ο παρουσ?ασε τα καλ?τερα αποτελ?σματα (8.3022). Η παραπ?νω τιμ? του C βρ?θηκε μετ? απ? βελτιστοπο?ηση με χρ?ση Grid Search. Παρακ?τω παρουσι?ζονται τα αποτελ?σματα για τα μ?τρα απ?δοση? που περιγρ?φηκαν παραπ?νω. Ορθ?τητα Δηλ?σεων (Accuracy)Το μοντ?λο LR παρουσι?ζει υψηλ? βαθμολογ?α στην ακρ?βεια δηλ?σεων για τιμ?? κατωφλ?ου που δεν ε?ναι ακρα?ε?, δηλαδ? βρ?σκονται μακρι? απ? το 0 και το 1. Για τιμ?? απ? 0.25 ?ω? και 0.7 η ακρ?βεια δηλ?σεων του μοντ?λου LR ε?ναι π?νω απ? 80% με τη μ?γιστη τιμ? να ε?ναι 85.05% για τιμ? κατωφλ?ου ?ση με 0.3997.8-6 Το ποσοστ? ορθ?τητα? δηλ?σεων του μοντ?λου LR αν? τιμ? κατωφλ?ουΑκρ?βεια Δηλ?σεων (Precision)Το μοντ?λο LR παρουσι?ζει υψηλ? βαθμολογ?α στην ακρ?βεια δηλ?σεων για τιμ?? κατωφλ?ου που βρ?σκονται μακρι? απ? το 0. Συγκεκριμ?να, για τιμ?? απ? 0.42 ?ω? και 1 η ακρ?βεια δηλ?σεων του μοντ?λου LR ε?ναι π?νω απ? 80% με τη μ?γιστη τιμ? να ε?ναι 100% για πολλ?? τιμ?? κατωφλ?ου κοντ? στο 1.8-7 Το ποσοστ? ακρ?βεια? δηλ?σεων του μοντ?λου LR αν? τιμ? κατωφλ?ουΑκρ?βεια Αν?κληση? (Recall)Το μοντ?λο LR παρουσι?ζει υψηλ? βαθμολογ?α στην ακρ?βεια αν?κληση? για τιμ?? κατωφλ?ου που δεν ε?ναι κοντ? στο 1. ?σο το κατ?φλι πλησι?ζει την τιμ? 0, παρατηρο?με α?ξηση στην ακρ?βεια αν?κληση?. Η μ?γιστη τιμ? ακρ?βεια? αν?κληση? προκ?πτει για πολλ? κατ?φλια κοντ? στο 0 και ε?ναι το ποσοστ? 100%.8-8 Το ποσοστ? επιτυχο?? αν?κληση? του μοντ?λου LR αν? τιμ? κατωφλ?ουΑκρ?βεια Βαθμολογ?α? F1 (F1 Score)Το μοντ?λο LR παρουσι?ζει υψηλ? βαθμολογ?α F1 για τιμ?? κατωφλ?ου που δεν ε?ναι ακρα?ε?, δηλαδ? για τιμ?? κατωφλ?ου που δεν ε?ναι κοντ? στο 0 και στο 1. ?σο το κατ?φλι πλησι?ζει την τιμ? 1, παρατηρο?με αισθητ? με?ωση στη βαθμολογ?α F1. Η μ?γιστη τιμ? ακρ?βεια? βαθμολογ?α? F1 προκ?πτει για τιμ? κατωφλ?ου 0. 3997 και ε?ναι ?ση με 81.07%.8-9 Η βαθμολογ?α F1 του μοντ?λου LR αν? τιμ? κατωφλ?ουΟι μ?γιστε? τιμ?? που παρατηρ?θηκαν ε?ναι:Βαθμολογ?α F1: 81.07% για τιμ? κατωφλ?ου: 0.3997Ορθ?τητα: 85.05% για τιμ? κατωφλ?ου: 0.3997Αν?κληση: 100% για τιμ? κατωφλ?ου 1Ακρ?βεια Δηλ?σεων: 100% για τιμ? κατωφλ?ου 0Καμπ?λη ROC για C = 8.3022Για την καμπ?λη ROC του μοντ?λου LR, παρατηρο?με ?τι παρουσι?ζει πολ? θετικ? αποτελ?σματα και το εμβαδ?ν κ?τω απ? την καμπ?λη ROC (Area Under Curve – AUC) ?χει τιμ? 89.13%. 8-10 Η καμπ?λη ROC του μοντ?λου LRΣ?γκριση αποτελεσμ?των των δ?ο μοντ?λωνΟρθ?τητα Δηλ?σεων (Accuracy)Εδ? παρατηρο?με ?τι το μοντ?λο SVR παρουσι?ζει καλ? αποτελ?σματα σε ?να μεγαλ?τερο ε?ρο? τιμ?ν κατωφλ?ου σε σχ?ση με το μοντ?λο LR. Το μοντ?λο LR παρουσι?ζει καλ?τερα αποτελ?σματα για τιμ?? κατωφλ?ου μεταξ? 0.3 και 0.5 και μεταξ? 0.9 και 1, εν? το μοντ?λο SVR παρουσι?ζει καλ?τερα αποτελ?σματα στα ?λλα διαστ?ματα, με ιδια?τερη διαφορ? στα διαστ?ματα 0.1 ?ω? 0.2 και 0.65 ?ω? 0.85. Η μ?γιστη τιμ? τη? ορθ?τητα? δηλ?σεων του μοντ?λου LR ε?ναι ελ?χιστα καλ?τερη απ? αυτ?ν του μοντ?λου SVR (85.05% ?ναντι 84.58%).8-11 Σ?γκριση ποσοστ?ν ορθ?τητα? δηλ?σεων των μοντ?λων SVR και LR αν? τιμ? κατωφλ?ουΑκρ?βεια Δηλ?σεων (Precision)Εδ? παρατηρο?με ?τι το μοντ?λο LR παρουσι?ζει καλ?τερα αποτελ?σματα ?σο η τιμ? κατωφλ?ου μεγαλ?νει, εν? το μοντ?λο SVR λ?γω τη? επιλογ?? διαφορετικο? C, γ αν? τιμ? κατωφλ?ου παρουσι?ζει διακυμ?νσει? στην ακρ?βεια δηλ?σεων. 8-12 Σ?γκριση ποσοστ?ν ακρ?βεια? δηλ?σεων των μοντ?λων SVR και LR αν? τιμ? κατωφλ?ουΑκρ?βεια Αν?κληση? (Recall)Εδ? παρατηρο?με ?τι το μοντ?λο LR παρουσι?ζει καλ?τερα αποτελ?σματα σε σχ?ση με το μοντ?λο SVR για τιμ?? κατωφλ?ου απ? 0.4 ?ω? 0.6 και 0.9 ?ω? 1, εν? το μοντ?λο SVR παρουσι?ζει καλ?τερα αποτελ?σματα στι? υπ?λοιπε? τιμ?? κατωφλ?ου, ιδια?τερα στο δι?στημα τιμ?ν 0.6 ?ω? 0.85. 8-13 Σ?γκριση ποσοστ?ν επιτυχο?? αν?κληση? των μοντ?λων SVR και LR αν? τιμ? κατωφλ?ουΑκρ?βεια Βαθμολογ?α? F1 (F1-score)Εδ? παρατηρο?με ?τι το μοντ?λο LR παρουσι?ζει καλ?τερα αποτελ?σματα σε σχ?ση με το μοντ?λο SVR για τιμ?? κατωφλ?ου απ? 0.2 ?ω? 0.6 και 0.9 ?ω? 1, εν? το μοντ?λο SVR παρουσι?ζει καλ?τερα αποτελ?σματα στι? υπ?λοιπε? τιμ?? κατωφλ?ου, ιδια?τερα στο δι?στημα τιμ?ν 0.65 ?ω? 0.85. Η μ?γιστη τιμ? τη? βαθμολογ?α? F1 του μοντ?λου SVR ε?ναι ελ?χιστα καλ?τερη απ? αυτ?ν του μοντ?λου LR (81.67% ?ναντι 81.07%).8-14 Σ?γκριση βαθμολογ?α? F1 των μοντ?λων SVR και LR αν? τιμ? κατωφλ?ουΚαμπ?λη ROCΗ περιοχ? κ?τω απ? την καμπ?λη ROC (AUC) ε?ναι υψηλ? και για τα δ?ο μοντ?λα αλλ? ?χει καλ?τερη τιμ? για το μοντ?λο γραμμικ?? παλινδρ?μηση? (89.13% ?ναντι 75.85%). 8-15 Σ?γκριση καμπ?λη? ROC των μοντ?λων SVR και LR αν? τιμ? κατωφλ?ου Λαμβ?νοντα? υπ?ψη την τερ?στια διαφορ? χρ?νου που δαπαν?θηκε για την εκπα?δευση των δ?ο μοντ?λων (για το μοντ?λο Μηχαν?? Διανυσμ?των Υποστ?ριξη? χρει?στηκε τ?ξη? μεγ?θου? περισσ?τερο? χρ?νο? εκπα?δευση? απ? το μοντ?λο Λογιστικ?? Παλινδρ?μηση? για τον ?διο αριθμ? δεδομ?νων εκπα?δευση?), θα δ?σουμε μια μικρ? υπεροχ? στο μοντ?λο Λογιστικ?? Παλινδρ?μηση? ?σο αυξ?νεται ο ?γκο? των δεδομ?νων εκπα?δευση?.Ο σκοπ?? μα? ε?ναι η δημιουργ?α τρι?ν διαφορετικ?ν πρακτ?ρων οι οπο?οι θα ?χουν διαφορετικ?? τιμ?? ρ?σκου στι? επιλογ?? του?. Η τιμ? ρ?σκου προκ?πτει απ? την τιμ? κατωφλ?ου π?νω απ? την οπο?α ?να? πρ?κτορα? θα δηλ?νει Grand Tichu. Για ?ναν πρ?κτορα που θ?λουμε να ε?ναι επιθετικ??, δηλαδ? να δηλ?νει Grand Tichu για μικρ?? τιμ?? κατωφλ?ου και π?νω θα προτιμ?σουμε το μοντ?λο SVR που παρουσι?ζει καλ?τερα αποτελ?σματα για χαμηλ?τερα κατ?φλια. Για ?ναν πρ?κτορα που θ?λουμε να ε?ναι ουδ?τερο?, δηλαδ? να δηλ?νει Grand Tichu για τιμ?? κατωφλ?ου κοντ? στο 0.5 θα προτιμ?σουμε το μοντ?λο LR, που παρουσι?ζει καλ?τερα αποτελ?σματα για τα κατ?φλια αυτ?, εν? για ?ναν συντηρητικ? πρ?κτορα που δηλ?νει Grand Tichu για μεγ?λε? τιμ?? κατωφλ?ου θα προτιμ?σουμε το μοντ?λο SVR που παρουσι?ζει ελαφρ?? καλ?τερα αποτελ?σματα για υψηλ? κατ?φλια.Αν ?μω? θ?λουμε να εκπαιδε?σουμε ?να ν?ο μοντ?λο με ελαφρ?? διαφορετικ? χαρακτηριστικ? ? παραπ?νω δεδομ?να εκπα?δευση?, θεωρο?με ?τι η διαφορ? στα αποτελ?σματα ε?ναι πολ? μικρ? για να δικαιολογ?σει την τερ?στια διαφορ? στο χρ?νο εκπα?δευση? μεταξ? των δ?ο μοντ?λων και ?ρα θα επιλ?γαμε το μοντ?λο λογιστικ?? παλινδρ?μηση?.Κεφ?λαιο 9Επ?λογο? και προτ?σει? για μελλοντικ?? μελ?τε?Στην παρο?σα εργασ?α ?γινε μια προσπ?θεια χρ?ση? ευφυ?ν μοντ?λων για τη λ?ψη αποφ?σεων στο κομμ?τι παιχνιδιο? Tichu που αφορ? τη δ?λωση Grand Tichu. H μοντελοπο?ηση των δεδομ?νων, η εξ?ρυξη χαρακτηριστικ?ν απ? αυτ? καθ?? και η επιλογ? και η εκπα?δευση των μοντ?λων λ?ψη? αποφ?σεων αποτ?λεσαν μεγ?λε? προκλ?σει?. Το Tichu ε?ναι ?να παιχν?δι για το οπο?ο ε?ναι υπολογιστικ? δ?σκολο να δημιουργηθο?ν ευφυε?? πρ?κτορε? και το οπο?ο δεν ?χει ερευνηθε? σε β?θο? απ? την επιστημονικ? κοιν?τητα. Η συνεργατικ?τητα μεταξ? των δ?ο παικτ?ν που βρ?σκονται στην ?δια ομ?δα, η βαθμολογ?α καθ?? και το πλ?θο? των επιτρεπτ?ν συνδυασμ?ν επιτρ?πουν την επιλογ? πλ?θου? διαφορετικ?ν διανυσμ?των χαρακτηριστικ?ν για την εκπα?δευση των μοντ?λων, προσθ?τοντα? ταυτ?χρονα μια επιπλ?ον δυσκολ?α στην επιλογ? αυτ?ν. Η μεγαλ?τερη δυσκολ?α που παρατηρ?θηκε κατ? τη δι?ρκεια τη? ?ρευνα? μα?, ?ταν ο χρ?νο? που χρει?στηκε για την εκπα?δευση του μοντ?λου μηχαν?? διανυσμ?των υποστ?ριξη? με παλινδρ?μηση. Ο απαιτο?μενο? χρ?νο? ?ταν τ?ξη? μεγ?θου? παραπ?νω απ? αυτ?ν που χρει?στηκε για το μοντ?λο τη? λογιστικ?? παλινδρ?μηση? και απαγορευτικ??, στα πλα?σια τη? εργασ?α? αυτ??, για εκπα?δευση των μοντ?λων με παραπ?νω δεδομ?να.Τα αποτελ?σματα τα οπο?α ε?χαν τα μοντ?λα τη? λογιστικ?? παλινδρ?μηση? και τη? μηχαν?? διανυσμ?των υποστ?ριξη? με παλινδρ?μηση που ερευν?σαμε στην εργασ?α αυτ?, μα? ?φησαν απολ?τω? ικανοποιημ?νου? και ελπ?ζουμε να δ?σουν ?θηση για μελλοντικ?? μελ?τε? π?νω στο παιχν?δι Tichu. Η δημιουργ?α τρι?ν διαφορετικ?ν πρακτ?ρων με β?ση τη λ?ψη τη? πιθαν?τητα? δ?λωση? Grand Tichu απ? τα μοντ?λα μα? αποτελε? ?ναν ευφ?νταστο τρ?πο χρησιμοπο?ηση? των μοντ?λων αυτ?ν, μια? και η ?ξοδο? των μοντ?λων αυτ?ν ε?ναι μια κατανομ? πιθαν?τητα? και ?χι αποκλειστικ? μια δυαδικ? τιμ?.Αν?μεσα στα δ?ο μοντ?λα που εξετ?σαμε στα πλα?σια τη? διατριβ??, για ?ναν πρ?κτορα που θ?λουμε να ?χει πιο επιθετικ?, αλλ? και για ?ναν πρ?κτορα που θ?λουμε να ?χει πιο συντηρητικ? τρ?πο παιξ?ματο?, προτε?νουμε το μοντ?λο μηχαν?? διανυσμ?των υποστ?ριξη?. Αντιθ?τω? για ?να πα?κτη ουδ?τερη? επιθετικ?τητα? προτε?νουμε το μοντ?λο λογιστικ?? παλινδρ?μηση?. Για εκπα?δευση ν?ων μοντ?λων που αντλο?ν στοιχε?α απ? τα ?σα μελετ?σαμε, προτε?νουμε τη χρ?ση μοντ?λων λογιστικ?? παλινδρ?μηση?, μια? και τα ?ποια μικρ? πλεονεκτ?ματα παρουσι?ζει σε δι?φορε? τιμ?? κατωφλ?ου το μοντ?λο μηχαν?? διανυσμ?των δε δικαιολογο?ν την τερ?στια διαφορ? στο χρ?νο εκπα?δευση? που απαιτε?ται σε σχ?ση με το μοντ?λο λογιστικ?? παλινδρ?μηση?. Στην αναζ?τηση για παρατηρ?σιμα παιχν?δια μερικ?? πληροφ?ρηση? παρατηρ?θηκε ?τι εν? υπ?ρχουν κ?ποιε? ?ρευνε? και προσπ?θειε? στον τομ?α αυτ?, υπ?ρχει μεγ?λο περιθ?ριο για μελλοντικ?? μελ?τε? απ? ερευνητ??. ?μφαση πρ?πει να δοθε? στο πω? αυτ? τα παιχν?δια μπορο?ν να γ?νουν υπολογιστικ? επιλ?σιμα, δηλαδ? να μειωθε? η πολυπλοκ?τητα τη? μοντελοπο?ηση? του?, ε?τε μ?σω απλοπο?ηση? των μοντ?λων, ε?τε με κ?ποιον ?λλον τρ?πο.Συγκεκριμ?να, για το παιχν?δι Tichu πιθαν?? μορφ?? μελλοντικ?? ?ρευνα? θα μπορο?σαν να ε?ναι:Η βελτ?ωση του μοντ?λου μα? λαμβ?νοντα? υπ?ψη ε?ν κ?ποιο? αντ?παλο? δ?λωσε Grand Tichu στο ?διο χ?ρι που καλε?ται το μοντ?λο μα? να αποφασ?σει, ε?ν θα δηλ?σει Grand Tichu ? ?χι. Η δ?λωση Grand Tichu απ? κ?ποιον αντ?παλο πρακτικ? σημα?νει ?τι ο αντ?παλο? αυτ?? ?χει με μεγ?λη πιθαν?τητα ?να πολ? δυνατ? χ?ρι και ?ρα θα πρ?πει να δρα αρνητικ? στη δ?λωση Grand Tichu απ? τον πρ?κτορα μα?.Η ε?ρεση τη? καλ?τερη? δυνατ?? συσχ?τιση? μεταξ? των 8 καρτ?ν πριν τη δ?λωση Grand Tichu με το να καταφ?ρνει ?ντω? ο πα?κτη? που δηλ?νει Grand Tichu να βγα?νει πρ?το?, δηλαδ? η δ?λωση να ε?ναι επιτυχ??. Πρ?πει να γ?νει μια μελ?τη των χερι?ν οπο? οδηγο?ν σε δ?λωση Grand Tichu και αναλ?γω? με το ε?ν η δ?λωση ε?ναι επιτυχ?? ? ?χι, να εφαρμοστε? μια ποιν? ? επιβρ?βευση στο μοντ?λο για την επιλογ? τη? δ?λωση?. Η δημιουργ?α εν?? μοντ?λου για το κομμ?τι των ανταλλαγ?ν καρτ?ν μεταξ? των παικτ?ν. Οι ανταλλαγ?? των καρτ?ν ε?ναι μια πολ? σ?νθετη διαδικασ?α στην οπο?α οι πα?κτε? Tichu χρησιμοποιο?ν μνημονικο?? καν?νε? και αρκετ? ? καθ?λου ρ?σκο αν?λογα με τον τ?πο πα?κτη. ?τσι θα μπορο?σαμε και εδ? να ?χουμε διαφορετικο?? τ?που? πρακτ?ρων αν?λογα με το ρ?σκο που αυτο? θα πα?ρνουν.Η δημιουργ?α εν?? μοντ?λου για τη δ?λωση ? ?χι Tichu. Εδ? πλ?ον οι κ?ρτε? για τι? οπο?ε? ?χει πληροφορ?α το μοντ?λο ε?ναι οι 14 κ?ρτε? του χεριο?, συν οι 3 κ?ρτε? των ανταλλαγ?ν που ο πρ?κτορα? ?χει δ?σει στου? δ?ο αντιπ?λου? και στο συμπα?κτη. Ε?ν μ?λιστα ο πρ?κτορα? δεν πα?ζει πρ?το?, τ?τε ?χει και σαν επιπλ?ον πληροφορ?α τη στο?βα των καρτ?ν που ?χει παιχτε?, το ποιο? πα?κτη? ?χει ρ?ξει ?ναν συγκεκριμ?νο συνδυασμ? φ?λλων, το ε?ν ?να? πα?κτη? ?χει πει π?σο και ?λλα.Η δημιουργ?α ευφυ?ν πρακτ?ρων για ολ?κληρο το παιχν?δι Tichu.Καλ?τερη ? διαφορετικ? εξαγωγ? χαρακτηριστικ?ν. Ιδανικ? θα μπορο?σαν να δημιουργηθο?ν πολλ? μοντ?λα με χρ?ση διαφορετικ?ν χαρακτηριστικ?ν και να επιλεγο?ν αυτ? που παρουσι?ζουν τα καλ?τερα αποτελ?σματα ? το β?λτιστο συνδυασμ? υπολογιστικ?? πολυπλοκ?τητα? και αποτελεσμ?των.ΠΑΡΑΡΤΗΜΑΕπιλογ? χαρακτηριστικ?ν με β?ση του? επιτρεπτο?? συνδυασμο?? στο Tichu18. Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι τα Τρι?ρια: με τιμ? 1 ×#Συνεχομ?νων Ζευγαρι?ν Μικρ?τερων απ? Τρι?ρια / 319. Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι τα Τεσσ?ρια: με τιμ? 1 ×#Συνεχομ?νων Ζευγαρι?ν Μικρ?τερων απ? Τεσσ?ρια / 320. Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι τα Πεντ?ρια: με τιμ? 1 ×#Συνεχομ?νων Ζευγαρι?ν Μικρ?τερων απ? Πεντ?ρια / 321. Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι τα Εξ?ρια: με τιμ? 1 ×#Συνεχομ?νων Ζευγαρι?ν Μικρ?τερων απ? Εξ?ρια / 322. Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι τα Εφτ?ρια: με τιμ? 1 ×#Συνεχομ?νων Ζευγαρι?ν Μικρ?τερων απ? Εφτ?ρια / 323. Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι τα Οχτ?ρια: με τιμ? 1 ×#Συνεχομ?νων Ζευγαρι?ν Μικρ?τερων απ? Οχτ?ρια / 324. Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι τα Εννι?ρια: με τιμ? 1 ×#Συνεχομ?νων Ζευγαρι?ν Μικρ?τερων απ? Εννι?ρια / 325. Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι τα Δεκ?ρια: με τιμ? 1 ×#Συνεχομ?νων Ζευγαρι?ν Μικρ?τερων απ? Δεκ?ρια / 326. Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι του? Βαλ?δε?: με τιμ? 1 ×#Συνεχομ?νων Ζευγαρι?ν Μικρ?τερων απ? Βαλ?δε? / 327. Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι τι? Ντ?με?: με τιμ? 1 ×#Συνεχομ?νων Ζευγαρι?ν Μικρ?τερων απ? Ντ?με? / 328. Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι του? Ρηγ?δε?: με τιμ? 1 ×#Συνεχομ?νων Ζευγαρι?ν Μικρ?τερων απ? Ρηγ?δε? / 329. Συνεχ?μενα Ζευγ?ρια με μεγαλ?τερο ζευγ?ρι του? ?σσου?: με τιμ? 1 ×#Συνεχομ?νων Ζευγαρι?ν Μικρ?τερων απ? ?σσου? / 330. Κ?ντα με μεγαλ?τερο φ?λλο το Π?ντε: με τιμ? 1 ×#Υποκεντ?ν / 431. Κ?ντα με μεγαλ?τερο φ?λλο το ?ξι: με τιμ? 1 ×#Υποκεντ?ν / 432. Κ?ντα με μεγαλ?τερο φ?λλο το Επτ?: με τιμ? 1 ×#Υποκεντ?ν / 433. Κ?ντα με μεγαλ?τερο φ?λλο το Οκτ?: με τιμ? 1 ×#Υποκεντ?ν / 434. Κ?ντα με μεγαλ?τερο φ?λλο το Εννι?: με τιμ? 1 ×#Υποκεντ?ν / 435. Κ?ντα με μεγαλ?τερο φ?λλο το Δ?κα: με τιμ? 1 ×#Υποκεντ?ν / 436. Κ?ντα με μεγαλ?τερο φ?λλο το Βαλ?: με τιμ? 1 ×#Υποκεντ?ν / 437. Κ?ντα με μεγαλ?τερο φ?λλο τη Ντ?μα: με τιμ? 1 ×#Υποκεντ?ν / 438. Κ?ντα με μεγαλ?τερο φ?λλο το Ρ?γα: με τιμ? 1 ×#Υποκεντ?ν / 439. Κ?ντα με μεγαλ?τερο φ?λλο τον ?σσο: με τιμ? 1 ×#Υποκεντ?ν / 440. Υπ?ρχει Full House Δυναμικ?τητα? Δ?ο: με τιμ? 0 ? 1.41. Υπ?ρχει Full House Δυναμικ?τητα? Τρ?α: με τιμ? 0 ? 1.42. Υπ?ρχει Full House Δυναμικ?τητα? Τ?σσερα: με τιμ? 0 ? 1.43. Υπ?ρχει Full House Δυναμικ?τητα? Π?ντε: με τιμ? 0 ? 1.44. Υπ?ρχει Full House Δυναμικ?τητα? ?ξι: με τιμ? 0 ? 1.45. Υπ?ρχει Full House Δυναμικ?τητα? Επτ?: με τιμ? 0 ? 1.46. Υπ?ρχει Full House Δυναμικ?τητα? Οκτ?: με τιμ? 0 ? 1.47. Υπ?ρχει Full House Δυναμικ?τητα? Εννι?: με τιμ? 0 ? 1.48. Υπ?ρχει Full House Δυναμικ?τητα? Δ?κα: με τιμ? 0 ? 1.49. Υπ?ρχει Full House Δυναμικ?τητα? Βαλ?: με τιμ? 0 ? 1.50. Υπ?ρχει Full House Δυναμικ?τητα? Ντ?μα?: με τιμ? 0 ? 1.51. Υπ?ρχει Full House Δυναμικ?τητα? Ρ?γα: με τιμ? 0 ? 1.52. Υπ?ρχει Full House Δυναμικ?τητα? ?σσου: με τιμ? 0 ? 1.53. Κ?ντα ?διο χρ?μα μπλε με μεγαλ?τερο φ?λλο το Π?ντε: με τιμ? 1 ×#Υποκεντ?ν / 454. Κ?ντα ?διο χρ?μα μπλε με μεγαλ?τερο φ?λλο το ?ξι: με τιμ? 1 ×#Υποκεντ?ν / 455. Κ?ντα ?διο χρ?μα μπλε με μεγαλ?τερο φ?λλο το Επτ?: με τιμ? 1 ×#Υποκεντ?ν / 456. Κ?ντα ?διο χρ?μα μπλε με μεγαλ?τερο φ?λλο το Οκτ?: με τιμ? 1 ×#Υποκεντ?ν / 457. Κ?ντα ?διο χρ?μα μπλε με μεγαλ?τερο φ?λλο το Εννι?: με τιμ? 1 ×#Υποκεντ?ν / 458. Κ?ντα ?διο χρ?μα μπλε με μεγαλ?τερο φ?λλο το Δ?κα: με τιμ? 1 ×#Υποκεντ?ν / 459. Κ?ντα ?διο χρ?μα μπλε με μεγαλ?τερο φ?λλο το Βαλ?: με τιμ? 1 ×#Υποκεντ?ν / 460. Κ?ντα ?διο χρ?μα μπλε με μεγαλ?τερο φ?λλο τη Ντ?μα: με τιμ? 1 ×#Υποκεντ?ν / 461. Κ?ντα ?διο χρ?μα μπλε με μεγαλ?τερο φ?λλο το Ρ?γα: με τιμ? 1 ×#Υποκεντ?ν / 462. Κ?ντα ?διο χρ?μα μπλε με μεγαλ?τερο φ?λλο τον ?σσο: με τιμ? 1 ×#Υποκεντ?ν / 463. Κ?ντα ?διο χρ?μα κ?κκινο με μεγαλ?τερο φ?λλο το Π?ντε: με τιμ? 1 ×#Υποκεντ?ν / 464. Κ?ντα ?διο χρ?μα κ?κκινο με μεγαλ?τερο φ?λλο το ?ξι: με τιμ? 1 ×#Υποκεντ?ν / 465. Κ?ντα ?διο χρ?μα κ?κκινο με μεγαλ?τερο φ?λλο το Επτ?: με τιμ? 1 ×#Υποκεντ?ν / 466. Κ?ντα ?διο χρ?μα κ?κκινο με μεγαλ?τερο φ?λλο το Οκτ?: με τιμ? 1 ×#Υποκεντ?ν / 467. Κ?ντα ?διο χρ?μα κ?κκινο με μεγαλ?τερο φ?λλο το Εννι?: με τιμ? 1 ×#Υποκεντ?ν / 468. Κ?ντα ?διο χρ?μα κ?κκινο με μεγαλ?τερο φ?λλο το Δ?κα: με τιμ? 1 ×#Υποκεντ?ν / 469. Κ?ντα ?διο χρ?μα κ?κκινο με μεγαλ?τερο φ?λλο το Βαλ?: με τιμ? 1 ×#Υποκεντ?ν / 470. Κ?ντα ?διο χρ?μα κ?κκινο με μεγαλ?τερο φ?λλο τη Ντ?μα: με τιμ? 1 ×#Υποκεντ?ν / 471. Κ?ντα ?διο χρ?μα κ?κκινο με μεγαλ?τερο φ?λλο το Ρ?γα: με τιμ? 1 ×#Υποκεντ?ν / 472. Κ?ντα ?διο χρ?μα κ?κκινο με μεγαλ?τερο φ?λλο τον ?σσο: με τιμ? 1 ×#Υποκεντ?ν / 473. Κ?ντα ?διο χρ?μα πρ?σινο με μεγαλ?τερο φ?λλο το Π?ντε: με τιμ? 1 ×#Υποκεντ?ν / 474. Κ?ντα ?διο χρ?μα πρ?σινο με μεγαλ?τερο φ?λλο το ?ξι: με τιμ? 1 ×#Υποκεντ?ν / 475. Κ?ντα ?διο χρ?μα πρ?σινο με μεγαλ?τερο φ?λλο το Επτ?: με τιμ? 1 ×#Υποκεντ?ν / 476. Κ?ντα ?διο χρ?μα πρ?σινο με μεγαλ?τερο φ?λλο το Οκτ?: με τιμ? 1 ×#Υποκεντ?ν / 477. Κ?ντα ?διο χρ?μα πρ?σινο με μεγαλ?τερο φ?λλο το Εννι?: με τιμ? 1 ×#Υποκεντ?ν / 478. Κ?ντα ?διο χρ?μα πρ?σινο με μεγαλ?τερο φ?λλο το Δ?κα: με τιμ? 1 ×#Υποκεντ?ν / 479. Κ?ντα ?διο χρ?μα πρ?σινο με μεγαλ?τερο φ?λλο το Βαλ?: με τιμ? 1 ×#Υποκεντ?ν / 480. Κ?ντα ?διο χρ?μα πρ?σινο με μεγαλ?τερο φ?λλο τη Ντ?μα: με τιμ? 1 ×#Υποκεντ?ν / 481. Κ?ντα ?διο χρ?μα πρ?σινο με μεγαλ?τερο φ?λλο το Ρ?γα: με τιμ? 1 ×#Υποκεντ?ν / 482. Κ?ντα ?διο χρ?μα πρ?σινο με μεγαλ?τερο φ?λλο τον ?σσο: με τιμ? 1 ×#Υποκεντ?ν / 483. Κ?ντα ?διο χρ?μα μα?ρο με μεγαλ?τερο φ?λλο το Π?ντε: με τιμ? 1 ×#Υποκεντ?ν / 484. Κ?ντα ?διο χρ?μα μα?ρο με μεγαλ?τερο φ?λλο το ?ξι: με τιμ? 1 ×#Υποκεντ?ν / 485. Κ?ντα ?διο χρ?μα μα?ρο με μεγαλ?τερο φ?λλο το Επτ?: με τιμ? 1 ×#Υποκεντ?ν / 486. Κ?ντα ?διο χρ?μα μα?ρο με μεγαλ?τερο φ?λλο το Οκτ?: με τιμ? 1 ×#Υποκεντ?ν / 487. Κ?ντα ?διο χρ?μα μα?ρο με μεγαλ?τερο φ?λλο το Εννι?: με τιμ? 1 ×#Υποκεντ?ν / 488. Κ?ντα ?διο χρ?μα μα?ρο με μεγαλ?τερο φ?λλο το Δ?κα: με τιμ? 1 ×#Υποκεντ?ν / 489. Κ?ντα ?διο χρ?μα μα?ρο με μεγαλ?τερο φ?λλο το Βαλ?: με τιμ? 1 ×#Υποκεντ?ν / 490. Κ?ντα ?διο χρ?μα μα?ρο με μεγαλ?τερο φ?λλο τη Ντ?μα: με τιμ? 1 ×#Υποκεντ?ν / 491. Κ?ντα ?διο χρ?μα μα?ρο με μεγαλ?τερο φ?λλο το Ρ?γα: με τιμ? 1 ×#Υποκεντ?ν / 492. Κ?ντα ?διο χρ?μα μα?ρο με μεγαλ?τερο φ?λλο τον ?σσο: με τιμ? 1 ×#Υποκεντ?ν / 493. Συνολικ?? αριθμ?? βομβ?ν στο χ?ρι: με τιμ? απ? 0 ?ω? 1 (κανονικοποιημ?νη)Βιβλιογραφ?αA Brief History of Computing. Αν?κτηση Δεκ?μβριο?, 2, 2019 απ?: BIBLIOGRAPHY Achro. Αν?κτηση Νο?μβριο? 4, 2019, απ?: Computer Poker Competition. Αν?κτηση Δεκ?μβριο?, 2, 2019 απ?: Asimakopoulos, C. (2019, Δεκ?μβριο? 1). GitHub Tichu Sensei. Αν?κτηση Δεκ?μβριο? 2, 2019, απ? GitHub: Game Geeek. (2011, Ιο?νιο? 29). Αν?κτηση Νο?μβριο? 6, 2019, απ? , B. G. (1992). A training algorithm for optimal margin classifiers. In Proceedings of the 5th Annual Workshop on Computational Learning Theory. ACM Press , σσ. 144-152.BrettSpielWelt. Αν?κτηση Νο?μβριο? 9, 2019, απ?: , K. (2017, Ιο?λιο? 20). Determinization for Monte Carlo Tree Search in the Card Game Tichu.Chih-Wei Hsu, C.-C. C.-J. (2003). A Practical Guide to Support Vector Classification. Αν?κτηση Νο?μβριο? 19, 2019, απ? Department of Computer Science, National Taiwan University, Taipei 106, Taiwan: C., V. V. (1995). Support-vector network. Mach. Learn. 20 , σσ. 273–297.da Silva, W. G. (2018, Ιο?νιο?). HearthBot: An Autonomous Agent Based on Fuzzy ART Adaptive Neural Networks for the Digital Collectible Card Game HearthStone. IEEE Transactions on Games, Vol. 10 Issue: 2 , σσ. 170-181.dod. Αν?κτηση απ?: Morgana. (2013). Αν?κτηση Νο?μβριο? 3, 2019, απ?: , H. K. (2008, Δεκ?μβριο? 03). Strategy-acquisition system for video trading card game. ACE '08 Proceedings of the 2008 International Conference on Advances in Computer Entertainment Technology , σσ. 175-182.Grand, E. F. (1952, Α?γουστο? 2). "The Talk of the Town - It". The New Yorker.Holdren, C. (n.d.). Tichu. Αν?κτηση Νο?μβριο? 6, 2019, απ? , U. (2004, Δεκ?μβριο? 12). Tichu Fata Morgana. Αν?κτηση Νο?μβριο? 3, 2019, απ? Fata Morgana: Full of Games. (n.d.). Αν?κτηση Νο?μβριο? 6, 2019, απ? Soo Chang, M. C. (2015). An adaptive samplingalgorithm for solving Markov decision processes. Operations Research,53(1) , σσ. 126-139.Ishii, F. M. (2005, Μ??ο?). A Reinforcement Learning Scheme for a Partially-Observable Multi-Agent Game. Machine Learning, May 2005, Volume 59, Issue 1–2 , σσ. 31-54.J. K. Anlauf, M. B. (1989, Δεκ?μβριο?). The AdaTron: An Adaptive Perceptron Algorithm. EPL (Europhysics Letters), Volume 10, Number 7 .Jesta. (2015, Σεπτ?μβριο? 7). Αν?κτηση Νο?μβριο? 4, 2019, απ?: , M. G. (2017). Value Function Approximation, Encyclopedia of Machine Learning and Data Mining. Lim, A. (2014, Ιο?λιο?). Αν?κτηση Νο?μβριο? 5, 2019, απ? E. Glickman, A. C. (1996, Ιανου?ριο? 28). Rating the Chess Rating System. American Chess Journal, 3 , σσ. 59-102.Martha Vlachou-Konchylaki, S. V. (2013, Μ??ο? 14). Combining Deliberation and Reactive Behavior for AIPlayers in the Mini-Tichu Card-game. Foundation of Digital Games, 2013, Chania, Crete, Greece , σ. 2.McCorduck, Pamela (2004). Machines Who Think (2nd ed.) ISBN 1-56881-205-1 A. K. Peters, Ltd., pp. 480-483Nate Silver, R. F.-B. (2015, Μ??ο? 21). FiveThirtyEight. Αν?κτηση Νο?μβριο? 11, 2019, απ?: How we calculate the Elo rankings: (2003). Στο S. a. Norvig, Artificial Intelligence: A Modern Approach, second edition (σ. 733). Prentice Hall.Online Tichu. Αν?κτηση Νο?μβριο? 7, 2019, απ?: . (2019, Δεκ?μβριο? 1). Dota 2 with Large Scale Deep Reinforcement Learning Αν?κτηση Δεκ?μβριο? 2, 2019, απ? GitHub: Cowling, C. W. (2012, Δεκ?μβριο?). Ensemble Determinization in Monte Carlo Tree Search for the Imperfect Information Card Game Magic: The Gathering. IEEE Transactions on computational intelligence and AI in games, Vol. 4, No. 4, December 2012 , σσ. 241-257.Reid, P. (2015, Μ?ρτιο? 16). Paul Hogan Reid, Wordpress. Αν?κτηση Νο?μβριο? 8, 2019, απ?: é Schwarz, T. P. (2013, Μ??ο? 2). Developing an Android app for the card game Tichu. σσ. 1-11.Richard S. Sutton, A. G. (2015). Reinforcement Learning: An Introduction, Second edition. Cambridge, Massachusetts: The MIT Press.Robiliard, F. T. (2014). Monte-Carlo Tree Search for the Game of "7-Wonders". Computer Games. CGW 2014. Communications in Computer and Information Science, vol 504. Springer .SciKit Learn Logistic Regression. Αν?κτηση Nο?μβριο? 19, 2019, απ?: learn.linear_model.LogisticRegression.htmlSciKit Learn SVM. Αν?κτηση Νο?μβριο? 18, 2019, απ? SciKit Learn SVM SVR: generated/sklearn.svm.SVR.htmlShalizi, C. (2013, Φεβρου?ριο? 27). Undergraduate Advanced Data Analysis. Αν?κτηση Νο?μβριο? 22, 2019, απ? Carnegie Mellon University: , D. (2015, Μα?ου 13). Computer Science, UCL. Retrieved Νο?μβριο? 1, 2019, απ?: , C. (2003, Νο?μβριο? 10). Parameter selection forsupport vector machines. HP Laboratories Israel HPL-2002-354 (R.1) .Steinacher, M. (n.d.). Steinacher. Αν?κτηση απ?: . Poggio, F. G. (1990, Φεβρουαρ?ου 23). Regularization Algorithms for Learning that are Equivalent to MultilayerNetworks. cience, New Series, Vol. 247, No. 4945. , σσ. 978-982.Tabletopia. (2019, Μ??ο? 25). Tabletopia. Αν?κτηση Νο?μβριο? 5, 2019, απ?: Kleynhans, M. M. (2017, Μ??ο? 3). Predicting Top-of-Atmosphere Thermal Radiance Using MERRA-2 Atmospheric Data with Deep Learning. Proceedings of the SPIE Defense and Commercial Sensing, Anaheim, CA, USA, Volume 10178 .Τeam, ToBHMA (2019, Μ??ο? 31). Η τεχνητ? νοημοσ?νη νικ?ει πια και παιχν?δια που απαιτο?ν συνεργασ?α. Αν?κτηση Δεκ?μρβιο? 1, 2019 απ?: Online. Αν?κτηση απ?: Τichu Pro. Αν?κτηση απ?: BrettSpielWelt. Αν?κτηση Ιο?λιο? 22, 2017, απ? . Αν?κτηση Νο?μβριο? 5, 2019, απ?: Tichurules Blogspot. (2012, Α?γουστο?). Αν?κτηση Νο?μβριο? 4, 2019, απ?: , A. (2016, Απρ?λη? 1). Tichu Perceptron. Αν?κτηση Νο?μβριο? 5, 2019, απ?: V., C. A. (1979). Theory of Pattern Recognition [in Russian]. Μ?σχα.Vapniκ, V. (1995). The Nature of Statistical Learning Theory. Μ?σχα: Springer.Wikipedia. (2019, Οκτωβρ?ου 17). Αν?κτηση Νοεμβρ?ου 1, 2019, απ?: . (2019, Nο?μβριο? 13). Αν?κτηση Νο?μβριο? 15, 2019, απ? Elo rating system: . (2018, Μ?ρτιο? 2). Αν?κτηση Νο?μβριο? 3, 2019, απ?: . (2019, Νο?μβριο? 3). Αν?κτηση Δεκ?μβριο? 2, 2019, απ?: , E. (2018, Δεκ?μβριο? 14). Betting strategy for the card game Tichu. Αν?κτηση Νο?μβριο? 8, 2019, απ?: , T. (2019, Σεπτ?μβριο? 1). . Αν?κτηση Νο?μβριο? 1, 2019, απ?: Β?νου, Θ. Μ. (2016, Φεβρου?ριο? 16). Αν?κτηση Νο?μρβιο? 4, 2019, απ?: Βλ?χου-Κογχυλ?κη, Μ. (2012, Οκτ?βριο?). Αν?πτυξη παιχνιδιο? στρατηγικ?? μερικ?? πληροφ?ρηση?.Γιαννο?λη, Δ. Π. (2014, Ιο?λιο?). Εφαρμογ?? των Μηχαν?ν Διανυσματικ?? Υποστ?ριξη? σε Προβλ?ματα Ταξιν?μηση? και Παλινδρ?μηση?. Διπλοματικ? Εργασ?α, Σχολ? Εφαρμοσμ?νων Μαθηματικ?ν και Φυσικ?ν επιστημ?ν, Εθνικ? Μετσ?βιο Πολυτεχνε?ο.Κυρ?τση?, Κ. (2014, Μ??ο?). nemertes.lis.upatras.gr. Αν?κτηση Νο?μβριο? 16, 2019, απ? Νευρωνικ? Δ?κτυα και Μηχαν?? Διανυσματικ?? Υποστ?ριξη?: Παπαδ?κη?, Ε. (2016, Ιο?νιο?). artemis.cslab.ece.ntua.gr. Αν?κτηση Νο?μβριο? 12, 2019, απ? Αν?λυση Συναισθ?ματο? απ? Κε?μενο με Τεχνικ?? Μηχανικ??: Τεχνητ? νοημοσ?νη τη? DeepMind ?φτασε στο αν?τατο επ?πεδο παικτ?ν στο Starcraft 2, δημοφιλ?? παιχν?δι των esports, (2019, 31, Οκτ?βριο?). Αν?κτηση Δεκ?μβριο? 1, 2019, απ? Naftemporiki: ................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download