Σάββατο 12 Φεβρουαρίου 2022

Μηχανική μάθησης (machine learning)


Μηχανική μάθησης (machine learning)
12 Φεβρουαρίου, 2022prodromikos



του Ανδρέα Σταλίδη

Στην ταινία «Παιχνίδια πολέμου» του 1983, ένας μαθητής αποκτά πρόσβαση στον στρατιωτικό υπερυπολογιστή των ΗΠΑ και χωρίς να το γνωρίζει παίζει ένα παιχνίδι τρίτου παγκόσμιου πολέμου. Οι ιθύνοντες θεωρούν ότι η απειλή πολέμου είναι υπαρκτή και συλλαμβάνουν τον μαθητή ως πράκτορα των Ρώσων! Αποσοβείται η παγκόσμια καταστροφή, μόνο όταν ο υπολογιστής παίζοντας μερικές εκατοντάδες παρτίδες τρίλιζα μόνος του, αντιλαμβάνεται ότι όπως δεν είναι δυνατόν κανένας να κερδίσει στην τρίλιζα, έτσι δεν δεν μπορεί καμία πλευρά να κερδίσει έναν πυρηνικό πόλεμο. Πρόκειται ίσως για το πρώτο παράδειγμα μηχανικής μάθησης (machine learning) σε κάποια ταινία.

Αν η τρίλιζα είναι ένα πολύ απλό παιχνίδι στρατηγικής, με πολύ περιορισμένο αριθμό κινήσεων, το σκάκι βρίσκεται στον αντίποδα. Ο αμερικανός μαθηματικός Σάννον υπολόγισε ότι για ένα παιχνίδι 40 κινήσεων υπάρχουν περίπου 10 εις την 120η διαφορετικές παρτίδες. Δηλαδή ο αριθμός 1 με 120 μηδενικά. Αλλιώς, οι πρώτες 10 κινήσεις (από 5 ο κάθε παίκτης) φθάνουν περίπου σε 69 δισεκατομμύρια διαφορετικές παρτίδες. Αδιανόητο να γίνουν όλοι υπολογισμοί, όπως στην τρίλιζα.

Έτσι, η τελευταία γενιά αλγορίθμων που παίζουν σκάκι, ο περίφημος Στόκφις (Stockfish), έχει «διαβάσει» πάρα πολλά εκατομμύρια παρτίδες, όλα τα «ανοίγματα» που χρησιμοποιούνται και υπολογίζει 70 εκατομμύρια σκακιστικές θέσεις το δευτερόλεπτο. Έχει ξεπεραστεί προ πολλού ο άνθρωπος, και πλέον οι διάφορες εκδόσεις του Στόκφις χρησιμοποιούνται για μελέτη και εκπαίδευση παικτών. Όχι ανταγωνιστικά.

Το 2017 έγινε κάτι σχεδόν απίστευτο. Μία εταιρεία τεχνητής νοημοσύνης, η οποία εκ των υστέρων αγοράστηκε από την Google, έφτιαξε ένα πρόγραμμα που το ονόμασε Αλφαζέροου (AlphaZero). Το πρόγραμμα αυτό δεν τράφηκε με καμία παρτίδα, κανένα μοτίβο, καμία τακτική ή στρατηγική. Του δόθηκαν μόνο οι κανόνες του παιχνιδιού, και αφέθηκε μόνος του να παίζει παρτίδες, ώστε να διδαχθεί από τον εαυτό του. Όπως περίπου στην ταινία Παιχνίδια Πολέμου.

Μετά από τέσσερις ώρες μηχανικής μάθησης, ο AlphaZero έπαιξε 100 παρτίδες με τον Stockfish. Κέρδισε τις 28, έφερε 72 ισοπαλίες και καμία ήττα! Εκπληκτικό αποτέλεσμα. Λίγους μήνες μετά, έπαιξε άλλες 1000 παρτίδες με τον Stockfish, σε παιχνίδια με μεγαλύτερο χρόνο (που ευνοεί τον Stockfish), αλλά το αποτέλεσμα ήταν εξίσου συντριπτικό. 155 νίκες, 6 ήττες και 839 ισοπαλίες.

Θα επαναλάβω ότι ο AlphaZero είναι μία μηχανή που έχει μάθει σκάκι παίζοντας μόνος του! Οι δύο μηχανές έφερναν ισορροπημένα αποτελέσματα μόνο όταν ο Stockfish είχε στη διάθεσή του 30 φορές περισσότερο χρόνο από τον AlphaZero για την παρτίδα.



Για την ιστορία να πούμε ότι ιδρυτής της εταιρείας (DeepMind) που έφτιαξε το πρόγραμμα AlphaZero είναι ο Ντέμης Χασάμπης από το Λονδίνο. Ο πατέρας του είναι Ελληνοκύπριος και η μητέρα του από τη Σιγκαπούρη. Αυτό βεβαίως είναι απλώς ένα παράδειγμα. Τον αιώνα που ζούμε γίνεται ολοένα και περισσότερο αντιληπτή η παρουσία αλγορίθμων μηχανικής μάθησης στη ζωή μας.

Ιδού ορισμένα παραδείγματα: επιλογή αναρτήσεων στα μέσα κοινωνικής δικτύωσης, επιλογή διαφημίσεων, ταινιών, τραγουδιών, προϊόντων σε υπηρεσίες του διαδικτύου, έλεγχος τραπεζικών συναλλαγών, αυτόματη διόρθωση κειμένων, αναγνώριση προσώπων από οπτικό υλικό, αναγνώριση φωνής, χάρτες και πλοήγηση αυτοκινήτων ή δρόνων (τηλεσκαφών), αναζήτηση στο διαδίκτυο, αυτόματη εξυπηρέτηση πελατών, συσκευές «έξυπνων σπιτιών», αυτόματη μετάφραση ή υποτιτλισμός, επεξεργασία εικόνας, ιατρική διάγνωση.

Στο μέλλον, θα χρησιμοποιούνται για πολύ περισσότερα πράγματα, με ριζικές αναμενόμενες επιπτώσεις στην οικονομία, στην παιδεία, στην εύρεση εργασίας, στις ανθρώπινες σχέσεις, παντού!

Δημοσιεύθηκε στην Εστία, 26 Ιανουαρίου 2022.

https://ardin-rixi.gr/archives/241637www.fotavgeia.blogspot.com

Δεν υπάρχουν σχόλια: