Ο όρος Μηχανική
Μάθηση (Machine
Learning) εισήχθη από
τον Arthur Samuel, ενώ
εργαζόταν για την IBM το
1959, κυρίως για να
περιγράψει τις εργασίες
αναγνώρισης προτύπων που
παρείχαν τη συνιστώσα
“μάθησης” στα
πρωτοποριακά τότε
συστήματα Τεχνητής
Νοημοσύνης (ΤΝ). Η
έννοια της Τεχνητής
Νοημοσύνης διερευνήθηκε
θεωρητικά και
δοκιμαστικά από τη
δεκαετία του 1930, αν
και μελετήθηκε πιο
συστηματικά μετά το
περίφημο Dartmouth
Workshop του 1956 (Kline
2011). Εκεί, μεταξύ
άλλων, ο John McCarthy,
ερευνητής στο ΜΙΤ εκείνη
την εποχή, πρότεινε τον
όρο Τεχνητή Νοημοσύνη
έναντι της Κυβερνητικής
(Cybernetics).
|
|
|
Σε αυτά τα πρώτα
χρόνια, τα συστήματα
Machine Learning
θεωρούνταν μόνο ως μέρος
ενός ευρύτερου
συστήματος Τεχνητής
Νοημοσύνης. Έκτοτε, το
φάσμα των πρακτικών
εφαρμογών της Μηχανικής
Μάθησης είναι πολύ ευρύ,
ξεπερνώντας τα στενά
όρια που όριζε το
πλαίσιο της ΤΝ. Σήμερα,
υπάρχουν περισσότερα
αυτόνομα συστήματα
Machine Learning απ’
ό,τι υπάρχουν στοιχεία
Machine Learning σε
αρχιτεκτονικές ΤΝ.
Οι όροι Artificial
Intelligence και Machine
Learning συχνά
εναλλάσσονται
καταχρηστικά για πολλούς
λόγους (μόδα,
χρηματοδότηση ή ακόμη
και άγνοια),
δημιουργώντας σύγχυση
στους μη ειδικούς. Ένας
γενικός κανόνας είναι
ότι αν το σύστημα
ενεργεί χωρίς παρέμβαση,
τότε μάλλον πρόκειται
για ΤΝ. Εάν το σύστημα
ταξινομεί ή προβλέπει
μέσω μάθησης, τότε
πρόκειται για Machine
Learning.
Η διαδικασία της
μάθησης στον υπολογιστή
καθιερώθηκε το 1997 από
τον καθηγητή Tom M.
Mitchel του
Πανεπιστημίου Carnegie
Mellon, στο διάσημο
απόσπασμα του λέει
(1997): “Ένα πρόγραμμα
υπολογιστή λέγεται ότι
μαθαίνει από την
εμπειρία Ε σε σχέση με
κάποια κατηγορία
εργασιών Τ και μέτρο
απόδοσης Ρ, αν η απόδοσή
του σε εργασίες της Τ,
όπως μετράται από το Ρ,
βελτιώνεται με την
εμπειρία Ε”. Τα
αυτοκινούμενα αυτοκίνητα
χρησιμοποιούν συστήματα
ΤΝ, το σύστημα αυτόματης
όρασης που αναγνωρίζει
ένα επικείμενο ατύχημα
είναι Machine Learning.
Κατά τη διάρκεια
αυτής της επιστημονικής
εξέλιξης, η Machine
Learning ακολούθησε τη
μοίρα της ΤΝ και γνώρισε
μεγάλες περιόδους
χαμηλού ενδιαφέροντος
και χαμηλής χρηματοδότησης,
που συχνά αναφέρονται ως
“χειμώνες της ΤΝ”. Παρ’
όλα αυτά, η παρούσα
περίοδος είναι αρκετά
διαφορετική, καθώς η
χρονική στιγμή των
πρόσφατων τεχνολογικών
εξελίξεων και της
έναρξης των νέων δομών
του Machine Learning
συμπίπτει ιδανικά. Οι
προσιτοί μεγάλης
υπολογιστικής ισχύος
υπολογιστές επέτρεψαν τη
χρήση πολύπλοκων και
απαιτητικών
αρχιτεκτονικών Βαθιάς
Μάθησης (DL), όπως τα
Recurrent Neural
Networks και τα
Convolutive Neural
Networks, σε κοινές
καθημερινές εφαρμογές.
Επιπλέον, αλγόριθμοι
όπως τα Support Vector
Machines και τα Random
Forests και τεχνικές
όπως kernelization,
bagging και boosting
επέτρεψαν για πρώτη φορά
την εφαρμογή της Machine
Learning σε σχετικά
μικρά σύνολα δεδομένων.
Επιπλέον, η
διαθεσιμότητα δωρεάν
βιβλιοθηκών Deep
Learning ανοικτού κώδικα
(που υποστηρίζονται από
εμπορικούς κολοσσούς),
όπως το TensorFlow και
το PyTorch, απλοποίησε
τη χρήση της DL για
όλους.
Η εφαρμογή της
Μηχανικής Μάθησης σε
οικονομικά προβλήματα
μπορεί να εντοπιστεί ήδη
από το 1974 (Lee and Lee
1974), αν και μόνο ως
απλή αναφορά στην
περίληψη. Η πρώτη
εργασία που συναντήσαμε
να εφαρμόζει πραγματικά
μια μεθοδολογία Machine
Learning αποκλειστικά σε
ένα οικονομικό πρόβλημα
είναι η μελέτη των Wang
et al. (1984). Η εργασία
υιοθετεί τον όρο
Artificial Intelligence,
αν και πιθανότατα
πρόκειται για κατάχρηση
σύμφωνα με τη διάκριση
που κάναμε παραπάνω, και
ο σωστός όρος θα έπρεπε
να είναι Machine
Learning. Το 1988 ο
White, δημοσίευσε μια
εργασία που αφορούσε μια
εφαρμογή Νευρωνικών
Δικτύων (ΝΝ) για την
πρόβλεψη των ημερήσιων
αποδόσεων των μετοχών
της IBM. Έκτοτε, η
εμφάνιση του Machine
Learning στα οικονομικά
αυξάνεται σταθερά.
Αρχικά, εφαρμόστηκε στην
πρόβλεψη
χρηματοοικονομικών
χρονοσειρών, όπου είναι
ευρέως διαθέσιμα μεγάλα
σύνολα δεδομένων. Τα
συστήματα Machine
Learning εκείνης της
εποχής απαιτούσαν -για
αποτελεσματική
εκπαίδευση- εκτεταμένα
σύνολα δεδομένων που δεν
υπήρχαν σε άλλους τομείς
των οικονομικών.
Επιπλέον, η εκπαίδευση
ήταν πολύ χρονοβόρα λόγω
της -συγκριτικά- χαμηλής
επεξεργαστικής ισχύος
των υπολογιστών της
εποχής.
Σήμερα, η χρήση
πολλών νέων
αρχιτεκτονικών Machine
Learning που δεν
απαιτούν αδικαιολόγητα
μεγάλα σύνολα δεδομένων,
αποτελεί μια
ενδιαφέρουσα και πολλά
υποσχόμενη κατεύθυνση
στην οικονομική πρόβλεψη.
Αυτό ισχύει όχι μόνο για
χρηματοοικονομικά
προβλήματα, αλλά και για
μακροοικονομικές ή
μικροοικονομικές
εφαρμογές όπου τα σύνολα
δεδομένων είναι εγγενώς
περιορισμένου μεγέθους.
Ως αποτέλεσμα, οι
πρόσφατες εφαρμογές
Machine Learning σε (για
παράδειγμα)
επιχειρηματικούς κύκλους
και πρόβλεψη ύφεσης
φαίνονται πολύ
επιτυχημένες σε σύγκριση
με τα παραδοσιακά
εμπειρικά μοντέλα. Επί
του παρόντος, συναντάμε
νέες μεθοδολογίες που
συνενώνουν και
συνδυάζουν την
οικονομετρία με την
Machine Learning (π.χ.
Garch-SVM). Επιπλέον,
είναι ενδιαφέρον πώς οι
τεχνικές Machine
Learning και οι
εμπειρικές διαδικασίες
όπως η διασταυρούμενη
επικύρωση είναι πλέον
δημοφιλείς και
υιοθετούνται σταθερά
στις παραδοσιακές
μεθοδολογίες της
Οικονομετρίας.
* Περικλής Γκόγκας,
Καθηγητής Οικονομικής
Ανάλυσης και Διεθνών
Οικονομικών, Τμήμα
Οικονομικών Επιστημών Δημοκρίτειου
Πανεπιστήμιου Θράκης
Δημοσίευση:
Machine Learning in
Economics and Finance,
Periklis Gogas &
Theophilos
Papadimitriou,
Computational Economics
volume 57, pages 1–4
(2021)
Πρώτη δημοσίευση
στον Οικονομικό
Ταχυδρόμο
|
|