Μοντελοποίηση χρονοσειρών κρουσμάτων και θανάτων από Covid – 19 στην Ελλάδα με χρήση μεθόδων μηχανικής μάθησης

Η SARS-CoV-2 (Severe Acute Respiratory Syndrome) είναι μια μολυσματική ασθένεια που μεταδίδεται από άνθρωπο σε άνθρωπο και έκανε την εμφάνισή της τον Δεκέμβριο του 2019 σε μια πόλη της Κίνας, την Wuhan. Μετά από πολλές καταγεγραμμένες περιπτώσεις εμφάνισης του ιού σε όλο τον κόσμο, στις 11 Μαρτίου 2...

Full description

Bibliographic Details
Main Author: Λυμπέρη, Αναστασία
Other Authors: Lymperi, Anastasia
Language:Greek
Published: 2023
Subjects:
Online Access:https://hdl.handle.net/10889/25284
Description
Summary:Η SARS-CoV-2 (Severe Acute Respiratory Syndrome) είναι μια μολυσματική ασθένεια που μεταδίδεται από άνθρωπο σε άνθρωπο και έκανε την εμφάνισή της τον Δεκέμβριο του 2019 σε μια πόλη της Κίνας, την Wuhan. Μετά από πολλές καταγεγραμμένες περιπτώσεις εμφάνισης του ιού σε όλο τον κόσμο, στις 11 Μαρτίου 2020 ο Παγκόσμιος Οργανισμός Υγείας (World Health Organization – WHO) αύξησε την εκτίμηση του ως πανδημία σε παγκόσμιο επίπεδο. Στην Ελλάδα έχουν καταγραφεί 5.920.428 επιβεβαιωμένα κρούσματα και 36.447 χιλιάδες θάνατοι μέχρι και τον Μάρτιο του 2023. Τα άτομα που νοσούν εμφανίζουν συμπτώματα πνευμονίας, άλλοτε σε ήπια, κι άλλοτε σε βαριά μορφή και τότε χρήζουν νοσηλείας. Ο COVID – 19 φαίνεται να μεταδίδεται μέσω των σταγονιδίων, για αυτό και τα περισσότερα μέτρα που έχουν ληφθεί από τις κυβερνήσεις, ώστε να μειωθούν τα κρούσματα και κατά συνέπεια η εξάπλωση του ιού, στοχεύουν - αφορούν την όσο γίνεται μικρότερη συγκέντρωση ατόμων, ειδικά σε κλειστούς χώρους, την υποχρεωτική χρήση μάσκας σε όλους τους χώρους και υποχρεωτική τηλεργασία σε μεγάλο ποσοστό των εργαζομένων σε πολλές επιχειρήσεις. Η χρήση γνωστών μαθηματικών επιδημιολογικών μοντέλων (SIR) και παραλλαγές αυτών ανάλογα με τις συνθήκες, τα οποία περιλαμβάνουν τις ευπαθείς ομάδες, τους ασθενείς και αυτούς που πεθαίνουν ή αναρρώνουν, μας βοηθά στην περαιτέρω κατανόηση της επιδημίας και της εξέλιξης της. Όμως οι περιορισμένοι βαθμοί ελευθερίας τους, καθώς και η ανάγκη για εκτίμηση εκ των προτέρων κάποιων παραμέτρων τους και συγχρόνως, η μη δυνατότητα μεταφοράς μοντέλων μεταξύ κρατών λόγω εγγενών διαφορών, κάνει αναγκαία την χρήση μοντέλων μηχανικής μάθησης για την δημιουργία αποδοτικότερων μοντέλων πρόβλεψης των κρουσμάτων και των θανάτων από Covid-19. Στην παρούσα διπλωματική, ασχοληθήκαμε με δεδομένα που αφορούν συγκεκριμένα την Ελλάδα (ελεύθερα διαθέσιμα από το European Centre for Disease Prevention and Control). Με τη βοήθεια των παραπάνω μοντέλων και μέσω εργαλείων τεχνητής νοημοσύνης, χρησιμοποιήσαμε ιστορικά δεδομένα για κρούσματα, εμβολιασμούς, θανάτους, εισαγωγές σε νοσοκομεία κ.α., για το διάστημα από 27 Μαρτίου 2020 έως και τις 5 Μαΐου 2021 για την εκπαίδευση μοντέλων πρόβλεψης των κρουσμάτων και των θανάτων σε ορίζοντα ημέρας, εβδομάδας και μήνα. Ύστερα από την εκπαίδευση των συγκεκριμένων μοντέλων, εφαρμόσαμε τα εκπαιδευμένα μοντέλα σε μοντέλα επαλήθευσης με σκοπό να εξετάσουμε την καταλληλόλητα του μοντέλου για τα δεδομένα του κορονοϊού και διαπιστώσαμε ότι το μοντέλο μηχανικής μάθησης μας δίνει αρκετά ικανοποιητικά αποτελέσματα, ειδικά όσον αφορά βραχυπρόθεσμες προβλέψεις κρουσμάτων. Παράλληλα, εξετάσαμε την αποδοτικότητα του κλασσικού επιδημιολογικού μοντέλου SIR στα δεδομένα της Ελλάδας, για τις προβλέψεις της επόμενης μέρας, της επόμενης εβδομάδας και του επόμενου μήνα, για τα κρούσματα και τους θανάτους αντίστοιχα, το οποίο με τη σειρά του δίνει ακόμα πιο ικανοποιητικά αποτελέσματα για την πρόβλεψη των κρουσμάτων, αλλά δεν συμβαίνει το ίδιο και για την πρόβλεψη των θανάτων για οποιοδήποτε χρονικό διάστημα μελετήσαμε. Έπειτα από σύγκριση των δύο μοντέλων, διαπιστώσαμε ότι το επιδημιολογικό μοντέλο ανταποκρίνεται καλύτερα στην πρόβλεψη των κρουσμάτων για το επόμενο χρονικό διάστημα σε σχέση με το μοντέλο παλινδρόμησης, ενώ και τα δύο φαίνεται να παρουσιάζουν αδυναμία στην πρόβλεψη θανάτων για μεγάλο χρονικό διάστημα από την περίοδο που μελετάμε. Τέλος, μελετάμε την δυνατότητα επέκτασης του μοντέλου ώστε να λαμβάνει καθημερινά καινούρια δεδομένα και να ανανεώνεται η λίστα, ώστε να παράγονται νέες προβλέψεις.