| Περίληψη: | Καθώς ζούμε στην εποχή που ο πιο πολύτιμος πόρος του κόσμου δεν είναι πλέον το
πετρέλαιο, αλλά η πληροφορία, οι εταιρίες τεχνολογίας επικεντρώνονται στο
πώς μπορούν να την συλλέξουν και να εξάγουν πολύτιμα συμπεράσματα για να
εξελίξουν τις τρέχουσες τεχνολογίες τους.
Ο όγκος των δεδομένων που παράγουμε κάθε μέρα είναι 2,5 πεντάκις εκατομμύρια
bytes με τον τρέχοντα ρυθμό μας. Το αποτέλεσμα είναι ότι η επεξεργασία και η
εξαγωγή σημαντικών πληροφοριών είναι ανθρώπινα αδύνατη. Έτσι, οι εταιρείες
χρησιμοποιούν αυτοματοποιημένες τεχνικές για την εξαγωγή γνώσεων από μεγάλες
Βάσεις Δεδομένων όπως τη Μηχανική Μάθηση.
Η εκπαίδευση της μηχανής όμως είναι μια διαδικασία που πραγματοποιείται από
ανθρώπους, έτσι η αμεροληψία μιας απόφασης που λαμβάνει ένα σύστημα μηχανικής
μάθησης είναι αμφιλεγόμενη. Ως αποτέλεσμα, η κακομεταχείριση δεδομένων από
μηχανικούς μπορούν να οδηγήσουν σε εξαγόμενη γνώση που είναι προκατειλημμένη.
Ο στόχος της διπλωματικής ήταν η ανάπτυξη ενός εργαλείου αναφοράς στο οποίο θα
έχουν πρόσβαση όλοι οι ερευνητές και προγραμματιστές που ενδιαφέρονται να
ανακαλύψουν με την χρήση της μετρικής του Disparate Impact ποιο μοντέλο μηχανικής
μάθησης θα ήταν πιο ‘δίκαιο’ στο δικό τους σύνολο δεδομένων. Ο χρήστης μπορεί να
εισάγει το δικό του σύνολο δεδομένων μέσω του web application επιλέγοντας τα πεδία
τα οποία θέλει να μελετήσει και να γίνει η ανάλυση, επιστρέφοντας σε πραγματικό
χρόνο τα αποτελέσματα που αναπαράγονται από τα διάφορα μοντέλα μηχανικής
μάθησης που εφαρμόζονται πάνω στα δεδομένα που τροφοδότησε στο σύστημα καθώς και τα αποτελέσματα του Disparate Impact για κάθε μοντέλο ξεχωριστά.
|