Υπολογιστικές Μέθοδοι για Ανάλυση Μεγάλων Δεδομένων (Hadoop και MapReduce)

Η λύση του Hadoop & ΜapReduce και των συνεργαζόμενων εφαρμογών τους περιλαμβάνει μεταξύ άλλων μια απλή αλλά πολύ ισχυρή μέθοδο για την επεξεργασία και την ανάλυση των εξαιρετικά μεγάλων συνόλων δεδομένων, ακόμη και μέχρι το επίπεδο πολλαπλών PetaByte. Κατά βάση το MapReduce είναι μια δια...

Full description

Bibliographic Details
Main Authors: Verykios, Vasileios, Kagklis, Vasileios, Stavropoulos, Ilias, Βερύκιος, Βασίλειος, Καγκλής, Βασίλειος, Σταυρόπουλος, Ηλίας
Format: 7
Language:Greek
Published: 2016
Subjects:
Online Access:http://localhost:8080/jspui/handle/11419/2973
Description
Summary:Η λύση του Hadoop & ΜapReduce και των συνεργαζόμενων εφαρμογών τους περιλαμβάνει μεταξύ άλλων μια απλή αλλά πολύ ισχυρή μέθοδο για την επεξεργασία και την ανάλυση των εξαιρετικά μεγάλων συνόλων δεδομένων, ακόμη και μέχρι το επίπεδο πολλαπλών PetaByte. Κατά βάση το MapReduce είναι μια διαδικασία για το συνδυασμό των δεδομένων από πολλαπλές εισόδους (δημιουργώντας το «map»), και μετά αναγωγή (reduce) χρησιμοποιώντας μία λειτουργία που θα διυλίσει τα επιθυμητά αποτελέσματα. Στο κεφάλαιο αυτό παρουσιάζονται πολλαπλές περιπτώσεις χρήσης των Hadoop & MapReduce και των εφαρμογών τους για περιπτώσεις πολλών TB ακόμη και αρκετών PB. το Hadoop χρησιμοποιεί ένα κατανεμημένο σύστημα αρχείων, το HDFS. Το σύστημα του Hadoop/MapReduce είναι χρήσιμο για δεδομένα τα οποία είναι λιγότερο δομημένα όπως για παράδειγμα οι σελίδες Διαδικτύου ή πολλαπλά δεδομένα εγγράφων ή εικόνων τα οποία δεν είναι πλήρως οργανωμένα-δομημένα.