Πονοκέφαλο στους θεράποντες ιατρούς προκαλεί συχνά η θεραπεία ασθενών που έχουν συμπτώματα χωρίς κάποια προφανή αιτία. Απαντήσεις μπορούν να δοθούν με τη βοήθεια της γενετικής και της ανάλυσης του γονιδιώματος του κάθε ασθενούς. Όπως αναφέραμε στο προηγούμενο άρθρο («Το CRISPR ξαναγράφει τη Γενετική Μηχανική»), η αλληλούχιση του DNA, για παράδειγμα, μπορεί να συμβάλει στη λήψη ορθότερων αποφάσεων κατά την επιλογή μιας θεραπείας. Ωστόσο, ο μεγάλος όγκος και η πολυπλοκότητα των δεδομένων που δημιουργούνται από μια τέτοια διαδικασία, συχνά καθιστά δύσκολη και χρονοβόρα την επεξεργασία τους. Σημαντικότερος παράγοντας είναι ο τρόπος οργάνωσης και όχι ο όγκος των «Μεγάλων Δεδομένων».
Η ανάλυση των μεγάλων δεδομένων επιτυγχάνεται με τη Βιοπληροφορική (bioinformatics), τον επιστημονικός κλάδο που προέκυψε από τη συνεργασία των επιστημών της μοριακής βιολογίας και της πληροφορικής. Ως βιολογικά δεδομένα χαρακτηρίζονται το DNA, το RNA ή και οι πρωτεΐνες που μεταφράζονται ως ψηφιακή πληροφορία και επεξεργάζονται για την εξαγωγή χρήσιμων συμπερασμάτων.
Τα «μεγάλα δεδομένα» αλλάζουν τον τρόπο μελέτης του ανθρώπινου γονιδιώματος
Για αρκετά χρόνια πλέον, τα γονίδια μελετώνται και χαρακτηρίζονται. Αντιπροσωπευτικό παράδειγμα αποτελεί ήδη από τις αρχές του 2000 η ολοκλήρωση της χαρτογράφησης του Ανθρώπινου Γονιδιώματος. Ένα συνηθισμένο ανθρώπινο γονιδίωμα περιέχει περισσότερα από 20.000 γονίδια, που το καθένα ξεχωριστά απαρτίζεται από εκατοντάδες χιλιάδες βάσεις. Η χαρτογράφηση και μόνο του γονιδιώματος απαιτεί εκατοντάδες gigabytes δεδομένων. Η αλληλούχιση πολλαπλών γονιδιωμάτων και η παρακολούθηση των αλληλεπιδράσεων μεταξύ των γονιδίων για την εξαγωγή συμπερασμάτων πολλαπλασιάζει τον αριθμό αυτό αρκετές φορές και ενδέχεται να φτάσει τα 100 petabytes. Είναι λοιπόν, η χρήση των «μεγάλων δεδομένων» που επιτρέπει στους ερευνητές να δουν πώς αλληλεπιδρούν τα γονίδια και να αλλάξει τον τρόπο μελέτης τους.
Ανάλυση μεγάλων δεδομένων
Πλέον δε χρειάζεται να περιμένουμε για την ανάλυση. Αποτελέσματα μπορούν να παρθούν σε σύντομο χρονικό διάστημα, ακόμη και από το πιο απλό εργαστήριο. Με την κατάλληλη χρήση εξελιγμένων λογισμικών βιοπληροφορικής, όπως το EDGE (Empowering the Development of Genomics Expertise), ο χρήστης μπορεί να λάβει άμεσα απαντήσεις σε ερωτήσεις σχετικές με την αλληλούχιση του DNA, την εξακρίβωση ειδών, ακόμη και τη δημιουργία φυλογενετικού δέντρου σε ένα φιλικό και εύχρηστο λειτουργικό σύστημα.
Το EDGE φυσικά δεν είναι το πρώτο εργαλείο βιοπληροφορικής ανάλυσης που προσφέρει εύκολο λειτουργικό σύστημα. Το Galaxy, που κυκλοφόρησε πρώτο το 2005, επιτρέπει στους επιστήμονες τη δημιουργία λειτουργικών δομών βιοπληροφορικής ανάλυσης (pipeline) από μια πληθώρα εύκολων εργαλείων, που είναι διαθέσιμα δωρεάν.
Βιοπληροφορική στην πράξη
Ένα πολύ ενδιαφέρον παράδειγμα του πώς η σωστή ανάλυση των «μεγάλων δεδομένων» μπορεί να συμβάλει στην αποδοτικότερη λήψη αποφάσεων έγινε στο Πανεπιστήμιο της Χάιφα. Οι επιστήμονες ήθελαν να αναλύσουν και να βρουν πώς τα γονίδια αλληλεπιδρούν στην ανάπτυξη των σύνθετων ασθενειών. Ο στόχος τους ήταν σχετικά δύσκολος μιας και η γενετική έκφραση ορισμένων ασθενειών συνήθως έρχεται με την αθροιστική επίδραση διαφόρων γενετικών δεικτών που αλληλεπιδρούν μεταξύ τους. Συνεπώς, όχι μόνο οι ερευνητές έπρεπε να «χτενίσουν» ολόκληρη την αλληλουχία του γονιδιώματος, αλλά έπρεπε και να καταγράφουν τις αλληλεπιδράσεις μεταξύ διαφόρων γονιδίων. Περιττό να αναφέρουμε ότι αυτή η πολυπλοκότητα χρειάζεται έναν τεράστιο όγκο δεδομένων. Ωστόσο, η εν λόγω μελέτη κατάφερε να μειώσει σημαντικά τις πιθανότητες από 900 εκατομμύρια σε μόλις 340.000. Οι επιστήμονες μπόρεσαν να χρησιμοποιήσουν κατάλληλες στατιστικές μελέτες κατά την ανάλυση μεγάλων δεδομένων. Το αποτέλεσμα ήταν η καλύτερη κατανόηση της αλληλεπίδρασης των γονιδίων και η αποτύπωση συγκεκριμένων αλληλεπιδράσεων στον «κοινωνικό χαρακτήρα» των γονιδίων.
Καθώς τα εργαλεία βιοπληροφορικής γίνονται ολοένα και πιο εύχρηστα, η πληροφορική ενδέχεται να χάσει λίγη από την αίγλη που κατέχει στην ανάλυση των μεγάλων δεδομένων. Για τους βιολόγους και του ιατρούς, αυτό θα οδηγήσει σε πιο ευρείες ερμηνείες και τον γενικότερο εκδημοκρατισμό των αποτελεσμάτων.