"The central tenet of bioinformatics essentially claims that genetic information exists in symbolic abstraction from the natural world and is subsequently ‘encoded’ into genes."
Το άρθρο είναι ενδιαφέρον σε ό,τι αφορά τις απόψεις και την παρρησία με την οποία αυτές διατυπώνονται. Σε γενικές γραμμές, τα βασικά σημεία του είναι τα εξής:
1. Η βιολογική πληροφορία ξεπερνά τα στενά όρια της γονιδιωματικής αλληλουχίας, καθώς υπάρχουν κληρονομήσιμα χαρακτηριστικά που δεν αποτελούν μέρος του γονιδιώματος.
2. Η βιοπληροφορική ανάλυση, περιοριζόμενη στην ανάλυση αλληλουχιών και δομών βιομορίων, δίνει μια χρήσιμη πλην όμως στατική και μονοδιάστατη ερμηνεία των βιολογικών συστημάτων.
3. Υπάρχει ανάγκη να προχωρήσουμε σε δυναμικές και πολυδιάστατες θεωρήσεις των βιολογικών φαινομένων.
Χωρίς κάποια ιδιαίτερη διάθεση να "προστατεύσουμε" το γνωστικό μας αντικείμενο υπάρχει εδώ μια σειρά από επιχειρήματα που είναι όχι μόνο αδύναμα αλλά και δυνητικά επικίνδυνα.
Ας ξεκινήσουμε από το βασικό σημείο κριτικής του άρθρου. Ότι δηλαδή, η βιοπληροφορική προσέγγιση που στοχεύει σε στατικές ερμηνείες, αναλλοίωτων χαρακτηριστικών (αλληλουχιών που διατηρούνται σε εξελικτικούς χρόνους, δομές πρωτεϊνών που παραμένουν απαράλλαχτες από το πιο ταπεινό βακτήριο ως τα πιο πολύπλοκα θηλαστικά) είναι εν ολίγοις ξεπερασμένη αν δεν ενσωματώσει προσεγγίσεις που θα είναι δυναμικές, συστημικές και στοχαστικές. Η άποψη αυτή μάλιστα υποστηρίζεται από το παρακάτω σχήμα, όπου μάλλον απλοϊκά, η μελέτη όλων των παραπάνω ιδιοτήτων εμφανίζεται ως ανάλογη της "κορυφής του παγόβουνου" με το μεγαλύτερο πλούτο να κρύβεται στα "αναλογικά σήματα" κάτω από την επιφάνεια.
Οι συγγραφείς επικαλούνται, στο σημείο, αυτό μια σειρά από γεγονότα που οι ίδιοι θεωρούν ότι καταδεικνύουν την αδυναμία του "δόγματος" της βιοπληροφορικής. Ως πρώτο από αυτά, αναφέρουν το c-value paradox, το παράδοξο δηλαδή σύμφωνα με το οποίο η φαινομενική πολυπλοκότητα των οργανισμών δε συσχετίζεται με το μέγεθος του γονιδιώματός τους. Από το παράδοξο αυτό σπεύδουν να συνάγουν ότι η "αλληλουχία μόνη της δε φτάνει" και ότι συνεπώς κάτι άλλο (κάτω από την επιφάνεια) είναι αυτό που διαμορφώνει τις ξεχωριστές ιδιότητες των οργανισμών. Είναι όμως πράγματι έτσι; Κανείς δεν μπορεί να μας διαβεβαιώσει ότι έχουμε κατανοήσει πλήρως τις δυνατότητες κωδικοποίησης του γονιδίωματος. Το ακριβώς αντίθετο συμβαίνει και διακεκριμένοι επιστήμονες έχουν επιχειρηματολογήσει για την ύπαρξη κρυμμένων "στοιβάδων" κωδικοποίησης στις γονιδιωματικές αλληλουχίες (χαρακτηριστικά παραδείγματα εδώ και εδώ).
Από την "εικονοκλαστική" κριτική διάθεση των συγγραφέων δεν ξεφεύγουν ούτε οι προσεγγίσεις αλληλούχισης νέας γενιάς (NGS), οι οποίες είναι κατ' αυτούς προβληματικές καθώς: "one does have to question why this technology was not aimed at directly capturing a more primary form of physical data. For example, perhaps it would have been possible to directly measure interactive energies or binding strengths, while using the sequence information only as a positional reference." Το παραπάνω σχόλιο δεν αντέχει σε κριτική και φαίνεται ότι στην καλύτερη περίπτωση οι συγγραφείς δεν έχουν πλήρη επίγνωση της NGS μεθοδολογίας, δύο από τα βασικά χαρακτηριστικά της οποίας είναι ότι α) βασίζεται σε ενέργειες αλληλεπίδρασης β) χρησιμοποιεί το γονιδίωμα ως σημείο αναφοράς.
Τα παραπάνω επιχειρήματα παρατίθενται ενδεικτικά. Υπάρχουν κι αρκετά άλλα στα οποία διαφαίνεται μια τάση των συγγραφέων προς έναν (μάλλον κακώς εννοούμενο) "εξυπνακισμό". Αρχικά με την επανάληψη της λανθασμένης αντίληψης ότι η βιοπληροφορική ασχολείται μόνο με αλληλουχίες και δομές και ότι περιορίζεται σε μια στατική ερμηνεία των συστημάτων. Είναι αλήθεια πως το μεγαλύτερο μέρος τόσο θεωρητικών όσο και εφαρμοσμένων εργασίων στο πεδίο της Βιοπληροφορικής/Υπολογιστικής Βιολογίας αφορούν τα παραπάνω αλλά αυτό είναι απλώς απόρροια του γεγονότος ότι οι αλληλουχίες και οι δομές είναι οι κατ' εξοχήν βιολογικές οντότητες που α) διατηρούν αναλλοίωτα (invariant) χαρακτηριστικά β) μπορούν να ψηφιοποιηθούν και γ) είναι άμεσα διαθέσιμα (για όσο τουλάχιστον επικρατεί η φιλοσοφία της ανοιχτής πρόσβασης στα επιστημονικά δεδομένα). Οι υπολογιστικοί βιολόγοι όμως (όπως μου αρέσει να αποκαλώ τους bioinformaticians) ασχολούνται επίσης σε μεγάλο βαθμό με την ανάλυση και την ερμηνεία αποτελεσμάτων από αυτά που οι "βιολόγοι του πάγκου" ονομάζουν "πραγματικά πειράματα" όπως είναι αυτά της γονιδιακής έκφρασης και της ρύθμισής της καθώς και μια σειρά από άλλες προσεγγίσεις μεγάλης κλίμακας στα πεδία της γονιδιωματικής, της πρωτεομικής αλλά και της κυτταρικής βιολογίας. (Από καθαρά τεχνική άποψη, την ανάλυση κύριων συνιστωσών (PCA) που διενεργεί ο χειριστής ενός FACS sorter μπορεί να καταλάβει καλύτερα ένας υπολογιστικός βιολόγος απ' ότι ο κυτταρικός βιολόγος που διενεργεί το πείραμα).
Σε ό,τι αφορά την "προσκόλληση" της βιοπληροφορικής σε στατικά συστήματα, κι εδώ οι συγγραφείς φαίνεται να υπερ-απλουστεύουν τα πράγματα μπερδεύοντας το εφικτό με το επιθυμητό. Όντας αυτοί που επιχειρούν να αναλύσουν τα δεδομένα από ένα πολύπλοκο σύστημα, οι υπολογιστικοί βιολόγοι έχουν στόχο να ενσωματώσουν όσο το δυνατόν καλύτερα τα δεδομένα αυτά σε μια αφηρημένη θεώρηση που να έχει όμως νόημα. Και πράγματι αυτό που ζητείται τις περισσότερες φορές από έναν "βιοπληροφορικάριο" (θα χρησιμοποιώ αυτόν τον όρο για να αναφερθώ σε αυτό το -ανύπαρκτο- είδος "τεχνικού" το οποίο έχουν συχνά στο μυαλό τους οι "πραγματικοί" βιολόγοι) είναι να διαχωρίσει το πραγματικό σήμα/νόημα από τον τυχαίο θόρυβο. Κάτι τέτοιο είναι προφανώς το επιθυμητό, είναι όμως αδύνατο να συμβεί χωρίς ένα βαθμό αφαίρεσης. Το πρώτο πράγμα που θα πρέπει να αφαιρεθεί είναι ακριβώς ο θόρυβος, το στοχαστικό μέρος του φαινομένου, ούτως ώστε να αναδειχθούν οι όποιες αναλλοίωτες, καθορίζουσες ιδιότητές του.
Στο σημείο αυτό οι συγγραφείς φαίνεται να ενστερνίζονται μια σχετικά όψιμη μόδα που εκφράζεται με την αναζήτηση στοχαστικότητας, τυχαιότητας, ποικιλομορφίας και χάους σε όλα τα επίπεδα της βιολογικής επιστήμης. Επισημαίνουν, για παράδειγμα, επικριτικά ότι τα δίκτυα πρωτεϊνικών αλληλεπιδράσεων δεν είναι τίποτα περισσότερο από στατικές απεικονίσεις ή με τα δικά τους λόγια: "static snapshots [...] that speak very little of the dynamic molecular forces that truly define these interactions". Υπάρχει όμως ένας πολύ καλός λόγος για τον οποίο τα δίκτυα είναι στατικά κι αυτός είναι ότι το να δημιουργήσει κανείς δυναμικά δίκτυα σε ένα τόσο πολύπλοκο σύστημα χωρίς πρώτα να το μελετήσει στατικά είναι το ανάλογο του να βάζεις "το κάρο μπροστά από τα άλογα". Κανείς δε διαφωνεί σχετικά με τη δυναμική φύση των βιολογικών συστημάτων, αλλά είναι αφελές να νομίζουμε ότι μπορούμε να μελετήσουμε δυναμικά δίκτυα χωρίς να έχουμε πρώτα κατανοήσει τις ιδιότητες των ίδιων δικτύων "εν στάσει". Είμαι σίγουρος ότι οι αδερφοί Wright δε θα σκέφτηκαν ούτε στιγμή να κατασκευάσουν το αεροπλάνο τους εν πτήσει. Με τον ίδιο τρόπο, το να αποζητούμε την επαναφορά της πολυπλοκότητας από την μπροστινή πόρτα, τη στιγμή που έχει γίνει τόση προσπάθεια για την εκπαραθύρωσή της μοιάζει να υπονομεύει το ίδιο το ερευνητικό πρόγραμμα (εδώ με την γενικότερη έννοια).
Το σημαντικότερο όμως, κι αυτό στο οποίο αναφέρομαι ως "δυνητικά επικίνδυνο" παραπάνω, είναι ότι το άρθρο επιχειρηματολογεί υπέρ μιας θεώρησης των βιολογικών συστημάτων ως "χαοτικών, στοχαστικών, μάυρων κουτιών" τα οποία δε θα μπορέσουμε να καταλάβουμε αν επιμείνουμε στις προσεγγίσεις που βασίζονται στο "βιοπληροφορικό δόγμα". Αντί να προσπαθούμε δηλαδή να μελετήσουμε την τεράστια πολυπλοκότητα των βιολογικών φαινομένων μέσα από τις κληρονομούμενες, αναλλοίωτες ιδιότητές τους θα πρέπει να επιτεθούμε "κατά μέτωπο", βάζοντας στα πειράματα και τα μοντέλα μας όσο το δυνατόν περισσότερες παραμέτρους και περιμένοντας να αναδυθούν αυθόρμητα οι χαρακτηριστικές ιδιότητες του συστήματος μέσα από το χάος. Το πρόβλημα που προκύπτει από αυτήν τη θεώρηση είναι προφανές. Μέσω ενός επιστημολογικού προγράμματος μερικών δεκαετιών, πυλώνες του οποίες υπήρξαν η ψηφιοποίηση βιολογικών δεδομένων και η αντικειμενική ανάλυση αναλλοίωτων χαρακτηριστικών του γονιδιώματος κάτω από το πρίσμα της εξελικτικής θεωρίας, καταφέραμε να διευρύνουμε το παράδειγμα της μοριακής βιολογίας, να εμπλουτίσουμε το "βασικό δόγμα" της και να ανακαλύψουμε νέους μηχανισμούς στα πεδία τόσο της βιοχημείας (π.χ. μη-κωδικά RNA) όσο και της κυτταρικής βιολογίας (διαφοροποίηση κυττάρων μέσω της δράσης συγκεκριμένων μεταγραφικών παραγόντων), κάτι που θα ήταν αδύνατο να συμβεί αν π.χ. ο Yamanaka είχε προσπαθήσει να ενσωματώσει τη "στοχαστικότητα" στα πειράματά του. Υπάρχει ένα βασικός λόγος που η αφαίρεση (abstraction) και η γενίκευση (generalization) βρίσκονται στη βάση των "βιοπληροφορικών" προσεγγίσεων. Αυτός είναι γιατί παραμένουν τα πιο ασφαλή επιστημολογικά εργαλεία που διαθέτουμε για να πειραματιστούμε και να ερμηνεύσουμε τα φυσικά φαινόμενα. Κι από αυτήν την άποψη το "δόγμα της Βιοπληροφορικής" δε διαφέρει πολύ από αυτό που στην ουσία είναι το "Δόγμα της Βιολογίας".