Computational Genomics Group
  • Home
  • Research
  • Publications
  • Teaching
  • Blog
  • Group Members
  • News
  • Computational Biology Book
  • Data Analysis with R Book
  • CG2 github
  • Fiction

Genome Urbanization: Gene segregation in eukaryotes

3/27/2017

0 Comments

 
Our group's last paper has just appeared in Nucleic Acids Research. In it we introduce a new concept that is related to the architecture of eukaryotic genomes and how it may have evolved to segregate functions in different genomic compartments in a way that is reminiscent of the semi-spontaneous social/ratial segregation of cities.

Genome Urbanization is inspired by the pioneering works on social segregation by Thomas Schelling whereby weak constraints may aggregate to shape macroscopic behaviour in various systems. Using an already published experiment in which we had previously studied how the chromatin structure of yeast promoters may shape gene expression under the accumulation of topological stress, we set out to investigate  whether differential gene expression upon a structurally-related stimulus may be reflected upon the spatial organization of genes. The first thing we found was that when put under topological stress, genes tend to form clusters in space, with groups of 6 or more adjacent genes being consistently up- or down-regulated. This was not so much of a surprise. DNA torsional stress acts exactly on the topology of the nucleus and so it would be expected for genes to follow this constraint. Surprisingly though, some clustering of gene expression also happens under other stress conditions  such as heat shock or nutrient deprivation albeit to a much lesser extent. What this pointed to is that genes occupy positions in the nucleus (even in lthe inear dimension) that allows them to respond to stimuli in a coordinated manner, thus the "micro-motives" of Schelling may be reflected on the local prerequisites of certain genes to be close to others due to their shared affinities for the same transcription factors or because the local environment is more favourable to their dedicated function.

Gene clustering is, of course, nothing new and many people have spotted preferences for genes that are spatially related in terms of expression, co-evolution or co-regulation. Our work, in this respect, focused on the chromatin and local gene structure of the observed gene clusters. We were thus able to define two distinct genome components with properties so different that the allusion to urban neighborhoods was almost spontaneous.

Genes that are "shut-down" upon the accumulation of topological stress were predominantly found close to the centromeres and the nuclear core. They were "old" genes in the sense that they coded for conserved, fundamental functions such as gene transcription and protein processing. More importantly, they were placed within very short distances from each other and with a rather "crammed" orientation that put, very frequently, adjacent genes transcribed in opposing directions. On the other hand, genes that were positively regulated, were found on the other extreme of the nucleus, close to subtelomeric regions. They coded for "newly" acquired stress-response functions, they had complex regulation and were surprisingly aligned with a clear tendency for co-directionality. They also had significantly longer "breathing" intergenic space between them. The set of these structural properties may allow them not only to be "resistant" to topological stress but to even harness DNA supercoiling in order to propel transcription.

This discrepancy in so many levels lead us to propose the Genome Urbanization model according to which, older, more conserved genes are preferentially located in the "old city center". The genome's core resembles the urban plan of a medieval city with its narrow meandering streets leaving little space between houses that appear as if touching each other. At the edges of the chromosomes lies what we call the "suburban genome" where the genome's "nouveau riches", new genes with complex functions that are not necessarily constitutively expressed and are employed only under specific conditions, have created a much different landscape. Here, genes are organized in tandem and with longer intergenic spacers inbetween them, in a way that brings to mind the tract housing of US city suburbia.   
Picture
Genome Urbanization may not be a particular property of the yeast genome, even though unicellularity and the increased gene density compared to more complex eukaryotic genomes is likely to make positional constraints more apparent. We nonetheless believe that similar tendencies may exist in bigger, mammalian genomes and that they may reflect even more intricate regulatory patterns that balance transcriptional homeostasis with expression noise and with the ability to respond to a great number of external and internal stimuli.

Given that the original data were already in our hands since 2006 and the fact that I first presented this concept more than 2 years ago in a talk at the IMBB, FORTH in Crete, this work has been no easy task to complete. It took the combined work of two undergraduate students (Maria Tsochatzidou and Maria Malliarou), the crucial assistance of a fellow bioinformatician (Nikolas Papanikolaou) and the support of long-standing collaborator Joaquim Roca at the CSIC, Barcelona who first introduced me to DNA topology. We are currently looking into many interesting perspectives that this work opens up regarding the evolution of genome architecture in eukaryotes and how gene positioning and chromosome structure may provide insight on the way cells employ transcriptional regulation under various conditions.

This paper is also, strictly speaking, the first paper to come entirely out of our group and thus seeing it published on my son's 5th birthday adds to a sense of accomplishment.
0 Comments

and then they were "fragile" (again)

12/21/2016

0 Comments

 
Just the other day we were discussing a new chemical-coupled NGS method that threatened to change our view on nucleosome positioning, according to which a great proportion of nucleosomes which are simply absent from MNase digestion maps but are revealed to occupy regions where once we thought they were not supposed to.
In a recent paper in Genome Research, Tess Jeffers and Jason Lieb, bring back the notion of fragile nucleosomes, this time through conventional "good-old" MNase-Seq. In a nutshell, what Jeffers and Lieb did is not very different from early works on the concept of fragile nucleosomes (i.e. nucleosomes that can be digested by MNase and are thus "lost" from MNase maps) in the sense that they use differential timing MNase digestion, separating the output and treating a specific set of sequences sizes that comes from low digestion times as  the "fragile" fraction. 

Through a rather straightforward analysis of differential nucleosome positioning in C. elegans embryos, the authors were able to recap most of what we knew about nucleosomes already. Fragile nucleosomes are AT-rich, enriched in promoters of low-expression genes, lacking enrichments in regulatory activating marks and isoforms such as H2A.Z. This reassuring(?) image is summarized in the Figure below (Figure 4a in their paper), where fragility and resistance correspond to the fragile and "well-positioned" fractions of the bulk nucleosomes.
Picture
A number of aspects touched upon the paper of Voong et al., such as exon-intron nucleosomes (a matter of personal interest) or different promoter classes remain unchallenged by this study. One however is  and in a particularly informative way. Jeffers and Lieb show that fragile nucleosomes are extremely enriched in areas of the genome where a number of transcription factors are expected to bind, which can explain the discrepancy in previous maps of MNase-defined nucleosomes and pioneer-factors or CTCF binding sites.

Still, as this little story develops it would be interesting to see if the chemical-mapping method was just a firework or is here to make a difference.
0 Comments

Most of what you knew about nucleosomes is wrong. Or is it?

12/12/2016

2 Comments

 
A recent paper in Cell by the group of Alec Wang, of Northwestern university threatens to change our view of nucleosome positioning. The paper, modestly entitled "Insights into Nucleosome Organization in Mouse Embryonic Stem Cells through Chemical Mapping" presents a new high-throughput method for nucleosome mapping that uses hydroxy-radical cleavage to "radically" transform most of what we know about nucleosome positioning preferences.
The main findings of this "iconoclastic" paper can be summarized in the following:

1. There are discrepancies between the nucleosome maps obtained through MNase sequencing and Chemical Mapping. This comes as an additional level of complexity given that a number of works (see examples here and here) have pointed out the discrepancy between nucleosome positions in vitro and in vivo. This becomes even more complex given that:
a. The authors find positioned nucleosomes exactly where other methods have repeatedly reported nucleosome-free regions such as upstream of transcription start sites, at CTCF binding sites and at the binding sites of pioneer transcriptional regulators of differentiationsuch as Oct4, Sox2 and Nanog. These are all well-reported cases of nucleosome-free regions being key genomic elements of regulation through chromatin (examples here for differentiation TF and here for CTCF). Last but not least, the authors observe a lack of nucleosomes positioned within exons, and instead find them at exon-intron junctions, contrary to what has been widely reported by a number of studies (e.g. here) among which ours was one of the first.

2. The authors attribute these marked discrepancies to inherent biases of the MNase sequencing protocol. This is valid, as a number of works, have in the past reported that digestion timing influences MNase output, as "fragile nucleosomes" (that is nucleosomes that are less stably bound to the the DNA) are more prone to digestion and are thus lost from the sequencing signal. The authors perform a number of convincing analyses to show that the nucleosomes they detect at TSS and pioneer factors binding sites (but not in exon/intron junctions) are indeed such "fragile nucleosomes". 

3. Last but not least, the paper shows a concise nucleosome profile clustering of TSS-regions that is revealing of great variability in the positioning patterns. This is one of the most interesting parts of this study, since such variability can account for the rather complex (and often inconclusive and odd) mean patterns of nucleosome positioning when all genes are pooled together. This finding is reminiscent of similar variability observed among yeast genes (see e.g. here) and even between yeast species such as S. cerevisiae and S. pombe.

The paper is solid methodologically (as it should be, after all it is a Cell Highlight Paper) and one cannot argue about the presented results. Fragile nucleosomes may be indeed picked up by this method but the problem that arises is conceptual rather than factual. A recurrent theme on the phenomenon of nucleosome positioning is its statistical nature, and many (including ourselves here, but most conclusively Andy Fire's lab here) have shown that only a small portion of nucleosomes are well- and reproducibly positioned in a homogeneous cell population. This means that only around 1/10 nucleosomes are actually a) guided by the underlying sequence through specific compositional constraints and b) appear to "matter" in terms of mechanistic aspects related to other functions. Such nucleosomes are precisely the ones found downstream of TSS, on either side of well-defined nucleosome-free regions and within exons, which is striking since these are exactly the points of discrepancy between MNase and the Chemical method presented by Voong et al. What is going on here? Is this a case of a new methodological protocol turning the tables? Is everything we knew about nucleosome positioning wrong? Or could it be that chemical mapping somehow "fixes" nucleosomes on positions that are not functionally relevant? The case of exons is rather odd, since it appears that the two methods yield almost mutually exclusive patterns (see adapted Figure below). Is MNase "pushing" nucleosomes to the center of the exon, or is Chemical mapping fixing them towards the boundaries?

My hunch tells me that we should not rush into discrediting MNase maps yet and this not so much due to the fact that I have been working with those for most of my academic years, but because of a very sound theoretical argument, with evolutionary implications. A number of theoretical models that predict nucleosome positioning have consistently found NFR and well-positioned nucleosomes to coincide with those obtained through MNase sequencing, which means that if we are to "ask" the sequence (at least with the models we have so far) it will tell us that nucleosomes tend indeed to avoid promoter regions, exon-intron junctions and TF-binding sites. This is not entirely contradicted in this work by Voong et al., since they also admit that the "new" nucleosomes belong to the "fragile" counterpart and are thus expected to be less strongly bound. From another point of view, it would be extremely interesting to look at the "fragile nucleosomes" that are picked up by the Chemical mapping and see what predictive models tell us about some of those. I promise to come back to this point, hopefully with some of our own analyses.

Untill then, beware of maps even bearing nucleosomes. 
Picture
2 Comments

Dual roles for transcription factors modulated by a combination of binding site affinities and chromatin interactions

11/9/2016

0 Comments

 
A very interesting paper by the group of good friend A. Papantonis came out recently in Genome Research (Kolovos et al., Genome Res 2016). In this work, the authors study the way TNF stimulation of the inflammatory response may be exerted in human primary cells (HUVECs) through a bimodal role of the NFkB transcription factor. 

In a series of (numerous) well-designed and carefully executed experiments they show that, contrary to conventional thinking, NFkB can actually function repressively, suppressing the expression of a great number of genes during the inflammatory response. More importantly the authors provide insights on mechanistic aspects of this process by demonstrating that NFkB is frequently associated to non-canonical binding sites via pre-existing chromatin loops. Upon activation by TNF, NFkB thus exploits already established enhancer-promoter chromosomal interactions to either directly activate or indirectly suppress (probably through JDP2 recruitment) gene expression within 30 minutes after induction. Among the key findings of this work is the fact that association with its canonical binding sites leads (as expected) to activation but binding to non-canonical sites leads to repression (see Figure below, adapted from Kolovos et al.)

Other important aspects of this work are dealing with the fact that both activation and repression appears to be clustered in specific areas of the genome (TADs), with repression showing a greater tendency to be concentrated (a feature our lab has also observed in similar contexts).

Read the full paper here. 
Picture
0 Comments

Γιατί το "δόγμα" της Βιοπληροφορικής είναι στην ουσία το "δόγμα" της Βιολογίας.

2/2/2016

0 Comments

 
Picture
Σε ένα πρόσφατο άρθρο γνώμης που δημοσιεύεται στο Gene o Gregory Babbitt και συνεργάτες του από το Τεχνολογικό Ινστιτούτο του Rochester αναρωτιούνται αν "Μπορεί όλη η κληρονομήσιμη βιολογική πληροφορία να αναχθεί σε μία μόνο διάσταση"; (Gene, 578:2, p162-166, 2016).  Βασικός στόχος του άρθρου είναι να θέσει εκ νέου την ιεραρχία των στόχων των βιολογικών επιστημών στην εποχή των μεγάλων δεδομένων (και άρα μεγάλων δυνατοτήτων). Μέρος της επιχειρηματολογίας των συγγραφέων αποτελεί μια (μάλλον καλοπροαίρετη) κριτική στη Βιοπληροφορική και στο βασικό της "δόγμα", το οποίο συνοψίζεται στην εξής πρόταση:

"The central tenet of bioinformatics essentially claims that genetic information exists in symbolic abstraction from the natural world and is subsequently ‘encoded’ into genes."

Το άρθρο είναι ενδιαφέρον σε ό,τι αφορά τις απόψεις και την παρρησία με την οποία αυτές διατυπώνονται. Σε γενικές γραμμές, τα βασικά σημεία του είναι τα εξής:
1. Η βιολογική πληροφορία ξεπερνά τα στενά όρια της γονιδιωματικής αλληλουχίας, καθώς υπάρχουν κληρονομήσιμα χαρακτηριστικά που δεν αποτελούν μέρος του γονιδιώματος.
2. Η βιοπληροφορική ανάλυση, περιοριζόμενη στην ανάλυση αλληλουχιών και δομών βιομορίων, δίνει μια χρήσιμη πλην όμως στατική και μονοδιάστατη ερμηνεία των βιολογικών συστημάτων.
3. Υπάρχει ανάγκη να προχωρήσουμε σε δυναμικές και πολυδιάστατες θεωρήσεις των βιολογικών φαινομένων.
​
Χωρίς κάποια ιδιαίτερη διάθεση να "προστατεύσουμε" το γνωστικό μας αντικείμενο υπάρχει εδώ μια σειρά από επιχειρήματα που είναι όχι μόνο αδύναμα αλλά και δυνητικά επικίνδυνα.


Ας ξεκινήσουμε από το βασικό σημείο κριτικής του άρθρου. Ότι δηλαδή, η βιοπληροφορική προσέγγιση που στοχεύει σε στατικές ερμηνείες, αναλλοίωτων χαρακτηριστικών (αλληλουχιών που διατηρούνται σε εξελικτικούς χρόνους, δομές πρωτεϊνών που παραμένουν απαράλλαχτες από το πιο ταπεινό βακτήριο ως τα πιο πολύπλοκα θηλαστικά) είναι εν ολίγοις ξεπερασμένη αν δεν ενσωματώσει προσεγγίσεις που θα είναι δυναμικές, συστημικές και στοχαστικές. Η άποψη αυτή μάλιστα υποστηρίζεται από το παρακάτω σχήμα, όπου μάλλον απλοϊκά, η μελέτη όλων των παραπάνω ιδιοτήτων εμφανίζεται ως ανάλογη της "κορυφής του παγόβουνου" με το μεγαλύτερο πλούτο να κρύβεται στα "αναλογικά σήματα" κάτω από την επιφάνεια. 
Οι συγγραφείς επικαλούνται, στο σημείο, αυτό μια σειρά από γεγονότα που οι ίδιοι θεωρούν ότι καταδεικνύουν την αδυναμία του "δόγματος" της βιοπληροφορικής. Ως πρώτο από αυτά, αναφέρουν το c-value paradox, το παράδοξο δηλαδή σύμφωνα με το οποίο η φαινομενική πολυπλοκότητα των οργανισμών δε συσχετίζεται με το μέγεθος του γονιδιώματός τους. Από το παράδοξο αυτό σπεύδουν να συνάγουν ότι η "αλληλουχία μόνη της δε φτάνει" και ότι συνεπώς κάτι άλλο (κάτω από την επιφάνεια) είναι αυτό που διαμορφώνει τις ξεχωριστές ιδιότητες των οργανισμών. Είναι όμως πράγματι έτσι;  Κανείς δεν μπορεί να μας διαβεβαιώσει ότι έχουμε κατανοήσει πλήρως τις δυνατότητες κωδικοποίησης του γονιδίωματος. Το ακριβώς αντίθετο συμβαίνει και διακεκριμένοι επιστήμονες έχουν επιχειρηματολογήσει για την ύπαρξη κρυμμένων "στοιβάδων" κωδικοποίησης στις γονιδιωματικές αλληλουχίες (χαρακτηριστικά παραδείγματα εδώ και εδώ).
Από την "εικονοκλαστική" κριτική διάθεση των συγγραφέων δεν ξεφεύγουν ούτε οι προσεγγίσεις αλληλούχισης νέας γενιάς (NGS), οι οποίες είναι κατ' αυτούς προβληματικές καθώς: "one does have to question why this technology was not aimed at directly capturing a more primary form of physical data. For example, perhaps it would have been possible to directly measure interactive energies or binding strengths, while using the sequence information only as a positional reference." Το παραπάνω σχόλιο δεν αντέχει σε κριτική και φαίνεται ότι στην καλύτερη περίπτωση οι συγγραφείς δεν έχουν πλήρη επίγνωση της NGS μεθοδολογίας, δύο από τα βασικά χαρακτηριστικά της οποίας είναι ότι α) βασίζεται σε ενέργειες αλληλεπίδρασης β) χρησιμοποιεί το γονιδίωμα ως σημείο αναφοράς. 

Τα παραπάνω επιχειρήματα παρατίθενται ενδεικτικά. Υπάρχουν κι αρκετά άλλα στα οποία διαφαίνεται μια τάση των συγγραφέων προς έναν (μάλλον κακώς εννοούμενο) "εξυπνακισμό". Αρχικά με την επανάληψη της λανθασμένης αντίληψης ότι η βιοπληροφορική ασχολείται μόνο με αλληλουχίες και δομές και ότι περιορίζεται σε μια στατική ερμηνεία των συστημάτων. Είναι αλήθεια πως το μεγαλύτερο μέρος τόσο θεωρητικών όσο και εφαρμοσμένων εργασίων στο πεδίο της Βιοπληροφορικής/Υπολογιστικής Βιολογίας αφορούν τα παραπάνω αλλά αυτό είναι απλώς απόρροια του γεγονότος ότι οι αλληλουχίες και οι δομές είναι οι κατ' εξοχήν βιολογικές οντότητες που α) διατηρούν αναλλοίωτα (invariant) χαρακτηριστικά β) μπορούν να ψηφιοποιηθούν και γ) είναι άμεσα διαθέσιμα (για όσο τουλάχιστον επικρατεί η φιλοσοφία της ανοιχτής πρόσβασης στα επιστημονικά δεδομένα). Οι υπολογιστικοί βιολόγοι όμως (όπως μου αρέσει να αποκαλώ τους bioinformaticians) ασχολούνται επίσης σε μεγάλο βαθμό με την ανάλυση και την ερμηνεία αποτελεσμάτων από αυτά που οι "βιολόγοι του πάγκου" ονομάζουν "πραγματικά πειράματα" όπως είναι αυτά της γονιδιακής έκφρασης και της ρύθμισής της καθώς και μια σειρά από άλλες προσεγγίσεις μεγάλης κλίμακας στα πεδία της γονιδιωματικής, της πρωτεομικής αλλά και της κυτταρικής βιολογίας. (Από καθαρά τεχνική άποψη, την ανάλυση κύριων συνιστωσών (PCA) που διενεργεί ο χειριστής ενός FACS sorter μπορεί να καταλάβει καλύτερα ένας υπολογιστικός βιολόγος απ' ότι ο κυτταρικός βιολόγος που διενεργεί το πείραμα).

Σε ό,τι αφορά την "προσκόλληση" της βιοπληροφορικής σε στατικά συστήματα, κι εδώ οι συγγραφείς φαίνεται να υπερ-απλουστεύουν τα πράγματα μπερδεύοντας το εφικτό με το επιθυμητό. Όντας αυτοί που επιχειρούν να αναλύσουν τα δεδομένα από ένα πολύπλοκο σύστημα, οι υπολογιστικοί βιολόγοι έχουν στόχο να ενσωματώσουν όσο το δυνατόν καλύτερα τα δεδομένα αυτά σε μια αφηρημένη θεώρηση που να έχει όμως νόημα. Και πράγματι αυτό που ζητείται τις περισσότερες φορές από έναν "βιοπληροφορικάριο" (θα χρησιμοποιώ αυτόν τον όρο για να αναφερθώ σε αυτό το -ανύπαρκτο- είδος "τεχνικού" το οποίο έχουν συχνά στο μυαλό τους οι "πραγματικοί" βιολόγοι) είναι να διαχωρίσει το πραγματικό σήμα/νόημα από τον τυχαίο θόρυβο. Κάτι τέτοιο είναι προφανώς το επιθυμητό, είναι όμως αδύνατο να συμβεί χωρίς ένα βαθμό αφαίρεσης. Το πρώτο πράγμα που θα πρέπει να αφαιρεθεί είναι ακριβώς ο θόρυβος, το στοχαστικό μέρος του φαινομένου, ούτως ώστε να αναδειχθούν οι όποιες αναλλοίωτες, καθορίζουσες ιδιότητές του.
Στο σημείο αυτό οι συγγραφείς φαίνεται να ενστερνίζονται μια σχετικά όψιμη μόδα που εκφράζεται με την αναζήτηση στοχαστικότητας, τυχαιότητας, ποικιλομορφίας και χάους σε όλα τα επίπεδα της βιολογικής επιστήμης. Επισημαίνουν, για παράδειγμα, επικριτικά ότι τα δίκτυα πρωτεϊνικών αλληλεπιδράσεων δεν είναι τίποτα περισσότερο από στατικές απεικονίσεις ή με τα δικά τους λόγια: "static snapshots [...] that speak very little of the dynamic molecular forces that truly define these interactions". Υπάρχει όμως ένας πολύ καλός λόγος για τον οποίο τα δίκτυα είναι στατικά κι αυτός είναι ότι το να δημιουργήσει κανείς δυναμικά δίκτυα σε ένα τόσο πολύπλοκο σύστημα χωρίς πρώτα να το μελετήσει στατικά είναι το ανάλογο του να βάζεις "το κάρο μπροστά από τα άλογα". Κανείς δε διαφωνεί σχετικά με τη δυναμική φύση των βιολογικών συστημάτων, αλλά είναι αφελές να νομίζουμε ότι μπορούμε να μελετήσουμε δυναμικά δίκτυα χωρίς να έχουμε πρώτα κατανοήσει τις ιδιότητες των ίδιων δικτύων "εν στάσει". Είμαι σίγουρος ότι οι αδερφοί Wright δε θα σκέφτηκαν ούτε στιγμή να κατασκευάσουν το αεροπλάνο τους εν πτήσει. Με τον ίδιο τρόπο, το να αποζητούμε την επαναφορά της πολυπλοκότητας από την μπροστινή πόρτα, τη στιγμή που έχει γίνει τόση προσπάθεια για την εκπαραθύρωσή της μοιάζει να υπονομεύει το ίδιο το ερευνητικό πρόγραμμα (εδώ με την γενικότερη έννοια).

Το σημαντικότερο όμως, κι αυτό στο οποίο αναφέρομαι ως "δυνητικά επικίνδυνο" παραπάνω, είναι ότι το άρθρο επιχειρηματολογεί υπέρ μιας θεώρησης των βιολογικών συστημάτων ως "χαοτικών, στοχαστικών, μάυρων κουτιών" τα οποία δε θα μπορέσουμε να καταλάβουμε αν επιμείνουμε στις προσεγγίσεις που βασίζονται στο "βιοπληροφορικό δόγμα". Αντί να προσπαθούμε δηλαδή να μελετήσουμε την τεράστια πολυπλοκότητα των βιολογικών φαινομένων μέσα από τις κληρονομούμενες, αναλλοίωτες ιδιότητές τους θα πρέπει να επιτεθούμε "κατά μέτωπο", βάζοντας στα πειράματα και τα μοντέλα μας όσο το δυνατόν περισσότερες παραμέτρους και περιμένοντας να αναδυθούν αυθόρμητα οι χαρακτηριστικές ιδιότητες του συστήματος μέσα από το χάος. Το πρόβλημα που προκύπτει από αυτήν τη θεώρηση είναι προφανές. Μέσω ενός επιστημολογικού προγράμματος μερικών δεκαετιών, πυλώνες του οποίες υπήρξαν η ψηφιοποίηση βιολογικών δεδομένων και η αντικειμενική ανάλυση αναλλοίωτων χαρακτηριστικών του γονιδιώματος κάτω από το πρίσμα της εξελικτικής θεωρίας, καταφέραμε να διευρύνουμε το παράδειγμα της μοριακής βιολογίας, να εμπλουτίσουμε το "βασικό δόγμα" της και να ανακαλύψουμε νέους μηχανισμούς στα πεδία τόσο της βιοχημείας (π.χ. μη-κωδικά RNA) όσο και της κυτταρικής βιολογίας (διαφοροποίηση κυττάρων μέσω της δράσης συγκεκριμένων μεταγραφικών παραγόντων), κάτι που θα ήταν αδύνατο να συμβεί αν π.χ. ο Yamanaka είχε προσπαθήσει να ενσωματώσει τη "στοχαστικότητα" στα πειράματά του. Υπάρχει ένα βασικός λόγος που η αφαίρεση (abstraction) και η γενίκευση (generalization) βρίσκονται στη βάση των "βιοπληροφορικών" προσεγγίσεων. Αυτός είναι γιατί παραμένουν τα πιο ασφαλή επιστημολογικά εργαλεία που διαθέτουμε για να πειραματιστούμε και να ερμηνεύσουμε τα φυσικά φαινόμενα. Κι από αυτήν την άποψη το "δόγμα της Βιοπληροφορικής" δε διαφέρει πολύ από αυτό που στην ουσία είναι το "Δόγμα της Βιολογίας". 



0 Comments

Η RNA πολυμεράση σε κίνηση (και σε στάση)

5/18/2015

0 Comments

 
Picture
Στα βιβλία μας της μοριακής βιολογίας διαβάζουμε συχνά για τον μηχανισμό της μεταγραφής, της παραγωγής και της ωρίμανσης του mRNA μέσω της διαδικασίας του splicing. Τι γνωρίζουμε όμως για τη δυναμική αυτών των κυτταρικών λειτουργιών; Την ταχύτητα με την οποία γίνονται; Την πολυπλοκότητα τους και τη ρύθμιση τους στο επίπεδο του splicing; Σε μια πρόσφατη δουλειά τους η Stirling Churchman από το Harvard και ο John Stamatoyannopoulos από το Πανεπιστήμιο της Washington χρησιμοποιήσαν μια τεχνική ανάλυσης επιμηκούμενων RNA πολυμερασών για να καταγράψουν τη διαδιασία της μεταγραφής με δυναμικό τρόπο. Η μέθοδος συνίσταται βασικά στην απομόνωση RNA πολυμερασών προσδεδεμένων στο RNA καθώς αυτό μεταγράφεται και στη συνέχεια αλληλούχιση των μορίων RNA από το 3' άκρο και προς "τα πίσω". Συνδέοντας αυτή τη χημική αντίδραση με μεθόδους αλληλούχισης νέας γενιάς καταφέρνει κανείς να ποσοτικοποιήσει την επιμηκούμενη πολυμεράση. Όσο πιο έντονο είναι το σήμα, τόσο περισσότερα RNA μόρια από εκείνη την περιοχή ήταν συνδεδεμένα (στη μονάδα του χρόνου) από την RNA πολυμεράση ΙΙ. Ακόμα πιο σημαντικά, το σήμα που προκύπτει από την αλληλούχιση είναι ειδικό για καθέναν από τους δύο κλώνους της γονιδιωματικής αλληλουχίας. Η μέθοδος (που ονομάζεται NET-Seq, Native Elongating Transcription) αντιστοιχεί στην πιο ακριβή απεικόνιση της ενεργού μεταγραφής ως σήμερα. 

Τι μπόρεσαν να δουν όμως οι Mayer και συνεργάτες στο συγκεκριμένο άρθρο (που βρέθηκε στο εξώφυλλο του Cell τον περασμένο Απρίλιο); Τα βασικά τους ευρήματα συνοψίζονται σε δύο πολύ πρωτότυπες παρατηρήσεις. Την "συγκλίνουσα μεταγραφή" (convergent transcription) και τη ρύθμιση του splicing στο μεταγραφικό επίπεδο.
 Η πρώτη παρατήρηση είναι τόσο ενδιαφέρουσα όσο και αναπάντεχη. Μελετώντας το σήμα επιμηκούμενων πολυμερασών γύρω από σημεία έναρξης της μεταγραφής πρωτεϊνικών γονιδίων, οι ερευνητές κατέγραψαν ένα έντονο σήμα στο συμπληρωματικό κλώνο για τα πρώτα 150-200 νουκλεοτίδια καθοδικά του σημείου έναρξης για το 25% των γονιδίων. Από παλιότερες δουλειές γνωρίζαμε ήδη από τα τέλη της προηγούμενης δεκαετίας την ύπαρξης της "αποκλίνουσας μεταγραφής" (divergent) κατά την οποία anti-sense μετάγραφα παράγονται από το σημείο έναρξης της μεταγραφής και ανοδικά του. Η ανακάλυψη των καθοδικών anti-sense μεταγράφων αποτελεί πραγματικό αίνιγμα για τους μοριακούς βιολόγους. Γιατί να συμβαίνει; Είναι άραγε μια απλή "παρενέργεια" του ανοίγματος της χρωματίνης κατά την έναρξη της μεταγραφής και της "εκκίνησης" των σταθμευμένων ως τότε πολυμερασών ή έχει μια συγκεκριμένη λειτουργία; Οι ερευνητές συσχετίζουν τα 25% περίπου γονίδια με συγκλίνοντα μετάγραφα με τη χαμηλή τους έκφραση και προτείνουν ότι η σύγκρουση δύο πολυμερασών που κινούνται η μία έναντι της άλλης θα μπορούσε να λειτουργήσει σαν κατασταλτικός μηχανισμός. Γιατί όμως το κύτταρο να "επιλέξει" κάτι τόσο πολύπλοκο; Τι απογίνονται τα μετάγραφα που προκύπτουν; Τα ερωτήματα που προκύπτουν είναι όπως συνήθως περισσότερα από τις απαντήσεις.

Το δεύτερο σημαντικό εύρημα της συγκεκριμένης δουλειάς είναι η σύνδεση των επιμηκούμενων πολυμερασών και του μηχανισμού του splicing. Αναλύοντας έναν μεγάλο αριθμό από μετάγραφα με πολλές εναλλακτικές μορφές, οι ερευνητές παρατήρησαν σημαντικές διαφορές στο σήμα επιμήκυνσης γύρω από διαφορετικούς τύπους εξονίων. Ενώ στα συσταστικά εξόνια (σε αυτά που ενσωματώνονται σε όλες τις πιθανές ισομορφές ενός γονιδίου κατά το splicing) και στα εναλλακτικά εξόνια που τελικώς χρησιμοποιούνται, η πολυμεράση "φρενάρει" και δείχνει να καθυστερεί, το αντίθετο συμβαίνει στα εξόνια τα οποία τελικά δεν ενσωματώνονται σε ώριμα μετάγραφα, πάνω από τα οποία η πολυμεράση φαίνεται να περνά χωρίς να "σταματήσει".  Τι μας λέει αυτό το εύρημα; Ότι κατά πάσα πιθανότητα η πολυμεράση αναγνωρίζει τα εξόνια με κάποιο τρόπο και ακόμα πιο σημαντικά δίνει χρόνο σε άλλους μηχανισμούς που ενδεχομένως σχετίζονται με το splicing να "αποφασίσουν" για την πορεία των εξονίων. Δίνει μάλιστα περισσότερο χρόνο στα εξόνια που τελικά ενσωματώνονται σε ώριμα μετάγραφα και λιγότερο στα άλλα. Κι εδώ τα ερώτηματα που προκύπτουν δεν είναι λίγα. Ποια είναι τα "σήματα" που αναγνωρίζει η πολυμεράση ώστε να "φρενάρει" στα "σωστά" εξόνια; Και γιατί εφόσον σταματά στο 5' άκρο τους κάνει το ίδιο αφού διατρέξει το σώμα των εξονίων και στο 3';

Τόσο η συγκλίνουσα μεταγραφή, όσο και σύζευξη με το splicing αναδεικνύουν τον ρόλο που διαδραματίζει η χρωματίνη και οι εναλλακτικές της διαμορφώσεις. Στα σημεία έναρξης της μεταγραφής, τα γονίδια που εμφανίζουν συγκλίνουσα μεταγραφή έχουν χαρακτηριστικές "δίρροπες" κατανομές νουκλεοσωμάτων που διαφέρουν από τα γονίδια στα οποία έχουμε αποκλίνουσα ή μονο-κατευθυνόμενη μεταγραφή. Αφετέρου, για την περίπτωση της μεταγραφής γύρω από εξόνια, η σύνδεση με τη δομή της χρωματίνης είχε ήδη γίνει από το 2009 με εργασίες (μεταξύ άλλων) και από το δικό μας group, όταν παρατηρήσαμε ότι εξόνια που πρόκειται να ενσωματωθούν σε ώριμα μετάγραφα έχουν πολύ διαφορετικό (και εντονότερο) σήμα κατάληψης από νουκλεοσώματα. Στενά προσδεδεμένα νουκλεοσώματα θα μπορούσαν να λειτουργήσουν σαν "φράγματα" για την πολυμεράση, καθυστερώντας την και δίνοντας έτσι περισσότερο χρόνο στον μηχανισμό αναγνώρισης των εξονίων να τα "επισημάνει" προς ωρίμανση. 

Τι περιμένουμε από εδώ και περά; Περισσότερη προσπάθεια για τον καθορισμό αυτών των χρωματινικών υπογραφών για τη ρύθμιση αυτών των διαδικασιών. Μια πρώτη σύνδεση της αποκλινουσας μεταγραφής με πρότυπα χρωματινικής διαμόρφωσης δημοσιεύθηκε πρόσφατα. Αλλά περισσότερα για αυτά τα θέματα σε επόμενα post.
0 Comments

A somewhat critical reading of "Arrival of the fittest" by Andreas Wagner

11/11/2014

0 Comments

 
Professorship has many advantages. Some (spending time with young, motivating people, or being constantly reminded of your humble mediocrity) are obvious. Among the not so obvious ones is the ability to access a great number of scientific material for free since editors consider it a good marketing policy to provide you with evaluation copies of possible suggested readings.  A couple of weeks ago, One World Publications was very kind to respond to my request for such a copy of "Arrival of the fittest" by Andreas Wagner and even though it is highly unlikely that I suggest this book as reading in any of my classes I felt much obliged to go immediately at it. Here are some fresh thoughts after completing it over two hectic weeks full of teaching duties.

First of all, my view of Andreas Wagner is that of an uncompromising scientist, who has dared to attack some of the most difficult, intriguing questions in biological research. I 've heard him talk twice, once in Barcelona while I was a post-doc and once again in Athens while still a post-doc, only a better-experienced one. Both talks were inspiring, to say the least (not very common for scientific talks, at least for me) as was my reading of his book "Evolvability and Robustness in Living Systems" which soon followed. At the core of Wagner's research lies a very important question: "How does innovation arise in living systems and how is it compromised with the ability of all organisms to survive in ever-changing conditions?". It so turns out that the two need not be compromised, instead one is actually a prerequisite for the other. The same ability to constantly innovate is paramount for the survival for every known organism but, more importantly, it is the necessity for adaptation in changing environments that calls upon the creation and conservation of mechanisms that drive innovation.  This last realization is at the same time revolutionary and extremely important and research in Andreas Wagner's lab has been pivotal in our understanding of it. 

"Arrival of the fittest" is taken from a phrase attributed to Hugo de Vries, according to whom "Natural [by the time Darwinian] selection may account for the survival of the fittest. Not the arrival of the fittest". Wagner is thus keen to remind us that the early seeds of the above-stated question(s) have been planted well before the advent of molecular biology and the flurry of genes and genomes. To put it more plainly (and prosaically), Wagner uses the example of  the arctic cod who has come up with an antifreeze protein that allows it to survive extremely cold water habitats. The question that arises is how was this protein "chosen" out of the superastronomical number of alternatives  that could have been created with the same number of aminoacids since it would have taken many times the age of the universe to traverse the "universe" of sequences even assuming extreme mutation rates? Wagner does a great job in stating this question, explaining why it is so important (hint: it reduces Darwinian Selection to a trivial factor)  and giving a good idea of the complexity that comes with it. He is also spot-on when producing an excellent metaphor that links the enormous (indeed super-astronomical) complexity of molecular structures, alternative metabolic organizations and regulatory circuits with Jorge Luis Borges' "Biblioteca de Babel" (which I, as a huge fan of the Argentinian particularly enjoyed). Wagner is at his best when describing how the mere size of this "library", its endless possibilities of alternative texts that at first sight appears to make innovation a "needle-in-a-haystack" problem, is at the same time its great power. It is in the next-to-last chapter "The hidden architecture" that, through a thorough and well-structured argumentation, Wagner shows how the complexity of biological systems, coupled with self-organization allows an extremely, totally counter-intuitive entanglement of radically different outcomes among alternative "texts", which in turn make apparently "impossible" jumps from one phenotype to another rather plausible. 

Plausibility is the key word here, even though never mentioned in Wagner's (witty and modern) prose. The book attacks the same question that Marc Kirschner and John Gerhart went after in their "The plausibility of life", a highly recommendable book on what is now simply called "evo-devo". And while Kirschner and Gerhart focus on the part of development and the creation of hierarchical body plan structures, Wagner extends the concept of a hidden architecture as an all-encompassing principle in living systems. Here lies, the only (yet somehow major) flaw of the book, which is the fact that a significant part of the material is presented in the same way, in some cases in an almost identical manner, which renders the text rather dull, especially in the crucial (as any writer should know) middle part of the book. In his attempt to demonstrate the universality of the "complex library" concept (the term is mine), Wagner becomes quite repetitive and this steals a lot from the book's originality.
​
In total, I would highly recommend this book to the "uninitialized" outsider who would like to know more about some of the most profound problems of biology, as he/she is bound to enjoy most of it and take advantage of some of its redundancy in better grasping the main points. On the other hand, I believe that the aforementioned "Evolvability and Robustness in Living Systems" is much better suited for both biology undergraduates and postgraduates.  
0 Comments

Μαθηματικός αναλφαβητισμός #1

9/5/2014

0 Comments

 
Ολοένα και συχνότερα βλέπουμε, διαβάζουμε και ακούμε για επιστημονικές (ή τουλάχιστον επιστημονικο-φανείς) μελέτες του τάδε ή του δείνα πανεπιστημίου. Οι μελέτες αυτές, ως επί το πλείστον, αφορούν θέματα γενικού ενδιαφέροντος που εγείρουν όμως και την περιέργεια (φαγητά που αδυνατίζουν ή αποτρέπουν τον καρκίνο, νέα είδη ζώων που ανακαλύπτονται ή παλιά που εξαφανίζονται κλπ). Ακόμα συχνότερα αφορούν οργανισμούς που έχουν με κάποιον τρόπο συνδεθεί με αυτό που λέμε "λαϊκή κουλτούρα" (pop culture) μέσω ταινιών, βιβλίων ή έργων τέχνης. Έτσι στο όχι και τόσο μακρυνό παρελθόν εντυπωσιαστήκαμε με τα "εξωγήινα βακτήρια" της λίμνης Μono που έχουν αρσενικό αντί φωσφόρου στο γενετικό τους υλικο (κάτι που αποδείχτηκε μια μεγαλοπρεπής απάτη), ενώ κατά καιρούς διαβάζουμε με (ελαφρώς ένοχο) ενδιαφέρον άρθρα για τα πιράνχα, τις ανακόντες, τα ψάρια της αβύσσου κ.λ.π.

Δυστυχώς τόσο για τα μέλη της επιστημονικής κοινότητας όσο και για τους αναγνώστες με ένα απλό ενδιαφέρον περι τα επιστημονικά, τα περισσότερα από αυτά τα άρθρα είναι όχι μόνο κακογραμμένα αλλά τις περισσότερες φορές είναι τόσο εκτός πραγματικότητας που κάνουν μεγαλύτερο κακό παρά καλό. Έτσι αντί να "εκπαιδεύσουν" ένα κοινό ώστε να αντιλαμβάνεται καλύτερα κάποια πράγματα, το βομβαρδίζουν με τσιτάτα διαφημιστικού τύπου (σαν τον "υγρό κολλαγόνο" και τα "δύο ενεργά fluoride") με αποτέλεσμα να πληθύνονται ολοένα ανάμεσα μας άνθρωποι που διαβάζουν διαρκώς ανοησίες.

Μια ολόκληρη κατηγορία τέτοιων δημοσιευμάτων είναι αυτά που ονομάζω συλλήβδην "μαθηματικά αναλφάβητα". Αφορούν συνήθως επιδημιολογικές μελέτες ή μελέτες σχετικές με τις επιδράσεις τροφών και ουσιών στην ανθρώπινη υγεία και παρόλο που συνήθως αντλούν υλικό από πραγματικές επιστημονικές εργασίες παρουσιάζουν μια ερμηνεία των αποτελεσμάτων που όχι μόνο είναι αβάσιμη αλλά και πολύ συχνά απολύτως ανερμάτιστη. Ένα χαρακτηριστικό παράδειγμα είναι ένα σημερινό αρθράκι στον ιστότοπο in.gr που μας "ενημερώνει" ότι οι λευκοί καρχαρίες προτιμούν να τρώνε άντρες. Αυτό προκύπτει από μελέτες του αρχείου επιθέσεων μεγάλων λευκών στην Αυστραλία που, σύμφωνα με τον συντάκτη του in.gr, "έδειξαν πως στο 84% των επιθέσεων τα θύματα ήταν άντρες". Το συμπέρασμα "οι καρχαρίες προτιμούν τους άντρες" προκύπτει έτσι μάλλον φυσικά και ο αναγνώστης καλείται να το καταπιεί "αμάσητο" χωρίς να γίνεται καμιά απολύτως αναφορά στην πιο απλή εξήγηση, ότι δηλαδή οι άντρες κολυμπούν περισσότερο, κάνουν περισσότερο σερφ και ανοίγονται σε βαθύτερα νερά πολύ συχνότερα απ' ότι οι γυναίκες. Η απλούστατη αυτή εξήγηση δεν διέφυγε (ευτυχώς) της προσοχής του επιστημονικού υπευθύνου της μελέτης, του καθηγητή Daryl McPhee στο Πανεπιστήμιο του Queensland της Αυστραλίας, ο οποίος απέδωσε τα αποτελέσματα της εργασίας του καθαρά στο γεγονός πως "οι άντρες περνούν στη θάλασσα πολύ περισσότερες ώρες από τις γυναίκες". Το γεγονός αυτό και μόνο αρκεί για να κάνει τις επιθέσεις καρχαριών έναντι αντρών πολύ πιο πιθανές απ' ότι έναντι γυναικών. Κάτω από αυτό το πρίσμα, το να γράφει κανείς πως οι καρχαρίες προτιμούν τους άντρες είναι τόσο ανόητο (και οικτρά λανθασμένο) όσο το να διατείνεται πως "τα λιοντάρια της Σαβάνας αποφεύγουν τους λευκούς".

Ανάμεσα στους διάφορους όρους της στατιστικής υπάρχει ένας με πολύ μεγάλη σημασία. Σε μελέτες συσχέτισης (το Α εξαρτάται από το Β, ή το Γ έχει μια προτίμηση για το Δ) πρέπει κανείς να έχει πάντα στο μυαλό του την λεγόμενη "αρχή της σύγχυσης" (confounding principle). Αυτή αναφέρεται σε μια "κρυφή" μεταβλητή η οποία ευθύνεται για την παρατηρούμενη συσχέτιση και που λαμβάνοντας την υπ' όψιν (και αφαιρώντας την) αρκεί για να εξαφανιστεί κάθε συσχέτιση. Στην περίπτωσή μας, οι ώρες παραμονής στο νερό είναι ακριβώς μια τέτοια μεταβλητή "σύγχυσης". Έτσι αν κανείς διαιρέσει τον αριθμό των επιθέσεων με τις εκτιμώμενες ώρες παραμονής στη θάλασσα για κάθενα από τα δύο φύλα (μια διαδικασία που ονομάζουμε κανονικοποίηση), θα έβλεπε πιθανότατα πως οι καρχαρίες δεν έχουν καμιά ιδιαίτερη προτίμηση. Η ανάλυση αυτή δεν είναι εφικτή καθώς κανείς δεν έχει καταγράψει (ευτυχώς ακόμα) τον χρόνο που περνούν οι λουόμενοι στη θάλασσα, ωστόσο η απλούστατη αυτή εξήγηση, πέρα από το ότι αναφέρεται από τους ίδιους τους συντάκτες της μελέτης, θα έπρεπε να είναι προφανής για οποιονδήποτε έχει μπει ποτέ στον κόπο να θυμηθεί την αριθμητική του γυμνασίου (κεφάλαιο: Αναλογίες).
​
Δυστυχώς ο συντάκτης του μεγαλύτερου σε επισκεψιμότητα ιστοτόπου ειδήσεων στην Ελλάδα δεν είναι ανάμεσα σε αυτούς. Το ακόμα χειρότερο είναι πως "εκπαιδεύει" μια γενιά αναγνωστών στο να του μοιάζει.

0 Comments

Coming back soon

7/7/2014

0 Comments

 
The CG2 has been dormant for quite a while, due to a lot of teaching, grading and travelling. This does not of course mean that we have stopped reading. Only that we were not so ...active in blogging.
As the summer has always been a great time for reading but also leaves quite some time for blogging we promise to come back soon, with more diverse topics from published papers, discussions on science (etc). We are also considering doing some posts in Greek for those of you, who feel that can better "connect" to the blog via their mother tongue.

So stay around and see what happens...

0 Comments

in the news: Exome Sequencing in the clinic

2/4/2014

0 Comments

 
Picture
(image adapted from Choi et al., PNAS 2009)

A work published recently in the New England Journal of Medicine (Yang et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. NEJM 2013) presents a summary of the findings of the application of Whole-Exome-Sequencing (WES) in a clinical setting.

The data used:  Researchers and medical doctors at the Baylor College of Medicine followed the results of the application of WES in 250 consecutive cases in search for the cause of rare (or unidentified) genetic diseases. A total of 62 cases (~25%) were able to be diagnosed via this next-generation sequencing approach, a yield that is significantly higher than other conventional genetic tests (~15%).  

The analysis: Analysis involved application of standard pipelines (quality control, mapping on the reference genome, calling of variants, functional analysis of variants after filtering for known SNPs). The results provided significant insight in the cause of various disease (most of which were related to neurological disorders associated to mental retardation). It is important to notice that not only the diagnostic yield was increased with the application of WES, but that even previously unknown gene-disease relationships were revealed through this approach.  Moreover, the inquiry at a genome-wide scale led to the identification of incidental findings in almost half of the positive cases (30/62) something which would have not been possible through conventional methods. One particular case is quite representative of the potential of WES. 
​
"For example, one patient (Patient 14 in Table S3 in the Supplementary Appendix) had whole-exomesequencing ordered at 26 months of age. He had previously been evaluated by means of chromosomal microarray analysis, DNA methylation, eight single-gene sequencing tests, mitochondrial genome sequencing by next-generation sequencing, respiratory-chain enzyme analysis, and multiple biochemical analyte studies. On the basis of the charges listed for these tests, we found that the cost of this patient’s previous genetic testing was three times as high as the current cost of whole-exome sequencing. This patient carried a mutation in SYNGAP1, which is associated with a newly recognized nonsyndromic mental retardation that may not have been identified by conventional genetic testing. He also had an incidental, medically actionable mutation in FBN1 that would have escaped detection without whole-exome sequencing."

Taking into account that as the cases analyzed with WES increase, we are bound to be able to associate more diseases with previously unidentified genetic causes, It becomes increasingly relevant to consider WES as the standard approach for genetic testing.

What's next:  More exomes, faster and cheaper becoming routine practice in the clinic.

Read more: On whole exome sequencing (WES) and its applications in medical genetics in this report of the Baylor College of Medicine.
0 Comments
<<Previous
Forward>>

    RSS Feed

    It's all about...

    Bioinformatics and computational biology with a focus on chromatin and genome architecture, plus a little bit of football and occasional aspects of  University education.

    Archives

    April 2021
    December 2020
    March 2020
    November 2018
    September 2017
    April 2017
    March 2017
    December 2016
    November 2016
    February 2016
    May 2015
    November 2014
    September 2014
    July 2014
    February 2014
    November 2013
    October 2013

    Categories

    All
    Academic Life
    Bioinformatics
    ChIPSeq
    ChIPSeq Bias
    Cpg Islands
    Data Analysis
    Exons
    Football
    Footballomics
    Gene Regulation
    Genetic Diseases
    Genome Architecture
    Genome Structure
    Inflammation
    Journalism
    Math Illiteracy
    NGS
    Nucleosome Positioning
    Nucleotide Composition
    Nucleotide Skews
    Promoters
    R
    Splicing
    Statistics
    Systems Biology
    Tnf
    Transcriptome
    Variation
    Whole Exome

Powered by Create your own unique website with customizable templates.