Eindelijk hebben we nu een compleet beeld van het menselijk genoom. Een mijlpaal!

Genomen bevatten een schat aan informatie. En dus proberen wetenschappers de genetische code van dieren en groenten, maar natuurlijk ook van de mens te kraken. Zo’n twintig jaar geleden waren we er bijna; wetenschappers slaagden erin zo’n 92 procent van het menselijk genoom te ontcijferen. Maar nu komen onderzoekers met groot nieuws. Want ook die laatste acht procent is nu in kaart gebracht.

Het DNA-alfabet
Je kan het genoom zien als een dik boek dat is geschreven in een DNA-alfabet van vier letters: A, T, G en C. De chromosomen zijn de hoofdstukken en de genen zijn de woorden. Tussen de functionele genen vind je ook heel wat onzin alsof er een kat over het toetsenbord gelopen is tijdens het schrijven van dit boek. Het doel van genoomwetenschappers is alle woorden en onzin in de juiste volgorde te zetten. Daarnaast moet elke paragraaf aan het juiste hoofdstuk (chromosoom) gekoppeld worden. Dit lijkt niet zo’n moeilijke opdracht, ware het niet dat de tekst – in het geval van het menselijk genoom – zo’n 6 miljard letters lang is. Begin er maar aan.

Het ontcijferen van het menselijk genoom is een helse klus. Dat komt omdat het menselijk genoom uit iets meer dan zes miljard afzonderlijke DNA-letters bestaat, verspreid over 23 paar chromosomen (zie kader). Om een genoom te kunnen lezen, hakken wetenschappers eerst al dat DNA in stukjes van honderden tot duizenden letters lang. Sequentiemachines lezen vervolgens de afzonderlijke letters in elk stuk. Wetenschappers proberen vervolgens de stukjes in de juiste volgorde in elkaar te zetten, zoals het leggen van een ingewikkelde puzzel.

Herhaling
Een grote uitdaging is echter dat sommige delen van het genoom dezelfde letters keer op keer herhalen. Repetitieve regio’s omvatten de centromeren (de delen die de twee strengen chromosomen bij elkaar houden en die een cruciale rol spelen bij de celdeling) en ribosomaal DNA (de moleculaire complexen die eiwitsynthese verzorgen). Nog andere zich herhalende delen omvatten nieuwe genen die soorten kunnen helpen zich aan te passen. In het menselijke genoom vinden we miljoenen repetitieve DNA-sequenties van 300 letters, die her en der in het genoom verspreid liggen. Vroeger maakte al die herhaling het onmogelijk om enkele gehakte stukken in de juiste volgorde in elkaar te zetten. Het is alsof je identieke puzzelstukjes hebt – wetenschappers wisten niet welke waar moest, waardoor er grote hiaten in het genoombeeld achterbleven.

Acht procent
Toch wisten onderzoekers in 2001 een heel eind te komen. Zoals gezegd liet deze originele menselijke genoomsequentie slechts acht procent van het DNA weg. Dat deze acht procent niet verder kon worden ontcijferd, had een goede reden. Wetenschappers wisten dat deze ontbrekende brokken bijna identieke duplicaties en zeer repetitieve sequenties bevatten. “Dit zijn belangrijke regio’s, maar moeilijk te rangschikken,” zegt onderzoeker Megan Dennis.

Sprong voorwaarts
Nieuwe technieken maken het nu echter mogelijk om ook die laatste acht procent te ontcijferen – wat qua grootte vergelijkbaar is met een heel chromosoom. Dat komt omdat eerdere DNA-sequencingtechnologie alleen relatief korte sequenties kon lezen. “Nieuwere generaties sequencers kunnen veel langere stukken decoderen, tot wel een miljoen basenparen of ‘letters’ DNA,” aldus Dennis. “Dat betekent dat de brokken veel groter zijn en daardoor gemakkelijker in de oorspronkelijke volgorde gemonteerd kunnen worden. Dit is een echte game-changer.”

Volledig menselijk genoom
Onderzoekers hebben het nu dan ook eindelijk goed. In de nieuwe studie beschrijven ze het volledige menselijke genoom; en dus ook de lastige stukjes waar wetenschappers eerder hun vingers niet aan durfden te branden. Het nieuwe referentiegenoom is afkomstig van een enkel menselijk monster – maar geen echt persoon. Onderzoekers genereerden de volledige genoomsequentie met behulp van een speciale cellijn die twee identieke kopieën van elk chromosoom heeft – in tegenstelling tot de meeste menselijke cellen, die twee enigszins verschillende kopieën dragen. De meeste van de nieuw toegevoegd DNA-sequenties bevinden zich in de buurt van de repetitieve telomeren (lange, achterlopende uiteinden van elk chromosoom) en de eerder genoemde centromeren (dichte middensecties van elk chromosoom). “In het genetische manuscript zien we hoofdstukken die nog nooit eerder zijn gelezen,” stelt onderzoeker Evan Eichler. Of, zoals geneticus Robert Waterston van de Universiteit van Washington het zegt: “er bestaan geen verborgen of onbekende stukjes meer.”

“De studie heeft grote gevolgen voor ons begrip van de menselijke evolutie, variatie en biologische functie”

Nieuwe inzichten
Wat onder andere aan het menselijk genoom opvalt, is dat een aanzienlijke hoeveelheid menselijk genetisch materiaal, uit lange, zich herhalende secties bestaan, die steeds opnieuw voorkomen. Hoewel elk mens enkele herhalingen heeft, heeft niet iedereen hetzelfde aantal. En het verschil in het aantal herhalingen is waar de meeste menselijke genetische variatie wordt gevonden. Maar dat is niet het enige nieuwe inzicht. Het is één van de vele belangrijke bevindingen van het project. “Het was het wachten waard,” zegt Francis Collins, een Amerikaans arts en geneticus. “De studie onthult een rijk scala aan verrassende architecturale kenmerken, met grote gevolgen voor het begrip van de menselijke evolutie, variatie en biologische functie.”

Al met al zijn de bevindingen een enorme mijlpaal. “Sinds we de eerste conceptsequentie van het menselijk genoom hadden, was het een uitdaging om de exacte volgorde van complexe genomische regio’s te bepalen,” zegt Eichler. “Ik ben heel blij dat we de klus hebben geklaard. Dit complete beeld van het menselijke genoom zal een revolutie teweegbrengen in de manier waarop we denken over menselijke genomische variatie, ziekte en evolutie.”

Meer weten…

…over hoe het sequencen van genomen precies in zijn werk gaat? Lees dan ook dit eerder verschenen artikel op Scientias.nl waarin uitgelegd wordt hoe wetenschappers dat doen.