1000 Genomes Project

De 1000 Genomes Project, gestart in januari 2008, is een internationaal onderzoek naar de catalogus van de menselijke genetische variatie meest gedetailleerd vast te stellen. Wetenschappers zijn van plan om de genomen van minstens duizend anonieme deelnemers sequentie in vele verschillende etnische groepen binnen drie jaar, met behulp van nieuwe technologieën die sneller en goedkoper zijn. In 2010 heeft het project de proeffase, beschreven in een Nature paper voltooid. Sinds eind 2010 is het project is in lijn met een groeiende generatie doel om 2000 personen sequentie.

Dit project brengt multidisciplinaire teams van onderzoekseenheden in instituten over de hele wereld, waaronder het Verenigd Koninkrijk, China en de Verenigde Staten samen. Elke bijdrage aan het werk van de oprichting van de sequenties en het verbeteren van de kaart van het menselijk genoom, die vrij beschikbaar in de openbare databases zal zijn om de wetenschappelijke gemeenschap en het publiek.

Door het verstrekken van een panorama van het gehele menselijke genetische diversiteit, niet alleen van wat valt onder de medische biologie, het consortium zal een zeer nuttig hulpmiddel voor alle gebieden van de biologische wetenschappen te genereren, vooral in de disciplines van de genetica, geneeskunde, farmacologie, biochemie en bio-informatica.

Historisch

In de afgelopen dertig jaar, de vooruitgang in de menselijke genetica bevolking en vergelijkende genomica hebben het mogelijk gemaakt om het begrip van wat de genetische diversiteit te vergroten. Echter, we zijn pas net begonnen om processen zoals willekeurige selectie van gameten, mutaties te begrijpen, veranderingen in het aantal kopieën van een segment in het genoom, retrotransposons, single nucleotide polymorfismen en natuurlijke selectie gevormd de niveaus en modellen variaties binnen soorten en tussen soorten, het vergelijken van de sequenties van MHC klasse I in mensen en chimpansees die inserties / deleties als het belangrijkste middel van genetische divergentie onthullen.

Menselijke genetische variatie

De willekeurige keuze van gameten tijdens weergave leidt tot genetische drift willekeurige fluctuatie in de frequentie van een teken in de populatie in de volgende generatie en als gevolg het verlies van elke variatie in de afwezigheid van externe druk. Er wordt gepostuleerd dat de snelheid van genetische drift is omgekeerd evenredig met de omvang van de populatie, en het kan worden versneld in specifieke situaties zoals pluggen, waarbij de populatiegrootte verminderd gedurende een bepaalde tijdsperiode, en de oprichter effect.

Anzai et al. hebben aangetoond dat indel, vertegenwoordigen 90,4% van alle variaties in de sequentie van de major histocompatibility locus tussen mensen en chimpansees. Na meervoudige INDELs gezien de hoge mate van genetische gelijkenis tussen de twee species daalt tot slechts 86,7%. Bijvoorbeeld, een grote 95-kilobase deletie tussen menselijke locus voor MICA en MICB genen, waardoor een chimpansee hybride gen MIC, die de regio om de ontwikkeling van verscheidene specifieke retrovirale infecties aan de soort en de resulterende gevoeligheid voor verschillende ziekten auto. De auteurs concluderen dat eerder subtielere SNPs, indels zijn de essentiële mechanisme op het speciatie primaten.

Naast de mutaties, SNP en andere structurele veranderingen het aantal kopieën van een gen dragen genetische diversiteit in menselijke populaties. Met behulp van microarrays, ongeveer 1500 tot gebieden van variabele kopieaantal, die ongeveer 12% van het genoom en met honderden genen locus van ziekten, functionele elementen en segmenten doublures zijn geïdentificeerd de HapMap collectie van sequenties. Echter, de specifieke functie van CNVs blijft onopvallend, dat de CNVs gebruiken meer nucleotide in het genoom dat SNPs tonen het belang van CNVs in genetische diversiteit en evolutie.

Het onderzoek op de menselijke genomische afwijkingen hebben een groot potentieel aan genen die verschillen in ziekteresistentie of Drug Metabolism kunnen ten grondslag liggen te identificeren.

Natural Selection

Natuurlijke selectie in de evolutie van een kenmerk kan worden verdeeld in drie klassen. De positieve selectie of gericht verwijst naar de situatie waarin een bepaald allel een grotere affiniteit met andere allelen, en verhoogt daardoor de frequentie in de populatie. Daarentegen, negatieve selectie of stabilisator verlaagt dezelfde frequentie of verwijdert allelen in een populatie vanwege de nadelen in de aanwezigheid van andere allelen. Tenslotte vele afgewogen keuze vormen bestaan; deze diversiteit verhoging binnen een soort door het maken van individuen, waar diversiteit geografisch kan variëren van een soort die verschillende ecologische niches bewoont, dus het bevorderen van verschillende allelen. Enkele verschillen in het genoom kan geen invloed op de goede levensvatbaarheid. Dit zijn neutrale variaties eerder gedacht om overbodige DNA van de "junk DNA", en die worden niet beïnvloed door natuurlijke selectie het geven van een hogere genetische variabiliteit in dergelijke sites in vergelijking met sites waar variaties invloed op de goede leefbaarheid.

Het is niet helemaal duidelijk hoe de natuurlijke selectie creëert verschillen in de bevolking. Echter, de kandidaat-genetische regio's die in de selectie sinds kort. DNA polymorfismen modellen kunnen worden gebruikt met vertrouwen naar de handtekeningen van de selectie op te sporen en te identificeren genen die verschillen in ziekteresistentie en metabolisme kan ten grondslag liggen. Barreiro et al. dat negatieve selectie beperkte populatie differentiatie aangetoond door het veranderen van het aminozuurniveau, terwijl de positieve selectie verschaft regionale aanpassing van menselijke populaties toenemende regionale differentiatie in segmenten van genen.

Men gelooft dat de meeste genetische aandoeningen en ziekten Mendeliaanse invloed op de overleving en / of weergeven, dus moet genetische oorzaken van deze ziekten worden beïnvloed door natuurlijke selectie zal hebben. Ziekte van Gaucher, ziekte van Crohn en familiale hypertrofe cardiomyopathie zijn allemaal voorbeelden van negatieve selectie. Deze ziekten veroorzaken mutaties zijn recessief en de eerste schaars zoals verwacht bij een lage frequentie, ondersteunen de hypothese van negatieve selectie. Enkele gevallen gemeld waarin mutaties veroorzaken ziekten komen met een hoge frequentie wordt ondersteund door de evenwichtige selectie. Het meest opvallende voorbeeld is voor mutaties van G6PD locus waar als aangetast door homozygotie enzym G6PD en dus het resultaat is sikkelcelziekte, maar heterozygoten zijn gedeeltelijk beschermd tegen malaria. Andere mogelijke verklaringen voor de schaarste van allelen ziekte te veroorzaken bij matige of hoge frequenties onder meer genetische drift en de recente veranderingen als gevolg positieve selectie, veroorzaakt door veranderingen in het milieu, zoals dieet of een 'genetische liftende "als de verantwoordelijke gen begeleidt buren en gunstige genen in reproductie.

Vergelijkende analyses grote delen van het genoom van andere menselijke populaties, en tussen species ons helpen om de relatie tussen ziekten selecties begrijpen en bewijs van mutaties in genen die gevoelig omdat onevenredig zijn gekoppeld erfelijke ziekten. De betrokken bij complexe aandoeningen genen hebben de neiging om in het kader van een minder negatieve selectie zoals ziektegenen in Mendeliaanse overerving.

Project Beschrijving

Doelen

Er zijn twee soorten genetische varianten in verband met ziekten. De eerste soort zijn zeldzame varianten die ernstige en overheersende effecten op eenvoudige traits.Dans veroorzaken de tweede meest voorkomende varianten hebben een verzwakte werking en worden verondersteld te worden betrokken bij complexe eigenschappen. Tussen deze twee soorten varianten is er een aanzienlijke kloof in de kennis, de 1000 Genomes project is ontworpen om te verminderen.

Het eerste doel van dit project is om een ​​uitgebreide en gedetailleerde catalogus van de menselijke genetische diversiteit, die op hun beurt gebruikt kunnen worden voor interdisciplinaire studies koppelen van genetische variatie en ziekte te creëren. Door in het consortium plan ontdekken meer dan 95% van varianten met lage allelfrequenties zo laag als 1% over het genoom en 0,1 tot 0,5% in de genen en hun frequenties te schatten in mensen, hun banden met haplotypes en verbindingsevenwichtsafwijking structuur van de varianten allelen.

De tweede doelstellingen omvatten het gebruik van betere SNP, de keuze van probes voor toekomstige studies genotypering platforms en verhoging van het menselijk referentiesequentie. Bovendien wordt de opgebouwde database een nuttig hulpmiddel om de DNA-gebieden onder selectiedruk, veranderingen in vele populaties te bestuderen en begrijpen van het proces ondersteund mutatie en genetische recombinatie zijn.

Inzichten

Het menselijke genoom is ongeveer 3 miljard DNA basenparen en wordt geschat slijtage 20 000 25 000 coderende eiwitten, genen. Bij het ontwerpen van het project, het consortium wilde reageren op ernstige kritiek op het project indicatoren, zoals technologische uitdagingen, data standaarden van kwaliteit en dekking van sequencing.

In de komende drie jaar, wetenschappers van het Sanger Centre in het Instituut voor Genome Beijing BGI in Shenzhen en grootschalige sequencing netwerk National Human Genome Research Institute, het plan van de sequentie van een minimum van 1000 genomen mens. Vanwege het grote aantal sequentiegegevens die moet worden gegenereerd en geanalyseerd, is het mogelijk dat andere deelnemers worden geworven in deze periode.

Bijna 10 miljard bases zullen elke dag worden gesequenced op de periode van de productie fase van twee jaar. Dit is meer dan twee menselijke genomen per 24 uur; een revolutionaire mogelijkheden. Een uitdaging om de beste experts in de bioinformatica en genetische statistieken, de basis sequenties 6000000000000 DNA-basen, 60 keer meer dan sequence data is gepubliceerd in de DNA-databanken van de afgelopen 25 jaar.

Om het uiteindelijke ontwerp van het gehele project te bepalen, werden drie studies ontworpen en uitgevoerd in het eerste jaar van het project. De bedoeling was de eerste pilot 180 personen genotype 3 grote geografische groepen met lage dekking. Voor de tweede pilot-studie van de genomen van twee nucleaire gezinnen zouden worden gesequenced met diepe dekking. De studie van de derde rijder betrokken sequencen van de coderende gebieden van de genen in 1000 1000 mensen met een diepe dekking.

Het project wordt geschat op waarschijnlijk kost meer dan 500 miljoen als de standaard DNA sequencing technologieën worden gebruikt. Echter, verschillende nieuwe technieken toegepast, verlagen de verwachte kosten in een bereik van 30 tot 50 miljoen dollar. Belangrijke steun zal worden verstrekt door de Wellcome Trust Sanger Institute, Hinxton, Engeland; Beijing Genomics Institute, Shenzhen, China; en NHGRI, een tak van de National Institutes of Heath.

De genoomsequentie van gecompileerde gegevens vrij toegankelijk.

Monsters van menselijke genomen

Op basis van de algemene doelstellingen van het project, zullen de monsters worden gekozen om een ​​sterke kennis van de bevolking waarmee de studies met betrekking tot voorkomende ziekten kan worden gemaakt. Daarnaast zullen monsters niet om medische aantekeningen in of op het fenotype aangezien de voorgestelde catalogus een kern bron menselijke diversiteit zal zijn.

Voor de pilotstudies, zal monsters van het menselijk genoom van HapMap collectie worden gesequenced. Het zal nuttig zijn gericht op monsters die al aanvullende gegevens kunnen de resultaten te vergelijken met die van andere projecten.

Door te voldoen aan de meest uitgebreide ethische procedures, zal de 1000 Project gebruiken monsters van vrijwillige donoren. De volgende personen zullen worden opgenomen in de studie: Yoruba in Ibadan, Nigeria; Tokyo Japan; Beijing Chinese; Utah inwoners met voorouders uit Noord en West-Europa; Luhya in Webuye, Kenia; Kinyawa Maasai, Kenia; Tuscans van Italië; Peruanen van Peru; Gujarati Indianen in Houston; Chinese Denver; Mexicaanse afkomst in Los Angeles en Afrikaanse afkomst in de zuidwestelijke Verenigde Staten.

Resultaten

Resultaten in Medische Genetica

Populatiegenetica Resultaten

In 2011, werden duizenden markers in het Y-chromosoom gevonden door amateurs op de ruwe data van de 1000 Genomes Project op basis van hun analyse van computerprogramma's. Deze bevindingen kunnen aanzienlijk groeien de bomen van Y haplogroups, zeer nuttig zijn voor de geschiedenis van de menselijke migratie en voor genetische genealogie. Nieuwe markers en vond al in de catalogi van DNA-onderzoek bedrijven.