Contenu
- Gènes codant pour les protéines
- Séquences d'ADN réglementaires
- Gènes pour ARN non codant
- Introns
- Vaste désert
Le génome humain est le catalogue complet des informations génétiques véhiculées par l'homme. Le projet du génome humain a commencé le processus d'identification et de cartographie systématiques de l'ensemble de la structure de l'ADN humain en 1990. Le premier génome humain complet a été publié en 2003 et les travaux se poursuivent. Le projet a identifié plus de 20 000 gènes codant pour des protéines dispersés parmi les 23 paires de chromosomes trouvés chez l'homme.
Cependant, ces gènes ne représentent qu'environ 1,5% du génome humain. Plusieurs types de séquences d'ADN ont été identifiés, mais de nombreuses questions demeurent.
Gènes codant pour les protéines
Les gènes codant pour les protéines sont des séquences d'ADN que les cellules utilisent pour synthétiser des protéines. L'ADN est constitué d'un long squelette sucre-phosphate auquel sont accrochées quatre molécules plus petites appelées bases. Les quatre bases sont abrégées en A, C, T et G.
La séquence de ces quatre bases le long des parties du squelette de l'ADN codant pour les protéines correspond à des séquences d'acides aminés, éléments constitutifs des protéines. Les gènes codant pour les protéines spécifient des protéines qui déterminent la structure physique de l'homme et contrôlent la chimie de notre corps.
Séquences d'ADN réglementaires
Différentes cellules ont besoin de différentes protéines à différents moments. Par exemple, les protéines nécessaires à une cellule cérébrale peuvent être très différentes de celles nécessaires à une cellule hépatique. Une cellule doit donc être sélective quant aux protéines qu’elle doit fabriquer.
Des séquences d'ADN régulatrices se combinent avec des protéines et d'autres facteurs pour contrôler les gènes actifs à un moment donné. Ils servent également de marqueurs qui identifient le début et la fin des gènes. Par le biais de processus biochimiques et de mécanismes de rétroaction, les séquences d'ADN régulatrices contrôlent l'expression des gènes.
Gènes pour ARN non codant
L'ADN ne fabrique pas directement de protéines. L'ARN, une molécule apparentée, sert d'intermédiaire. Les gènes de l’ADN sont d’abord transcrits en ARN messager, qui porte ensuite le code génétique sur des sites d’usine de protéines situés ailleurs dans la cellule.
L'ADN peut également transcrire des molécules d'ARN non codant pour les protéines, que la cellule utilise pour diverses fonctions. Par exemple, l'ADN est la matrice d'un type important d'ARN non codant utilisé pour construire les fabriques de protéines présentes dans la cellule.
Introns
Lorsqu'un gène est transcrit en ARN, il peut être nécessaire de retirer des parties de l'ARN car elles contiennent des informations inutiles ou déroutantes. Les séquences d'ADN qui codent pour cet ARN inutile sont appelées introns. Si l'ARN créé par les introns dans les gènes codant pour les protéines n'était pas épissé, la protéine résultante serait mal formée ou inutile.
Le processus d’épissage de l’ARN est assez remarquable: la biochimie cellulaire doit connaître l’existence de l’intron, localiser précisément sa séquence sur un brin d’ARN et l’exciser au bon endroit.
Vaste désert
Les scientifiques ne connaissent pas la fonction d’un pourcentage élevé des séquences de bases d’une molécule d’ADN. Certains pourraient être simplement de la malbouffe, tandis que d'autres pourraient jouer des rôles non encore compris.