Vous manquez d’espace sur votre téléphone ? Ne mettez pas encore à niveau votre abonnement au stockage cloud. Des scientifiques chinois ont découvert que des images, des fichiers texte et d’autres données numériques peuvent être stockés dans des brins d’ADN fusionnés dans une bande de plastique de 100 mètres de long, capable de contenir l’équivalent de 3 milliards de chansons.
C’est loin d’être un appareil construit par Microsoft en 2016, qui a réussi à regrouper 200 mégaoctets de données dans une touche d’ADN. « beaucoup plus petit que la pointe d’un crayon. »
ADN est une longue molécule à double hélice constituée d’une séquence unique de quatre bases chimiques — adénine (A), cytosine (C), guanine (G) et thymine (T) — qui codent ensemble pour l’information génétique d’un organisme. De même, chaque fichier numérique est en fin de compte une combinaison de 1 et de 0 qu’un ordinateur peut interpréter comme un fichier PDF, JPEG ou autre.
Si chaque base devait représenter un modèle spécifique de 0 et de 1, alors un morceau d’ADN artificiel pourrait être codé pour contenir le code binaire des fichiers numériques. Ce type de molécule ne provient pas d’un organisme vivant, mais est assemblé en laboratoire en reliant des éléments constitutifs de nucléotides préfabriqués entre eux dans la séquence souhaitée.
C’est ce que les scientifiques ont fait avant d’imprimer l’ADN codé sur un long morceau de ruban adhésif. Une solution contenant les brins a été passée sur la bande afin qu’ils soient adsorbés à la surface du polymère.
« L’ADN a le potentiel de devenir le support de stockage d’informations de nouvelle génération en raison de sa haute densité de stockage », écrivent les auteurs dans l’étude. « La configuration enroulée de la bande ADN maximise efficacement l’utilisation spatiale du matériau, permettant la portabilité et augmentant le nombre de zones disponibles et la capacité de stockage en augmentant sa longueur. »
Chaque section de la bande est imprimée avec un code-barres indiquant quel fichier s’y trouve. Une caméra installée sur la machine semblable à un lecteur de cassettes scanne ensuite la bande alors qu’elle se déplace entre ses deux rouleaux, localise un fichier et plonge cet endroit dans une solution basique qui libère l’ADN. L’ADN peut ensuite être séquencé et cette séquence de bases peut être traduite dans le code du fichier.
Stockage des données pendant des centaines, voire des milliers d’années
Les chercheurs espèrent que leur bande ADN pourrait offrir une solution au prolifération des données numériquesqui a été massivement exacerbée par le phénomène génératif intelligence artificielle (IA) boom. Ils estiment qu’une pièce d’environ 1 kilomètre de long pourrait contenir jusqu’à 362 000 téraoctets de données, soit l’équivalent d’environ 60 milliards de photos. À titre de référence, les ordinateurs portables sont souvent livrés avec entre 0,5 et 2 To de stockage, tandis que les smartphones ont généralement un minimum de 128 Go ou 256 Go.
Au-delà de la capacité de stockage élevée, les données encapsulées par la bande ADN pourraient être conservées pendant une longue période, a indiqué l’équipe. En effet, les brins d’ADN sont stockés dans des structures organométalliques (MOF) – des cages à l’échelle moléculaire constituées d’ions zinc – qui fournissent une couche de protection.
L’ADN est connu pour garder sa forme pendant des siècleset les chercheurs ont découvert que leur bande pouvait stocker des données pendant plus de 345 ans à température ambiante, soit environ 20 000 ans à 32 degrés Fahrenheit (0 degré Celsius). Même en cas de rupture, la bande ADN pourrait être fixée à l’aide d’un ruban adhésif transparent, précisent-ils dans l’étude.
En plus d’identifier et d’extraire les brins d’ADN correspondant à un fichier spécifique, le lecteur peut encapsuler de nouveaux brins d’ADN dans des MOF et les déposer sur la bande. Il peut également détecter de manière autonome lorsqu’un brin d’ADN se trouve dans la mauvaise section de code-barres et le déplacer vers la bonne.
Même si le stockage des données ADN a été exploré largement au fil des annéesc’est l’une des premières solutions à afficher un comportement élégant de « système de fichiers », ce qui signifie que les fichiers peuvent être récupérés, modifiés ou supprimés. Il fonctionne également de manière robotique, au lieu de nécessiter une combinaison d’étapes manuelles et instrumentales, et peut gérer des données « chaudes » (accédées à plusieurs reprises) ainsi que des données « froides » (rarement consultées).
Toutefois, des défis demeurent. La synthèse proprement dite de l’ADN reste coûteuse, prend du temps et nécessite un équipement volumineux. De plus, le processus de récupération d’un seul fichier à partir de la bande prend environ 25 minutes. Par conséquent, dans son état actuel, le lecteur de cassettes ADN n’offre pas une méthode réalisable pour archiver nos données numériques.
Cela étant dit, les scientifiques espèrent que leurs recherches pourraient déboucher sur une technologie capable de stocker d’énormes quantités de données chaudes et froides sous une forme compacte, réduisant ainsi la dépendance à l’égard du centres de données massifs en usage aujourd’hui.

