A 96-well plate containing about a kilobyte of DNA-encoded data.

Ce nouveau système de stockage ADN peut contenir 10 milliards de chansons dans un litre de liquide – mais des défis subsistent concernant ce format de stockage inhabituel.

Par Anissa Chauvin

La société américaine de biotechnologie Atlas Data Storage a lancé un système de stockage d’ADN synthétique capable de contenir 1 000 fois plus de données qu’une bande magnétique traditionnelle.

Le produit, appelé Atlas Eon 100, prétend qu’il stockera les « archives irremplaçables » de l’humanité pendant des milliers d’années. Il s’agit notamment de photos de famille, de données scientifiques, de documents d’entreprise, d’objets culturels et de versions originales d’œuvres d’art numériques, de films, de manuscrits et de musique.

« C’est l’aboutissement de plus de dix années de développement de produits et d’innovation dans de multiples disciplines », Bill Banyaifondateur d’Atlas Data Storage, a déclaré dans un déclaration. « Nous avons l’intention de proposer de nouvelles solutions pour l’archivage à long terme, la préservation des données pour les modèles d’IA et la sauvegarde du patrimoine et des contenus de grande valeur. »

Fondamentalement, toutes les données numériques ne sont qu’une série de 1 et de 0 dans une séquence définie. L’ADN est similaire dans le sens où il est constitué de séquences définies des bases chimiques adénine (A), cytosine (C), guanine (G) et thymine (T).

Le stockage des données ADN fonctionne en mappant le code binaire sur ces bases ; par exemple, un schéma de codage pourrait attribuer à A la valeur 00, C à la valeur 01, G à la valeur 10 et T à la valeur 11. L’ADN artificiel peut ensuite être synthétisé avec les bases disposées dans l’ordre correspondant.

Pour l’Atlas Eon 100, l’ADN est ensuite déshydraté et stocké sous forme de poudre dans des capsules en acier robuste de 0,7 pouce de hauteur (1,8 cm). Il n’est réhydraté que lorsqu’il doit être séquencé et ses bases retranscrites en binaire.

Plus utile que la bande magnétique

Un seul quart (un litre) de solution d’ADN peut contenir 60 pétaoctets de données, soit l’équivalent de 10 milliards de chansons ou 12 millions de films HD. Cela rend l’Atlas Eon 100, annoncé le 2 décembre, 1 000 fois plus dense en termes de stockage que la bande magnétique.

Pour le contexte, environ 15 500 miles (25 000 km) de bande LTO-10 de 0,5 pouce de large (12,7 mm), un support de stockage standard haute capacité, seraient nécessaires pour contenir la même quantité de données.

Cette densité de stockage rendra le transport de grandes quantités de données plus facile qu’avec des disques durs ou des bobines de bande classiques. L’ADN est également connu pour garder sa forme pendant des sièclesce qui en fait un support remarquablement stable pour conserver les données sur de très longues périodes.

Atlas Data Storage affirme que son produit est stable dans un environnement de bureau avec une fiabilité de 99,99999999999 %, mais les capsules peuvent également supporter des températures aussi élevées que 104°F (40°C). En revanche, la bande magnétique se désintègre en une décennie environ même avec des contrôles de température et d’humidité.

Les supports optiques, tels que les CD et DVD, se dégradent généralement d’ici 30 ansjusqu’à épuisement des disques durs environ 6 ou 7 ans avant de montrer des signes de détérioration. En moins de 3 heures à 158°F (70°C), une cellule mémoire flash peut « vieillir » autant qu’il le ferait normalement en un mois.

Atlas affirme également que son service de stockage ADN offre un moyen plus simple que d’autres supports de sauvegarder les données de ses clients. En effet, une fois qu’un brin est codé, les enzymes peuvent être utilisées pour réaliser plus d’un milliard de copies en quelques heures seulement.

Une solution pour une société avide de données ?

Selon Atlas, la société génère 280 Po de données chaque minute. Elle présente son stockage de données ADN comme une solution potentielle au prolifération des données numériquesqui a été massivement exacerbée par le phénomène génératif intelligence artificielle (IA) boom.

Cependant, la biotechnologie est confrontée à un défi majeur : la synthèse d’ADN artificiel codé reste un processus assez long comparé, par exemple, à l’enregistrement d’une photo sur un disque dur existant. Twist Bioscience, l’ancienne société mère d’Atlas dont elle a hérité son procédé de synthèse d’ADN, dispose actuellement d’un délai de livraison de entre 2 et 8 jours ouvrés sur les commandes de gènes et d’oligo (brins d’ADN courts et longs).

Le séquençage est également notoirement coûteux ; ça coûte environ 30 $ US pour lire une gigabase d’ADN, l’équivalent d’environ 250 Go de données. Cela prend également beaucoup de temps, une autre résolution récente sur le stockage de l’ADN signalant qu’il prend 25 minutes pour récupérer un seul fichier. Néanmoins, Atlas Data Storage affirme que les séquenceurs d’ADN modernes « améliorent le débit et réduire les coûts 1 000 fois plus rapidement que la loi de Moore

Cela dit, en raison du temps requis pour synthétiser et séquencer l’ADN, le Alliance de stockage de données ADN ont noté en 2025 qu’ils ne s’attendaient pas à ce que l’ADN soit utilisé pour le stockage de données d’archives à grande échelle avant trois à cinq ans.

Le professeur Thomas Heinis, professeur d’informatique à l’Imperial College de Londres qui étudie le stockage de données basé sur l’ADN, est sceptique quant au manque de données concrètes publiées par Atlas sur les performances de l’Atlas Eon 100. Il a souligné le fait que Catalog DNA, qui avait fait des promesses similaires concernant sa solution de stockage Shannon, a fait faillite il y a quelques mois.

« Je n’ai aucun doute sur le fait qu’ils ont construit un appareil impressionnant, mais il est difficile de l’apprécier sans informations concrètes », a-t-il déclaré à Live Science, ajoutant que le principal défi de la commercialisation du stockage de l’ADN est la synthèse et non le séquençage.

« Cela semble banal, mais si le coût d’écriture/synthèse n’est pas compétitif, alors il ne sert à rien de lire/séquencer de manière rentable. Vous ne pouvez pas lire (à moindre coût) ce que vous ne pouvez pas vous permettre d’écrire. Actuellement, la synthèse coûte des ordres de grandeur trop chers, tandis que le séquençage est plus proche de la bande, mais encore plus cher. Bien que je sois un fervent partisan du stockage de l’ADN, de nombreux progrès technologiques sont nécessaires et je n’ai encore vu personne avec une solution économiquement viable. »

Anissa Chauvin