Jan Oliver Löfken

Journalist, Moderator, Physiker (Energie, Technik, Wissenschaft), Hamburg & Berlin

1 Abo und 8 Abonnenten
Artikel

DNA als Datenspeicher

Wide  1300x731

Es ist der Code, der unser Leben programmiert. Ohne ihn gäbe es uns nicht. Gespeichert in jeder Körperzelle. Zur Sicherheit zweifach. #


Die DNA ( siehe Kasten).

DNA

DNA ist die aus dem Englischen stammende Abkürzung von . Im Deutschen spricht man daher auch von DNS. Im Normalzustand kommt sie als Doppelhelix in jeder Zelle des Menschen vor. Auf diesem Strang ist das komplette Erbgut des Menschen als Code aus Basenpaaren gespeichert. Desoxyribonukleinsäure

Diese vier Genbausteine - symbolisiert durch die Buchstaben A, T, G und C - sind die Basen Adenin, Thymin, Guanin und Cytosin. Deren Buchstaben ergeben einen einzigartigen Code, ganz ähnlich wie die Striche maschinenlesbarer Etiketten im Supermarkt.

Damit die Informationen der DNA auch umgesetzt werden, muss sie abgelesen werden. Bei diesem Vorgang entstehen Ribonukleinsäuren (RNA), darunter bestimmte Boten-RNA, die den Bau von Proteinen regulieren - so werden Informationen aus der DNA im Organismus in die Tat umgesetzt.

Proteine wiederum steuern nicht nur die Biochemie des Körpers. Organe, Knochen, Muskeln, Haut und Gewebe des Menschen formen sich, weil Proteine in ihren Zellen das Sagen haben.




Dass die organischen Moleküle, genauer gesagt die Basen aus denen sie besteht, auch fantastische Datenspeicher für Computer wären - auf diese Idee ist man schon lange gekommen. Nur ist das in der Praxis nicht so einfach. US-Forscher haben jetzt in einem Experiment gezeigt: Mit nur einem Gramm DNA-Material könnte man 215.000 Terabyte dauerhaft speichern. Moderne Hochleistungsfestplatten aus künstlichem Material speichern heute mehrere Tausend Gigabyte.

Für ihr Experiment, das die Bioinformatiker um Yaniv Erlich von der Columbia University in New York im Magazin Science ( Erlich/Zielinkski, 2017) beschreiben, mussten sie keine so enorme Datenmenge verarbeiten. Sie schnürten aus einem kurzen Video, einem schlanken Betriebssystem und weiteren Bild- und Textdateien ein komprimiertes Datenpaket von insgesamt 2.146.816 Byte. Dieses zerlegten sie daraufhin in 67.088 Segmente zu je 32 Byte. Jedes Paket ergänzten sie um sechs Byte, die der Fehlerkorrektur dienten und die Information in sich trugen, wo sich die aneinandergereihten Segmente platzieren sollen.

Jedes Segment bestand aus einer Folge von 304 Nullen und Einsen. Diese ordneten Erlich und Zielinski mithilfe eines Algorithmus einer Folge aus den vier Buchstaben A, G, C und T zu, entsprechend der vier Nukleinbasen Adenin, Guanin, Cytosin und Thymin, aus denen unsere DNA aufgebaut ist. Nicht eindeutig zuzuordnende Buchstabenfolgen wurden vermieden. So entstand eine einfache Textdatei mit dem Bauplan für 72.000 DNA-Stränge aus jeweils 200 Nukleinbasen.

Künstliche DNA kann man längst herstellen

Diese Datei sandten sie an ein Unternehmen in Kalifornien, das mit biochemischen Verfahren synthetische DNA-Stränge anhand der Bauplanliste herstellt. Nach zwei Wochen erhielten die New Yorker Bioinformatiker einen kleinen Flakon mit den synthetisierten DNA-Schnipseln. Mit bereits kommerziell verfügbaren Sequenzierautomaten lasen sie diese Stränge wieder aus und rekonstruierten mit dem ursprünglich verwendeten Algorithmus die Zahlenfolge aus Nullen und Einsen.

Alle anfangs genutzten Dateien konnten wiederhergestellt und fehlerfrei ausgelesen werden. Selbst über das PCR-Verfahren, die Polymerase-Kettenreaktion, duplizierte DNA-Stränge enthielten die exakt identischen Informationen. Um zu zeigen, dass das funktioniert, betrachteten die Forscher die Video-, Bild- und Textdateien und konnten auch das Betriebssystem erfolgreich auf einem Rechner installieren.

"Wir glauben, mit unserem Versuch die höchste Speicherdichte für Daten überhaupt erreicht zu haben", sagte Erlich.

Dieser Grundlagenversuch belegt: DNA-Stränge sind für eine Speicherung digitaler Daten prinzipiell geeignet. Kann eine Nukleinbase theoretisch exakt zwei Byte speichern, erreichten die Forscher wegen der zu ergänzenden Byte für eine Fehlerkorrektur und Positionsangabe immerhin einen Wert von 1,6 Byte pro Nukleinbase. Daraus ergab sich rechnerisch eine Speicherdichte von 215 Petabyte pro Gramm. Der Aufwand dieser Technologie ist allerdings noch ausgesprochen groß. Allein die Herstellung der künstlichen DNA und das Sequenzieren kosteten etwa 9.000 US-Dollar. Die Bioinformatiker erwarten, dass diese Kosten in Zukunft drastisch sinken könnten.

Lange haltbar, aber nichts für zu Hause

Als Alternative zur täglich genutzten Festplatte taugt diese DNA-Datenspeicherung aber nicht. Vielmehr könnten in Zukunft solche Speicher aus Erbgut-Molekülen für möglichst langlebige Datenarchive genutzt werden. Von Vorteil wäre nicht nur die extrem hohe Datendichte, sondern auch die Stabilität von DNA-Molekülen. In kühler und trockener Umgebung erwarten die Forscher eine Haltbarkeit von Hunderttausenden von Jahren. Diese Annahme begründen sie mit einem Fund intakter DNA in Knochen von Frühmenschen, die vor etwa 430.000 Jahren im heutigen Spanien gelebt hatten.

Zum Original