Poezja, artykuł naukowy, nagranie, zdjęcie własnego instytutu - takie informacje brytyjscy badacze zapisali w sekwencji DNA, a następnie bez problemów z niej odtworzyli. Przekonują, że taka metoda molekularnego przechowywania danych może być idealna do magazynowania dużych ilości informacji nawet przez tysiące lat. Jedną z zalet jest ogromna pojemność DNA - jeden gram jego sekwencji pomieści taką ilość informacji, dla której potrzebowalibyśmy aż 3 mln płyt CD.
Zespół naukowców z Europejskiego Instytutu Bioinformatyki (EIB) w Hinxton niedaleko Cambridge przeprowadził eksperyment, podczas którego w sekwencji DNA zakodowano sporą ilość informacji pochodzących z różnych rodzajów zapisu. Następnie bez problemów, ze stuprocentową dokładnością, odzyskali te dane z cząsteczki DNA. Całe doświadczenie opisali w czasopiśmie "Nature".
760 kB w niewidocznej drobinie
Badacze wykorzystali 26-sekundowy fragment słynnej antyrasistowskiej przemowy Martina Luthera Kinga "I Have a Dream", zapisane w formacie jpg zdjęcie swojego instytutu, artykuł naukowy z 1953 r. opisujący strukturę DNA w formacie pdf, plik tekstowy zawierający wszystkie sonety Szekspira i plik z informacjami o systemie kodującym.
Wszystkie te informacje, które łącznie na dysku komputera zajmowały około 760 kB zamknęli w cząsteczce DNA, która fizycznie jest mniejsza od drobinki kurzu. Jak podkreślił jeden z badaczy Nick Goldman, to niezwykle "gęsty" nośnik. Dodał, że jeden gram DNA może być w stanie pomieścić około dwóch petabajtów danych - czyli tyle, co około 3 mln płyt CD.
Małe wymagania, zero konserwacji
- Wspaniałą właściwością DNA jest to, że nie potrzeba żadnej elektryczności do jego przechowywania - podkreślił z kolei należący do zespołu badawczego dr Ewan Birney. - Jeśli pozostaje w chłodnym, suchym i ciemnym otoczeniu, może przetrwać bardzo długi czas. Wiemy to, bo sekwencjonujemy DNA mamuta włochatego, które przez przypadek znajdowało się w takich warunkach - wyjaśniał.
Według badaczy metoda przechowywania molekularnego może być szczególnie przydatna dla archiwizowania danych historycznych i rządowych. Wiele z nich nie jest potrzebnych na co dzień, ale muszą być zachowane. Zakodowanie w DNA umożliwi ich bezpieczne utrzymanie do czasu, aż przyjdzie potrzeba z nich skorzystać.
Taka forma przechowywania nie wymaga stałej konserwacji – inaczej niż w przypadku innych nośników takich jak twarde dyski czy taśma magnetyczna. Ponadto według naukowców powszechność cząsteczki DNA gwarantuje, że nie pojawi się problem niedopasowania technologicznego, który po upływie długiego czasu mógłby uniemożliwić odczytanie danych.
Amerykanie też testują
- Uważamy, że dopóki na Ziemi istnieje życie oparte na DNA, zawsze znajdzie się technologia pozwalająca na odczytanie z niego informacji, choć wymaga to pewnego zaawansowania - skomentował dr Birney.
Eksperyment brytyjskich badaczy to nie pierwszy przypadek, kiedy DNA zostało użyte do zakodowania zwykłych informacji – takich, jakie mamy zapisane w naszych komputerach. Np. w zeszłym roku amerykańscy badacze opublikowali w "Science Magazine" wyniki podobnego doświadczenia, w którym zarchiwizowali w ten sposób całą książkę.
Brytyjski zespół użył nieco innych technik, ale przy tym zbadał głębiej niektóre zagadnienia związane ze skalowalnością i funkcjonalnością.
Jeden "alfabet", różne "języki"
Podstawą tej metody jest wykorzystanie sekwencji nukleotydów. Określa ona kolejność występowania zasad w kwasach nukleinowych tworzących cząsteczkę DNA. Tym samym stanowi kod, czyli sposób zapisu informacji genetycznej o kolejności aminokwasów w białkach. To informacje potrzebne żywemu organizmowi do powstania i funkcjonowania.
System zapisu danych testowany przez Europejski Instytut Bioinformatyki wykorzystuje "znaki" tego kodu, ale w zupełnie innym układzie. Można to porównać do sytuacji, kiedy różne języki wykorzystują litery tego samego alfabetu - każdy stosuje je w innych kompozycjach.
Żeby można było zapisać w cząsteczce DNA pliki z komputera - dokument tekstowy, informację w systemie binarnym - musi ona najpierw zostać "przetłumaczona" na opracowany w EIB kod. Następnie maszyna syntetyzująca DNA wytwarza według niego odpowiednią sekwencję.
Jedyny problem: cena
Nie stanowi ona jednolitej, długiej cząsteczki, tylko wielokrotne kopie zachodzących na siebie fragmentów, z których każdy zawiera wskazówki o tym, w jakim miejscu całej sekwencji powinien się znaleźć. To rodzaj zabezpieczenia, bo nawet jeśli niektóre fragmenty zostaną utracone, nie spowoduje to utraty danych.
Do odczytania zapisanych w ten sposób informacji stosuje się standardowe urządzenia używane w laboratoriach biologii molekularnej.
Naukowcy przyznają, że koszty związane z syntetyzowaniem cząstek DNA w laboratorium sprawiają, że obecnie ten sposób przechowywania informacji jest niesamowicie drogi. Twierdzą jednak, że nowe, szybsze technologie już wkrótce staną się bardziej przystępne, szczególnie dla archiwizacji długoterminowej.
Autor: js/mj / Źródło: bbc.co.uk