Rejestracja

Please leave these two fields as-is:
UWAGA: Prosimy o rozwiązanie prostego równania matematycznego!
zamknij

Zaloguj się

Zapomniałeś hasła?

Jeżeli nie pamiętasz swojego hasła, wyślemy Ci nowe - wystarczy skorzystać ze specjalnego formularza
Przypomnij mi hasło

Zarejestruj się
Napisano: 24 stycznia 2013

Liczba komentarzy: 0
Sonety Shakespeare’a w podwójnej helisie

Wczoraj w Nature ukazała się przełomowa praca z pogranicza biologii molekularnej, bioinformatyki i … archiwistyki. Dzięki współpracy badaczy z European Bioinformatics Institute w Hinxton oraz firmy Agilent udało się bezbłędnie zakodować ponad pół megabajta (a dokładniej 739 Kb) danych w nici syntetycznego DNA.

Archiwizacja danych jest problemem trudnym, szczególnie w dzisiejszych czasach, w których ogrom generowanych informacji wymusza produkcję coraz większych dysków twardych. Podobno ilość danych przechowywanych tylko w CERNie wynosi ok. 90 petabajtów (kto z was wie, ile ta liczba ma zer?).

Dyski twarde, taśmy, płyty cd, pamięci flash- wszystkie one są bardzo zawodne, dane na nich zawarte ulegają zniszczeniu lub przekłamaniu po maksymalnie kilku latach. Alternatywą dla takich magazynów danych może być DNA, które jak wiemy,zachowuje się całkiem nieźle.

W najnowszej pracy  Goldman i wsp. zakodowali 5 „plików”:  wszystkie 154 Sonety Shakespeare’a kodowane w ASCII, kultową publikację Watsona i Cricka o strukturze DNA, fotkę instytutu w którym pracują badacze i 26-sekundowy fragment przemowy Martina Luthera Kinga z  1963. Do tego wszystkiego dołączyli jeszcze instrukcję konwersji metodą Huffmana kodu byte-3 do kodu DNA.

Naukowcy z Hinxton nie odkryli Ameryki. Już od jakiegoś czasu badacze kodują fragmenty tekstu w DNA, warto wspomnieć choćby o Craigh’u Venterze, który w genomie swojej syntetycznej bakterii zawarł kilka zdań, oraz o prof. Church’u z Harvardu, który napisał książkę i zakodował ją w cząsteczce DNA ( dzieło zajmowało nieco mniej pamięci, bo ok. 650Kb).

Co jednak jest epokowe w nowym doniesieniu, to sposób zapisu i odczytu danych, który w 100% zapobiega przekłamaniom i błędom, generowanym podczas syntezy fragmentów DNA i ich ligacji. Angielski system zapisu polega na kodowaniu znaków w tzw. kodzie „base-3”, w ciągu nukleotydowym, w którym na każdy bajt przypada 5 (lub 6, w zależności od rodzaju alfabetu) par zasad. W przekładzie kodu cyfrowego (0-1-2) na nukleotydowy przyjęto zasadę, że nie dopuszcza się w zapisie traktów nukleotydowych (czyli  powtórzeń AA, TT, CC lub GG) by zminimalizować ryzyko błędnego dodania dwóch zasad pod rząd podczas syntezy nici.

Helisa DNA
może być niedługo częścią naszych pendrive'ów
Nie dość, że zastosowano takie środki ostrożności, wprowadzono także coś, co można by porównać do  „chromosomów homologicznych”- informację kodowano niezależnie na dwóch niciach odwrotnie komplementarnych.

Nie obyło się bez zgrzytów: odczyt danych na platformie Illumina wykazał, że brakuje małego fragmentu ok. 25 zasad w jednym z zakodowanych „plików” za sprawą błędu ligacji. Błąd został „ręcznie” naprawiony i ostatecznie dane nie ucierpiały.

W opublikowanej wczoraj pracy Goldman i wsp. kładą główny nacisk na fakt, że kiedyś MUSIMY zacząć kodować informację w DNA lub podobnym medium.  Nie ma od tego ucieczki, proces powstawania nowych danych przyspiesza z prędkością wykładniczą, a systemy do syntezy DNA i jego odczytu tanieją. Powstaje zupełnie nowa platforma do składowania danych, która jest trwała, odporna na degradację i kompaktowa. Wspomniane 90 petabajtów (10^15 bajtów, czyli milion miliardów bajtów!) z CERNu zmieści się w 41 gramach DNA.

 

Marzena Wojtaszewska

 

Źródło:

Nature 1, 2 (uwaga: praca dostępna jest w Open Source!)

Science

Ps. Podziękowania dla autora http://www.wi3dza.com.pl/ za podlinkowanie artykułu!

image_pdfimage_print
Podziel się ze znajomymi
Skocz do formularza

Komentarze 0

Nikt jeszcze nie skomentował tego wpisu, napisz coś!
  1. Dodaj komentarz
    (wymagany)
    (wymagany)
    (wymagany)

    Pola oznaczone znaczkiem W są obowiązkowe. Musisz wypełnić wszystkie pola wymagane, aby dodać komentarz.
    Twój adres email, który podasz nie zostanie opublikowany z Twoim komentarzem.

    W treści komentarza dozwolone są tagi XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

do góry