Naujame „Science“ publikuotame tyrime pora tyrėjų iš Kolumbijos universiteto ir Niujorko genomo centro (NYGC) parodė, kad algoritmas, skirtas vaizdo transliacijoms mobiliuosiuose telefonuose, gali atskleisti praktiškai visą DNR informacijos talpos potencialą ir sutalpinti daugiau informacijos į keturių nukleotidų bazes. Be to, jie parodė, kad ši technologija itin patikima.
DNR yra ideali informacijos saugojimo priemonė, nes yra itin kompaktiška ir šaltoje, sausoje vietoje gali išlikti šimtus tūkstančių metų, kaip parodė neseniai atliktas DNR atkūrimas iš urve Ispanijoje rastų 430 000 metų senumo žmonių protėvių kaulų.
„DNR laikui bėgant negenda, kaip kasečių juostos ar CD, ir ši technologija netaps nebenaudojama – jei taip nutiks, turėsime dėl ko labiau nerimauti“, – sakė tyrimo bendraautorius Yanivas Erlichas, kompiuterijos profesorius iš Kolumbijos universiteto, Kolumbijos duomenų mokslo instituto narys ir pagrindinis NYGC narys.
Y.Erlichas ir jo kolegė NYGC mokslininkė D.Zielinski kodavimui, įrašymui į DNR, pasirinko šešis failus: kompiuterio operacinę sistemą „KolibriOS“, trumpą 1895 metų prancūzišką filmą „Traukinio atvykimas į stotį“, 50 dolerių „Amazon“ dovanų kortelę, kompiuterio virusą, „Pioneer“ plokštelę ir informatikos teoretiko Claude Shannon 1948 metų tyrimą.
Jie suspaudė failus į vieną failą ir tada suskaidė duomenis į trumpas dvejetainio kodo iš 1 ir 0 atkarpas. Naudodami ištrynimą koreguojantį algoritmą, vadinamąjį fontano kodu, jie atsitiktine tvarka įterpė šias kodo atkarpas į vadinamuosius lašelius ir kiekviename lašelyje vienetus ir nulius priskyrė keturioms DNR nukleotidų bazėms: A, G, C ir T. Algoritmas ištrindavo raidžių kombinacijas, kurios sukurdavo klaidas, ir kiekvienam lašeliui priskyrė brūkšninį kodą, padedantį vėl surinkti failus.
Iš viso jie sukūrė skaitmeninį 72 tūkst. DNR atkarpų, kurių kiekvienoje buvo po 200 bazių, sąrašą, ir išsiuntė jį tekstiniame faile į San Franciską DNR sintetinimo startuoliui „Twist Bioscience“, kuris specializuojasi skaitmeninių duomenų vertimu biologiniais duomenimis. Po dviejų savaičių jie gavo mėgintuvėlį su trupinėliu DNR molekulių.
Savo failus jie atkūrė, modernia genų sekoskaitos technologija nuskaitę DNR atkarpas ir programine įranga išvertę genetinį kodą atgal į skaitmeninį. Tyrime pažymima, kad failai buvo atkurti be klaidų. Trumpame vaizdo siužete Y.Erlichas atidaro suarchyvuotą operacinę sistemą virtualiame kompiuteryje ir pažymi sėkmę, žaisdamas „Minesweeper“.
Taip pat jie pademonstravo, kad naudojant jų kodavimo techniką galima sukurti praktiškai neribotą skaičių failų kopijų, padauginant DNR pavyzdžius polimerazės grandinine reakcija (PGR), o šios kopijos ir netgi tų kopijų kopijos ir taip toliau, gali būti atkuriamos be klaidų.
Galiausiai, tyrėjai parodė, kad naudojant jų kodavimo techniką viename DNR grame galima sutalpinti 215 petabaitus duomenų – 100 kartų daugiau nei naudojant metodus, kuriuos pirmieji paskelbė George'as Churchas iš Harvardo, Nickas Goldmanas ir Ewanas Birney iš Europos bioinformatikos instituto. „Manome, tai didžiausio informacijos tankio saugojimo įrenginys, koks kada nors buvo sukurtas“, – sakė Y.Erlichas.
Teoriškai, DNR paremta duomenų talpa apribota 2 dvejetainiais skaičiais vienam nukleotidui, tačiau biologiniai pačios DNR apribojimai ir būtinybė įterpti perteklinę informaciją, padedančią nuskaityti ir surikiuoti fragmentus, sumažina talpą iki 1,8 dvejetainių skaičių vienai nukleotidų bazei.
Komanda įžvalgiai pasinaudojo fontano kodais – technika, kurią Y.Erlichas prisiminė iš vidurinės mokyklos – ir skaitymo bei rašymo procesą padarė efektyvesnį. Tyrėjai vidutiniškai sutalpino 1,6 bito į kiekvienos bazės nukleotidą. Tai yra bent 60 proc. daugiau duomenų nei naudojant anksčiau publikuotus metodus ir arti 1,8 bitų ribos.
Panaudojimą teberiboja kaina. Tyrėjai išleido 7000 dolerių, sintetindami DNR, kuria suarchyvavo 2 megabaitus duomenų, ir dar 2000 dolerių išleido jos nuskaitymui. Nors DNR nuskaitymo kaina sumažėjo labai stipriai, tokios pat paklausos DNR sintezei gali ir nebūti, sako tyrime nedalyvavęs Sri Kosuris, UCLA biochemijos profesorius. „Investuotojai nelinkę rizikuoti pinigais, kad numuštų kainą“, – sakė jis.
Bet DNR sintetinimas galėtų stipriai atpigti, jei būtų gaminamos prastesnės kokybės molekulės ir molekulių klaidos būtų taisomos tokiomis kodavimo strategijomis, kaip „DNA Fountain“, pažymi Y.Erlichas. „Daugiau darbo galima palikti kompiuteriams ir trumpiau užtrukti koduojant molekules“, – sakė jis.