Selain itu, secara alamiah, bakteri jauh lebih tahan terhadap kerusakan dibanding media penyimpanan elektronik manapun. Ia sanggup bertahan dari berbagai macam bencana yang dapat menghancurkan harddisk.
Reproduksi alami bakteri juga dapat dimanfaatkan untuk membuat duplikasi data dan menjaga integritas informasi yang disimpan. Ini juga membuat proses pengambilan kembali data dapat dilakukan dengan lebih mudah.
Berpedoman pada pemikiran tersebut, sekelompok peneliti asal The Chinese University of Hong Kong mencari cara bagaimana menyimpan data ke dalam DNA bakteri. Ternyata tidak sulit.
Pada bakteri, ada empat basis DNA yang bisa digunakan untuk membuat untaian DNA yakni Adenine (A), Cytosine (C), Guanine (G), dan Thymine (T). Artinya, penyimpanan akan menggunakan sistem angka basis empat.
Pada laporannya, seperti dikutip dari i09, 9 Desember 2010 peneliti memberi contoh mengubah kata “iGEM” ke dalam kode yang siap disimpan dalam DNA.
Mereka menggunakan tabel ASCII untuk mengonversi setiap huruf ke dalam nilai numerik misalnya i = 105, G = 71, dan seterusnya. Angka ini kemudian diubah menjadi penomoran basis 4 yakni 105 menjadi 1221, 71 menjadi 0113 dan seterusnya.
Angka basis 4 ini kemudian diubah ke dalam sistem DNA yang menggunakan kode A, T, C, dan G di mana A menggantikan angka 0, T menggantikan 1, C menggantikan angka 2, dan G pengganti angka 3. Jadi, kata iGEM disimpan di dalam DNA sebagai ATCTATTGATTTATGT.
Setelah data mentah siap, peneliti menyebutkan, beberapa algoritma bisa digunakan untuk menyingkirkan informasi repetitif atau redundan. Ini bukan hanya dapat menghemat ruang, banyaknya repetisi dalam untaian DNA secara biologis berpotensi membahayakan DNA dan bakteri tersebut. Berarti, penggunaan algoritma itu akan mengatasi dua masalah sekaligus.
Yang jadi masalah, untaian DNA tidak cukup panjang untuk menyimpan informasi kompleks seperti foto atau buku. Solusi terbaik adalah memecah data menjadi bagian-bagian kecil dan menyebarkannya pada sel yang berbeda.
Agar berhasil, peneliti membuat sistem yang memungkinkan pecahan-pecahan data diidentifikasi dan kemudian disusun ke dalam urutan yang benar. Untuk itu, mereka membuat tiga struktur bagian untuk seluruh DNA yakni header, message, dan checksum.
Header merupakan rangkaian sepanjang 8 bagian yang dibagi ke dalam empat level informasi yakni zona, kawasan, area, dan distrik yang memungkinkan setiap bagian dikembalikan ke dalam urutan yang tepat.
Setelah pesan yang membawa data sebenarnya dihantarkan, checksum menyediakan repetisi dari header awal yang berguna untuk mengontrol mutasi yang mungkin terjadi pada bakteri yang bersangkutan.
Setelah informasi dienkripsi dan ditempatkan pada banyak sel yang berbeda di bakteri, bagaimana cara pemilik data mengambil kembali data yang disimpan oleh bakteri yang bersangkutan?
Sebuah decrypter akan mengambil DNA dan menjalankannya pada sebuah teknologi yang disebut next-generation high-througput sequencing, atau NGS.
Tipe sequencing ini dapat menganalisa dan membandingkan banyak kopi dari sequence yang sama dan menggunakan modus terbanyak untuk mengetahui basis data mana yang benar dan data mana yang telah mengalami perubahan. Setelah itu, algoritma kompresi akan dibalikkan untuk mengembalikan data mentah ke dalam bentuk aslinya.
Langkah terakhir adalah menyusun kembali pecahan-pecahan data dalam urutan yang benar agar rangkaian DNA tersebut bisa diterjemahkan kembali menjadi data yang dapat digunakan.
Sampai tahap ini, data sudah disimpan dan mengalami enkripsi. Orang yang ingin membaca data tersebut membutuhkan formula yang mengetahui urutan yang benar dari header dan checksum. Tanpa formula tersebut, data yang ia miliki tidak dapat digunakan.