DNA ເປັນສື່ກາງເພື່ອເກັບຂໍ້ມູນຄອມພິວເຕີຂະໜາດໃຫຍ່: ເປັນຄວາມເປັນຈິງໃນໄວໆນີ້ບໍ? -

ການສຶກສາແບບກ້າວກະໂດດຂັ້ນໄດ້ກ້າວໄປໜ້າຢ່າງສຳຄັນໃນການຄົ້ນຫາເພື່ອພັດທະນາກ DNA-based ລະບົບການເກັບຮັກສາຂໍ້ມູນດິຈິຕອນ.

ດິຈິຕອນ ຂໍ້ມູນ ກໍາລັງເຕີບໂຕໃນອັດຕາຕົວເລກໃນມື້ນີ້ເນື່ອງຈາກການເພິ່ງພາອາໄສເຄື່ອງມືຂອງພວກເຮົາແລະມັນຮຽກຮ້ອງໃຫ້ມີການເກັບຮັກສາໃນໄລຍະຍາວທີ່ເຂັ້ມແຂງ. ການເກັບຮັກສາຂໍ້ມູນແມ່ນຄ່ອຍໆກາຍເປັນສິ່ງທ້າທາຍເພາະວ່າເຕັກໂນໂລຢີດິຈິຕອນໃນປະຈຸບັນບໍ່ສາມາດສະຫນອງການແກ້ໄຂໄດ້. ຕົວຢ່າງຫນຶ່ງແມ່ນວ່າຂໍ້ມູນດິຈິຕອນຫຼາຍໄດ້ຖືກສ້າງຂື້ນໃນສອງປີທີ່ຜ່ານມາຫຼາຍກ່ວາໃນປະຫວັດສາດທັງຫມົດ ຄອມພິວເຕີ, ໃນຄວາມເປັນຈິງ 2.5 quintillion byte {1 quintillion byte = 2,500,000 Terabytes (TB) = 2,500,000,000 Gigabytes (GB)} ຂອງຂໍ້ມູນແມ່ນຖືກສ້າງຂຶ້ນທຸກໆມື້ໃນໂລກ. ນີ້ປະກອບມີຂໍ້ມູນໃນເວັບໄຊທ໌ເຄືອຂ່າຍສັງຄົມ, ການເຮັດທຸລະກໍາທະນາຄານອອນໄລນ໌, ບັນທຶກຂອງບໍລິສັດແລະອົງການຈັດຕັ້ງ, ຂໍ້ມູນຈາກດາວທຽມ, ການເຝົ້າລະວັງ, ການຄົ້ນຄວ້າ, ການພັດທະນາແລະອື່ນໆ. ຂໍ້ມູນນີ້ແມ່ນຂະຫນາດໃຫຍ່ແລະບໍ່ມີໂຄງສ້າງ. ດັ່ງນັ້ນ, ດຽວນີ້ມັນເປັນສິ່ງທ້າທາຍອັນໃຫຍ່ຫຼວງທີ່ຈະຮັບມືກັບຄວາມຕ້ອງການເກັບຮັກສາຂໍ້ມູນອັນໃຫຍ່ຫຼວງແລະການຂະຫຍາຍຕົວຂອງຕົວຊີ້ບອກຂອງມັນ, ໂດຍສະເພາະສໍາລັບອົງການຈັດຕັ້ງແລະບໍລິສັດທີ່ຕ້ອງການການເກັບຮັກສາໃນໄລຍະຍາວທີ່ເຂັ້ມແຂງ.

ທາງເລືອກທີ່ມີຢູ່ໃນປັດຈຸບັນແມ່ນຮາດດິດ, ແຜ່ນ optical (CDs), ຫນ່ວຍຄວາມຈໍາ, flash drives, ແລະ tapes drive ທີ່ກ້າວຫນ້າຫຼືແຜ່ນ optical BluRay ທີ່ເກັບຮັກສາຂໍ້ມູນປະມານ 10 Terabytes (TB). ອຸປະກອນເກັບຮັກສາດັ່ງກ່າວເຖິງແມ່ນວ່າຖືກນໍາໃຊ້ໂດຍທົ່ວໄປມີຂໍ້ເສຍປຽບຫຼາຍ. ກ່ອນອື່ນ ໝົດ, ພວກມັນມີອາຍຸການເກັບຮັກສາຕໍ່າຫາປານກາງແລະພວກມັນຕ້ອງຖືກເກັບໄວ້ພາຍໃຕ້ເງື່ອນໄຂອຸນຫະພູມແລະຄວາມຊຸ່ມຊື່ນທີ່ເຫມາະສົມເພື່ອໃຫ້ສາມາດຢູ່ໄດ້ຫຼາຍສິບປີແລະດັ່ງນັ້ນຈຶ່ງຕ້ອງການພື້ນທີ່ເກັບຮັກສາທາງດ້ານຮ່າງກາຍທີ່ຖືກອອກແບບພິເສດ. ເກືອບທັງຫມົດເຫຼົ່ານີ້ບໍລິໂພກພະລັງງານຫຼາຍ, bulky ແລະ impractical ແລະສາມາດເສຍຫາຍໃນການຫຼຸດລົງງ່າຍດາຍ. ບາງສ່ວນຂອງພວກເຂົາແມ່ນລາຄາແພງຫຼາຍ, ມັກຈະ plagued ກັບຄວາມຜິດພາດຂໍ້ມູນແລະດັ່ງນັ້ນຈຶ່ງບໍ່ເຂັ້ມແຂງພຽງພໍ. ທາງເລືອກທີ່ໄດ້ຮັບການຍອມຮັບຈາກອົງການຈັດຕັ້ງທົ່ວໄປເອີ້ນວ່າຄອມພິວເຕີ້ຟັງ - ການຈັດການທີ່ບໍລິສັດໂດຍພື້ນຖານແລ້ວຈ້າງເຄື່ອງແມ່ຂ່າຍ "ນອກ" ສໍາລັບການຈັດການຄວາມຕ້ອງການດ້ານໄອທີແລະການເກັບຮັກສາຂໍ້ມູນທັງຫມົດ, ເອີ້ນວ່າ "ຟັງ". ຫນຶ່ງໃນຂໍ້ເສຍປຽບຕົ້ນຕໍຂອງຄອມພິວເຕີ້ຟັງແມ່ນບັນຫາຄວາມປອດໄພແລະຄວາມເປັນສ່ວນຕົວແລະຄວາມອ່ອນແອທີ່ຈະໂຈມຕີໂດຍແຮກເກີ. ຍັງມີບັນຫາອື່ນໆເຊັ່ນ: ຄ່າໃຊ້ຈ່າຍສູງທີ່ກ່ຽວຂ້ອງ, ການຄວບຄຸມທີ່ຈໍາກັດໂດຍອົງການຈັດຕັ້ງແມ່ແລະການຂຶ້ນກັບເວທີ. ຄອມພິວເຕີ້ຄລາວຍັງເຫັນວ່າເປັນທາງເລືອກທີ່ດີສໍາລັບການເກັບຮັກສາໃນໄລຍະຍາວ. ແນວໃດກໍ່ຕາມ, ເບິ່ງຄືວ່າຂໍ້ມູນດິຈິຕອລທີ່ຖືກສ້າງຂຶ້ນທົ່ວໂລກແມ່ນແນ່ນອນວ່າເຮົາສາມາດເກັບມັນເກີນຄວາມສາມາດ ແລະ ຍັງມີການແກ້ໄຂທີ່ແຂງແຮງກວ່າເພື່ອຕອບສະໜອງການເກີດນໍ້າຖ້ວມຂໍ້ມູນນີ້ ໃນຂະນະທີ່ການສະໜອງການຂະຫຍາຍໄດ້ເພື່ອຄຳນຶງເຖິງຄວາມຕ້ອງການການເກັບຮັກສາໃນອະນາຄົດເຊັ່ນກັນ.

DNA ສາມາດຊ່ວຍໃນການເກັບຮັກສາຄອມພິວເຕີໄດ້ບໍ?

ຂອງພວກເຮົາ DNA (Deoxyribonucleic acid) ຖືກພິຈາລະນາເປັນສື່ທາງເລືອກທີ່ຫນ້າຕື່ນເຕັ້ນສໍາລັບການເກັບຮັກສາຂໍ້ມູນດິຈິຕອນ. DNA ແມ່ນອຸປະກອນການຈໍາລອງດ້ວຍຕົນເອງທີ່ມີຢູ່ໃນເກືອບທຸກສິ່ງມີຊີວິດແລະເປັນສິ່ງທີ່ປະກອບເປັນຂໍ້ມູນພັນທຸກໍາຂອງພວກເຮົາ. ທຽມຫຼືສັງເຄາະ DNA ເປັນວັດສະດຸທີ່ທົນທານທີ່ສາມາດເຮັດໄດ້ໂດຍໃຊ້ເຄື່ອງຈັກສັງເຄາະ oligonucleotide ທີ່ມີຂາຍໃນການຄ້າ. ຜົນປະໂຫຍດຕົ້ນຕໍຂອງ DNA ແມ່ນອາຍຸຍືນຂອງມັນ DNA ໃຊ້ໄດ້ດົນກວ່າຊິລິໂຄນ 1000 ເທົ່າ (ຊິລິຄອນ-ຊິບ – ວັດສະດຸທີ່ໃຊ້ໃນການກໍ່ສ້າງ ຄອມພິວເຕີ). ເຮັດໃຫ້ປະລາດ, ພຽງແຕ່ຫນຶ່ງ millimeter cubicmeter ຂອງ DNA ສາມາດເກັບຂໍ້ມູນໄດ້ຫຼາຍຕື້ໄບຕ໌! DNA ຍັງເປັນວັດສະດຸທີ່ມີຂະໜາດກະທັດຮັດທີ່ບໍ່ເຄີຍເຮັດໃຫ້ເສື່ອມເສຍ ແລະສາມາດເກັບຮັກສາໄວ້ໃນບ່ອນທີ່ເຢັນ ແລະແຫ້ງເປັນເວລາຫຼາຍຮ້ອຍສັດຕະວັດ. ແນວຄວາມຄິດຂອງການນໍາໃຊ້ DNA ສໍາລັບການເກັບຮັກສາໄດ້ມີມາດົນນານກັບປີ 1994. ເຫດຜົນຕົ້ນຕໍແມ່ນຮູບແບບທີ່ຄ້າຍຄືກັນທີ່ຂໍ້ມູນຈະຖືກເກັບໄວ້ໃນຄອມພິວເຕີແລະໃນຂອງພວກເຮົາ. DNA – ນັບຕັ້ງແຕ່ທັງສອງເກັບຮັກສາ blueprints ຂອງຂໍ້ມູນ. ຄອມພິວເຕີເກັບຂໍ້ມູນທັງໝົດເປັນ 0s ແລະ 1s ແລະ DNA ເກັບຂໍ້ມູນທັງໝົດຂອງສິ່ງມີຊີວິດໂດຍນຳໃຊ້ສີ່ຖານຄື thymine (T), guanine (G), adenine (A) ແລະ cytosine (C). ດັ່ງນັ້ນ, DNA ສາມາດເອີ້ນວ່າອຸປະກອນເກັບຮັກສາມາດຕະຖານ, ຄືກັນກັບຄອມພິວເຕີ, ຖ້າພື້ນຖານເຫຼົ່ານີ້ສາມາດເປັນຕົວແທນເປັນ 0s (ຖານ A ແລະ C) ແລະ 1s (ຖານ T ແລະ G). DNA ແມ່ນມີຄວາມເຄັ່ງຄັດແລະຍາວນານ, ການສະທ້ອນທີ່ງ່າຍດາຍທີ່ສຸດແມ່ນວ່າລະຫັດພັນທຸກໍາຂອງພວກເຮົາ - ແບບແຜນທີ່ຂອງຂໍ້ມູນທັງຫມົດຂອງພວກເຮົາທີ່ເກັບໄວ້ໃນ DNA - ຖືກຖ່າຍທອດຢ່າງມີປະສິດທິພາບຈາກລຸ້ນຫນຶ່ງໄປຫາຄົນຕໍ່ໄປໃນລັກສະນະຊ້ໍາຊ້ອນ. ຍັກໃຫຍ່ຊອບແວແລະຮາດແວທັງຫມົດມີຄວາມກະຕືລືລົ້ນໃນການນໍາໃຊ້ DNA ສັງເຄາະສໍາລັບການເກັບຮັກສາຈໍານວນຫຼວງຫຼາຍເພື່ອບັນລຸເປົ້າຫມາຍຂອງພວກເຂົາໃນການແກ້ໄຂການເກັບຂໍ້ມູນໃນໄລຍະຍາວ. ແນວຄວາມຄິດແມ່ນເພື່ອທໍາອິດປ່ຽນລະຫັດຄອມພິວເຕີ 0s ແລະ 1s ເຂົ້າໄປໃນລະຫັດ DNA (A, C, T, G), ລະຫັດ DNA ທີ່ຖືກແປງຫຼັງຈາກນັ້ນຖືກນໍາໃຊ້ເພື່ອຜະລິດສາຍພັນ DNA ສັງເຄາະຊຶ່ງຫຼັງຈາກນັ້ນສາມາດໃສ່ເຂົ້າໄປໃນບ່ອນເກັບຮັກສາເຢັນ. ເມື່ອໃດກໍ່ຕາມທີ່ຕ້ອງການ, ສາຍ DNA ສາມາດຖືກໂຍກຍ້າຍອອກຈາກບ່ອນເກັບມ້ຽນເຢັນແລະຂໍ້ມູນຂອງພວກມັນຖືກຖອດລະຫັດໂດຍໃຊ້ເຄື່ອງຈັດລໍາດັບ DNA ແລະລໍາດັບ DNA ສຸດທ້າຍຖືກແປເປັນຮູບແບບຄອມພິວເຕີຄູ່ຂອງ 1s ແລະ 0s ເພື່ອອ່ານໃນຄອມພິວເຕີ.

ມັນໄດ້ຖືກສະແດງໃຫ້ເຫັນ¹ ວ່າພຽງແຕ່ສອງສາມກຼາມຂອງ DNA ສາມາດເກັບຂໍ້ມູນ quintillion byte ແລະຮັກສາມັນໄວ້ໄດ້ດົນເຖິງ 2000 ປີ. ຢ່າງໃດກໍ່ຕາມ, ຄວາມເຂົ້າໃຈງ່າຍໆນີ້ໄດ້ປະເຊີນກັບສິ່ງທ້າທາຍບາງຢ່າງ. ກ່ອນອື່ນ ໝົດ, ມັນມີລາຄາແພງຫຼາຍແລະຍັງເຈັບປວດຢ່າງຊ້າໆທີ່ຈະຂຽນຂໍ້ມູນໃສ່ DNA ເຊັ່ນການປ່ຽນຕົວຈິງຂອງ 0s ແລະ 1s ກັບຖານ DNA (A, T, C, G). ອັນທີສອງ, ເມື່ອຂໍ້ມູນຖືກ "ຂຽນ" ໃສ່ DNA, ມັນເປັນສິ່ງທ້າທາຍທີ່ຈະຊອກຫາແລະດຶງໄຟລ໌ແລະຕ້ອງການເຕັກນິກທີ່ເອີ້ນວ່າ. DNA sequencing – ຂະບວນການຂອງການກໍານົດຄໍາສັ່ງທີ່ຊັດເຈນຂອງຖານທີ່ຢູ່ໃນ DNA ໂມເລກຸນ - ຫຼັງຈາກທີ່ຂໍ້ມູນຖືກຖອດລະຫັດກັບໄປເປັນ 0s ແລະ 1s.

ການສຶກສາທີ່ຜ່ານມາ² ໂດຍນັກວິທະຍາສາດຈາກການຄົ້ນຄວ້າຂອງ Microsoft ແລະມະຫາວິທະຍາໄລວໍຊິງຕັນໄດ້ບັນລຸ "ການເຂົ້າເຖິງແບບສຸ່ມ" ກ່ຽວກັບການເກັບຮັກສາ DNA. ລັກສະນະ "ການເຂົ້າເຖິງແບບສຸ່ມ" ແມ່ນມີຄວາມສໍາຄັນຫຼາຍເພາະວ່າມັນຫມາຍຄວາມວ່າຂໍ້ມູນສາມາດຖືກໂອນໄປຫາຫຼືຈາກສະຖານທີ່ (ໂດຍທົ່ວໄປເປັນຫນ່ວຍຄວາມຈໍາ) ໃນທຸກສະຖານທີ່, ບໍ່ວ່າບ່ອນໃດຢູ່ໃນລໍາດັບແລະສາມາດເຂົ້າເຖິງໄດ້ໂດຍກົງ. ການນໍາໃຊ້ເຕັກນິກຂອງການເຂົ້າເຖິງແບບສຸ່ມນີ້, ໄຟລ໌ສາມາດຖືກດຶງມາຈາກການເກັບຮັກສາ DNA ໃນລັກສະນະທີ່ເລືອກເມື່ອປຽບທຽບກັບກ່ອນຫນ້ານີ້, ເມື່ອການດຶງຂໍ້ມູນດັ່ງກ່າວຕ້ອງການລໍາດັບແລະຖອດລະຫັດຊຸດຂໍ້ມູນ DNA ທັງຫມົດເພື່ອຊອກຫາແລະສະກັດໄຟລ໌ຈໍານວນຫນ້ອຍທີ່ຕ້ອງການ. ຄວາມສໍາຄັນຂອງ "ການເຂົ້າເຖິງແບບສຸ່ມ" ແມ່ນສູງຂຶ້ນຕື່ມອີກເມື່ອຈໍານວນຂໍ້ມູນເພີ່ມຂຶ້ນແລະກາຍເປັນຈໍານວນຫຼວງຫຼາຍຍ້ອນວ່າມັນຫຼຸດລົງຈໍານວນລໍາດັບທີ່ຕ້ອງເຮັດ. ມັນເປັນຄັ້ງທໍາອິດທີ່ການເຂົ້າເຖິງແບບສຸ່ມໄດ້ຖືກສະແດງໃຫ້ເຫັນໃນລະດັບຂະຫນາດໃຫຍ່ດັ່ງກ່າວ. ນັກຄົ້ນຄວ້າຍັງໄດ້ພັດທະນາສູດການຄິດໄລ່ສໍາລັບການຖອດລະຫັດແລະການຟື້ນຟູຂໍ້ມູນທີ່ມີປະສິດທິພາບຫຼາຍຂຶ້ນໂດຍມີຄວາມທົນທານຕໍ່ຄວາມຜິດພາດຂອງຂໍ້ມູນທີ່ເຮັດໃຫ້ຂັ້ນຕອນການລໍາດັບໄວຂຶ້ນ. ຫຼາຍກວ່າ 13 ລ້ານ oligonucleotides DNA ສັງເຄາະໄດ້ຖືກເຂົ້າລະຫັດໃນການສຶກສານີ້ເຊິ່ງເປັນຂໍ້ມູນຂະຫນາດ 200MB ປະກອບດ້ວຍ 35 ໄຟລ໌ (ປະກອບດ້ວຍວິດີໂອ, ສຽງ, ຮູບພາບແລະຂໍ້ຄວາມ) ຕັ້ງແຕ່ 29KB ຫາ 44MB. ໄຟລ໌ເຫຼົ່ານີ້ຖືກດຶງມາແຕ່ລະອັນໂດຍບໍ່ມີຂໍ້ຜິດພາດ. ນອກຈາກນີ້, ຜູ້ຂຽນໄດ້ວາງແຜນສູດການຄິດໄລ່ໃຫມ່ທີ່ມີຄວາມເຂັ້ມແຂງແລະທົນທານຕໍ່ຄວາມຜິດພາດໃນການຂຽນແລະການອ່ານລໍາດັບ DNA. ການສຶກສານີ້ຈັດພີມມາຢູ່ໃນ Nature Biotechnology ໃນຄວາມກ້າວຫນ້າອັນໃຫຍ່ຫຼວງທີ່ສະແດງໃຫ້ເຫັນເຖິງລະບົບຂະຫນາດໃຫຍ່ທີ່ມີປະສິດທິພາບສໍາລັບການເກັບຮັກສາແລະການດຶງຂໍ້ມູນ DNA.

ລະບົບການເກັບຮັກສາ DNA ເບິ່ງຄືວ່າມີຄວາມຫນ້າສົນໃຈຫຼາຍເພາະວ່າມັນມີຄວາມຫນາແຫນ້ນຂອງຂໍ້ມູນສູງ, ຄວາມຫມັ້ນຄົງສູງແລະງ່າຍຕໍ່ການເກັບຮັກສາ, ແຕ່ແນ່ນອນມັນມີຄວາມທ້າທາຍຫຼາຍຢ່າງກ່ອນທີ່ມັນຈະຖືກຮັບຮອງເອົາທົ່ວໂລກ. ປັດໄຈບໍ່ຫຼາຍປານໃດແມ່ນການຖອດລະຫັດທີ່ໃຊ້ເວລາແລະແຮງງານຂອງ DNA (ການຈັດລໍາດັບ) ແລະຍັງສັງເຄາະຂອງ DNA. ເຕັກນິກດັ່ງກ່າວຮຽກຮ້ອງໃຫ້ມີຄວາມຖືກຕ້ອງແລະການຄຸ້ມຄອງກວ້າງກວ່າ. ເຖິງແມ່ນວ່າຄວາມກ້າວຫນ້າໄດ້ຖືກເຮັດໃຫ້ຢູ່ໃນພື້ນທີ່ນີ້ຮູບແບບທີ່ແນ່ນອນທີ່ຂໍ້ມູນຈະຖືກເກັບໄວ້ໃນໄລຍະຍາວເປັນ DNA ຍັງພັດທະນາຢູ່. Microsoft ໄດ້ປະຕິຍານວ່າ ຈະປັບປຸງການຜະລິດ DNA ສັງເຄາະ ແລະ ແກ້ໄຂສິ່ງທ້າທາຍຕ່າງໆ ໃນການອອກແບບການດຳເນີນງານຢ່າງເຕັມທີ່ DNA ລະບົບການເກັບຮັກສາໃນປີ 2020.

***

{ທ່ານສາມາດອ່ານເອກະສານການຄົ້ນຄວ້າຕົ້ນສະບັບໄດ້ໂດຍການຄລິກທີ່ລິ້ງ DOI ທີ່ໃຫ້ໄວ້ຂ້າງລຸ່ມນີ້ໃນລາຍຊື່ແຫຼ່ງທີ່ອ້າງອີງ}

ແຫຼ່ງຂໍ້ມູນ (s)

1. Erlich Y ແລະ Zielinski D 2017. DNA Fountain ຊ່ວຍໃຫ້ມີສະຖາປັດຕະຍະກໍາການເກັບຮັກສາທີ່ເຂັ້ມແຂງ ແລະມີປະສິດທິພາບ. ວິທະຍາສາດ. 355(6328). https://doi.org/10.1126/science.aaj2038

2. ອົງການຈັດຕັ້ງ L et al. 2018. ການເຂົ້າເຖິງແບບສຸ່ມໃນການເກັບຮັກສາຂໍ້ມູນ DNA ຂະຫນາດໃຫຍ່. ເຕັກໂນໂລຊີຊີວະພາບທໍາມະຊາດ. 36. https://doi.org/10.1038/nbt.4079

DNA ເປັນສື່ກາງເພື່ອເກັບຂໍ້ມູນຄອມພິວເຕີຂະໜາດໃຫຍ່: ເປັນຄວາມເປັນຈິງໃນໄວໆນີ້ບໍ?

ຈອງ​ຈົດ​ຫມາຍ​ຂ່າວ​ຂອງ​ພວກ​ເຮົາ

ບົດຂຽນທີ່ເປັນທີ່ນິຍົມທີ່ສຸດ

EDITOR PICKS

POPULAR POSTS

ປະເພດທີ່

ຈອງຈົດຫມາຍຂ່າວຂອງພວກເຮົາ