
笑!研究者が猫の写真(とその他たくさんのデジタルデータ)をDNA分子に保存
アラン・ボイル著

ワシントン大学とマイクロソフトの研究者は、現実世界のアプリケーションで必要となるランダム アクセスの可読性とエラー訂正プロトコルを備え、DNA 分子にデータをアーカイブできるデジタル ストレージ システムを開発しています。
これらのハードルを乗り越えれば、あとは技術をいかに手頃な価格にするかを考えるだけです。最終的には、こうした研究が、現在のシリコンベースの方法よりも何百万倍も高密度に情報を保存できるデータストレージデバイスの実現につながる可能性があります。
前回:DNAに数千年分のデータをエンコード?研究者たちが研究中!
「生命はDNAと呼ばれる素晴らしい分子を生み出しました。DNAは遺伝子や生体システムの仕組みに関するあらゆる情報を効率的に保存します。非常にコンパクトで耐久性に優れています」と、ワシントン大学のコンピュータサイエンス・エンジニアリング准教授、ルイス・セゼ氏はニュースリリースで述べています。「私たちは基本的に、DNAを再利用して、写真、動画、文書といったデジタルデータを数百年、数千年にわたって管理しやすい形で保存しようとしています。」
Ceze 氏と彼の同僚は、今週アトランタで開催される ACM プログラミング言語およびオペレーティング システム向けアーキテクチャ サポートに関する国際会議 (ASPLOS) で発表される論文で、彼らの研究成果について説明しています。
一連の実験において、研究者たちは画像ファイルのデジタルデータを合成DNAの分子配列にエンコードした。DNAコードの「文字」、すなわちアデニン、チミン、シトシン、グアニン(ATCG)は、コンピューターのバイナリコードの1と0の代わりとなる。エンコードされた画像には、5キロバイトの笑顔の猿の画像、12キロバイトの猫の画像、そしてオーストラリアのシドニー港の24キロバイトの風景が含まれていた。

研究チームは、DNAの断片にファイルタグを挿入し、広く用いられているポリメラーゼ連鎖反応(PCR)法でデータを取得できるようにした。これにより、研究者はDNAコード全体を読み出す必要がなくなり、コンピューターのランダムアクセスメモリのように、探している情報に焦点を絞ることができた。
研究者らは、排他的論理和(XOR)を利用した誤り訂正手法も用いた。その結果、1バイトの情報も失うことなく画像を再構成することができた。
もうひとつの実験は、UW の「ルワンダ法廷からの声」プロジェクトのアーカイブビデオファイルを認証するためにデータをエンコードして取得することでした。

10年以上にわたり、世界中の研究者がDNAをデータストレージに利用する研究を行ってきました。あるチームは2012年に、5万3000語の書籍と関連画像をDNA分子にエンコードしました。翌年には、別のチームがウィリアム・シェイクスピアのソネットを用いて同様のことを行いました。
Ceze氏は電子メールでGeekWireに、ランダムアクセスの手法を実証し、エンドツーエンドのシステムを説明し、DNAの読み書きエラーの原因を詳細に分析することで、彼と彼の同僚は最先端技術を進歩させたと語った。
DNA合成のコストは数千ドルにも達するため、この技術が近い将来USBメモリの脅威となる可能性は低い。しかし、DNAベースのストレージシステムは、非常に小さなスペースに膨大な情報を保存でき、適切な条件下ではDNA分子が数百年、数千年も無傷のまま保存できることから、依然として研究する価値がある。
「私たちは実際のシステムの構築に積極的に取り組んでおり、進歩を遂げています」とセゼ氏は語った。
「DNAベースのアーカイブ保管システム」の著者には、セゼ氏に加え、ワシントン大学のジェームズ・ボーンホルト氏、ランドルフ・ロペス氏、ゲオルグ・シーリグ氏、そしてマイクロソフトリサーチのダグラス・カーミアン氏とカリン・ストラウス氏も名を連ねています。本研究は、マイクロソフトリサーチ、国立科学財団、そしてデビッド・ノトキン寄付大学院フェローシップの資金提供を受けて行われました。