|
DeepMindは最近、Nature誌にAlphaFold 2の詳細を記した論文を発表し、正式にオープンソース化しました。AlphaFold 2の人工知能システムは、タンパク質の形状をより正確に予測できます。DeepMindは、コードベースを公開することで、ヘルスケアやライフサイエンスなどの分野でAlphaFold 2の利用を拡大したいと述べています。 2018年12月、DeepMindはAlphaFoldを用いてタンパク質フォールディングの課題解決に挑戦し、AlphaFoldは従来のソリューションよりも正確にタンパク質構造を予測できると発表しました。2年間の改良を経て、2020年12月にAlphaFold 2がリリースされました。AlphaFold 2には、タンパク質フォールディング予測を大幅に向上させる多数の機能強化が施されています。第14回CASP評価において、AlphaFold 2は平均誤差わずか0.1ナノメートル(原子1個分の幅に相当)を達成し、AIによる予測は実験手法に匹敵するレベルに達しました。DeepMindは最近、AlphaFold 2を正式にオープンソース化しました。 タンパク質は、アミノ酸からなる巨大分子で、組織、筋肉、毛髪、酵素、抗体、その他の生物の基本的な構成要素です。DNAにコードされています。これらの遺伝子はタンパク質の三次元構造を定義・制約し、それがタンパク質の機能を決定します。しかし、タンパク質の「折り畳み」は、対応する遺伝子配列のみから識別することは困難です。DNAにはアミノ酸残基の鎖に関する情報しか含まれておらず、最終的な鎖の形状に関する情報は含まれていません。 前述のように、タンパク質の形状は機能を決定する上で重要です。ほとんどの薬剤は、タンパク質構造内の非常に特殊な形状の「ポケット」に結合することで効果を発揮します。したがって、タンパク質の正確な形状を理解することは、新薬開発において重要なステップとなる可能性があり、AlphaFold 2は医薬品の開発と発見を加速させる可能性を秘めています。 AlphaFoldは生物学、物理学、そして機械学習からインスピレーションを得ています。折り畳まれたタンパク質は「空間グラフ」とみなせるという事実を活用しています。AlphaFoldは人工知能アルゴリズムを用いてこのグラフの構造を解釈しようと試みると同時に、進化的に関連する配列、多重配列アライメント、そしてアミノ酸残基ペアの表現を用いて、構築する暗黙的なグラフについて推論を行います。 オープンソース版では、DeepMindはAlphaFold 2を大幅に簡素化しました。以前は一部のCASPエントリの構造生成に数日を要していた計算が、オープンソース版では約16倍高速化されました。タンパク質のサイズにもよりますが、数分から数時間で構造を生成できます。 DeepMindは、AlphaFoldをさらに改良すれば、疫学研究関連の問題を含め、タンパク質フォールディングの分野でこれまで解決が困難だった問題にも応用できると考えています。昨年、DeepMindは、これまで構成が謎であったORF3aを含む、SARS-CoV-2の複数のタンパク質の構造を予測しました。CASP 14では、DeepMindは別のコロナウイルスタンパク質であるORF8の構造も予測し、後に研究者によって確認されました。 DeepMindは、パンデミック対策への貢献に加え、AlphaFold 2が現在モデル化されていない数億種のタンパク質の探索にも活用されることを期待しています。現在、公開されている一般的なタンパク質データベースには1億8000万種のタンパク質配列が登録されていますが、タンパク質構造は約17万種に過ぎません。 DeepMindは、AlphaFoldの「スケールアップ」に注力し、複数のタンパク質がどのように複合体を形成し、DNA、RNA、小分子と相互作用するかといった新たな領域をパートナーと共同で探求していくと述べました。DeepMindは今年初め、ジュネーブに拠点を置く「顧みられない病気のための新薬イニシアチブ」との新たな提携も発表しました。このイニシアチブでは、AlphaFoldを用いて、睡眠病の治療薬として有毒化合物であるメラルソプロールの代替としてフェキシニダゾールを特定しました。 この記事はOSCHINAから転載したものです。 タイトル: DeepMindがAlphaFold 2をオープンソース化、ライフサイエンス分野に大きな変化をもたらす可能性 この記事は以下でご覧いただけます:https://www.oschina.net/news/151434/deepmind-alphafold-2-for-protein-structure-predictions |