DUICUO

DeepMindのオープンソースAlphaFoldはどのように使用すればいいですか? Colabを開くとオンラインで使用できます。

[[414398]]

最近、*Nature*誌はDeepMindによる2本の論文を掲載し、同社のタンパク質構造予測における最新の進歩を紹介しました。この研究によると、DeepMindのAlphaFoldは、タンパク質構造予測において原子レベルの精度を達成しました。同時に、同社はAlphaFoldのソースコードもGitHubで公開しました。

オープンソースリンク: https://github.com/deepmind/alphafold

しかし、一部の研究者からデータファイルが大きすぎる(2.2TB)という苦情が寄せられました。そこで、熱心な研究者グループは数時間でGoogle Colabノートブックを作成しました。このツールを使えば、無料のGoogleアカウントを持つ人なら誰でも、データのダウンロードや特別なハードウェアの使用を必要とせずに、興味のあるタンパク質に対してAlphaFold 2の簡略化されたバージョンを実行できます。すべての計算はクラウド上の無料Colabスペース内で実行されるため、ユーザーは実行を微調整できます。これは、テクノロジーの民主化を加速させる最良の方法の一つです。

Colab アドレス: https://colab.research.google.com/github/deepmind/alphafold/blob/main/notebooks/AlphaFold.ipynb

オープンソースの AlphaFold は、分子生物学の研究に新時代をもたらします。

2020年12月、AlphaFold2は国際的なタンパク質構造予測コンペティションCASP14において多数の競合相手を破り、前例のない構造予測精度を達成しました。これは50年来の課題であったタンパク質フォールディングの解決に繋がり、構造生物学における「革命的な」ブレークスルーであり、タンパク質研究分野における画期的な出来事として高く評価されました。

しかし、成功の後には、「学界はこのような大企業と競争することはできない」「彼らは素晴らしい仕事をしたが、私たちはそれを使うことができない」「彼らは絶対にそれを他の人に提供しないだろう」といった批判や疑念が湧き起こった。

しかし、DeepMindの最近の行動はこれらの懸念に対処しました。AlphaFoldのコードをオープンソース化しただけでなく、Colabパイプラインも提供しました。これにより、モバイル端末からAlphaFold 2の簡易版を使用することも可能になりました。

下記の2人の研究者が述べているように、Colabノートブックは、ライブラリの読み込み、タンパク質配列の入力、タンパク質配列アライメントの構築など、幅広いタスクを実行できます。結果表示インターフェースでは、ブラウザ上で5つの3Dモデルと、配列に基づく推定LDDTスコアが表示されます。さらに、原則として、これらのノートブックをフォークして、より具体的なタスクに合わせて編集することも可能です。

ただし、Colab版のAlphaFold 2はやや簡略化されており、テンプレート(相同構造)が欠如しており、BFD配列データベースの一部のみを使用しています。開発者は、数千の最新のPDB構造を用いて、簡略版と完全版の違いを検証したと述べています。Colab版の精度は多くのターゲットにおいて完全版AlphaFoldシステムとほぼ同じですが、MSA(多重配列アライメント)が小さく、テンプレートがないため、一部のターゲットでは精度が大幅に低下します。より信頼性の高い結果を得るには、オープンソースの完全版AlphaFoldまたはAlphaFoldタンパク質構造データベースの使用をお勧めします。

データベースリンク: https://alphafold.ebi.ac.uk/

構造生物学と分子モデリングを専門とするEPFL(ローザンヌ連邦工科大学)のポスドク研究員、ルチアーノ・アブリアータ氏は、これらのノートブックを用いていくつかのテストを行い、いくつかの結論を導き出したと述べています。最も重要なのは、配列アライメントなどの機能が、より優れたモデルを得るのに非常に役立つということです。アブリアータ氏はまた、多くの人がこのツールを使用する際にLDDT推定プロットを見落としていることを発見しましたが、これらのプロットは実際には非常に重要です。

AlphaFoldのオープンアクセスは、世界中の研究者に利便性をもたらしました。実験的に構造を決定するのが難しいタンパク質の場合、この手法はタンパク質モデルの構築に不可欠です。たとえすぐに入手できないデータがあったとしても、優れたタンパク質モデルがあればなおさら役に立ちます。

DeepMind が生物学のさらに多くの分野に進出するにつれて (まだ発表する予定はないが、タンパク質間の相互作用や次のステップである小分子の設計に進出する可能性があると推測するのは妥当である)、AF2 の応用と公開されているすべての知識から恩恵を受ける研究者は増えるだろう。

生物学分野の研究は長らくコンピューターと従来のソフトウェアに依存してきました。しかし今、生物学はAIの時代に入りました。