banner
ニュース センター
カスタマイズされたご要望にも喜んでお応えいたします

ニューラル ネットワークはまったく新しいタンパク質の設計に役立ちます

Jul 09, 2023

柔軟な言語ベースのアプローチは、材料科学における難解な問題を解決するのに驚くほど効果的であることが証明されています。

アメリカ物理学研究所

画像: 複雑な命令を理解し、最終的な構成要素から材料を分析および設計できるトランスフォーマー グラフ ニューラル ネットワークを使用して作成された、デザイナー タンパク質生体材料のサンプル視覚化。もっと見る

クレジット: マルクス・ビューラー

ワシントン、2023 年 8 月 29 日 – タンパク質は、その複雑な配置と動的な機能により、幾何学が重要となる単純な構成要素の独自の配置を採用することで、数多くの生物学的タスクを実行します。 このほぼ無限の配列ライブラリーをそれぞれの機能に翻訳することで、研究者は特定の用途に合わせてカスタムタンパク質を設計できるようになる可能性があります。

マサチューセッツ工科大学のマーカス・ビューラー氏は、AIP 出版の『Journal of Applied Physics』で、タンパク質の理解と設計をより良くするために、トランスフォーマーと呼ばれることが多いアテンション ニューラル ネットワークとグラフ ニューラル ネットワークを組み合わせました。 このアプローチは、幾何学的な深層学習の長所と言語モデルの長所を組み合わせて、既存のタンパク質の特性を予測するだけでなく、自然がまだ考案していない新しいタンパク質を想定することもできます。

「この新しい方法を使用すると、基礎となる原理をモデル化することで、自然が発明したすべてのものを知識基盤として利用できます」とビューラー氏は述べています。 「このモデルは、これらの自然な構成要素を再結合して、新しい機能を実現し、この種のタスクを解決します。」

タンパク質は、その複雑な構造、マルチタスク能力、溶解時に形状が変化する傾向があるため、モデル化が難しいことで知られています。 機械学習は、タンパク質の挙動を支配するナノスケールの力を、その機能を記述する機能的な枠組みに変換する能力を実証しました。 しかし、その逆、つまり目的の機能をタンパク質の構造に変えることは依然として課題です。

この課題を克服するために、ビューラーのモデルは、数値、説明、タスク、その他の要素をニューラル ネットワークが使用できるシンボルに変換します。

彼はまず、さまざまなタンパク質の配列、溶解度、アミノ酸の構成要素を機能から予測するためにモデルをトレーニングしました。 次に彼は、新しいタンパク質の機能に関する初期パラメータを受け取った後、創造性を発揮してまったく新しい構造を生成するようにタンパク質に教えました。

このアプローチにより、以前は水に溶解する必要があった抗菌タンパク質の固体バージョンを作成できるようになりました。 別の例では、彼のチームは天然に存在するシルクタンパク質を利用し、弾力性を高めるためにらせん形状を与えたり、靭性を高めるためにプリーツ構造を与えるなど、それをさまざまな新しい形状に進化させました。

このモデルは新しいタンパク質を設計する中心的なタスクの多くを実行しましたが、ビューラー氏は、このアプローチはより多くのタスクに対してさらに多くの入力を組み込むことができ、潜在的にさらに強力になる可能性があると述べました。

「大きな驚きは、モデルが複数のタスクを解決できるように開発されたにもかかわらず、非常に優れたパフォーマンスを発揮したことです。 これは、モデルが多様なタスクを考慮することでより多くのことを学習するためであると考えられます」と彼は言いました。 「この変更は、研究者が特定のタスクに特化したモデルを作成するのではなく、マルチタスクおよびマルチモーダル モデルの観点から幅広く考えることができることを意味します。」

このアプローチの広範な性質は、このモデルがタンパク質設計以外の多くの領域に適用できることを意味します。

「私たちの現在の焦点はタンパク質ですが、この方法は材料科学において大きな可能性を秘めています」とビューラー氏は語った。 「私たちは材料の破損挙動の研究に特に熱心に取り組んでおり、特定の破損パターンを持つ材料を設計することを目指しています。」

###

記事「新規タンパク質の分析と発見に適用された生成事前学習自己回帰トランスフォーマー グラフ ニューラル ネットワーク」は、Markus Buehler によって執筆されています。 これは、2023 年 8 月 29 日に Journal of Applied Physics に掲載される予定です (DOI: 10.1063/5.0157367)。 その日付以降は、https://doi.org/10.1063/5.0157367 からアクセスできます。