このプロジェクトが大好きです!! @samuelhking、@pdhsu、そして@arcinstituteの乗組員、おめでとうございます! 私の2セント: 生物学的デザインに使用されるAIは、翻訳者として考えるのが最善です。 英語で話し、それをDNAに翻訳したり、その逆を行ったりすることができます。 パーツからファージを設計する方法はわかりませんが、Evo 1/2は自然界から200万を超えるファージゲノムを「読み取る」ことで訓練されたため、ファージDNAを「話す」ことを学習しました。 したがって、ChatGPT に中国語で詩を生成するように依頼するのと同じように、自分で詩を話さなくても、ChatGPT に中国語の詩を生成するように依頼できます。 私たちはすでに、AlphafoldやESMなどのモデルを使用してタンパク質の言語でAIモデルをトレーニングしており、それはうまく機能しました-この論文は、より高いレベルの複雑さでそれを行うことができることを示しています。 このAIモデルは、個々の遺伝子だけでなく、複数の遺伝子ファージゲノムを話します。 非常にエキサイティングなデモンストレーションと、設計されたファージを実際に作成してテストすることで、それをうまく証明しています。彼らは働いています! 私の意見では、将来の方向性が明らかであり、最終的に成功するであろうことが 2 つあります。 (1) モデルは、人間が何を求めているのかをよりよく理解し、それを DNA に変換できるように、設計されたファージについて学習した内容に基づいて再トレーニングする必要があります。 この「強化学習」は、Google が AI モデルにチェスを教えた方法に似ており、モデルにゲームをプレイさせ、勝ったか負けたかを伝えます。 ここでは、モデルに何百万ものファージを設計させ、ラボで構築し、さまざまな設計のパフォーマンスをモデルに伝えます。 (2) 何百万もの細菌ゲノムでトレーニングされたモデルによって、ここでファージに対して行われたのと同様の AI 設計の細菌細胞全体を構築できるかどうかを確認する必要があります。これは、英語のリクエストをファージのDNA詩(ファージ内の5,000文字のDNA)ではなく、DNAブック(最も単純な細菌の場合は500,000文字のDNA)に翻訳できるかどうかを確認します。 細胞はすべての生命の構成要素であり、米国は私たちが最初にそれに到達するようにすべきであるため、これは全国規模の科学的マイルストーンとなるでしょう。 (1)と(2)の両方を行うためには、DNAを構築し、生物の性能をテストするために必要な実際のウェットラボ生物学の実行効率を劇的に向上させる必要があります。 これは、彼らが302のファージデザインしか構築せず、16のデザインをテストしたことを示しています--それは、ウェットラボでの作業が遅すぎて費用がかかるためです。 それに対する答えはラボの自動化です -- NSF が AI 制御可能な自動化されたクラウド ラボや、米国の科学インフラをより効率的かつ産業規模にするその他の取り組みに $100M を投資しているのを見てうれしく思います。 ホワイトハウスのAI行動計画では、これらの「クラウド対応ラボ」の必要性も指摘されている。 繰り返しになりますが、素晴らしい仕事!!