多くの医薬品候補は臨床試験を通過できず、成功しても開発には10年から15年、約1兆円から2兆円の費用がかかります。開発プロセスは多くの段階と基準を要しますが、狙ったターゲットに効果を現しつつ、他の部分に悪影響を与えないような薬を見つけることは困難です。
目的地に到達し、適切な時間で体外に排出され、大量生産に適していなければなりません。実験によるこれらの特性の測定は高額で時間がかかるため、代替手段としてのチャンスがあります。
それは、機械学習(ML)を使用して、これらの特性を迅速かつ効率的に予測することです。このために紹介されるTx-LLMは、多数の実体(例えば、小分子、タンパク質、核酸、細胞、病気など)に関連する特性を予測するために、PaLM-2から洗練された大規模言語モデル(LLM)です。
Tx-LLMは、初期のターゲット遺伝子同定から後期の臨床試験承認まで、66の薬物発見データセットに基づいて訓練されており、治療応用の研究に最適です。
単一の重みセットで、Tx-LLMは66のタスク中43のタスクで最先端モデルに匹敵する性能を達成し、22のタスクでそれらを上回りました。また、文字情報を分子情報と組み合わせる能力や、異なるタイプの治療物質間でタスク機能を移行する能力も備えていることが見受けられました。
Tx-LLMは、薬物治療開発のパイプライン全体を通して役立つ可能性のある単一のモデルです。
出典 : Tx-LLM: Supporting therapeutic development with large language models https://research.google/blog/tx-llm-supporting-therapeutic-development-with-large-language-models/