AI が「生命の規範」に新たな光を当てる
ChatGPT、Bard、その他の人工知能ツールにより、ターミネーター映画シリーズの作家、教師、ファンはさまざまな終末的なシナリオを心配して夜も眠れなくなりますが、AI の別の使用法はより希望に満ちた結果をもたらします。
USC Dornsife College of Letters, Arts and Sciencesの研究者たちは、AIやその他の計算手法を利用して、科学者によるDNAの見方を再定義し、「生命の規範」についてより明確で包括的な視点を与えようとしている。
明らかになった知識は、がん研究から創薬、持続可能性に至るまで、科学分野を変革することを約束します。
最も単純に言えば、遺伝暗号は A、C、G、T の 4 つの文字で構成されています。これらの文字は、DNA 二重らせんの一部であるヌクレオチド、アデニン、シトシン、グアニン、チミンを表しています。 これら 4 つのヌクレオチド文字は、すべての生物の遺伝暗号を表します。
この単純なバージョンのコードは何十年にもわたって実用的な仕事をしてきましたが、DNA の複雑さを完全に明らかにし始めたわけではありません。
「私たちは、線形文字コードを超える、DNA をコード化する新しい方法を見つけたかったのです」と、USC Dornsife の定量・計算生物学部の部長である Remo Rohs 氏は述べています。 彼と彼の同僚は、大規模な実験データを使用した重要な研究を今年初めに米国科学アカデミー紀要に発表した。 彼らはまた、フォークヘッドボックス転写因子と呼ばれるがん関連タンパク質ファミリーに関する同様の実験データを、先週のNucleic Acids Research誌に発表した。
これらおよびその他の研究の進歩により、同部門は、AI や機械学習、データ サイエンス、ブロックチェーン、量子情報などの高度なコンピューティング テクノロジーの研究と革新を促進することを目的とした新しい USC フロンティア オブ コンピューティング イニシアチブの最前線に位置します。
定量的および計算生物学、化学、物理学、天文学、コンピューターサイエンスの教授である Rohs 氏と彼のチームは、「現在または我々が知っているすべての構造変異と化学修飾」を含む、遺伝暗号のより現実的かつ全体的な定義を開発しようとしている。それは将来発見されるかもしれない」と彼は言った。
ロース氏が言及するこれらの化学修飾や構造変化は、4 つのヌクレオチドに対する小さな変化から、DNA が自身やタンパク質などの他の分子に巻き付く方法に影響を与える大きな変化まで多岐にわたります。
これらの変化は、タンパク質と DNA の相互作用やコードの読み取りを許可またはブロックすることにより、どの遺伝子が活性化し、どの遺伝子が休止状態になるかに影響を与える可能性があります。
Rohs のアプローチは、単純な 4 文字の配列を、DNA 二重らせんの主溝と副溝に物理化学的基を含む配列に置き換えます。
それで、それは何を意味するのでしょうか?
DNAの二重らせんはねじれたはしごの形をしています。 はしごのねじれのおかげで、より広い主溝とより狭い副溝ができています。 サイズと形状に応じて、細胞分子は一方の溝を介して、もう一方の溝を介して DNA と相互作用しやすくなる場合があります。
「物理化学的」とは、物理的特性と化学的特性の両方を指します。 Rohs の方法では、ヌクレオチドやその他の DNA 成分のさまざまな凹凸と、2 つの溝内でのそれらの物理的なアクセス可能性が考慮されています。 また、DNA 構成要素がタンパク質とどのように化学的に反応するかについても組み込まれています。 まとめると、これにより、細胞の機構がどのように遺伝コードと相互作用し、解釈するのかがより明確にわかります。
たとえば、タンパク質は通常、AGTCATGGA としてコード化された DNA セクションに結合しますが、そのセクションが副溝に隠れている場合、タンパク質は結合するのに十分な距離に近づくことができない可能性があります。 あるいは、タンパク質とコード部分が強い化学的引力を持っている場合、コード部分がしっかりと押し込まれている場合でも、タンパク質は依然として相互作用できる可能性がありますが、程度は低いです。
これは、Rohs のチームが AI を導入したもので、DNA の各溝の特定の物理的位置にある特定の化学基に対する DNA 結合タンパク質の好みを学習します。
これらの微妙な違いを考慮することで、Rohs 氏と彼のチームは、単純で直線的な 4 文字のコードをはるかに超えた、生細胞内の DNA で何が起こっているのか、より完全な全体像を明らかにしました。 バイオテクノロジー企業ビオナノ・ゲノミクス社の名誉最高情報責任者であるソヘイル・シャムズ氏は、これがゲノムのコンピューター研究を進める鍵になると述べている。
「機械学習などの多くの計算生物学応用における最も重要だが、最も困難なステップの 1 つは、計算処理できるように生化学情報をどのように表現するかということです」と、USC ビタビ工学部を修士号を取得して卒業したシャムズ氏は述べています。 1986年に学位を取得し、1992年に博士号を取得した。「ロース博士らによって提案されたアプローチは、DNA配列のより完全な表現を提供しており、これにより、がん研究だけでなく遺伝子変異の解釈においても同様により完全な発見が可能になるはずです。」
Rohs氏の手法は、科学者がなぜ一部の遺伝子が特定の条件下で部分的にしか活性を示さないのか、あるいはなぜ一部の遺伝子の活性が年齢とともに増加または減少するのかを理解するのに役立つだろう。
そしてこれにより、さまざまな有益な研究の道への扉が開かれる、と Rohs 氏は言います。
同氏は、「化学修飾や構造修飾を行ったゲノムにAI手法を利用すれば、がんや老化の研究、農業研究、合成生物学、化学工学、創薬などに応用できるようになるだろう」と述べた。 「例えば、ある種のがんにはDNAの化学修飾が関係しており、老化はDNAメチル化のレベルと相関しており、植物のゲノムは他の生物のゲノムと比べて広範な化学修飾を受けています。」
Rohs氏によると、研究者らは次のステップとして、遺伝子活性を制御するDNA結合タンパク質に自分たちの研究を応用し、ヌクレオチドの変更、または新しい合成ヌクレオチドの置換がそれらのタンパク質の機能にどのような影響を与えるかを予測したいと考えているという。
「私たちは、転写因子と呼ばれる遺伝子調節タンパク質の、化学的に修飾されたヌクレオチドや合成塩基対を含むDNAへの結合選好を予測して、結合特性を改善し、人間の健康と病気を改善する薬剤を開発したいと考えています」と同氏は述べた。
AI を使用した計算生物学の最先端に関する Rohs 氏の研究は、ChatGPT のようなボットが夢見ることしかできなかった利益を人類にもたらす可能性があります。
米国科学アカデミー紀要に掲載されたこの論文は、博士研究員のTsu-Pei Chiu氏が主導し、元大学院生のSatyanarayan Rao氏が共著者となった。
Nucleic Acids Researchに掲載されたこの論文は、博士研究員ブレンドン・クーパー氏が主導し、元博士研究員アナ・カロリーナ・ダンタス・マシャド氏、実験技術者のヤン・ガン氏、生物学科学教授オスカー・アパリシオ氏の共著者となった。
この実験プロジェクトはマイケルソン収束生物科学センターの一部でした。 どちらの研究も国立衛生研究所とヒューマンフロンティアサイエンスプログラムの支援を受けました。
Rohs の研究室で行われた研究の詳細については、www.rohslab.org でご覧いただけます。
ダリン・S・ジョイ