創薬AIが特効薬を求めて分子の宇宙を探索

暗い夜に街の明かりから離れると、天の川の星は無数にあるように感じられます。しかし、どの地点から観察しても肉眼では4,500個ほどの星しか見ることができません。一方で、私たちの銀河には1,000億から4,000億個の星があり、宇宙にはさらに多数の銀河が存在します。

夜空に関する数字は途方もないものですが、薬物に関する深い洞察を与えてくれます。

その薬物には「おい、今夜は星がめちゃくちゃキレイだ!」という類のドラッグも入りますが、病気から回復させる薬も含まれています。「薬のような」特性を持つ有機化合物の可能性上の数は、宇宙に存在する星の数よりもはるかに多く、30桁以上も上回っているのです。

この多元宇宙的な可能性と比べて、化学者が実際に薬として作り出した化学物質の配列は、繁華街で垣間見る星の数ほどにすぎません。

しかしながら、これには正当な理由があります。

潜在的な薬物空間をすべて探究することは、物理的空間のすべてを探索することと同様に人間には不可能であり、たとえ可能であったとしても、そこで発見したものは目的に合致しないことがほとんどです。それでも、そうした「無数の可能性の中に特効薬が潜んでいるはずだ」という考えは、無視することなど到底できないほどに魅力的です。

だからこそ、先週、サンディエゴのSingularity UniversityのExponential MedicineにてAlex Zhavoronkov氏は、私たちはAIを使って可能性の探求と発見の速度向上に取り組むべきだと述べたのです。彼いわく、これはAIの医療における次なる大きな応用分野になる可能性があるとのことです。

犬、診断、および薬物

Zhavoronkov氏は、Insilico MedicineのCEOであり、Biogerontology Research FoundationのCSOです。Insilicoは、AIで創薬を促進することを目指している、数あるAI関連スタートアップの1つです。

近年、Zhavoronkov氏は、今や有名な機械学習技術であるディープラーニングは、いくつかの面で進歩を遂げていると語りました。 DeepMindのAlphaGo ZeroやCarnegie MellonのポーカーをプレイするAIのように、自分自身でゲームのプレイ方法を学習することができるアルゴリズムは、様々な応用システムの中でも、おそらくもっとも多く取り上げられるでしょう。しかし、パターン認識は初期段階でディープラーニングの開発を推進したものであり、その後、機械学習のアルゴリズムは犬とネコを区別するのに苦戦していたレベルから、あっという間に類似するシステムや、その制作者までをも上回る性能を発揮するようになりました。

[Singularity Universityの人工知能とロボティクスの責任者、Neil Jacobstein氏からのAIに関する最新情報についてはこのビデオをご覧ください。]

医療分野では、医療用画像データベースで学習したディープラーニングアルゴリズムは、人間の専門家と同等以上の精度で生命を脅かす疾患を発見することができます。 私たちがAIを信頼するようになれば、AIは病気の診断に非常に役立つ可能性が高いという意見もあります。

そして、Zhavoronkov氏が指摘したように、多くの応用が行われ、長期間にわたる実績が蓄積することでAIに対する信頼度は高まっています。

「テスラはすでに自動運転車を公道で運用しています」とZhavoronkov氏は述べます。 「3〜4年の技術開発で既にA点からB点に時速100マイルの速さで乗客を運んでいます。一度の失敗で人が亡くなる可能性もありますが、乗客はこの技術を信頼し命を預けています。」

「では、なぜ、私たちは製薬会社でAIを活用しないのでしょうか?」

試行錯誤を繰り返しましょう。

医薬品研究では、AIは自動運転車のように自動で研究を行うわけではありません。AIは、化学者と協力することで、より良い薬品の候補を探すために、より多くの可能性をスクリーニングすることで、創薬を迅速化するアシスタントとなることができるのです。

Zhavoronkov氏によれば、AIには医療分野の様々なものを効率的にする余地が十分にあるとのことです。

創薬は困難で費用がかかります。化学者は、合成すべき最も有望な組み合わせを求めて、候補となる数万の化合物をふるいにかけます。これらのうち、一握りがさらなる研究へと進み、さらに少数が人間の臨床試験へと進み、それらのうちほんのいくつかが新薬として承認されます。

プロセス全体には何年にも及ぶ長い時間と何億ドルもの資金がかかることがあります。

これは間違いなくビッグデータの問題であり、ディープラーニングはビッグデータによってますます進歩していきます。初期のアプリケーションは、巨大なトレーニングデータベースの微妙なパターンを発見することで価値を示しました。製薬会社は既に化合物を選別するためにソフトウェアを使用していますが、そのような場合には化学者によって明記された規則が必要となっています。AIの魅力は、AI自身が学習し改善を重ねる能力です。

「製薬業界には、より優れた分子とより迅速な承認を得るための、AI主導型イノベーションの2つの戦略があります」とZhavoronkov氏は述べています。 「ひとつは干し草の中から針を探し出すことで、もうひとつは新しい針を作ってしまうことです。」

干し草の中から針を見つけるために、アルゴリズムは大規模な分子データベースで訓練された後、魅力的な性質を持つ分子を探しだそうと試みます。しかし新しい針を作るとは、いったいどのようなことでしょうか?それは、Zhavoronkov氏の専門分野である敵対的生成ネットワーク(GAN)によって実現される新しい可能性です。

このアルゴリズムは、2つのニューラルネットワークを互いに競わせます。一方が意味のある出力を生成し、もう一方はこの出力が真か偽かを判断します、とZhavoronkovは述べました。2つのアルゴリズムが組み合わさることで、ネットワークはテキスト、画像、もしくは今回の場合のように分子構造のような新しいオブジェクトを生成します。

「私たちはこの特殊な技術を採用し、ディープニューラルネットワークに新しい分子を想像させ、最初から完璧に正しい方向性を保てるようにしています。つまり、その目的とは本当に完璧な針を発見するためです。基本的な仕組みとしては、この敵対的生成ネットワークに、たんぱく質XをYという濃度で抑制する最も現実的で、特定の性質を持ち、副作用が最小限の分子を開発するように依頼します。
AIが分子配列の可能性の中からより多くの針を見つけたり製造することで、人間の化学者は最も有望なものだけを合成することに集中することができるとZhavoronkov氏は信じています。

AIがうまく稼働すれば、私たちは成功確率を上げ、ミスを最小限に抑え、プロセスをスピードアップできるようになると彼は期待しています。

論より証拠

創薬の試みを行っているのはInsilicoだけではなく、また創薬は全く新しい関心分野でもありません。昨年、ハーバード・グループは、同様に薬品の候補を提示するAIに関する論文を発表しました。このソフトウェアは250,000種類の薬物分子データを基にしており、既存の薬物をブレンドした新規分子を生成するためにその知見を使用し、望まれている特性に基づいた提案を行いました。

このテーマを扱ったMIT Technology Reviewの記事は、このようなシステムが未だ直面しているいくつかの課題を強調しました。AIの提案するものは、ラボでは必ずしも意義深いものとは限らず、また簡単に合成できるとも限りません。さらにそうした提案の質は、常にそうであるように、利用されたデータの質と同程度のものでした。

スタンフォード大学の化学教授で、Andreesen Horowitz氏のパートナーでもあるVijay Pande氏は、ディープラーニングによって急速な進歩を遂げた3領域である「イメージ」「スピーチ」「テキスト」は、より質が高く、よりクリーンなデータを持っていると述べました。一方、化学データは、まだディープラーニングに向けて最適化されている最中です。また、公開データベースが存在する一方で、多くのデータが各民間企業による非公開情報となっています。

課題を克服し、その価値を証明するために、彼の会社は技術の検証に大きく注力している、とZhavoronkov氏は述べました。しかしながら、今年、製薬業界の懐疑主義が関心と投資にも波及しつつあるように思えます。

AI創薬のスタートアップであるExscientia社は、Sanofiと2億8,000万ドルの契約を、GlaxoSmithKlineと4,200万ドルの契約を結びました。 InsilicoはGlaxoSmithKlineとも提携しており、さらにNumerateは武田薬品工業と協働しています。Googleさえもこうした動きに参入してくるかもしれません。この分野を概説しているNatureの記事によると、同社のディープラーニングプロジェクトであるGoogle Brainはバイオサイエンスチームを拡張しており、彼らが創薬をターゲットにしたとしても業界の専門家たちは驚かないだろう、とのことです。

AIとそれを稼働させるハードウェアは急激に進歩しているものの、最大のポテンシャルを発揮できるのはまだ先のことかもしれません。もしかすると、ある日、薬物分野の1060分子をすべて思いのままに利用できるようになるかもしれません。「そうなった場合、あなたはどんな意思決定よりも優先して、あなたが持つすべてのデータを利用し、n通りの新モデルを構築し、可能な限り多くの1060分子を調査すべきです」とNumerateのCTOであるBrandon Allgood氏はNatureに対して語りました。

もちろん、今日のプロジェクトは約束通りに実行される必要がありますが、Zhavoronkov氏は、AIは今後数年間のうちに大きな影響を与えるものであり、今こそまさにAIを統合すべき時だと考えています。 「もしあなたが製薬会社に勤めていて、『それで証拠はどこ?』などといまだに考えているとしましょう。証拠があって、それを確認してから信じるのであれば、あまりに遅すぎるのです」と彼は言いました。

Image Credit: Klavdiya Krinichnaya / Shutterstock.com
By
This article originally appeared on Singularity Hub, a publication of Singularity University.

この記事はSingularity Hubに掲載された記事を翻訳したものです。