AIの活用が、生命に隠されたデザインの謎を解き明かす ── 北里大学生命情報デザイン研究室が切り開くゲノム医療と創薬の未来

AIの活用が、生命に隠されたデザインの謎を解き明かす ── 北里大学生命情報デザイン研究室が切り開くゲノム医療と創薬の未来

成 果公共データベースの活用
組 織北里大学
業 種創薬

2023年4月、北里大学に新学部「未来工学部データサイエンス学科」が誕生した。データ解析やモデリングを通じまだ起きていない未来の課題をいち早く見出していくことをビジョンに掲げるこの学科のなかでも、今年4月に本格始動した生命情報デザイン研究室は積極的にAIを活用しながら効果的なゲノム医療と効率的な創薬の実現に取り組んでいる。まだまだ課題も謎も多いこの領域で、AI活用はどのように進んでいるのか──同研究室教授の鎌田真由美とfuku代表の山田涼太が語る、ライフサイエンスにおけるAI活用の未来とは。

ハッカソンでの出会いがコラボレーションへ

山田涼太(以下、山田): 鎌田先生は今年4月に北里大学へ移られて、 生命情報デザインの研究室を設立 されました。それまでは京都大学でバイオインフォマティクスを研究されていたんですよね。

鎌田真由美(以下、鎌田): 私はもともと情報学専攻でしたが、生命科学に関心があり、大学院生の頃はアミノ酸同士の相互作用を予測する機械学習モデルの研究をしていました。その後、ポスドクなどを経てバイオインフォマティクスの研究を続けていましたが、もっと直接的に人の役に立つ研究に携われないかと考えるようになったんです。

そんなタイミングで奥野(恭史)先生と出会いました。 研究の主たる対象が自分の関わってきたタンパク質の構造やゲノム情報の領域 だったこともあり、2015年から昨年まで奥野研究室で研究に携わっていました。

山田: 鎌田先生と初めてお会いしたのも京大にいらっしゃったころですよね。2019年に行われた生命科学分野の技術基盤を確立するためのイベント「BioHackathon」でお会いしたことを覚えています。

鎌田: そこで 医科学分野のデータベースを対象としたデータ統合 についてご相談することになったんですよね。医科学データではTSVやCSVといった表形式のフォーマットがよく使われているんですが、当時ライフサイエンス統合データベースセンターとの共同研究で進めていたデータ統合のプロジェクトでは、 RDFというフォーマットが用いられていたので、データを変換して統合していく必要 がありました。

山田: その後しばらく経ってから、奥野研から発注いただく形でお仕事をご一緒させていただくことになりました。私が「LINC」というAI創薬コンソーシアムに参加して、ライフサイエンスの論文から自然言語処理を活用した情報抽出に取り組めないか考えていたところ、奥野研から 製剤データを処理するAI活用 のご相談をいただいたんです。

image

数千件のデータベースをLLMで自動的に処理

鎌田: 製薬企業は薬を出すときにインタビューフォームと呼ばれる薬剤師向けの医薬品解説資料をつくるのですが、従来はPDFでしか公開されていなかったので、データ活用が進みづらい状況 にありました。山田さんがその課題に対して、AIを用いたデータの抽出や整理を行っていることを伺い、奥野研ではその後山田さんにいろいろなお仕事をご相談するようになりましたよね。 AIやデータ分析の領域でなにか頼もうとなったら、山田さんの名前が挙がるようになっていました。

山田: ありがたいかぎりです。奥野研はAI創薬に取り組んでいることもあり、さまざまなデータベースに関するプロジェクトが多かったですね。数十件のデータベースを対象に、その背景やライセンスの扱い、データの種類や管理形態などを整理しながら、データベースを統合していけるような作業に取り組んでいました。

鎌田: 10年以上前から「バイオインフォマティシャンの仕事の8割はデータの前処理」と言われていたほど、 従来は毎回目的別に異なるデータベースを参照して統合する必要があった ので、時間としても労力としてもコストがかかってしまっていたんです。 AIやデータサイエンスに使える共通のデータ基盤をつくる ことで、多くの研究者がより幅広い研究に携われるようになると考えています。

山田: 他方で、ライフサイエンスのデータベース自体は無数にあるんですよね。たとえばNBDC(バイオサイエンスデータベースセンター)のIntegbioデータベースカタログには2,500件ほどのデータベースが登録されていて、これらを人の手ですべて統合することは難しい。だから現在は LLM(大規模言語モデル)を活用しながら自動的にデータベースを読み解いてデータの形式を整理し、統合 できるようなプログラムの開発にも取り組んでいます。

鎌田: サイエンスにおけるAI活用を考えるうえで、データベースは必要不可欠ですからね。もちろんさまざまな研究室や研究機関がもっている独自のデータも重要ですし、一般に公開されているオープンデータと組み合わせる必要もあります。それぞれデータ形式も異なっているので、データ処理は必要不可欠です。現在天然化合物を対象に、オープンデータと研究室がもつ独自のデータを組み合わせてAIが扱える基盤をつくることに取り組んでおり、データベースの調査についても山田さんにご依頼していますね。

image

研究への深い理解がデータ処理を加速させる

山田: 近年は私たちのようなスタートアップが大学の研究室から発注をいただく機会が増えてきたように感じています。

鎌田: 効率的に研究を進めていくうえで「外注」はすごく重要 なんです。大学の研究室のなかには外注せずすべてを内製するところも少なくないですし、かつては私自身も自分たちですべてつくることが当たり前だと思っていたのですが、奥野研に入ってから考え方が変わりました。

山田: データサイエンスやAIの領域だと手を動かせる学生も多いですし、内製する方が一般的だったのかもしれませんね。

鎌田: データの前処理ってある意味泥臭い作業ではありますし、それだけで論文になるわけではないので、なかなか陽が当たらないものなんです。とくに生命科学のデータは細かなズレが生じていることも非常に多いので、挫けそうになる学生も少なくない。

山田: 私はむしろデータ処理の作業がすごく好きなんですよね。自分が農学部の獣医学科出身なのでもともとライフサイエンスの領域には関心がありましたし、先生たちがおっしゃっているビジョンにも共感できるので個人的にも勉強になることがとても多いです。

鎌田: 山田さんのようにデータそのものに興味をもってくださる方の方が、アウトプットのクオリティとしても関係性としても、信頼感があります。 もちろん選択肢としては大手ITベンダーの方々へ依頼することもできるんですが、ライフサイエンスのデータを扱うためには専門的な知識も必要になるので、一つひとつ前提となる知識を共有しようとすると時間もかかってしまいますし、結局自分たちが一からデータをチェックしなければいけないこともあります から。

image

ライフサイエンスにおけるAI活用の難しさ

山田: 鎌田さんとご一緒しているプロジェクトを通じて、徐々にLLMなどAIの活用が現実的なものになってきていると感じていました。

鎌田: 将来的には、AI活用を通じてゲノムと個性や病気との関係など、生物学的なメカニズムを解き明かしていきたいと思っています。そのためには山田さんにご依頼しているプロジェクトを通じて点在しているデータを統合する必要がありますし、今後はLLMなどを活用しながら自動化できる技術を開発していかなければいけません。

山田: 近年ビジネスの領域ではLLMの活用がかなり進んでいますが、ライフサイエンスにおいてはまだハードルが高いですよね。 ライフサイエンスのデータベースは複雑ですし、専門家が扱うことが前提とされているのでハイコンテクストでもある。ただLLMに突っ込むだけでは簡単に分析できないので、プロンプトやデータ基盤を調整していかなければいけない。

鎌田: まだまだ課題はあるものの、少しずつライフサイエンスのデータ基盤を整備していけるといいですね。

山田: 個人的にも、LLMの発展によって研究の裾野がかなり広がったのではないかと感じています。科学研究におけるAIの活用については昔からさまざまな研究が行われてきましたが、非常にハイレベルなのでごく一部の人しか議論に参加できない状況にありましたから。

image

研究の「パートナー」として人類の未来へ貢献する

鎌田: ライフサイエンスにおけるAI活用が注目されている一方で、医療に限って言えばまだ実装の場は限定的だとも感じています。もちろんAIによってさまざまなことを分析できるようになったものの、最終的には人間が判断する必要がありますし、すぐに患者さんに還元できるわけではありません。実装の面ではまだまだたくさん考えることがあると思っています。

山田: とくに患者さんの視点から考えると、人の存在は大きいですからね。エンジニアならフットワーク軽くAIツールも導入できますが、たとえばつらい思いをして病院を訪れた患者さんがタブレットだけで自動的に対応されたら安心や信頼を感じづらいかもしれない。制度やテクノロジーとは別の観点からAIの受容を考えていく必要がありますよね。 私としてもまずエンドユーザそのものではなく、病院や製薬企業などエンドユーザに価値を届ける方々をサポートできるようなAIの活用を進めていきたい と思っています。

鎌田: 創薬の領域でもAIの活用は進んでいますし、効率化にはかなり貢献していることも事実ですが、だからといって臨床試験をスキップできるわけではありませんからね。だからこそやりがいもあるし面白い領域だとも感じています。

山田: AIの活用だけ見れば広告やメディアの領域の方が短期的な経済効果は大きいのかもしれませんが、ライフサイエンスの研究は人類に貢献するものでもある。個人的にもやりがいを感じますし、今後もAI活用の可能性について考えていきたいですね。

鎌田: そう言っていただけるのはうれしいです。 私たちとしても山田さんは「外注先」というより研究のパートナーとして目的を共有しながら一緒に研究へ取り組んでいる と思っているので、今後もさまざまなプロジェクトをご一緒させていただきたいです。

image

取材協力:北里大学未来工学部データサイエンス学科(https://www.kitasato-u.ac.jp/fr-eng/

ダウンロードできる資料の画像
fuku株式会社のロゴ

事例資料をダウンロードする

社内での検討やお客様事例をまとめてご覧になりたい方のために、これまでのお客様事例をPDFにてご用意しました。

お客様事例一覧に戻る
  • CONTACT

    お問い合わせ

    システム開発やコンサルティング、共同研究、セミナーのご依頼などお気軽にご相談ください

    問い合わせる
  • DOWNLOAD

    資料ダウンロード

    会社紹介やお客様事例、技術に関する情報など、
    各種資料のダウンロードはこちらからどうぞ。

    資料ダウンロードする