AIモデルが制御ゲノムの汎用「言語」を学習し、細胞のストーリーを予測

AIモデルが制御ゲノムの汎用「言語」を学習し、細胞のストーリーを予測

研究概要

研究タイトル: 細胞タイプに依存しない制御予測のためのマルチモーダルトランスフォーマー
掲載誌: Cell Genomics誌、2025年1月29日
著者(ダナファーバーがん研究所): Bradley Bernstein医学博士

概要: ダナファーバーがん研究所、MIT・ハーバード大学ブロード研究所、Google、コロンビア大学の研究者チームが、あらゆる種類のヒト細胞でどの遺伝子が発現しているかを予測できる人工知能モデルを作成した。EpiBERTと呼ばれるこのモデルは、人間のような言語を理解して生成するように設計されたディープラーニングモデルであるBERTにヒントを得ている。EpiBERTは、複数のフェーズにある数百種類のヒト細胞からのデータで学習した。30億塩基対の長さのゲノム配列と、どの配列が染色体からほどかれて細胞に読み取られるかを示すクロマチンアクセシビリティのマップが入力された。このモデルはまず、特定の細胞タイプのゲノムの大きな部分にわたるDNA配列とクロマチンアクセシビリティの関係を学習するように訓練された。次に、学習したこれらの関係を使用して、対応する細胞タイプでどの遺伝子が活性であるかを予測する。このモデルは、転写因子によって認識されるゲノムの一部である制御要素と、それが多くの細胞タイプにわたる遺伝子発現に与える影響を正確に特定し、汎化可能かつ予測可能な「文法」を構築した。この文法構築プロセスは、ChatGPT などの大規模な言語モデルが多数のテキスト例から意味のある文章や段落を構築することを学習する方法に似ている。EpiBERTモデルは、アクセシビリティを処理し、これまでに見たことのない細胞タイプの機能的塩基とRNA発現を予測できる。

意義: 体内のすべての細胞は同じゲノム配列を持っているため、2種類の細胞の違いはゲノム内の遺伝子ではなく、どの遺伝子がいつ、どの程度、活性化するかである。制御要素に関わるゲノムコードの約20%によって、活性化する遺伝子が決まるが、それらのコードがゲノム内のどこにあるか、その指示がどのようになっているか、変異が細胞内の機能にどのように影響するかについてはほとんどわかっていない。EpiBERTは、細胞内で遺伝子がどのように制御されているか、さらには、そうした細胞の制御システムがいかに変異してがんなどの疾患につながるのかについて解明に役立つ可能性もある。

資金提供: ブロード研究所、ノボ ノルディスク財団、国立ゲノム研究所、シャーフ グリーン がん研究基金、リチャード・ナンシー・ルービン家、米国がん協会。Tensor Processing Unit (TPU) へのアクセスとサポートは Google 提供。

  • 監修 高光恵美(生化学、遺伝子解析)
  • 記事担当者 山田登志子
  • 原文を見る
  • 原文掲載日 2025/01/29

【免責事項】
当サイトの記事は情報提供を目的として掲載しています。
翻訳内容や治療を特定の人に推奨または保証するものではありません。
ボランティア翻訳ならびに自動翻訳による誤訳により発生した結果について一切責任はとれません。
ご自身の疾患に適用されるかどうかは必ず主治医にご相談ください。

がん研究に関連する記事

免疫療法薬が“効きにくいがん”を“効きやすいがん”にする方法の画像

免疫療法薬が“効きにくいがん”を“効きやすいがん”にする方法

免疫療法薬の対象拡大により、より多くの患者の寛解や回復までの期間を短縮できる可能性ーUCSFの研究よりがんに打ち勝つ最善の方法のひとつは、免疫系を活性化させてがんを攻撃すること...
患者自身の抗体が免疫療法薬の効果を高めるカギかの画像

患者自身の抗体が免疫療法薬の効果を高めるカギか

フレッドハッチンソンがんセンター一部のがん患者は「自身の補助薬」を産生している、今後の治療モデルになるかー Nature誌従来自己免疫疾患と関連付けられてきた自己抗体(免疫タン...
免疫細胞が「裏切り者」に―がんがNK細胞を再プログラムし免疫療法薬から回避の画像

免疫細胞が「裏切り者」に―がんがNK細胞を再プログラムし免疫療法薬から回避

本来がん細胞を標的として殺傷するはずの白血球の一部は、ある状況下で分子的に乗っ取られ、がんを排除する身体の機能に反する働きをすることが、オハイオ州立大学総合がんセンターのアーサー・G・...
【米国癌学会(AACR)】MDアンダーソンから画期的発表12演題の画像

【米国癌学会(AACR)】MDアンダーソンから画期的発表12演題

アブストラクト:1186、3746、3763、3776、3824、6367、6384、6396、6424、6427、6436、6438テキサス大学MDアンダーソンがんセンターの...