astavisionが企業・特許情報のビッグデータ分析により、今後成長が見込まれる市場を分類した「2025年の成長市場」。近日公開予定の「ゲノム医療・核酸・遺伝子治療」市場コンテンツについて、その一部をプレビューする。
「ゲノム医療・核酸・遺伝子治療」について
2015年1月20日、バラク・オバマ米国大統領は一般教書演説の中で、新たな科学技術施策「プレシジョン・メディスン・イニシアティブ(Precision Medicine Initiative)」を発表した。プレシジョン・メディスン(精緻医療)とは、これまで疾病ごとに標準化・平均化された患者向けにデザインされていた医療を、遺伝子・環境・ライフスタイルなど個人差を考慮し、同じ疾病でも症例をより精緻に定義した患者群にカテゴライズし、それぞれのカテゴリーに最適化された医療の確立を目指すものだ。1月30日付ホワイトハウス報道発表によると、2016年度予算案において、国立衛生研究所(NIH:National Institutes of Health)や国立がん研究所(NCI:National Cancer Institute)、食品医薬品局(FDA:Food and Drug Administration)などに総額2億1500万ドルを拠出する。
これにより、NIHは100万人規模のコホート(疫学)研究を始めるほか、遺伝子データベースの構築、高速・微量の遺伝子検査やゲノム解析を実現するための次世代シークエンサー技術開発など、ツール・ナレッジ・治療法にわたる支援を医療関係者に提供するという。
プレシジョン・メディシンは、患者一人ひとりに最適化されたテーラーメイド医療・個別化医療と概念は似ているが、特定の個人にターゲットを絞るものではなく、同じ疾病の患者を遺伝子・環境・ライフスタイルなどの切り口で統計的にセグメント化する医療であり、完全な個別化医療の手前にある概念ととらえるべきである。また、ゲノム(全遺伝子)情報やメタボローム(全代謝物質)情報、薬剤情報など膨大なデータからデータマイニングを行うことから、ビッグデータ医療ともいえるだろう。
[参考]
ゲノム(genome)とは、遺伝子(gene)と染色体(
現在の定義では、
ゲノム医療はこうしたゲノム情報に基づいた医療の総称である。
DNA塩基配列と遺伝子多型
1962年のノーベル生理学医学賞に輝いたジェームズ・ワトソンとフランシス・クリックが、DNA(デオキシリボ核酸)の有名な二重らせん構造を提唱した1953年から50年を経た2003年4月14日、ヒトゲノム(ヒトDNAの一揃いを意味し、精子や卵1個に含まれる常染色体22本+性染色体X+Y=24本相当のDNA、約30億塩基対)の全塩基配列の完成版が公開された。これは全塩基配列が解明されたという意味であり、タンパク質の設計図としての遺伝子の構造と機能、その制御機構など、ゲノム情報の全容解明は今も続いている。現在、ヒト核ゲノムに含まれる遺伝子の数は約2万6800個とされる。
DNAは、A(アデニン)、G(グアニン)、 C(シトシン)、 T(チミン) という4 種類の塩基を持ったヌクレオチド(糖+塩基+リン酸の複合分子)が鎖状に繋がった分子で、これが2本らせん状に絡まって、二重らせん構造を形成している。A はT とだけ、G はC とだけ、向かい合って結合(相補的塩基対)し、2本鎖DNAを形成する。各鎖について、例えば、ATGTCCCGAATT…という塩基配列を読むシークエンシング(sequencing:配列解析)を行うため、様々なシーケンサ(塩基配列解析機器・システム)が開発されている。ちなみに、ATG、TCC、CGA、ATTは、それぞれ、メチオニン、セリン、アルギニン、トレオニンというアミノ酸に対応するtriplet code(三つ組暗号)であり、ATGTCCCGAATT…という配列は、メチオニン-セリン-アルギニン-トレオニン…をこの順番で繋いだペプチド(小規模なタンパク質分子)を合成せよという遺伝暗号となる。遺伝子がタンパク質の設計図と呼ばれるのは、このように、塩基3文字で一つのアミノ酸を表し、合成すべきタンパク質の構造を指令しているからである。
SNIPsと病気
ヒトの個々の遺伝子の塩基配列は原理的には同一だが、先天的に部分的に異なった配列を持つ遺伝子多型が見られる。塩基の一部が、他の塩基に置き換わる置換(CGT→CATなど)、塩基の欠失(CGT→CTなど)、重複(CGT→CGCGTなど)、他の遺伝子やウイルスなどの遺伝子の一部の挿入(CGT→CGAACTGCATなど)などが知られる。ウイルス感染や、紫外線や放射線、発がん物質など環境の影響で後天的に生じる突然変異もある。ヒトゲノムには、0.1%の塩基配列の個体差があると見られ、特に一つの塩基が変異している一塩基多型(SNIPs:Single Nucleotide Polymorphisms)は、ヒト全ゲノム中に300万~1000万箇所あると考えられている。
遺伝的多型によっては、生体に全く影響のないサイレント突然変異(同義突然変異)もある一方、タンパク質機能の低下や機能欠如、異常タンパク質の出現など、疾病につながる場合もある。 例えば、CGAがCGC、CGG、CGTのいずれに置換してもアミノ酸はアルギニンのままで変わりない。しかし、アフリカで見られる鎌状赤血球貧血症では、11番染色体にあるヘモグロビンβ鎖の遺伝子のDNA塩基配列が、GAGからGTGに変異した結果、ヘモグロビンβ鎖の6番目のアミノ酸がグルタミン酸からバリンに置換しており、これにより、ヘモグロビンによる末梢血への酸素供給能が著しく下がるとともに、赤血球の形状が円盤形から鎌形へと大きく変貌する。
遺伝子多型の世界最大級のデータベースとして、日本人に見られる約20万か所のSNPsデータにアノテーションデータ(遺伝子情報、位置情報、アミノ酸置換情報など)を付加したJSNPデータベースが公開されている。疾患関連のSNIPsとして、各種のがんや心筋梗塞、狭心症、高血圧、糖尿病、肥満、関節リューマチ、肺炎、気管支喘息、C型慢性肝炎、白内障、加齢黄斑変性、てんかん、筋萎縮性側索硬化症、クローン病、統合失調症などのほか、アルコールとニコチンの共依存、注意欠陥多動性障害の発症時期、歯周微生物叢、統合失調症の海馬容積など、多様な情報がデータベース化されている。
(参考リンク)JSNPデータベース(JST&東京大学医科学研究所)
こうしたことから、一人一人のSNIPs解析によって、比較的患者数の多い病気(common disease)について、発症リスクや薬の副作用等を個人差を考慮して評価する個別化医療への道が拓けると考えられ、健康診断でも様々な遺伝子解析が利用されるようになってきた。
東大発ベンチャーのジーンクエストや、「MYCODE」を運営するDeNAは、自分で口腔粘膜を採取して郵送するタイプの遺伝子検査キットを販売している。
しかしながら、すべての病気がSNIPsで説明できるわけではなく、また、SNIPsと相関のある病気でも、個体差があり、同じ変異を持ちながら、発症の程度や薬の効果には大きな差がある。ゲノム情報には、上記のようなDNA塩基配列のほか、DNA発現系としてのトランスクリプトーム(RNA情報)やプロテオーム(タンパク質情報)、メタボローム(代謝産物情報)、さらに、エピゲノム変化(DNAのメチル化などのゲノム修飾)、がんや体細胞変異などに伴い後天的に生じるゲノム変化等が含まれる。
そのため、一つの疾病に対しても、多数の遺伝子に注目したり、DNA塩基配列だけでなく、メッセンジャーRNA(mRNA)など転写産物の動態、体液中のマイクロRNA(miRNA)やエクソソーム(exosome)、テロメア(加齢により次第に短くなっていく染色体の両端部位)の長さやGテール(テロメア末端の一本鎖部分)など、より広い視点で患者や疾病をとらえる必要があると考えられるようになってきた。個別化医療を実現するためにも、ビッグデータ解析を基礎に、統計的に精緻なグルーピングを行うことが重要になる。
近日公開予定の「ゲノム医療・核酸・遺伝子治療」市場コンテンツでは、この市場のグローバル市場規模や最新技術、用途展開などを紹介する。