まずはお手軽に「ワンポイント解説」から。

これは独立行政法人製品評価技術基盤機構(NITE)のホームページから拾ったもの。

1.ゲノムとは

ゲノム(genome)とは遺伝子の英語ジーン(gene)と集合をあらわす"-ome"を組み合わせた言葉です。

うーむ、「オーム」というのはシンドロームの「オーム」か。ということは「遺伝子群」ということになる。つまりセットとして把握された遺伝子集団のことだな。

その実体は生物の細胞内にあるDNA分子であり、遺伝子や遺伝子の発現を制御する情報などが含まれています。

そうか。1個のDNAに乗っているすべての遺伝子のセットのことだな。ただ注意しなければならないのは、「や遺伝子の発現を制御する情報など」もふくまれることだ。ここには明らかに言葉の拡大解釈がある。これについては項を改めて説明する。

細菌などの原核生物の場合,DNAはリング状で、そこに代謝や分裂などの生命活動に必要な数千個の遺伝子が含まれてい る。真核生物の場合には,DNAは染色体に分かれて存在している。人間の場合なら常染色体の23本と,XとYの性染色体2本に分かれ1セットのゲノムが含まれる。


2.ゲノム解析とは

ゲノム解析といっても二つの段階がある。

A) 塩基配列の解析

DNAというのは蝿取りリボンのようなもので、ぐるぐると垂れ下がった紙リボンの片側に糊がついている。この糊にあたるのがA、G、C、Uの4つの塩基である。

これ以上の説明は省略するが、塩基には並び順があって、それがリボンの端から端までずっと続いている。

この並び順を完全に明らかにしようというのが塩基配列の解析で、実はこれは2000年頃にすでに完了している。

B) 塩基配列の解読

ゲノム解析では端から順番にDNAの塩基配列を調べていって、「遺伝子の発現を制御する情報」、要するに開きカッコ(「)と閉じカッコ(」)を見つければ、その間が遺伝子ということになる。

A) はゲノム解析ではない。DNA上の塩基配列の解析に過ぎない。B) はその区画化とグルーピングに過ぎない。両方とも厳密な意味でのゲノム(遺伝子群)解析とは言えず、むしろ勝負はこれからということになる。

3.ゲノム解析の手法

A) 塩基配列の解析方法

これはいかにもアメリカ的な手法で、ショットガン(散弾銃)作戦と呼ばれる。とにかく取り出したDNAをみじん切りにして、片っ端からクローン培養する。

DNAの断片が大量にできあがったところで、その塩基配列を解析する。無数の塩基配列情報が出来上がるので、これをコンピューターにかけて「絵合わせ」をしていく。そうすると下記のごとくDNAの全体像が浮かび上がってくるというしだいだ。

アセンブルの操作

「下手な鉄砲も数打ちゃ当たる」ということだ。昔の日本人なら「何とかもう少し要領よくやる方法はないものだろうか」と考えると思うが、最近は安部首相みたいなノータリンばかりだ。

B) 遺伝子領域の推定

先に述べた開きカッコと閉じカッコは、開始コドンと終止コドンと呼ばれる。開始がATGで終止がTGAだからつじつまは合っている。

その間が推定遺伝子領域と呼ばれる。英語で言うとOpen Reading Frame:ORFとなる。

読んで字のごとく遺伝子だろうと推定されるに過ぎない。本当にそれが遺伝子なのかどうかは、いろいろやってみて、機能を推定するほかない。

この「意味づけ」作業が、英語で言うとアノテーションとなる。

アノテーションの結果はNITEに集積されていて、いつでも研究者が利用できるようになっている。ということで、最後はNITEのPRで終わり。

ゲノム情報データベース
DOGAN