専門コア情報処理演習

課題 (3)  cDNA とゲノム情報の利用



さて、あなたが単離した、cDNA はカタユウレイボヤCiona intestinalis)という動物
に由来するものです。ここでは、この動物がどういう動物であるかを詳しく知る必要は
ありませんが、あっちこっちに情報はあるはずですから、自力で少し調べてください。
レポートを作成するにあたり、ホモロジー検索アラインメント系統樹の結果を考察
する上で参考になるはずです。藤原のホームページの中にも少しだけ解説があります
こちら )。

カタユウレイボヤでは、cDNA ライブラリーから拾った何万・何十万という cDNA
クローンの配列を片っ端から解析する cDNA プロジェクトEST プロジェクト)と
全ゲノム DNA の配列を解読するゲノムプロジェクトが進んでいます。まずは、
カタユウレイボヤの cDNA プロジェクトのホームページに行ってみましょう ( こちら )。
こんなページが表示されます。このページは、京大・佐藤矩行研究室で作成され、
公開されているものです。

Ghost ホームページ

ここでは、カタユウレイボヤというホヤの 1 種について、200000 個以上の cDNA の
配列と発現を解析した結果が載せられています。この研究は、京大の佐藤矩行研究室が
中心になって、多くの研究室の協力で行ったものです。cDNA プロジェクト(または
EST プロジェクトとも言う・・・ EST とは expression sequence tag の略)は、
特定の組織・発生段階など多数の cDNA を(片端から)単離して、その両端の
塩基配列を決定することです。通常、それらはデータベース化され、世界中の人が
アクセスできるようになっています。
  あなたが、カタユウレイボヤから単離した(という設定の)課題の配列と、同じ
配列を含む cDNA は、このデータベースの中に存在するでしょうか?このページの
下のほうに 〈2〉 BLAST と書いてありますね。そこの Query Sequence の大きな
ボックス中に、自分の配列を入力してみましょう。あなたの入力した配列を用いて、
このデータベースを対象とした BLAST 検索ができます。ここで、プログラムとして
あなたはどれを選択しますか?(BLASTN ですか?、BLASTX ですか?)
いろいろ試してみましょう。

うまくヒットするものがあれば、以下のような画面にたどり着くはずです。

ghost blast

Score とか E value の意味はもう大丈夫ですね?この画面に表示されている中では、
citb014p24 というクローンとの間で E value (つまり危険率)がゼロ ・・・ すなわち、入力した
配列は、間違いなく、このクローンと同一のものであろうという結論が得られます。今年の
課題の配列はこれとは違いますので注意してください。
  一致するクローンが見つかったら、再び最初のページに戻って、上から 3 番目のボックス
CloneID と書いてあるところ)に、このクローン番号を入力してください。 そうすると、
下のようなページに行くはずです。

cDNA は、同じ配列のもの(同じ遺伝子に由来すると考えられるもの)が 1 グループ
クラスター cluster という)にまとめられて、ID を与えられます。このホヤの cDNA プロジェクト
では、250000 個ほどの cDNA が 20000 弱のクラスターに分類されています。
  下に表示されているページからは、このクラスターに属する cDNA クローンのリスト
(そこからは、各クローンの配列へのリンクもあります)、このクラスターに属する
cDNA の 5' 側の EST 配列を利用して行った相同性検索(BLASTX と BLASTN)の
結果や、発現パターン(テキストと写真)へのリンクがあります。また、ページの下の
方には胚発生のそれぞれの段階の mRNA から作った cDNA ライブラリーの中に
このクラスターに属する cDNA クローンがいくつ出現したかを書いてあります。

01890r1 cDNA

試しに他のクラスターについても見てみましょう。 Cluster ID release 1 のボックスに
00025r1、00086r1、03695r1 など、いろいろな番号を入力して、それぞれの cDNA の
特徴を見比べてみましょう。

下の図では、 01890r1 について調べています。あなたの配列についても同じようにして
調べてみましょう。 BLASTx というリンクへ飛んでください。 01890r1 の場合には、
No significant match was found

という表示が出ます。このクラスターの 5' EST 配列を用いて行った相同性検索では
既知の遺伝子との顕著な相同性が見つからなかったということを意味しています。
あなたの課題の配列ではどうだったでしょうか?

次に、このページの Clones and Sequences というリンクへ飛んでください。
そこには以下のような内容が表示されているはずです。

01890 sequence

ここから Full insert sequence(s) の中のクローン番号(上の図では citb014p24 と
書いてある部分)のリンクへ移動します。 5' と 3' の両末端からの配列だけでなく、
(後で念入りに調べられた) cDNA 全長の塩基配列が表示されます。この配列をコピー &
ペーストで、自分のパソコンのメモ帳に保存してください。



今度は、ゲノムの方を見てみましょうか。
カタユウレイボヤは世界中に分布していて、多くの研究者がこの動物に興味を持って
いるため、ゲノム配列の解析も進められました。アメリカ・エネルギー省Joint
Genome InstituteJGI)で配列の解読が行われ、多数の研究室の協力で、配列への
注釈付け
annotation)が行われました。ゲノム解析のホームページは、こちら です。
トップページには、BrowseBLAST などのタブがついています。あっちこっち覗いて
みましょう。

あなたの cDNA をコードする遺伝子は、ゲノム上で見つかるでしょうか?以下のことを
やってみましょう。

1. BLAST のページに進んで、cDNA の配列を入力しましょう。自分の配列と一致する
  配列がありますね?以下のようなページが表示されるはずです。対応する配列のところに
  Scaffold という言葉が見えますね。これは元々、大工さんが家を建てるときに組むような
  “足場”の意味です。ゲノム配列は、数え切れない DNA 断片の配列を決定し、それらの
  断片どうしの配列を比較し、それらを連結するという風に進めます。いくつかの断片が連結
  されたものを scaffold といいます。これらの scaffold がさらに大きく連結されれば、最終的
  には、染色体の全体像が見えるはずです。カタユウレイボヤのゲノム配列では、まだ
  そこまでは進んでいません。

JGI BLAST

2. このページに行けたら、Scaffold のリンクへ飛びましょう。さらに、View on Browser
  というところを探し、ゲノム DNA 上で遺伝子構造を調べてみましょう。 cDNA プロジェクト
  のホームページで確認したクローン ID (上の図では citb014p24)がありますね? 
  やはり、あなたの cDNA の配列は、ゲノム上のこの scaffold 上にあるのです。
 
3. あなたの cDNA はゲノム上に annotate された遺伝子のどれに対応しているか、わかり
  ますか?ズームなどを駆使して、遺伝子を見つけましょう。遺伝子を突き止めることが
  できたら、その遺伝子(Ciona Gene Models version 1.0)と書いてある部分の
  下にある遺伝子の図をクリックしてください。下のようなページに行けましたか?

gene

4. 赤と青で塗られているバーをクリックしてください。これで、あなたの cDNA に対応する
  遺伝子の構造が表示されるはずです。赤い部分が翻訳領域、青い部分が非翻訳領域
  黒い部分は遺伝子間 DNA やイントロンなどです。

5. ゲノム解析のホームページには、他にもさまざまな機能があります。あっちこっちを
  覗いて、遊んでみてください。

6. 遺伝子の全体像がわかりましたか?翻訳領域の全長はわかりましたか?そうしたら、
  今度は、cDNA の断片ではなく、この遺伝子がコードするタンパク質のアミノ酸配列の
  全長がわかりますよね?その配列を用いて、もう一度相同性検索や、類似のタンパク
  とのアラインメント、系統樹作成などを試みてください。



 課題のページに戻る