TOPページに戻るサイト内を検索するサイトマップリンク
機器部門RI部門配置図セミナー産学連携学内向け
過去のセミナー支援センターセミナー支援センター特別講習会支援センターテクニカルセミナー支援センター交流会

インターネットを用いた遺伝子バンクデータの活用法演習


礒野 高敬(実験実習機器センター)  
洲崎 雅史(実験実習機器センター)  
水田 嘉彦(マルチメディアセンター) 

 1900年は、マックス・プランクのプランク定数の発見(量子仮説)で物理学のパラダイムの変革が起こった。100年経って今年2000年を迎えたが、後世の人は、2000年を遺伝学のパラダイムの変革が起こった年と考えるかもしれない。つまり、ヒトゲノムの解読がほぼ終わり、本格的にポストゲノム時代が到来しているのだ。従来のようにある病気の原因遺伝子をクローニングしていく時代から、すでに解読されたゲノム情報から、コンピューターのパターン認識で遺伝子とおぼしき配列から機能を推定し遺伝子の役割を明らかにしていく「逆遺伝学( reverse genetics )」の時代になろうとしている。ゲノム情報の入った遺伝子バンクデータから、DNA解読システムを構築し、生物学的認識を一気に拡大しようというバイオインフォマティックス(生物情報学)という新領域が誕生している。このような状況下で、我々は、ゲノム情報の入った遺伝子バンクデータからの情報をインターネットを通じて得て研究に活用せざるを得ないと言える。

本演習では、インターネットを用いた遺伝子バンクデータの活用法の入門編として、基本的でかつよく利用される遺伝子の検索法、遺伝子のホモロジー検索法についてコンピューターを実際に操作しながら演習を行う。併せて、ポストゲノム研究への活用例として、ペプチドマスデータベースの活用法を紹介する。


演習1. 遺伝子の検索
 文献に載っている興味ある遺伝子の情報を検索する。
 得られたデータの読み方を紹介する。
  国内の利用できるサーバー: 遺伝研内の日本DNAデータバンク(DDBJ)
http://www.ddbj.nig.ac.jp/
  ゲノムネット(GenomeNet)
http://www.genome.ad.jp/
講師は、主にDDBJの方を用いている。
検索方法として、アクセッション番号による検索とキーワードによる検索とがある。アクセッション番号による検索は、文献に記載された調べたい遺伝子に付けられた登録番号を検索する方法である。キーワードによる検索は、文献検索と同じように、キーワードで検索する方法で、複数のキーワードで限定していくことができる。キーワードで検索する場合、対象の遺伝子を登録した際に別名で登録されている場合もあるので注意を要する。


演習2. 遺伝子のホモロジー検索
 実験実習機器センターのシーケンサーから得られたデータを用いてホモロジー検索を行う。
遺伝子のホモロジー検索には、BLASTとFASTAというプログラムがある。ヌクレオチド配列についてもアミノ酸配列についても検索できる。
BLASTは、ギャップを入れない部分配列のアライメントを複数集めて評価する方式をとっており高速である。DNAシーケンサーで得られた生データの検索には、こちらが向いているようである。メールでも、WWWでもサービスが受けられるが、検索された遺伝子配列についての登録データや論文情報をリンクをたどって調べられるWWWの方がお薦めである。
FASTAは、一致する領域を高速に検索してから、最終的には、ギャップを入れた完全なアライメントを行う。検索結果を出すまでには時間がかかるので、長い領域を検索する場合メールでサービスを受ける方がよいであろう。
講師は、主にゲノムネットのBLAST(http://www.blast.genome.ad.jp/)とDDBJのFASTA(http://www.crick.genes.nig.ac.jp/homology/fasta-e.html)を用いている。
前項で、キーワードで検索した場合、対象の遺伝子を登録した際に別名で登録されている場合もあり、見落とすこともあることを述べた。講師は、キーワード検索したあと、検索されたヌクレオチド配列またはアミノ酸配列をBLASTを用いて、ホモロジー検索をおこない、見落としがないか確認している。
演習3. ペプチドマスデータベース
 ポストゲノム研究への活用例として、タンパク質のペプチド断片の質量から、遺伝子バンクデータを用いてタンパク質を同定する方法を紹介する。
今、ポストゲノム時代の手法としてプロテオーム解析が注目されている。プロテオームとは、細胞内の全遺伝子を意味するゲノムに対して、細胞内の全タンパクを示す言葉として作られたものである。遺伝子はタンパク質をコードしている暗号であり、実際の細胞内で働くのはタンパク質である。また、翻訳されたタンパク質は、その後、糖鎖の付加や切断などの修飾を受けてから実際に機能する。この実際に機能している全タンパク質の全体像をつかもうというのが、プロテオーム解析である。
プロテオーム解析は、二次元電気泳動により、全タンパクを展開し、各スポットを切り取り、トリプシン等のプロテアーゼを用いてゲル内の中でタンパク質の消化を行い、消化されたされたペプチド断片の分子量を、飛行時間型質量分析計(TOF-MS)で測定し、遺伝子バンクのデータに基づきどの遺伝子の産物かを決定していく方法が主流となっている。
タンパク質の各スポットについて、プロテアーゼの特異性に基づき、断片化された数種類のペプチドの質量数を TOF-MSで測定し、プロテアーゼ消化の条件とこの数種類のペプチドの質量数の測定値を、ペプチドマスデータベース MS-Fit (http://prospector.ucsf.edu/ucsfhtml3.2/msfit.htm) という検索サイトに入力すると、遺伝子バンクに登録されている全遺伝子について、推定されるアミノ酸配列から生じるペプチドの質量数を計算し、入力したデータと照合してくれて、スポット中にあるタンパク質は何かという情報を教えてくれる。
従来であれば、大量の試料と時間をかけねばならなかった仕事が、少量の試料で、数日の間に、多検体の解析を行えるようになっている。これは、分析機器の機能向上もあるが、遺伝子バンクのデータの蓄積によるところが大きい。

前へ 先頭へ
Copyright (C) Central Research Laboratory. All right reserved.since 1996/2/1

Last Updated 2005/8/8