TOPページに戻るサイト内を検索するサイトマップリンク
機器部門RI部門配置図セミナー産学連携学内向け
過去のセミナー支援センターセミナー支援センター特別講習会支援センターテクニカルセミナー支援センター交流会

インターネットを用いた遺伝子解析法


実験実習機器センター 礒野 高敬

 5年程前、遺伝子を解析し始めた当時、遺伝子のホモロジー解析をCD-ROMを用いて行っていた。1件につき、2時間ほどかけていた。 本学に、LANシステムが導入されて、インターネットを用いて同じことを行うと、5分で終わってしまい感動した。また、検索対象と なるデーターベースは、日々更新されているので最新情報が得られる。データーベースに登録された遺伝子は、もう世界の全研究者の もので、プライマーを合成してPCRを行えば、その遺伝子を手に入れ自由に研究できる。今回は、利用頻度が高いと思われる遺伝子の 検索法と ホモロジー検索法を中心に、コンピューターを操作しながら紹介していきたい。

1. 遺伝子の検索

 国内の利用できるサーバー:遺伝研内の日本DNAデーターバンク(DDBJ)
  http://www.ddbj.nig.ac.jp/
  ゲノムネット(GenomeNet)
  http://www.genome.ad.jp/

 講師は、主にDDBJの方を用いている。
 検索方法として、アクセッション番号による検索とキーワードによる検索とがある。
 アクセッション番号による検索は、文献に記載された調べたい遺伝子に付けられた登録番号を検索する方法である。 キーワードによる検索は、文献検索と同じように、キーワードで検索する方法で、複数のキーワードで限定していくことができる。 キーワードで検索する場合、対象の遺伝子を登録した際に別名で登録されている場合もあるので注意を要する。

2. ホモロジー検索
 ホモロジー検索には、BLASTとFASTAというプログラムがある。ヌクレオチド配列についてもアミノ酸配列についても 検索できる。
 BLAST(http://www.genome.ad.jp/SIT/BLAST.html)は、ギャップを入れない部分配列のアライメントを複数集めて 評価する方式をとっており高速である。DNAシーケンサーで得られた生データーの検索には、こちらが向いているようである。 メールでも、WWWでもサービスが受けられるが、検索された遺伝子配列についての登録データーや論文情報をリンクをたどって 調べられるWWWの方がお薦めである。
 FASTA(http://www.genome.ad.jp/SIT/FASTA.html)は、一致する領域を高速に検索してから、最終的には、ギャップを 入れた完全なアライメントを行う。検索結果を出すまでには、時間がかかるのでメールでサービスを受ける方がよいであろう。  講師は、主にゲノムネットのBLASTとFASTAを用いているが、ゲノムネット以外でもサービスを受けることができる。

 以下に、検索例を示す。
 Netscape Navigator を開き、 http://www.ddbj.nig.ac.jp/Welcom-j.htmlに接続する。
 日本DNAデーターバンクのホームページ内に以下の解析サービスがある。

DDBJのデータ検索とデータ解析サービス:
   アクセッション番号によるエントリー取得(getentryを使用) 
   キーワード検索によるエントリー取得(SFgateとWAISを使用) 
   FASTA/BLASTを使用した相同性検索(ホモロジーサーチ) 
   配列の多重整列(malignを使用) 
   配列の多重整列(clustalwを使用) 
   3D-1D法を用いた蛋白質の二次構造予測  
   Gopher/Anonymous FTP/E-mail検索サーバ 
   他のデータベースWWWページへのリンク 

 ”キーワード検索によるエントリー取得”をクリックするとキーワード検索に入れる。

 検索キー: の所に " isono and rabbit " とキーワードを入れてクリックすると、以下の検索結果が得られる。 (注:ここで、Proxies をNo Proxiesしておかないと検索できない。ネットに負担をかけないように、検索終了後、 Manual Proxy Configuration に戻しておくこと。)

検索結果 ( 1 - 37 ) 
検索キー: isono and rabbit 
1:  D49841 Rabbit mRNA for CD28, complete cds.  
     Database: ddbj, Size: 3.2 kbytes, Type: TEXT, Score: 1000 
2:  D49843 Rabbit mRNA for CD80, complete cds. 
     Database: ddbj, Size: 3.6 kbytes, Type: TEXT, Score: 1000 
3:  D49842 Rabbit mRNA for CD86, complete cds. 
     Database: ddbj, Size: 3.8 kbytes, Type: TEXT, Score: 1000 
4:  AB003911 Rabbit mRNA for OX40 precursor, partial cds. 
     Database: ddbj, Size: 3.3 kbytes, Type: TEXT, Score: 1000 
5:  AB003912 Rabbit mRNA for OX40 ligand, complete cds. 
     Database: ddbj, Size: 3.0 kbytes, Type: TEXT, Score: 960 
6:  D84216 Rabbit mRNA for interferon gamma, partial cds. 
     Database: ddbj, Size: 2.2 kbytes, Type: TEXT, Score: 933 
7:  D84217 Rabbit mRNA for interleukin-10, partial cds. 
     Database: ddbj, Size: 2.3 kbytes, Type: TEXT, Score: 921 
  /////////////////////////////
36: D38142 Rabbit mRNA for T-cell receptor gamma chain V2-P2-C
precursor. 
     Database: ddbj, Size: 3.5 kbytes, Type: TEXT, Score: 480 
37: D38134 Rabbit mRNA for T-cell receptor precursor (V-J-C region). 
     Database: ddbj, Size: 4.7 kbytes, Type: TEXT, Score: 451 

 "6: D84216 Rabbit mRNA for interferon gamma, partial cds. " をクリックすると以下の登録データーが得られる。

D84216 Rabbit mRNA for interferon gamma, partial cds.
LOCUS       D84216        164 bp ss-mRNA            MAM       16-DEC-1996
DEFINITION  Rabbit mRNA for interferon gamma, partial cds.
ACCESSION   D84216
KEYWORDS    IFNg; interferon-gamma.
SOURCE      Oryctolagus cuniculus (sub_species:domesticus, strain:B/Jas)
            HTLV-I-transformed T cell cell_line:B405 cDNA to mRNA.
  ORGANISM  Oryctolagus cuniculus
            Eukaryota; Animalia; Chordata; Vertebrata; Mammalia; Theria;Eutheria; Lagomorpha; Leporidae.
REFERENCE   1  (bases 1 to 164)
  AUTHORS   Isono,T.
  TITLE     Direct Submission
  JOURNAL   Submitted (25-MAR-1996) to the DDBJ/EMBL/GenBank databases.
            Takahiro Isono, Shiga University of Medical Science, CentralResearch Laboratory; Seta Tsukinowachou,  
     Otsu, Shiga 520-21, Japan(E-mail:isono@bellebsd.shiga-med.ac.jp, Tel:0775-48-2308,Fax:0775-48-2048)
  STANDARD  full staff_review
REFERENCE   2  (bases 1 to 164)
  AUTHORS   Isono,T.
  JOURNAL   Unpublished (1996)
  STANDARD  full staff_review
REFERENCE   3  (sites)
  AUTHORS   Isono,T., Nagano,Y. and Seto,A.
  TITLE     Expression of the interferon-gamma and interleukin-10 genes inrabbit HTLV-I-transformed T-cell lines
  JOURNAL   Immunogenetics 44, 306-308 (1996)
  STANDARD  full staff_review
COMMENT     
FEATURES             Location/Qualifiers
     source          1..164
                     /cell_line="B405"
                     /cell_type="HTLV-I-transformed T cell"
                     /organism="Oryctolagus cuniculus"
                     /sequenced_mol="cDNA to mRNA"
                     /strain="B/Jas"
                     /sub_species="domesticus"
     CDS             <1..>164
                     /codon_start=1
                     /gene="IFNg"
                     /product="interferon-gamma"
                     /standard_name="interferon-gamma"
                     /translation="DNLKDHEVIKKSMESIKEDIFVKFFNSNLTKMDDFQNLTRISDD
                     RLVQRKAVSE"
BASE COUNT       61 a     29 c     35 g     39 t      0 others
ORIGIN      
        1 gacaacttaa aagaccatga ggtcataaag aagagtatgg aatccatcaa agaagacata
       61 tttgtgaagt tcttcaatag caacctaact aagatggatg acttccaaaa tctgactcga
      121 atttcggatg atcggctggt ccagcgtaaa gcagtaagtg aact
//

 "D84216 Rabbit mRNA for interferon gamma, partial cds." のヌクレオチド配列をコピーして(ヌクレオチド番号は 消すこと。)、http://www.genome.ad.jp/SIT/BLAST.html に接続して、ホモロジー検索した結果は以下の通りである。

BLASTN Search Result
  Computed at GenomeNet kyoto-center on Wed Jul  9 13: 8:58 JST 1997
  Database Name NR-NT
   >query
   gacaacttaa aagaccatga ggtcataaag aagagtatgg aatccatcaa
   agaagacata tttgtgaagt tcttcaatag caacctaact aagatggatg
   acttccaaaa tctgactcga atttcggatg atcggctggt ccagcgtaaa
   gcagtaagtg aact

                                                              Smallest
                                                                   Sum
                                                           High  Probability
Sequences producing High-scoring Segment Pairs:             Score  P(N)      N

gb:D84216     Rabbit mRNA for interferon gamma, partial c...  820  2.6e-62   1
gb:A11779     Nucleotide sequence 3 from patent number EP...  339  2.5e-20   1
gb:HRSIG      Horse mRNA for interferon gamma, complete c...  339  2.8e-20   1
gb:ECU04050   Equus caballus interferon-gamma precursor m...  339  2.9e-20   1
gb:A11777     E.caballus gene for interferon gamma.>emb:A...  338  5.0e-20   1
gb:SYNIFNGS   Human immune gamma-interferon gene, promote...  324  5.1e-19   1
gb:CJINTERFG  C.jacchus interferon gene for interferon ga...  324  7.4e-19   1
gb:A10717     Synthetic nucleotide sequence encoding a rI...  315  2.4e-18   1
gb:HSIFNG20   H.sapiens mRNA for IFN-gamma (pKC-20).>emb:...  315  2.4e-18   1
gb:A19599     Artificial sequence for human IFN-gamma var...  315  2.5e-18   1
gb:HSIFNG19L  H.sapiens mRNA for IFN-gamma (pKC-19L).>emb...  315  2.5e-18   1
gb:HSIFNG11   H.sapiens mRNA for IFN-gamma (pKC-11).>emb:...  315  2.5e-18   1
gb:I02074     Sequence 2 from Patent US 4855409.>emb:I020...  315  2.6e-18   1
gb:HSIFNG14L  H.sapiens mRNA for IFN-gamma (pKC-14L).>emb...  315  2.6e-18   1
gb:A02254     Plasmid pGLS DNA for interferon-gamma.>emb:...  315  2.6e-18   1
gb:A02260     Plasmid pHis,His-Xa-IFN-gamma(-8)(Asn) fusi...  315  2.6e-18   1
gb:A02258     Plasmid pHis,His-Ek-IFN-gamma(-8) fusion ge...  315  2.6e-18   1
      /////////////////////////
gb:MTPFZ1A    M.thermoformicicum complete plasmid pFZ1 DN...  121  0.997     1
gbu:D87022    Human (lambda) DNA for immunoglobin light c...  120  0.9991    1
gb:AA083948   zn16d07.r1 Stratagene neuroepithelium NT2RA...   87  0.9993    2
gb:AA084195   zn17d07.r1 Stratagene neuroepithelium NT2RA...   87  0.9998    2

 これは、ホモロジーのランキングを示すデーターで、P(N)の小さい順に並んでいる。P(N)は、0から1の間の値を取り、 0に近いほど類似性が高く、1に近いときは、偶然に見つかった場合と区別できないという意味で類似性があると言えないことを示す。
 この後、アライメントのデーターが続く。

>gb:D84216 Rabbit mRNA for interferon gamma, partial cds.>emb:OCD216 Rabbit
           mRNA for interferon gamma, partial cds.
           Length = 164
  Plus Strand HSPs:
 Score = 820 (226.6 bits), Expect = 2.6e-62, P = 2.6e-62
 Identities = 164/164 (100%), Positives = 164/164 (100%), Strand = Plus / Plus

Query:     1 GACAACTTAAAAGACCATGAGGTCATAAAGAAGAGTATGGAATCCATCAAAGAAGACATA 60
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct:     1 GACAACTTAAAAGACCATGAGGTCATAAAGAAGAGTATGGAATCCATCAAAGAAGACATA 60

Query:    61 TTTGTGAAGTTCTTCAATAGCAACCTAACTAAGATGGATGACTTCCAAAATCTGACTCGA 120
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct:    61 TTTGTGAAGTTCTTCAATAGCAACCTAACTAAGATGGATGACTTCCAAAATCTGACTCGA 120

Query:   121 ATTTCGGATGATCGGCTGGTCCAGCGTAAAGCAGTAAGTGAACT 164
             ||||||||||||||||||||||||||||||||||||||||||||
Sbjct:   121 ATTTCGGATGATCGGCTGGTCCAGCGTAAAGCAGTAAGTGAACT 164
               (これは、同一の遺伝子である。)
        ////////////////////////////

>gb:SYNIFNGS Human immune gamma-interferon gene, promoter T5P25 and ribosome
            binding site (RBS), synthetically constructed.>emb:HSIFNGS Human
            immune gamma-interferon gene, promoter T5P25 and ribosome binding
            site (RBS), synthetically constructed.
            Length = 524
 Plus Strand HSPs:
 Score = 324 (89.5 bits), Expect = 5.1e-19, P = 5.1e-19
 Identities = 92/126 (73%), Positives = 92/126 (73%), Strand = Plus / Plus

Query:     2 ACAACTTAAAAGACCATGAGGTCATAAAGAAGAGTATGGAATCCATCAAAGAAGACATAT 61
             | ||||| |||||  || ||  |||  | |||||| ||||  ||||||| ||||||||  
Sbjct:   265 AGAACTTTAAAGATGATCAGAGCATCCAAAAGAGTGTGGAGACCATCAAGGAAGACATGA 324

Query:    62 TTGTGAAGTTCTTCAATAGCAACCTAACTAAGATGGATGACTTCCAAAATCTGACTCGAA 121
              ||| ||||| ||||||||||||  ||  ||    ||||||||| |||| ||||||    
Sbjct:   325 ATGTCAAGTTTTTCAATAGCAACAAAAAGAAACGTGATGACTTCGAAAAGCTGACTAATT 384

Query:   122 TTTCGG 127
              |||||
Sbjct:   385 ATTCGG 390

 検索を行っている遺伝子(ウサギのgamma-interferon gene)とヒトのgamma-interferon geneとの間で、ヌクレ オチド配列で73%の同一配列があることを示している。

 "D84216 Rabbit mRNA for interferon gamma, partial cds." のアミノ酸配列をコピーして、 http://www.genome.ad.jp/SIT/FASTA.html に接続して、ホモロジー検索した結果は以下の通りである。

FASTA3_T Search Result
Computed at GenomeNet kyoto-center on Wed Jul  9 16:49:37 JST 1997
Database Name NR-AA
   >query
   DNLKDHEVIK KSMESIKEDI FVKFFNSNLT KMDDFQNLTR ISDDRLVQRK
   AVSE

FASTA (3.06 Sept, 1996) function (optimized, /bio/db/fasta/matrix/aa/blosum50 matrix) ktup: 2
 join: 36, opt: 24, gap-pen: -12/ -2, width:  16 reg.-scaled
 Scan time:  3.810
The best scores are:                            initn init1 opt z-sc E(268410)
gp:D84216_1 interferon-gamma [Oryctolagus  (  54)  341  341  341 513.5 2.3e-21
sp:ING_RABIT INTERFERON GAMMA PRECURSOR (I ( 167)  327  267  329 488.5 5.7e-20
gp:A11777_1 interferon gamma [Equus caball ( 166)  204  173  221 334.3 2.2e-11
gp:HRSIG_1 interferon gamma [Equus caballu ( 166)  204  173  221 334.3 2.2e-11
sp:ING_HORSE INTERFERON GAMMA PRECURSOR (I ( 166)  204  173  221 334.3 2.2e-11
sp:ING_CALJA INTERFERON GAMMA PRECURSOR (I ( 166)  154  154  195 297.1 2.6e-09
sp:ING_MACMU INTERFERON GAMMA PRECURSOR (I ( 165)  147  147  188 287.2 9.3e-09
gp:HSIFNG20_1 interferon-gamma variant [Ho ( 124)  145  145  183 282.0 1.8e-08
gp:HSIFNG19L_1 interferon-gamma variant [H ( 125)  145  145  183 282.0 1.8e-08
gp:HSIFNG14L_1 interferon-gamma variant [H ( 130)  145  145  183 281.7 1.9e-08
gp:HSIFNG11_1 interferon-gamma variant [Ho ( 133)  145  145  183 281.5 1.9e-08
gp:HSIFNG11L_1 interferon gamma variant [H ( 133)  145  145  183 281.5 1.9e-08
gp:A19599_1 human IFN-gamma variant C-10L  ( 134)  145  145  183 281.5 1.9e-08
prf:1007177A      interferon gamma - Homo  ( 143)  145  145  183 281.0 2e-08
gp:A07051_1 Artificial sequence for mature ( 144)  145  145  183 281.0 2.1e-08
gp:A11033_1 human INF gamma [unidentified] ( 147)  145  145  183 280.8 2.1e-08
          /////////////////////////
sp:ING_RAT INTERFERON GAMMA PRECURSOR (IFN  ( 156)   49   49   93 151.8 0.32
sp:ING_MOUSE INTERFERON GAMMA PRECURSOR (I  ( 155)   48   48   90 147.6 0.55
gp:RNIFNG2_2 Rat gene fragment for interfe  (  61)   49   49   73 129.8  5.4

 これは、ホモロジーのランキングを示すデーターで、initnの値に基づく z-score の高い順に並んでいる。 optの値の方がより正確な値である。E値は、0に近いほど類似性が高い。
 この後、アライメントのデーターが続く。

>gp:D84216_1 interferon-gamma [Oryctolagus cuniculus]    (54 aa)
 initn: 341 init1: 341 opt: 341 Z-score: 513.5 expect() 2.3e-21
Smith-Waterman score: 341;  100.000% identity in 54 aa overlap

               10        20        30        40        50    
query  DNLKDHEVIKKSMESIKEDIFVKFFNSNLTKMDDFQNLTRISDDRLVQRKAVSE
       ::::::::::::::::::::::::::::::::::::::::::::::::::::::
gp:D84 DNLKDHEVIKKSMESIKEDIFVKFFNSNLTKMDDFQNLTRISDDRLVQRKAVSE
               10        20        30        40        50    
               (これは、同一の遺伝子である。)
          ///////////////////////

>prf:1007177A      interferon gamma - Homo sapiens (man  (143 aa)
 initn: 145 init1: 145 opt: 183 Z-score: 281.0 expect() 2e-08
Smith-Waterman score: 183;  59.259% identity in 54 aa overlap

                                            10        20        30 
query                               DNLKDHEVIKKSMESIKEDIFVKFFNSNLTK
                                     :.:: . :.::.:.::::. :::::::  :
prf:10 FLGILKNWKEESDRKIMQSQIVSFYFKLFKNFKDDQSIQKSVETIKEDMNVKFFNSNKKK
       30        40        50        60        70        80        

              40         50                                   
query  MDDFQNLTRIS-DDRLVQRKAVSE                               
        :::..::  :  :  :::::. :                               
prf:10 RDDFEKLTNYSVTDLNVQRKAIHELIQVMAELSPAAKTGKRKRSQMLFRGRRASQ
       90       100       110       120       130       140   
 検索を行っている遺伝子(ウサギのgamma-interferon gene)とヒトのgamma-interferon geneとの間で、 アミノ酸配列で59%の同一配列があることを示している。

前へ 先頭へ
Copyright (C) Central Research Laboratory. All right reserved.since 1996/2/1

Last Updated 2005/8/16