実験実習機器センター 礒野 高敬
5年程前、遺伝子を解析し始めた当時、遺伝子のホモロジー解析をCD-ROMを用いて行っていた。1件につき、2時間ほどかけていた。
本学に、LANシステムが導入されて、インターネットを用いて同じことを行うと、5分で終わってしまい感動した。また、検索対象と
なるデーターベースは、日々更新されているので最新情報が得られる。データーベースに登録された遺伝子は、もう世界の全研究者の
もので、プライマーを合成してPCRを行えば、その遺伝子を手に入れ自由に研究できる。今回は、利用頻度が高いと思われる遺伝子の
検索法と ホモロジー検索法を中心に、コンピューターを操作しながら紹介していきたい。
1. 遺伝子の検索
国内の利用できるサーバー: | 遺伝研内の日本DNAデーターバンク(DDBJ) http://www.ddbj.nig.ac.jp/ |
ゲノムネット(GenomeNet) http://www.genome.ad.jp/ |
講師は、主にDDBJの方を用いている。
検索方法として、アクセッション番号による検索とキーワードによる検索とがある。
アクセッション番号による検索は、文献に記載された調べたい遺伝子に付けられた登録番号を検索する方法である。
キーワードによる検索は、文献検索と同じように、キーワードで検索する方法で、複数のキーワードで限定していくことができる。
キーワードで検索する場合、対象の遺伝子を登録した際に別名で登録されている場合もあるので注意を要する。
2. ホモロジー検索
ホモロジー検索には、BLASTとFASTAというプログラムがある。ヌクレオチド配列についてもアミノ酸配列についても
検索できる。
BLAST(http://www.genome.ad.jp/SIT/BLAST.html)は、ギャップを入れない部分配列のアライメントを複数集めて
評価する方式をとっており高速である。DNAシーケンサーで得られた生データーの検索には、こちらが向いているようである。
メールでも、WWWでもサービスが受けられるが、検索された遺伝子配列についての登録データーや論文情報をリンクをたどって
調べられるWWWの方がお薦めである。
FASTA(http://www.genome.ad.jp/SIT/FASTA.html)は、一致する領域を高速に検索してから、最終的には、ギャップを
入れた完全なアライメントを行う。検索結果を出すまでには、時間がかかるのでメールでサービスを受ける方がよいであろう。
講師は、主にゲノムネットのBLASTとFASTAを用いているが、ゲノムネット以外でもサービスを受けることができる。
以下に、検索例を示す。
Netscape Navigator を開き、 http://www.ddbj.nig.ac.jp/Welcom-j.htmlに接続する。
日本DNAデーターバンクのホームページ内に以下の解析サービスがある。
DDBJのデータ検索とデータ解析サービス:
アクセッション番号によるエントリー取得(getentryを使用)
キーワード検索によるエントリー取得(SFgateとWAISを使用)
FASTA/BLASTを使用した相同性検索(ホモロジーサーチ)
配列の多重整列(malignを使用)
配列の多重整列(clustalwを使用)
3D-1D法を用いた蛋白質の二次構造予測
Gopher/Anonymous FTP/E-mail検索サーバ
他のデータベースWWWページへのリンク
”キーワード検索によるエントリー取得”をクリックするとキーワード検索に入れる。
検索キー: の所に " isono and rabbit " とキーワードを入れてクリックすると、以下の検索結果が得られる。
(注:ここで、Proxies をNo Proxiesしておかないと検索できない。ネットに負担をかけないように、検索終了後、
Manual Proxy Configuration に戻しておくこと。)
検索結果 ( 1 - 37 )
検索キー: isono and rabbit
1: D49841 Rabbit mRNA for CD28, complete cds.
Database: ddbj, Size: 3.2 kbytes, Type: TEXT, Score: 1000
2: D49843 Rabbit mRNA for CD80, complete cds.
Database: ddbj, Size: 3.6 kbytes, Type: TEXT, Score: 1000
3: D49842 Rabbit mRNA for CD86, complete cds.
Database: ddbj, Size: 3.8 kbytes, Type: TEXT, Score: 1000
4: AB003911 Rabbit mRNA for OX40 precursor, partial cds.
Database: ddbj, Size: 3.3 kbytes, Type: TEXT, Score: 1000
5: AB003912 Rabbit mRNA for OX40 ligand, complete cds.
Database: ddbj, Size: 3.0 kbytes, Type: TEXT, Score: 960
6: D84216 Rabbit mRNA for interferon gamma, partial cds.
Database: ddbj, Size: 2.2 kbytes, Type: TEXT, Score: 933
7: D84217 Rabbit mRNA for interleukin-10, partial cds.
Database: ddbj, Size: 2.3 kbytes, Type: TEXT, Score: 921
/////////////////////////////
36: D38142 Rabbit mRNA for T-cell receptor gamma chain V2-P2-C
precursor.
Database: ddbj, Size: 3.5 kbytes, Type: TEXT, Score: 480
37: D38134 Rabbit mRNA for T-cell receptor precursor (V-J-C region).
Database: ddbj, Size: 4.7 kbytes, Type: TEXT, Score: 451
"6: D84216 Rabbit mRNA for interferon gamma, partial cds. " をクリックすると以下の登録データーが得られる。
D84216 Rabbit mRNA for interferon gamma, partial cds.
LOCUS D84216 164 bp ss-mRNA MAM 16-DEC-1996
DEFINITION Rabbit mRNA for interferon gamma, partial cds.
ACCESSION D84216
KEYWORDS IFNg; interferon-gamma.
SOURCE Oryctolagus cuniculus (sub_species:domesticus, strain:B/Jas)
HTLV-I-transformed T cell cell_line:B405 cDNA to mRNA.
ORGANISM Oryctolagus cuniculus
Eukaryota; Animalia; Chordata; Vertebrata; Mammalia; Theria;Eutheria; Lagomorpha; Leporidae.
REFERENCE 1 (bases 1 to 164)
AUTHORS Isono,T.
TITLE Direct Submission
JOURNAL Submitted (25-MAR-1996) to the DDBJ/EMBL/GenBank databases.
Takahiro Isono, Shiga University of Medical Science, CentralResearch Laboratory; Seta Tsukinowachou,
Otsu, Shiga 520-21, Japan(E-mail:isono@bellebsd.shiga-med.ac.jp, Tel:0775-48-2308,Fax:0775-48-2048)
STANDARD full staff_review
REFERENCE 2 (bases 1 to 164)
AUTHORS Isono,T.
JOURNAL Unpublished (1996)
STANDARD full staff_review
REFERENCE 3 (sites)
AUTHORS Isono,T., Nagano,Y. and Seto,A.
TITLE Expression of the interferon-gamma and interleukin-10 genes inrabbit HTLV-I-transformed T-cell lines
JOURNAL Immunogenetics 44, 306-308 (1996)
STANDARD full staff_review
COMMENT
FEATURES Location/Qualifiers
source 1..164
/cell_line="B405"
/cell_type="HTLV-I-transformed T cell"
/organism="Oryctolagus cuniculus"
/sequenced_mol="cDNA to mRNA"
/strain="B/Jas"
/sub_species="domesticus"
CDS <1..>164
/codon_start=1
/gene="IFNg"
/product="interferon-gamma"
/standard_name="interferon-gamma"
/translation="DNLKDHEVIKKSMESIKEDIFVKFFNSNLTKMDDFQNLTRISDD
RLVQRKAVSE"
BASE COUNT 61 a 29 c 35 g 39 t 0 others
ORIGIN
1 gacaacttaa aagaccatga ggtcataaag aagagtatgg aatccatcaa agaagacata
61 tttgtgaagt tcttcaatag caacctaact aagatggatg acttccaaaa tctgactcga
121 atttcggatg atcggctggt ccagcgtaaa gcagtaagtg aact
//
"D84216 Rabbit mRNA for interferon gamma, partial cds." のヌクレオチド配列をコピーして(ヌクレオチド番号は
消すこと。)、http://www.genome.ad.jp/SIT/BLAST.html に接続して、ホモロジー検索した結果は以下の通りである。
BLASTN Search Result
Computed at GenomeNet kyoto-center on Wed Jul 9 13: 8:58 JST 1997
Database Name NR-NT
>query
gacaacttaa aagaccatga ggtcataaag aagagtatgg aatccatcaa
agaagacata tttgtgaagt tcttcaatag caacctaact aagatggatg
acttccaaaa tctgactcga atttcggatg atcggctggt ccagcgtaaa
gcagtaagtg aact
Smallest
Sum
High Probability
Sequences producing High-scoring Segment Pairs: Score P(N) N
gb:D84216 Rabbit mRNA for interferon gamma, partial c... 820 2.6e-62 1
gb:A11779 Nucleotide sequence 3 from patent number EP... 339 2.5e-20 1
gb:HRSIG Horse mRNA for interferon gamma, complete c... 339 2.8e-20 1
gb:ECU04050 Equus caballus interferon-gamma precursor m... 339 2.9e-20 1
gb:A11777 E.caballus gene for interferon gamma.>emb:A... 338 5.0e-20 1
gb:SYNIFNGS Human immune gamma-interferon gene, promote... 324 5.1e-19 1
gb:CJINTERFG C.jacchus interferon gene for interferon ga... 324 7.4e-19 1
gb:A10717 Synthetic nucleotide sequence encoding a rI... 315 2.4e-18 1
gb:HSIFNG20 H.sapiens mRNA for IFN-gamma (pKC-20).>emb:... 315 2.4e-18 1
gb:A19599 Artificial sequence for human IFN-gamma var... 315 2.5e-18 1
gb:HSIFNG19L H.sapiens mRNA for IFN-gamma (pKC-19L).>emb... 315 2.5e-18 1
gb:HSIFNG11 H.sapiens mRNA for IFN-gamma (pKC-11).>emb:... 315 2.5e-18 1
gb:I02074 Sequence 2 from Patent US 4855409.>emb:I020... 315 2.6e-18 1
gb:HSIFNG14L H.sapiens mRNA for IFN-gamma (pKC-14L).>emb... 315 2.6e-18 1
gb:A02254 Plasmid pGLS DNA for interferon-gamma.>emb:... 315 2.6e-18 1
gb:A02260 Plasmid pHis,His-Xa-IFN-gamma(-8)(Asn) fusi... 315 2.6e-18 1
gb:A02258 Plasmid pHis,His-Ek-IFN-gamma(-8) fusion ge... 315 2.6e-18 1
/////////////////////////
gb:MTPFZ1A M.thermoformicicum complete plasmid pFZ1 DN... 121 0.997 1
gbu:D87022 Human (lambda) DNA for immunoglobin light c... 120 0.9991 1
gb:AA083948 zn16d07.r1 Stratagene neuroepithelium NT2RA... 87 0.9993 2
gb:AA084195 zn17d07.r1 Stratagene neuroepithelium NT2RA... 87 0.9998 2
これは、ホモロジーのランキングを示すデーターで、P(N)の小さい順に並んでいる。P(N)は、0から1の間の値を取り、
0に近いほど類似性が高く、1に近いときは、偶然に見つかった場合と区別できないという意味で類似性があると言えないことを示す。
この後、アライメントのデーターが続く。
>gb:D84216 Rabbit mRNA for interferon gamma, partial cds.>emb:OCD216 Rabbit
mRNA for interferon gamma, partial cds.
Length = 164
Plus Strand HSPs:
Score = 820 (226.6 bits), Expect = 2.6e-62, P = 2.6e-62
Identities = 164/164 (100%), Positives = 164/164 (100%), Strand = Plus / Plus
Query: 1 GACAACTTAAAAGACCATGAGGTCATAAAGAAGAGTATGGAATCCATCAAAGAAGACATA 60
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 1 GACAACTTAAAAGACCATGAGGTCATAAAGAAGAGTATGGAATCCATCAAAGAAGACATA 60
Query: 61 TTTGTGAAGTTCTTCAATAGCAACCTAACTAAGATGGATGACTTCCAAAATCTGACTCGA 120
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 61 TTTGTGAAGTTCTTCAATAGCAACCTAACTAAGATGGATGACTTCCAAAATCTGACTCGA 120
Query: 121 ATTTCGGATGATCGGCTGGTCCAGCGTAAAGCAGTAAGTGAACT 164
||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 121 ATTTCGGATGATCGGCTGGTCCAGCGTAAAGCAGTAAGTGAACT 164
(これは、同一の遺伝子である。)
////////////////////////////
>gb:SYNIFNGS Human immune gamma-interferon gene, promoter T5P25 and ribosome
binding site (RBS), synthetically constructed.>emb:HSIFNGS Human
immune gamma-interferon gene, promoter T5P25 and ribosome binding
site (RBS), synthetically constructed.
Length = 524
Plus Strand HSPs:
Score = 324 (89.5 bits), Expect = 5.1e-19, P = 5.1e-19
Identities = 92/126 (73%), Positives = 92/126 (73%), Strand = Plus / Plus
Query: 2 ACAACTTAAAAGACCATGAGGTCATAAAGAAGAGTATGGAATCCATCAAAGAAGACATAT 61
| ||||| ||||| || || ||| | |||||| |||| ||||||| ||||||||
Sbjct: 265 AGAACTTTAAAGATGATCAGAGCATCCAAAAGAGTGTGGAGACCATCAAGGAAGACATGA 324
Query: 62 TTGTGAAGTTCTTCAATAGCAACCTAACTAAGATGGATGACTTCCAAAATCTGACTCGAA 121
||| ||||| |||||||||||| || || ||||||||| |||| ||||||
Sbjct: 325 ATGTCAAGTTTTTCAATAGCAACAAAAAGAAACGTGATGACTTCGAAAAGCTGACTAATT 384
Query: 122 TTTCGG 127
|||||
Sbjct: 385 ATTCGG 390
検索を行っている遺伝子(ウサギのgamma-interferon gene)とヒトのgamma-interferon geneとの間で、ヌクレ
オチド配列で73%の同一配列があることを示している。
"D84216 Rabbit mRNA for interferon gamma, partial cds." のアミノ酸配列をコピーして、
http://www.genome.ad.jp/SIT/FASTA.html に接続して、ホモロジー検索した結果は以下の通りである。
FASTA3_T Search Result
Computed at GenomeNet kyoto-center on Wed Jul 9 16:49:37 JST 1997
Database Name NR-AA
>query
DNLKDHEVIK KSMESIKEDI FVKFFNSNLT KMDDFQNLTR ISDDRLVQRK
AVSE
FASTA (3.06 Sept, 1996) function (optimized, /bio/db/fasta/matrix/aa/blosum50 matrix) ktup: 2
join: 36, opt: 24, gap-pen: -12/ -2, width: 16 reg.-scaled
Scan time: 3.810
The best scores are: initn init1 opt z-sc E(268410)
gp:D84216_1 interferon-gamma [Oryctolagus ( 54) 341 341 341 513.5 2.3e-21
sp:ING_RABIT INTERFERON GAMMA PRECURSOR (I ( 167) 327 267 329 488.5 5.7e-20
gp:A11777_1 interferon gamma [Equus caball ( 166) 204 173 221 334.3 2.2e-11
gp:HRSIG_1 interferon gamma [Equus caballu ( 166) 204 173 221 334.3 2.2e-11
sp:ING_HORSE INTERFERON GAMMA PRECURSOR (I ( 166) 204 173 221 334.3 2.2e-11
sp:ING_CALJA INTERFERON GAMMA PRECURSOR (I ( 166) 154 154 195 297.1 2.6e-09
sp:ING_MACMU INTERFERON GAMMA PRECURSOR (I ( 165) 147 147 188 287.2 9.3e-09
gp:HSIFNG20_1 interferon-gamma variant [Ho ( 124) 145 145 183 282.0 1.8e-08
gp:HSIFNG19L_1 interferon-gamma variant [H ( 125) 145 145 183 282.0 1.8e-08
gp:HSIFNG14L_1 interferon-gamma variant [H ( 130) 145 145 183 281.7 1.9e-08
gp:HSIFNG11_1 interferon-gamma variant [Ho ( 133) 145 145 183 281.5 1.9e-08
gp:HSIFNG11L_1 interferon gamma variant [H ( 133) 145 145 183 281.5 1.9e-08
gp:A19599_1 human IFN-gamma variant C-10L ( 134) 145 145 183 281.5 1.9e-08
prf:1007177A interferon gamma - Homo ( 143) 145 145 183 281.0 2e-08
gp:A07051_1 Artificial sequence for mature ( 144) 145 145 183 281.0 2.1e-08
gp:A11033_1 human INF gamma [unidentified] ( 147) 145 145 183 280.8 2.1e-08
/////////////////////////
sp:ING_RAT INTERFERON GAMMA PRECURSOR (IFN ( 156) 49 49 93 151.8 0.32
sp:ING_MOUSE INTERFERON GAMMA PRECURSOR (I ( 155) 48 48 90 147.6 0.55
gp:RNIFNG2_2 Rat gene fragment for interfe ( 61) 49 49 73 129.8 5.4
これは、ホモロジーのランキングを示すデーターで、initnの値に基づく z-score の高い順に並んでいる。
optの値の方がより正確な値である。E値は、0に近いほど類似性が高い。
この後、アライメントのデーターが続く。
>gp:D84216_1 interferon-gamma [Oryctolagus cuniculus] (54 aa)
initn: 341 init1: 341 opt: 341 Z-score: 513.5 expect() 2.3e-21
Smith-Waterman score: 341; 100.000% identity in 54 aa overlap
10 20 30 40 50
query DNLKDHEVIKKSMESIKEDIFVKFFNSNLTKMDDFQNLTRISDDRLVQRKAVSE
::::::::::::::::::::::::::::::::::::::::::::::::::::::
gp:D84 DNLKDHEVIKKSMESIKEDIFVKFFNSNLTKMDDFQNLTRISDDRLVQRKAVSE
10 20 30 40 50
(これは、同一の遺伝子である。)
///////////////////////
>prf:1007177A interferon gamma - Homo sapiens (man (143 aa)
initn: 145 init1: 145 opt: 183 Z-score: 281.0 expect() 2e-08
Smith-Waterman score: 183; 59.259% identity in 54 aa overlap
10 20 30
query DNLKDHEVIKKSMESIKEDIFVKFFNSNLTK
:.:: . :.::.:.::::. ::::::: :
prf:10 FLGILKNWKEESDRKIMQSQIVSFYFKLFKNFKDDQSIQKSVETIKEDMNVKFFNSNKKK
30 40 50 60 70 80
40 50
query MDDFQNLTRIS-DDRLVQRKAVSE
:::..:: : : :::::. :
prf:10 RDDFEKLTNYSVTDLNVQRKAIHELIQVMAELSPAAKTGKRKRSQMLFRGRRASQ
90 100 110 120 130 140
検索を行っている遺伝子(ウサギのgamma-interferon gene)とヒトのgamma-interferon geneとの間で、
アミノ酸配列で59%の同一配列があることを示している。
前へ | 先頭へ |
Last Updated 2005/8/16