分子生物学用データベース一覧

インストール済みデータベース一覧

データベース名種類フォーマット更新型
GenBank/GenBank-upd核酸配列テキストファイル, dbget用定期/日々
EMBL/EMBL-upd核酸配列テキストファイル, dbget用定期/日々
RefSeq/RefSeq-upd核酸配列テキストファイル, dbget用, BLAST用定期/日々
EST_human/EST_mouse/EST_others核酸配列FASTA用, BLAST用定期
NCBI nr-nt核酸配列(非冗長)FASTA用, BLAST用定期
gss核酸配列FASTA用, BLAST用定期
HTGS核酸配列FASTA用, BLAST用定期
dbsts核酸配列FASTA用, BLAST用定期
patnt核酸配列FASTA用, BLAST用定期
NCBI nr-aaアミノ酸配列(非冗長)FASTA用, BLAST用, diamond用定期
RefSeq-protinアミノ酸配列FASTA用, BLAST用, diamond用定期
UniProt(TrEMBL, Swissprot)アミノ酸配列FASTA用, BLAST用, diamond用定期
pataaアミノ酸配列FASTA用, BLAST用定期
env_nrアミノ酸配列FASTA用, BLAST用定期
pdbaaアミノ酸配列FASTA用, BLAST用定期
PDBアミノ酸配列FASTA用, BLAST用定期
kegg遺伝子/ゲノム統合テキストファイル, dbget用, FASTA用, BLAST用, diamond用定期

データベースがあるディレクトリ

ディレクトリ Directory

内容 Summary

/apl/bio/ftp/(DB_name)/

FTPでダウンロードしたファイル   (/apl/bio/ftp/licenced/ (KEGG)はアクセス不可)  

/apl/bio/db/ideas/(DB_name)/

テキストファイル DBGET検索用インデックスファイル(.cdb, .tit) 

/apl/bio/db/fasta/(DB_name)/

BLAST/FASTA検索用

/apl/bio/db/diamond/db/(DB name)/

DIAMOND検索用

/apl/bio/db/iproscan.bk/(DB name)/

InterProScan検索用

以下はシンボリックリンク

/apl/bio/db/blast/db/

全BLAST/FASTA検索用DBファイルへのシンボリックリンク

環境変数 BLASTDB に設定済み

/apl/bio/db/diamond/db/

全DIAMOND検索用DBファイルへのシンボリックリンク

/apl/bio/db/igenomes/

イルミナゲノムズのDB (Illumina Genomes DB)

  • コマンドの書き方例
diamond blastx --db /apl/bio/db/diamond/db/tremble --query exons.fa --out diamond.tab 
blastx -db nr -query exons.fa -out blastout.tab -outfmt 6
	環境変数BLASTDBが設定されているのでデータベースのパスは不要

DBGETコマンドの使い方

DBGET:分子生物学関連データベースの統合検索システム

  • source /apl/bio/etc/bio.sh すると使える
  • コマンド名 -h でヘルプを表示する
     
  • binfo:使えるデータベースの情報を取得
binfo
binfo (blast|fasta|diamond|dbget)
binfo diamond
	diamondで使えるデータベースを表示する
  • bfind:キーワード検索 
bfind [option] (DB名) (keyword1) (keyword2) ...
bfind swissprot human interleukin   
	swissprotデータベースからキーワードhuman, interleukinを含むエントリを探す
  • bget:配列データの取得
bget [option] (DB名):(ID1) (DB名):(ID2) ...
bget -f -n a swissprot:P05067    
	swissprotデータベースにあるP05067のアミノ酸配列のみを取得