FAQ(基礎生物学)
FAQ
- コンテナファイルの使い方が知りたい(BUSCO, BRAKERなど)
- BUSCOで Cannot reach https://busco-data2.ezlab.org/v5/data/file_versions.tsv エラー
- SRA-toolkit が動かない
- BRAKER, GALBA をコンテナで使った際に Failed to create new species with new_species.pl エラー
コンテナファイルの使い方が知りたい(BUSCO, BRAKERなど)
apptainer exec (options..) コンテナ名
に続いて、解析のコマンドを書きます。
例:(-B オプションで現在のディレクトリをコンテナ内の同じ場所にマウントしています)
apptainer exec -B ${PWD} container_name.sif command --option...
BUSCOで Cannot reach https://busco-data2.ezlab.org/v5/data/file_versions.tsv エラー
BUSCOは毎回データセットをダウンロードしようとしますが、計算ノードは外部と通信できない故のエラーです。先に使いたいデータのみダウンロードしておいてから、jsubでの解析を実行します。 下記は"eukaryota_odb10"を使う場合の例です。
・eukaryota_odb10データセットをダウンロード
cd
apptainer exec -B ${HOME} /apl/bio/container/BUSCO/busco580.sif busco busco --download eukaryota_odb10
busco_downloads というディレクトリが自動で作成され、busco_downloads/lineages/ 内にeukaryota_odb10データセットが置かれます。
・コンテナを使ったスクリプト例(--offlineが必須)
apptainer exec -B ${HOME} /apl/bio/container/BUSCO/busco580.sif busco -i ${HOME}/test.fa -m tran -o busco_out -l eukaryota_odb10 --offline
/apl/bio/db/BUSCO/BUSCO_datasetsにデータセットが置いてありますので、それをコピーして使うことも可能です。
SRA-toolkit が動かない
jsubされたジョブが実行される計算ノードは、外部と通信できないため、fastqのダウンロードなどができません。お手元のPCでダウンロードしてからccfepにアップロードしてください。
BRAKER, GALBA をコンテナで使った際に Failed to create new species with new_species.pl エラー
BRAKER, GALBA が内部で利用しているAugustus は、既存のspeciesを使うのでない場合、speciesディレクトリに新しくディレクトリを作成します。 それをコンテナ内に作ろうとして、書き込みできずにエラーになっています。
解決法:(下記の例ではbraker3.sif というコンテナを使っているものとします)
speciesディレクトリが含まれる augustus_config ディレクトリごとコンテナ内から外にコピーします。
1. コンテナ内のspecies ディレクトリを探します
apptainer exec braker3.sif printenv | grep AUGUSTUS_CONFIG_PATH
AUGUSTUS_CONFIG_PATH=/opt/Augustus/config/
2. /opt/Augustus/config ディレクトリをコンテナから現在のディレクトリにコピーします。
apptainer exec -B ${PWD} braker3.sif cp -R /opt/Augustus/config augustus_config .
3. jsub用スクリプトは先のディレクトリをAUGUSTUS_CONFIG_PATH環境変数として追加して書きます
apptainer exec -B ${PWD} --env AUGUSTUS_CONFIG_PATH=${PWD}/augustus_config braker3.sif --species=mysp --genome=mygenome.fa ......