《將整個PDB下載回本機端》說明要怎樣將整個蛋白質資料庫(PDB)下載回自己的機器上。但PDB這個資料庫現在是每個星期三UTC 00:00會更新,台灣是UTC+8,所以就是每個星期三早上八點會更新。考量到每個資料庫一更新完一堆人會去抓、還有週間大家使用資料庫比較頻繁,所以建議週末再來做更新。
- VISUAL=vim crontab -e
- crontab -l | grep -v ^#
3 2 * * 6 /dw/rsyncPDB.sh
每週六凌晨2:03開始做更新。下面是rsyncPDB.sh的腳本:
#!/bin/sh
MIRRORDIR=/dw/rcsb # your top level rsync directory
LOGFILE=/dw/rsyncPDB.log/rsyncPDB.`/bin/date +"%Y%m%d"` # file for storing logs
RSYNC=/usr/bin/rsync # location of local rsync
SERVER=rsync.wwpdb.org::ftp # RCSB PDB server name
PORT=33444 # port RCSB PDB server is using
${RSYNC} -rlpt -v -z --delete --port=$PORT ${SERVER}/ $MIRRORDIR > $LOGFILE 2>/dev/null
參考資料:
_EOF_
沒有留言:
張貼留言