2017年7月18日 星期二

定期更新PDB資料庫

《將整個PDB下載回本機端》說明要怎樣將整個蛋白質資料庫(PDB)下載回自己的機器上。但PDB這個資料庫現在是每個星期三UTC 00:00會更新,台灣是UTC+8,所以就是每個星期三早上八點會更新。考量到每個資料庫一更新完一堆人會去抓、還有週間大家使用資料庫比較頻繁,所以建議週末再來做更新。
  • VISUAL=vim crontab -e
  • crontab -l | grep -v ^#
    3 2 * * 6 /dw/rsyncPDB.sh
每週六凌晨2:03開始做更新。下面是rsyncPDB.sh的腳本:
#!/bin/sh
MIRRORDIR=/dw/rcsb    # your top level rsync directory
LOGFILE=/dw/rsyncPDB.log/rsyncPDB.`/bin/date +"%Y%m%d"`  # file for storing logs
RSYNC=/usr/bin/rsync  # location of local rsync
SERVER=rsync.wwpdb.org::ftp  # RCSB PDB server name
PORT=33444            # port RCSB PDB server is using
${RSYNC} -rlpt -v -z --delete --port=$PORT ${SERVER}/ $MIRRORDIR > $LOGFILE 2>/dev/null

參考資料:

_EOF_

沒有留言:

張貼留言