濁水溪公社 - 笑虧世界, 5m04s
2019年7月31日 星期三
2019年7月30日 星期二
Windows 7自動登入
一台Windows 7開機後讓某個帳號自動登入,步驟如下:
_EOF_
- 控制台 > 使用者帳戶 > 變更使用者帳戶控制設定
- 將「選擇電腦變更的通知時機」調整成「不要通知」
- WinKey-R,輸入netplwiz
- 取消「必須輸入使用者名稱和密碼,才能使用這台電腦」
- 按下「套用」
- 輸入想要自動登入的使用者密碼
- 重新開機
_EOF_
2019年7月26日 星期五
元素週期表 Periodic Table
網路上可以找到的元素週期表有很多,這個由Michael Dayah做的動態元素週期表Ptable不錯用,包含了下述幾個頁面:
- Wikipedia:不同週期(period, 列)與不同族(group, 欄)與單一元素都可直接連結。還有一個bar可以調整環境溫度,按下去可以看到在那個溫度的時候元素的相。建議把右上角的Electrons勾選起來,這樣字體比較大
- Properties:相、熔點、沸點、電負度、電子親和度、價、解離能、半徑、硬度、密度、導電度、熱焓、含量、被發現時間等等,而且會根據這些特性的數值由淺至深上色
- Orbitals:電子如何填到電子軌域裡面,還可看到電子軌域長得樣子
- Isotopes:每種元素的各種同位素
- Compounds:每種元素形成的分子
Labels:
Chemistry化學,
Websites網站
2019年7月22日 星期一
Shell一行文:用底線取代檔名中的空白
許多程式在處理檔名有空格的檔案時容易出錯,下面一行指令可以將資料夾下面所有檔名中所有空格全部都取代成底線(_)
- for f in *\ *; do mv "$f" "${f// /_}"; done
Labels:
Bash與Shell命令稿,
Office與辦公文書
2019年7月21日 星期日
iPhoneXR黑屏無法開機,強制重開機
找了很多資料,對於iPhone XR黑屏(black screen, 整個螢幕全黑)都沒說可能發生的原因,只有說使用強制重開機可能可以解決。強制重開機(force restart)三步驟:
- 按一下音量(+)按鈕並迅速放開(約0.2秒)
- 按一下音量(-)按鈕並迅速放開(約0.2秒)
- 長按鎖定按鈕直到重開機
2019年7月17日 星期三
2019年7月16日 星期二
grep要注意部分匹配的問題
在使用grep用關鍵字抓文本資料的時候,要注意到部分匹配的問題,舉下面的例子:
以下範例,首先是式樣(pattern)存成一個叫做patterns.txt的檔案
- grep --color -f patterns.txt file.txt
- grep --color -xf patterns.txt file.txt
- grep --color -wf patterns.txt file.txt
- 一般抓文本資料的方法,只要列在patterns.txt裡面每一行的式樣(pattern)有匹配到file.txt那一行裡面隨便哪個部分,就會把結果印出來
- -x, --line-regexp:必須要file.txt裡面整行都完全與式樣有匹配才印出結果
- -w, --word-regexp:file.txt裡面看起來像一個字(word)的與式樣有匹配才會印出結果。一個字的定義是被`[[:<:]]'與`[[:>:]]'包含一群字元
以下範例,首先是式樣(pattern)存成一個叫做patterns.txt的檔案
2019年7月9日 星期二
bioSyntax: 為生物文本上色的plugin
bioSyntax:提供文字編輯器的plugin,幫助生物文本上色,可支援的文本:
- .fasta:一般的核酸或是蛋白質序列
- .fastq:Fasta + Phred score檔案,看序列內容與品質
- .clustal:Multiple Sequence Alignment (MSA)
- .bed:基因體範圍規範檔
- .gtf:基因體註解檔案
- .pdb:蛋白質三級結構
- .vcf:Variant Caller Format,標註基因體上面的變異
- .sam:Sequence Alignment Map (SAM) 次世代定序檔
上面是sublime, vim, gedit, less等文字編輯器可看到~
Labels:
BioInfo生物資訊,
Editor編輯器,
Macintosh,
PyMOL,
Sublime Text,
vi與vim,
Websites網站
2019年7月6日 星期六
2019年7月5日 星期五
靈敏度 ✕ 特異度 ✕ ROC曲線
在開發檢測方法的時候,通常都會有許多參數可以調整。例如說:
這時候需要一個方法來估算某檢測方法的好壞。其中一種方式就是畫出某種檢測方法的ROC curve(Receiver Operating Characteristic curve見維基百科上面的範例圖):
- 提高靈敏度Sensitivity:故意把預測陽性的數目增多
- 提高特異度Specificity:故意把預測陰性的數量增多
這時候需要一個方法來估算某檢測方法的好壞。其中一種方式就是畫出某種檢測方法的ROC curve(Receiver Operating Characteristic curve見維基百科上面的範例圖):
- y軸 = Sensitivity = TPR:故y值越大越好
- x軸 = 1 - Specificity = 1 - FPR:x值越小越好
Labels:
AI與機器學習,
BioTech生物科技,
Statistics統計
2019年7月4日 星期四
混淆矩陣之 Accuracy, MCC, F1 score
前面兩篇文章談及預測準不準確的測量如下:
跟之前一樣,先把混淆矩陣confusion matrix寫出來:
- 《混淆矩陣之 Sensitivity vs. Specificity》:以實際有無數量為分母的好壞判斷
- 《混淆矩陣之 Precision vs. NPV》:以陰陽性數量為分母的好壞判斷
- ACC:Accuracy、準確率。數值在0到1之間,越大越準
- 一般的檢測最愛拿這個當作標準,但如果實際有與實際無的數量差很多,使用ACC無法判斷檢測是不是好的。
- MCC:Matthews correlation coefficient,數值會在-1到1之間
- 數值靠近0:代表跟隨機亂猜差不多
- 數值遠離0:正的代表預測的很準、負值代表是反指標
- F1 score:又稱為F-score或F-measure
- sensitivity與precision的調和平均數,在0到1之間越大越好
跟之前一樣,先把混淆矩陣confusion matrix寫出來:
Labels:
AI與機器學習,
BioTech生物科技,
Statistics統計
2019年7月3日 星期三
2019年7月2日 星期二
混淆矩陣之 Precision vs. NPV
上一篇談及《Sensitivity vs. Specificity》,主要是以實際有無為的數量當作分母來判斷檢測好不好。這篇談及的則是檢測出陰陽當作分母來判斷好壞。下面則是所使用到的混淆矩陣(Confusion Matrix):
上述表格裡面使用(小括號)圈起來的代表是要填寫自然數,裡面縮寫分別代表:
真實情況 | ||||
有, + | 無, - | |||
預
測 結 果 | 陽性 Positive, P | (真陽性, TP) | (偽陽性, FP) | (P=TP+FP) |
陰性 Negative, N | (偽陰性, FN) | (真陰性, TN) | (N=FN+TN) |
上述表格裡面使用(小括號)圈起來的代表是要填寫自然數,裡面縮寫分別代表:
Labels:
AI與機器學習,
BioTech生物科技,
Statistics統計
2019年7月1日 星期一
混淆矩陣之 Sensitivity vs. Specificity
判斷一個預測的準確程度,會先把實際情形與預測結果的數量畫出一個矩陣,這個矩陣稱之為混淆矩陣(Confusion Matrix),畫出來就是下列的形式:
上述表格裡面使用(小括號)圈起來的代表是要填寫自然數,裡面縮寫分別代表:
真實情況 | |||
有, + | 無, - | ||
預
測 結 果 | 陽性 Positive, P | (真陽性, TP) | (偽陽性, FP) |
陰性 Negative, N | (偽陰性, FN) | (真陰性, TN) | |
(y=TP+FN) | (n=FP+TN) |
上述表格裡面使用(小括號)圈起來的代表是要填寫自然數,裡面縮寫分別代表:
Labels:
AI與機器學習,
BioTech生物科技,
Statistics統計
訂閱:
文章 (Atom)