8. ERROR ANALYSIS
定義:檢驗在 dev/validation set 中,被錯誤分類的樣本,
所以能更了解錯誤分類的真正原因,此流程稱為 Error
Analysis。
量化 (quantitative) 指標輔助決策的方法。
避免投入資源在沒有效益的方向。
先解決最重要的問題。
以迭代 (iterative) 的方式進行。
也可以用同樣的方法,針對 training set 進行 error
analysis。
9. 錯誤標記 (MISLABELED)
在檢驗分類 (classification) 錯誤樣本的同時,也檢驗標
記錯誤 (mislabeled) 的樣本。
最好也要同時檢驗被”正確”分類的樣本。
修正了 dev set 的標記,也要同時修正 test set 的,以確
保 dev set 和 test set 繼續保持相同的分佈。
11. DEV SET 夠大的話
把 Dev set 切分為
Eyeball dev set: 人眼檢驗錯誤並修正資料
Blackbox dev set: 透過換算法或是調參數
(hyperparameter),讓算法檢驗錯誤
如果在 Eyeball dev set 上的 performance 表現改善
優於 Blackbox dev set 的話,該回去檢視是否對
Eyeball dev set 有 overfitting 的問題
估算方式範例:
1. Error rate 是 20%, Dev set 共有 5000 筆, 總錯誤筆數是 1000
2. 想要抽 100 筆來人眼檢驗, 佔總錯誤 10%
3. 從 Dev set 中隨機抽 500 筆做為 Eyeball dev set, 剩下的 4500 為 Blackbox dev set
12. EYEBALL / BLACKBOX DEV SET 的 SIZE
不管錯誤比例多少,做 Eyeball dev set 檢驗都是有幫助
的。
如果 dev set 資料很小,就全部拿來做為 Eyeball dev
set。除了做錯誤分析之外,也可以用來做模型選擇和參
數 (hyperparameter) 調校。
錯誤比例愈小,Eyeball dev set 就要愈大,才能有足夠
的錯誤資料來做類別分析 (做才有意義)。
13. EYEBALL / BLACKBOX DEV SET 的 SIZE
如果是「人」沒有辦法做好類別分析的話,就不要有
Eyeball dev set。
Blackbox dev set 愈大愈好?小的話也有幫助。
16. 目標準確率 VS. 偏差 VS. 變異
如果還差目標太多,先想改變算法
再來做 Bias / Variance 的分析
公式:
Bias = Training Error
Variance = Dev Error (or Test Error) - Bias
17. EXAMPLE OF BIAS AND VARIANCE
Error Rate Bias and Variance Result Overfitting /
Training error: 1%
Dev error: 11%
Bias: 1%
Variance: 10%
High Variance Overfitting
Training error: 15%
Dev error: 16%
Bias: 15%
Variance: 1%
High Bias Underfitting
Training error: 15%
Dev error: 30%
Bias: 15%
Variance: 15%
High Bias
High Variance
Both
Training error: 0.5%
Dev error: 1%
Bias: 0.5%
Variance: 0.5%
Low Bias
Low Variance
19. OPTIMAL ERROR RATE
(UNAVOIDABLE BIAS, BAYES ERROR RATE /
BAYES RATE)
絕對值 vs. 相對值
Optimal error rate 可能是 Human-level Performance
Error Rate Bias and Variance Result Overfitting /
Optimal error: 14%
Training error: 15%
Dev error: 30%
Unavoidable Bias: 14%
Avoidable Bias: 1%
Variance: 15%
High
Variance
Overfitting
公式:
Bias = Optimal Error Rate + Avoidable Bias
Avoidable Bias = Optimal Error Rate - Training Error
Variance = Dev Error (or Test Error) - Bias
20. ADDRESSING BIAS AND VARIANCE
BIAS VS. VARIANCE TRADEOFF
Start training
High
training
error?
• Increase model size
• Modify input features based on
insights from error analysis
• Reduce or eliminate regularization
• Modify model architecture
• Add more training data
• Add regularization
• Add early stopping
• Feature selection to decrease
number/type of input features
• Decrease model size
• Modify input features based on
insights from error analysis
• Modify model architecture
Done
High dev
error?
Yes
High Bias
Yes
High Variance
No