A survey of loss function for semantic segmentation #39

masa-suke opened this issue Jan 29, 2024 · 0 comments

masa-suke opened this issue Jan 29, 2024 · 0 comments


Shruti Jadon. 2020. "A survey of loss function for semantic segmentation" arXiv [eess.IV].

  • 損失関数は、モデルの性能を決定する上で重要な役割を果たす。
    • セグメンテーションのような複雑な目的においては、普遍的な損失関数を決定することは困難
    • 多くの場合は、分布、歪度、境界など、学習に用いるデータセットの特性に依存する。


Types of Semantic Segmentation Loss Functions

Type Loss Function
Distribution-based Loss Binary Cross-Entropy
Weighted Cross-Entropy
Balanced Cross-Entropy
Focal Loss
Distance map derived loss penalty term
Region-based Loss Dice Loss
Sensitivity-Specificity Loss
Tversky Loss
Focal Tversky Loss
Log-Cosh Dice Loss(ours)
Boundary-based Loss Hausdorff Distance loss
Shape aware loss
Compounded Loss Combo Loss
Exponential Logarithmic Loss




Image Segmentation has been an active field of research as it has a wide range of applications, ranging from automated disease detection to self driving cars. In the past 5 years, various papers came up with different objective loss functions used in different cases such as biased data, sparse segmentation, etc. In this paper, we have summarized some of the well-known loss functions widely used for Image Segmentation and listed out the cases where their usage can help in fast and better convergence of a model. Furthermore, we have also introduced a new log-cosh dice loss function and compared its performance on NBFS skull-segmentation open source data-set
with widely used loss functions. We also showcased that certain loss functions perform well across all data-sets and can be taken as a good baseline choice in unknown data distribution scenarios.

画像セグメンテーションは、病気の自動検出から自動運転車まで、幅広い用途があるため、活発な研究分野となっている。過去5年間で、様々な論文が、偏ったデータ、スパースセグメンテーションなど、様々なケースで使用される様々な目的損失関数を発表した。本論文では、画像分割に広く使われている有名な損失関数のいくつかを要約し、その使用によってモデルの高速かつ良好な収束に役立つケースを列挙した。さらに、新しいlog-cosh dice損失関数を導入し、NBFS skull-segmentationオープンソースデータセットでその性能を比較した。



A. Binary Cross-Entropy

Binary Cross-Entropyは2値分類の損失関数で、ピクセル与えられた確率変数またはイベントの集合に対する2つの確率分布の差の尺度として定義される。セグメンテーションはピクセルレベルの分類であるため、うまく機能する。

$$L_{BCE}(y, \hat{y}) = −(y\log(\hat{y}) + (1 −y)log(1 −\hat{y})) \tag{1}$$

B. Weighted Binary Cross-Entropy(WCE)

重み付きのBinary Cross-Entropyで、Binary Cross-Entropyの変種。

$$L_{W−BCE}(y, \hat{y}) = −(\beta ∗ ylog(\hat{y}) + (1 − y)log(1 −\hat{y})) \tag{2}$$

偽陰性の数を減らしたい場合はβ > 1, 偽陽性の数を減らしたい場合はβ < 1に設定する。

C. Balanced Cross-Entropy(BCE)


$$L_{BCE}(y,\hat{y}) = −(\beta ∗ ylog(\hat{y})+(1−\beta)∗(1−y)log(1−\hat{y})) \tag{3}$$

D. Focal Loss(FL)

Binary Cross-Entropyの派生で、(判別が)簡単なサンプルの寄与を重み付けし、判別が難しいサンプルの学習により焦点を当てる損失関数。Binary Cross-Entropyと同様に、不均衡データに有効とされ、次のように定義される[9]。

$$FL(p_t) = −\alpha t(1 − p_t)\gamma log(p_t) \tag{7}$$

E. Dice Loss(DL)


$$DL(y, \hat{p}) = \frac{2y\hat{p}+1}{1 − y + \hat{p} + 1} \tag{8}$$

F. Tverskey Loss

Dices係数を一般化、重みづけしたTversky index(TI)を損失関数としたものがTverskey Loss(TL)。

$$TI(p,\hat{p}) = \frac{p\hat{p}}{p\hat{p}+ \gamma(1 −p)\hat{p}+ (1 − \gamma)p(1 − \hat{p})} \tag{9}$$ $$TL(p,\hat{p}) = \frac{1+p\hat{p}}{1+p\hat{p}+\beta(1−p)\hat{p}+(1−\beta)p(1−\hat{p})} \tag{10}$$

G. Focal Tversky Loss


$$FTL = \sum_c(1 − TI_c)^\gamma \tag{11}$$

H. Sensitivity Specificity Loss

この損失関数(Sensitivity Specificity Loss, SSL)は、SensitivitySpecificity、およびパラメータで下記のように定義され、不均衡データに有効とされる。

$$SSL = w * sensitivity + (1-w)*specificity \tag{12} $$$$

I. Shape-aware Loss

名前からもわかるように、Shape-aware Lossは、形状を考慮した損失関数。
一般に、すべての損失関数はピクセルレベルで動作するが、Shape-aware Lossは、予測されたセグメンテーションの曲線付近の点間のユークリッド距離を曲線にする平均点を計算し、それをクロスエントロピーの損失関数として使用する。

$$L_{shape−aware} = −\sum_i CE(y, \hat{y}) − \sum_i i E_iCE(y, \hat{y}) \tag{16} $$$$

J. Combo Loss

Combo Lossは、Dice Lossとモディファイされたクロスエントロピーの加重和として定義される。
これは、不均衡データによるダイスロスの柔軟性を活用しようとすると同時に、クロスエントロピーをcurve smoothingに利用するものである。

$$L_{m−bce} = −\frac{1}{N} \sum_i \beta(y−log(\hat{y}))+(1−\beta)(1−y)log(1−\hat{y}) \tag{17}$$ $$CL(y,\hat{y}) = \alpha L_{m-bce}-(1-\alpha)DL(y,\hat{y}) \tag{18}$$

K. Exponential Logarithmic Loss

DLとCross Entropy Lossを組み合わせより、予測精度が低いものに着目した損失関数。

$$L_{Exp} = w_{Dice} L_{Dice} + w_{cross}L_{cross}$$

L. Distance map derived loss penalty term

距離マップは、Ground truthと予測されたマップの距離(ユークリッド距離、絶対値など)として定義することができる。

$$L(y,p) = \frac{1}{N} \sum^N_{i=1} (1+\phi)(⊙)(L_{CE})(y,p) \tag{22}$$

M. Hausdorff Distance Loss

Hausdorff Distance (HD) は、セグメンテーションアプローチによって、モデルの性能を追跡するために使用されるメトリックで、以下のように定義される。

$$d(X,Y) = \max_{xεX} min_{yεY} ||x − y||^2 \tag{23}$$

N. Correlation Maximized Structural Similarity Loss


$$Loss_{ssl}(y_{n,c},p_{n,c}) = e_{n,c}f_{n,c}L_{CE}(y_{n,c},p_{n,c})$$

O. Log-Cosh Dice Loss

Dice Lossのバリエーションと、回帰ログコシュアプローチにインスパイアされた平滑化手法で、本論文で提案する損失関数。

$$L_{lc−dce} = log(cosh(DiceLoss)) \tag{32}$$

また、NBFS Skill Stripping Dataset を用いて、他の損失関数と比較検証し、優位性を示している。

Comparison of some above mentioned loss functions on basis of Dice scores, Sensitivity and Specificity for Skull Segmentation
Evaluation Metrics
Dice Coefficient
Binary Cross-Entropy 0.968 0.976 0.998
Weighted Cross-Entropy 0.962 0.966 0.998
Focal Loss 0.936 0.952 0.999
Dice Loss 0.970 0.981 0.998
Tversky Loss 0.965 0.979 0.996
Focal Tversky Loss 0.977 0.990 0.997
Sensitivity-Specificity Loss 0.957 0.980 0.996
Exp-Logarithmic Loss 0.972 0.982 0.997
Log Cosh Dice Loss 0.989 0.975 0.997


