二值交叉熵的数学表达:

如果我们希望的是a为0或者1,假设是1的话,那么我们的L会自动舍去

就剩下了:

假如一个概率为0.4,一个为0.6:

显然更贴近1的损失更小,而我们如果希望他的值是0,同理,只留下:

同样的数据:

显然,损失朝着我们希望的的方向变小。