一问总览机器学习中各种熵的含义及本质腾讯云开发者社区

机器学习领域有一个十分有魅力的词:熵。然而究竟什么是熵,相信多数人都能说出一二,但又不能清晰的表达出来。

而笔者对熵的理解是:“拒绝学习、拒绝提升的人是没有未来的,也只有努力才能变成自己想成为的人”。

下图是对熵的一个简单描述:

熵可以理解为是一种对无序状态的度量方式。那么熵又是如何被用在机器学习中呢?

自信息又称信息量。

“陈羽凡吸毒?!工作室不是刚辟谣了吗?哇!信息量好大!”

也就是说,信息量的多少与事件发生概率的大小成反比。

对于已发生的事件i,其所提供的信息量为:

其中底数通常为2,负号的目的是为了保证信息量不为负。

事件i发生的概率与对应信息量的关系如下所示:

我们再考虑一个问题:假设事件x个可能的状态,例如一枚硬币抛出落地后可能有两种状态,正面或反面朝上,这时候该怎样取衡量事件所提供的信息量?

信息熵又称香农熵。

到目前为止,我们只讨论了自信息。实际上,对于一枚硬币来讲,自信息实际上等于信息熵,因为无论正反面,朝上的概率都相等。

信息熵用来度量一个事件可能具有多个状态下的信息量,也可以认为是信息量关于事件概率分布的期望值:

其中事件x共有n个状态,i表示第i个状态,底数b通常设为2,也可设为10或e。

H(x)表示用以消除这个事件的不确定性所需要的统计信息量,即信息熵。

还是以抛硬币为例来理解信息熵:

事件

概率

信息量(自信息)

信息熵(统计信息量)

正面朝上

1/2

-log(1/2)

(-1/2*log(1/2))+(-1/2*log(1/2))

反面朝上

根据信息熵公式可得出以下结论:

信息熵可以推广到连续域,此时被称为微分熵。对于连续随机变量x和概率密度函数p(x),信息熵的定义如下:

上面我们讲到的都是对于一个事件的熵。那么如果有多个事件,例如事件x和事件y都出现时,又该怎样去度量呢?

首先,是联合熵,公式如下:

其中p(x,y)代表事件x和事件y的联合概率。

这次以同时抛两枚硬币为例来说明联合熵如何对两个事件进行度量:

联合熵

x正,y正

1/2*1/2=1/4

-log(1/4)

-(1/4*log(1/4)+1/4*log(1/4)+1/4*log(1/4)+1/4*log(1/4))

x正,y反

X反,y正

X反,y反

条件熵表示在已知事件x的条件下,事件y的不确定性。定义为在给定条件下x,y的条件分布概率的熵对x的数学期望:

可以发现,条件熵与联合熵仅仅在于log项不同。

此外,根据联合概率分布与条件概率分布的关系,可得:

所以:

即在x条件下,y的条件熵=x,y的联合熵-x的信息熵。

交叉熵是一个用来比较两个概率分布p和q的度量公式。换句话说,交叉熵是衡量在真实分布下,使用非真实分布所制定的策略能够消除系统不确定性的大小。

如何正确理解上述这段描述呢?首先,观察交叉熵的公式,如下图所示:

其中,p(x)为事件的真实分布概率,q(x)为事件的非真实分布概率。

可以看到,与信息熵相比,唯一不同的是log里的概率由信息熵中的真实分布概率p(x)变成了非真实概率(假设分布概率)q(x),即1-p(x)。也就是与信息熵相比,交叉熵计算的不是log(p)在p下的期望,而是log(q)在p下的期望。

同样地,交叉熵可也以推广到连续域。对于连续随机变量x和概率密度函数p(x)和假设分布概率密度函数q(x),交叉熵的定义如下:

所以,如果假设分布概率与真实分布概率一致,那么交叉熵=信息熵。

相对熵又称KL散度。

相对熵衡量了当修改从先验分布p到后验分布q的信念后所带来的信息增益。换句话说,就是用后验分布q来近似先验分布p的时候造成的信息损失。再直白一点,就是衡量不同策略之间的差异性。

计算公式如下:

其中H(p,q)代表策略p下的交叉熵,H(p)代表信息熵。所以,相对熵=某个策略的交叉熵-信息熵。

相对熵用来衡量q拟合p的过程中产生的信息损耗,损耗越少,q拟合p也就越好。

需要注意的是,尽管从直觉上相对熵(KL散度)是个度量或距离函数,但是它实际上并不是一个真正的度量或距离。因为KL散度不具有对称性:从分布P到Q的距离通常并不等于从Q到P的距离。

互信息用来表示两个变量X与Y之间是否有关系,以及关系的强弱。

用公式可以表示为:

因此,可认为变量X与Y的互信息就是信息熵H(X)与条件熵H(X|Y)的差。

THE END
1.你认为买彩票会中大奖吗?希望买彩票发大财的人都是些什么人?中与不中都要保持平常心。而那些想靠买彩票发财的人都是怀着极大的梦想的人,可能有极少的人梦想成真https://www.haian.com.cn/thread-1361056-2-1.html
2.为什么大多数买彩票中大奖的人下场都不太好?讲真,作为一辈子都不可能踩到狗屎中彩票的我,知道这些后有什么意义呢? 第一,我开始记账,分析自己资产的走向,明确了自己需要、必要和想要的东西,把家里堆到快要无处安放的基本不穿的衣服鞋子饰品等等各种断舍离,并控制自己买买买。 第二,我开始学习理财,把自己每个月的钱分成四份:一份拿来应付日常开销,一份定投https://www.jianshu.com/p/1132be8666af
3.中大奖的都是“好人”吗?人们常说,好人有好报。每当有人在不同场合被幸运眷顾,也常有人说出“人家肯定是以前做了好事”之类的话。那么,买彩票中大奖的都是“好人”吗? 对于这个问题,或许答案并不是那么绝对,但是不可否认的是,仅在今年体育彩票市场复市后的不长时间里,体彩大奖得主中就涌现了不少心地善良、胸怀公益的“好人”。 https://www.lottery.gov.cn/xwzx/djqx/20200813/2184347.html
4.女生嘴里说的安全感到底是什么?当下的苦难没关系,两人省吃俭用都是过程,但一旦其中一方不知上进,甚至拖后腿,原地踏步,毫无前进动力,以这样的趋势,直接给未来下了个“恶性通牒”。 “要么靠你一个人能致富,要么中彩票大奖,反正我坐以待毙。” 所以,当男生不能通过自己的表现,让女生看到两人更好的未来时,也会让女生觉得没有安全感。 https://m.douban.com/note/749151603/
5.彩票相关知识很多人做梦都想中得彩票头奖,很多人希望天上能掉下馅饼来砸中自己,很多人在作白日梦……彩票是一种风险投资,是一种四两拨千斤的气势,更是一种众人拾柴火焰高的真实写照,没买过彩票的人是很难体会那种美好的期望及期望破灭带来的失望的感受,在不断地经历过两个极端的磨炼之后,让人学到更多的是为人处世的道理。https://blog.csdn.net/iteye_19129/article/details/82276920
6.风云王自健:做一个搞得定自己的人另外我是挺悲观的一个人,虽然工作中比较喜庆。平时我劝朋友也是悲观一点好,就低看自己一眼,别高看自己。为什么有那么多中彩票的人迅速返贫?一个人中了500万,只要他不在北京、上海、广州这种一线大都市,应该这辈子生活费用就没问题了,但很多人会迅速返贫?因为他太高看自己了,觉得自己变成另外一个阶层的人了,不https://www.jfdaily.com/news/detail?id=3298
7.中大奖的人是什么命一个人要中奖的征兆中大奖的人是什么命 1、大运、流年遇偏财 大运、流年是引发、兑现命中信息的因素,若命中有发偏财的信息标志,大运、流年又出现偏财来引发,买彩票中大奖的几率就非常高了。 2、财星会合成局 财星三合三会成局,是大财,中大奖的几率自然会高。表示财星的柱中,坐下面有库,在命理学中也叫钱财入库,那么偏财为忌,会https://www.qiyuange.com/zhanbu/75633.html
8.男子买彩票中14.6万却被传中了500万:小区都知道了现在小区邻居都知道了,甚至还产生了谣言。“我父亲不知道在哪里兑奖,然后跟彩票店老板发信息询问,我们小区邻居还造谣说我中了一等奖,500万怎么中的。为这个事情,我妈要跟我爹离婚。”小王称还有人开始找他借钱,对他产生了很不好的影响。 彩票店老板表示,当时接到小王父亲电话时,他当时正在打彩票,用的是免提通话http://news.hnr.cn/shxw/article/1/1767553249631604737
9.八字看中彩票是人都是哪些人八字看中彩票是人都是哪些人 横财运的命局 横财运是一笔来的非常突然的财富,这类人往往命局具有一定的特点,他们命中日干健旺,命主身强,往往是日主逢生得地。有人可能要问何谓命主身强,比如一个人的八字日主甲乙木且生于春季,或者一个人日主丙丁火生于夏季,出生在合适的季节,那么此人日主得令,命主身强。横财https://www.360doc.cn/article/83491919_1116958675.html