jensen不等式

Jensen不等式(Jensen's inequality)是一个在数学分析和概率论中常用的不等式,由丹麦数学家约翰·Jensen(Johannes Jensen)于1906年提出。

Jensen不等式描述了凸函数的性质,它说明了在凸函数上的一组点的函数均值不会超过函数值的凸组合。具体而言,设$f(x)$是定义在区间$[a, b]$上的凸函数,$x_1, x_2, \ldots, x_n$是该区间上的任意$n$个点,$\lambda_1, \lambda_2, \ldots, \lambda_n$是非负权重且满足$\lambda_1 + \lambda_2 + \ldots + \lambda_n = 1$,则Jensen不等式可以表达为:

$$f(\lambda_1x_1 + \lambda_2x_2 + \ldots + \lambda_nx_n) \leq \lambda_1f(x_1) + \lambda_2f(x_2) + \ldots + \lambda_nf(x_n)$$

其中,等号成立的条件是$x_1, x_2, \ldots, x_n$是相同点或者是连续的点,且函数$f(x)$是严格凸函数。

Jensen不等式在优化理论、信息论、概率论等领域有广泛的应用。它可以用来证明一些重要的结论,比如凸优化问题的最优性条件,以及信息熵的性质等。此外,Jensen不等式也为概率论中的期望和凸函数之间的关系提供了重要的工具。