$f:\mathbb R \rightarrow \mathbb R$가 위로 볼록인 함수이고 $n\ge 2$라고 하자. $t_1, \ldots, t_n > 0$이 $t_1 + \cdots + t_n = 1$을 만족할 때는 모든 $x_1,\ldots,x_n\in\mathbb R$에 대해서 다음의 부등식이 성립한다. \[ f(t_1x_1 + \cdots + t_nx_n) > t_1f(x_1) + \cdots + t_nf(x_n) \tag{$*1$} \] 즉, 데이터의 가중평균에 함수를 적용한 값은 각 데이터의 함숫값을 취한 것들의 가중평균보다 크다는 것이다. $t_i$들을 확률로 보면, 함수가 위로 볼록인 경우에는 기댓값의 함숫값이 함숫값의 기댓값보다 크다는 것으로 해석할 수 있다.
$f$가 아래로 볼록인 경우에는 $(*1)$의 부등호를 $<$로 바꾼 부등식이 성립한다.
단, $x_1 = \cdots = x_n$일 때는, 그리고 이때만 위의 부등호는 $=$로 바뀐다.
$n$이 자연수가 아니라 무한대인 경우에도 젠센 부등식은 수렴성의 가정하에 성립한다. 이에 대한 증명은 여기서 생략한다.
(증명). 수학적 귀납법을 사용한다.
$n=2$인 경우에는 볼록함수의 정의에 의하여 $(*1)$이 성립한다.
$t_i$들은 모두 양수이고 $t_1 + \cdots + t_n + t_{n+1} = 1$이라 하자. 그러면 $t_1 + \cdots + t_n = 1 - t_{n+1}$이므로 귀납가설 $(*1)$에 의하여 \[ f\left( \frac{t_1}{1-t_{n+1}}x_1 + \cdots + \frac{t_n}{1-t_{n+1}}x_n\right) > \frac{t_1}{1-t_{n+1}}f(x_1) + \cdots + \frac{t_n}{1-t_{n+1}}f(x_n) \tag{$*2$} \] 이 성립한다.
$(*2)$의 양변에 $1 - t_{n+1}$을 곱하고 $t_{n+1}f(x_{n+1})$을 더하면 \begin{align*} &(1 - t_{n+1})f\left( \frac{t_1}{1-t_{n+1}}x_1 + \cdots + \frac{t_n}{1-t_{n+1}}x_n\right) + t_{n+1}f(x_{n+1}) \\[1.5ex] &\rule{40mm}{0mm} > t_1f(x_1) + \cdots + t_nf(x_n) + t_{n+1}f(x_{n+1}) \tag{$*3$} \end{align*} 를 얻는다. $(*3)$의 좌변에서 $x := \frac{t_1}{1-t_{n+1}}x_1 + \cdots + \frac{t_n}{1-t_{n+1}}x_n$로 두고 $x_{n+1} = y$로 두면 $f$가 위로 볼록이므로 \begin{align*} (1 - t_{n+1})f(x) + t_{n+1}f(y) &< f\Bigl((1 - t_{n+1})x + t_{n+1}y\Bigr) \\[1.5ex] &= f(t_1x_1 + \cdots + t_nx_n + t_{n+1}x_{n+1}) \tag{$*4$} \end{align*} 가 성립한다. 이제 $(*4)$와 $(*3)$을 결합하면 원하는 부등식을 얻게 된다.
$x_1 = \cdots = x_n$일 때 $(*1)$의 부등호가 등호 $=$로 바뀌는 것은 아주 쉽게 알 수 있다. 이것의 역은 수학적 귀납법을 사용하여 증명한다.
$n=2$일 때는 볼록함수의 정의에 의해서 성립한다.
$x_1, \ldots, x_n, x_{n+1}$들 중에 적어도 어느 2개의 값이 다르다면 다음의 2가지 경우 중 어느 하나일 것이다.
(1) $x_1, \ldots, x_n$ 중에 어느 2개의 값이 다른 경우에는 귀납가설에 의해서 $(*2)$에서 부등호가 성립하므로 $(*4)$에서도 부등호가 성립한다.
(2) $x_1 = \cdots = x_n \ne x_{n+1}$인 경우에는 $(*3)$에서 부등호가 성립하므로 $(*4)$에서도 부등호가 성립한다. $\Box$
젠센의 부등식을 이용하여 많은 부등식을 증명할 수 있다. 예를 들어 모든 양의 실수들에 대하여 산술평균이 기하평균보다 크거나 같다는 것은 $x\mapsto\log x$가 위로 볼록임을 이용하여 다음과 같이 증명한다. \[ \log\left(\frac{1}{n}x_1 + \cdots + \frac{1}{n}x_n\right) \ge \frac{1}{n}\log x_1 + \cdots + \frac{1}{n}\log x_n = \frac{1}{n}\log(x_1\cdots x_n) \] 양변에 지수함수를 적용하면 \[ \frac{x_1 + \cdots + x_n}{n} \ge \sqrt[n]{x_1\cdots x_n} \]
이 부등식의 등호가 모든 $x_i$들이 같을 때, 그리고 이때만 성립하는 것도 젠센의 부등식의 두 번째 명제에 의해서 알 수 있다.
$\log x$가 위로 볼록인 것은 2계 도함수가 $-\frac{1}{x^2} < 0$인 것으로부터 알 수 있다. (참조: 볼록함수와 2계 도함수)
[홈으로]