Липшицевая функция
Пусть есть два метрических пространства A с метрикой dA и B с метрикой dB.
Функция f:A→B называется L-липшицевой,
если для любых x,y∈A
dB(f(x),f(y))⩽L⋅dA(x,y) Более естественное определение для отображения f:A→B для нормированных векторных пространств A и B
∥f(x)−f(y)∥⩽L⋅∥x−y∥ Квадратичное ограничение сверху для липшицевой гладкости
Пусть у функции f:Rn→R градиент ∇f является L-липшицевым:
∥∇f(y)−∇f(x)∥⩽L⋅∥y−x∥для всех x,y∈Rn Тогда для всех x,y∈Rn верно неравенство
f(y)⩽f(x)+∇f(x)T⋅(y−x)+2L⋅∥y−x∥2 Выберем x,y∈Rn — две произвольные точки.
Посмотри на функцию φ(t)=f(x+t⋅(y−x)) при 0⩽t⩽1.
Можем записать f(y)−f(x) через эту функцию
f(y)−f(x)=0∫1φ′(t)dt=0∫1∇f(x−t⋅(y−x))T⋅(y−x)dt Добавляя и вычитая ∇f(x)T⋅(y−x), получаем формулу
f(y)−f(x)=∇f(x)T⋅(y−x)+0∫1(∇f(x−t⋅(y−x))−∇f(x))T⋅(y−x)dt Применяя неравенство Коши-Шварца и липшицевость градиента, получаем
(∇f(x−t⋅(y−x))−∇f(x))T⋅(y−x)⩽∇f(x−t⋅(y−x))−∇f(x)⋅∥y−x∥⩽⩽L⋅∥x−t⋅(y−x)−x∥⋅∥y−x∥==L⋅t⋅∥y−x∥2 Применяем полученное неравенство для оценки интеграла
f(y)−f(x)⩽∇f(x)T⋅(y−x)+0∫1L⋅t⋅∥y−x∥2dt=∇f(x)T⋅(y−x)+2L⋅∥y−x∥2 Получили требуемый результат
f(y)⩽f(x)+∇f(x)T⋅(y−x)+2L⋅∥y−x∥2