Непрерывность и гладкость

Непрерывность

Рассмотрим функцию f(x)f(x). Обозначим также область определения функции f(x)f(x) за DD.

Определение непрерывности функции

Пусть DRD \subset \mathbb{R} и f:DRf: D \to \mathbb{R}. Функция f(x)f(x) непрерывна в точке x0Dx_0 \in D (где x0x_0 — предельная точка DD), если f(x)f(x) имеет предел в точке x0x_0, и этот предел совпадает со значением функции f(x0)f(x_0):

limxx0f(x)=f(x0)\lim\limits_{x \to x_0} f(x) = f(x_0)

Но данное определение характеризует непрерывность функции лишь в конкретной точке. Непрерывность функции на компакте характеризуется следующим свойством:

Функция непрерывна на компакте, если она непрерывна в каждой точке этого компакта.

Непрерывность функции на компакте дает нам множество полезных следствий и теорем, применяемых повсеместно. Одна из ключевых теорем — теорема о промежуточном значении, применяемая в алгоритмах поиска корней уравнений.

Теорема о промежуточном значении (теорема Больцано–Коши)

Если непрерывная на отрезке [a,b][a, b] функция принимает на его концах значения A и B, то она принимает и любое промежуточное значение между A и B.

Рассмотрим функцию g(x)=f(x)Cg(x) = f(x) - C. Она непрерывна на отрезке [a,b][a, b] и g(a)<0,g(b)>0g(a) < 0, g(b) > 0. Покажем, что существует такая точка с[a,b]с \in [a, b], что g(с)=0g(с) = 0. Разделим отрезок [a,b][a, b] точкой x0x_0 на два равных по длине отрезка, тогда либо g(x0)=0g(x_0) = 0 и нужная точка с=x0с = x_0 найдена, либо g(x0)0g(x_0) \ne 0 и тогда на концах одного из полученных промежутков функция g(x)g(x) принимает значения разных знаков (на левом конце меньше нуля, на правом больше). Обозначив полученный отрезок [a1,b1][a_1, b_1], разделим его снова на два равных по длине отрезка и т.д. Тогда, либо через конечное число шагов придем к искомой точке сс, либо получим последовательность вложенных отрезков [an,bn][a_n, b_n]. По свойству системы вложенных отрезков (вложенных отрезков Коши - Кантора) получим, что g(xn)=0g(x_n) = 0, где xnx_n — точка принадлежащая всем отрезкам.

Второй не менее важной теоремой является теорема Вейерштрасса, применяемая в алгоритмах поиска (greed search) и машинном обучении (обучение моделей с регуляризацией).

Теорема Вейерштрасса

Непрерывная на компакте функция ограничена и достигает на нем своих наибольшего и наименьшего значений.

Предположим, что функция f(x)f(x) не грагичена на отрезке [a,b][a, b]. Тогда для любого nNn \in \mathbb{N} существует точка xn[a,b]x_n \in [a, b], такая что f(xn)>n|f(x_n)| > n. Построенная последовательность xn{x_n} ограничена, так как xn[a,b]x_n \in [a, b] для всех nn. По лемме Больцано-Вейерштрасса, из последовательности xn{x_n} можно выделить подпоследовательность xnkx_{nk}, то есть limkxnk=c\lim\limits_{k \to \infty} x_{nk} = c, где c[a,b]c \in [a, b]. Так как f(x)f(x) непрерывна на отрезке [a,b][a, b], то она непрерывна в точке cc, следовательно limkf(xnk)=f(c)\lim\limits_{k \to \infty} f(x_{nk}) = f(c). Однако по построению последовательности xn{x_n}, f(xnk)>nk|f(x_{nk})| > n_k, что противоречит существованию предела limkf(xnk)\lim\limits_{k \to \infty} f(x_{nk}), так как nkn_k \to \infty. Следовательно предположение о неограниченности функции f(x)f(x) на отрезке [a,b][a, b] неверно, и функция f(x)f(x) ограничена на этом отрезке.

Далее, зная что функция ограничена на отрезке, несложно доказать достижение функцией наибольшего и наименьшего значений.

Точки разрыва

Если условие непрерывности функции в точне не выполняется, то данную точку именуют точкой разрыва. В математическом анализе точки разрыва функции классифицируются в зависимости от поведения пределов функции слева и справа в данной точке.

Основные типы точек разрыва:

Точка разрыва первого рода

Разрыв первого рода

Функция f(x)f(x) имеет разрыв первого рода в точке x=ax = a , если существуют конечные односторонние пределы

limxaf(x)=L1иlimxa+f(x)=L2,\lim\limits_{x \to a^{-}} f(x) = L_1 \quad \text{и} \quad \lim\limits_{x \to a^{+}} f(x) = L_2,

Но хотя бы один из них не равен значению функции f(a)f(a) либо функция f(a)f(a) не определена.

Пример: f(x)=sin(x)/xf(x) = \sin(x)/x в точке x=0x = 0. Предел равен 1, но функция не определена.

Разрывы первого рода делятся на два подтипа:

  • Устранимый разрыв: если L1=L2L_1 = L_2, но f(a)f(a) либо не определено, либо не равно этому общему пределу.

  • Неустранимый разрыв (скачок): если L1L2L_1 \ne L_2

Точка разрыва второго рода

Разрыв второго рода

Функция f(x)f(x) имеет разрыв второго рода в точке x=ax = a , если хотя бы один из односторонних пределов не существует или бесконечен.

    Пример разрыва второго рода:

  • Вертикальная асимптота: f(x)=1/xf(x) = 1/x в точке x=0x = 0

Непрерывность функций многих переменных

Рассмотрим функцию f(x)f(x), где x=(x1,x2,...,xn)Rnx = (x_1, x_2,...,x_n) \in \mathbb{R^n}. Обозначим также область определения функции f(x)f(x) за DRnD \subset \mathbb{R^n}.

Определение непрерывности (через предел)

Пусть DRnD \subset \mathbb{R^n} и f:DRf: D \to \mathbb{R}. Функция f(x)f(x) непрерывна в точке aDa \in D (где aa — предельная точка DD), если f(x)f(x) имеет предел в точке aa, и этот предел совпадает со значением функции f(a)f(a):

limxaf(x)=f(a)\lim\limits_{x \to a} f(x) = f(a)

Определение непрерывности функции многих переменных дается и при помощи нормы. Определять непрерывность функции многих переменных по каждой переменной отдельно нельзя!

Например рассмотрим функцию двух переменных f(x,y):R2Rf(x,y): \mathbb{R^2} \to \mathbb{R}:

f(x,y)={xyx2+y2,если (x,y)(0,0),0,если (x,y)=(0,0).f(x,y)= \begin{cases} \dfrac{xy}{x^2 + y^2}, & \text{если } (x, y) \ne (0, 0),\\ 0, & \text{если } (x, y) = (0, 0). \end{cases}

При проверке на непрерывность в (0,0)(0, 0) отдельно по xx и yy получаем, что функция непрерывна, но при проверке на непрерывность по норме, получим, что в точке (0,0)(0, 0) функция разрывна. Значит непрерывности по отдельным координатам не достаточно!

Наиболее часто применяется евклидова норма: xa=(x1a1)2+(x2a2)2+...+(xnan)2\|x - a\| = \sqrt{(x_1 - a_1)^2 + (x_2 - a_2)^2 +...+ (x_n - a_n)^2}. Тогда определение непрерывности имеет вид:

Определение непрерывности (через норму)

ε>0δ>0:xD,xa<δf(x)f(a)<ε\forall\, \varepsilon > 0 \exists\, \delta > 0: \forall\, x \in D, ||x-a||<\delta \Rightarrow |f(x)-f(a)|<\varepsilon

Аналогично функциям одной переменной, функция f(x)f(x) называется непрерывной на множестве DD, если она непрерывна в каждой точке этого множества. Также для f(x)f(x) справедливы аналоги теорем для одной переменной:

Теорема о промежуточном значении (теорема Больцано–Коши)

Если f(x)f(x) непрерывная на связном множестве DRnD \subset \mathbb{R^n} и f(a)=A,f(b)=Bf(a)=A, f(b)=B, то для любого CC между AA и BB найдется сDс \in D, такое что f(c)=Cf(c)=C

Теорема Вейерштрасса

Непрерывная на компакте функция ограничена и достигает на нем своих наибольшего и наименьшего значений.

Непрерывность функций комплексных переменных

Рассмотрим функцию f(z)f(z), где z=x+iyCz = x + iy \in \mathbb{C}. Обозначим также область определения функции f(z)f(z) за DCD \subset \mathbb{C}.

Определение непрерывности (через предел)

Пусть DCD \subset \mathbb{C} и f:DCf: D \to \mathbb{C}. Функция f(z)f(z) непрерывна в точке z0Dz_0 \in D (где z0z_0 — предельная точка DD), если f(z)f(z) имеет предел в точке z0z_0, и этот предел совпадает со значением функции f(z0)f(z_0):

limzz0f(z)=f(z0)\lim\limits_{z \to z_0} f(z) = f(z_0)

Вместо модуля разности действительных чисел (функции одной переменной) или евклидовой нормы (функции многих переменных), в функциях комплексных переменных используется модуль комплексного числа: zz0=(xx0)2+(yy0)2|z - z_0| = \sqrt{(x - x_0)^2 + (y - y_0)^2}. Тогда определение непрерывности имеет вид:

Определение непрерывности (через модуль)

ε>0δ>0:xD,zz0<δf(z)f(z0)<ε\forall\, \varepsilon > 0 \exists\, \delta > 0: \forall\, x \in D, |z-z_0|<\delta \Rightarrow |f(z)-f(z_0)|<\varepsilon

Полюсы в комплексном анализе

В отличие от вещественного анализа, где разрывы классифицируются как первого и второго рода, в комплексном анализе используется понятие полюса.

Полюс функции

    Точка z0Cz_0 \in \mathbb{C} называется полюсом функции f(z)f(z), если:

  1. f(z)f(z) не определена в точке z0z_0

  2. limzz0f(z)=\lim\limits_{z \to z_0} |f(z)| = \infty

  3. Существует целое число n>0n > 0 и такая функция g(z)g(z), голоморфная (аналитичная) в некоторой окрестности точки z0z_0, что

    • f(z)=g(z)/(zz0)nf(z)=g(z)/(z-z_0)^n

    • g(z0)0g(z_0) \neq 0

Число nn из определения называется порядком полюса. Если n=1n = 1, полюс называется простым.

Характеризация полюса через ряд Лорана

Точка z0z_0 является полюсом порядка nn функции f(z)f(z) тогда и только тогда, когда в ряду Лорана функции f(z)f(z) в окрестности точки z0z_0 главная часть (часть с отрицательными степенями) содержит конечное число членов, и старшая отрицательная степень равна n-n:

f(z)=k=nak(zz0)k,an0f(z) = \sum\limits_{k=-n}^{\infty} a_k (z-z_0)^k, \quad a_{-n} \neq 0

Рассмотрим несколько характерных примеров:

  1. Функция f(z)=1zf(z) = \frac{1}{z} имеет простой полюс в точке z=0z = 0.

  2. Функция f(z)=1(z1)3f(z) = \frac{1}{(z-1)^3} имеет полюс третьего порядка в точке z=1z = 1.

  3. Функция f(z)=z+2z21=z+2(z1)(z+1)f(z) = \frac{z+2}{z^2-1} = \frac{z+2}{(z-1)(z+1)} имеет простые полюсы в точках z=1z = 1 и z=1z = -1:

Дифференцируемость

Непрерывность — необходимое условие не менее важного свойства функции — дифффиренцируемости.

Пусть функция f(x)f(x) определена в некоторой окрестности точки x0x_0 Тогда:

Дифференцируемость функции одной переменной

Функция f(x)f(x) называется дифференцируемой в точке x0x_0, если ее приращение в этой точке можно представить в виде:

Δy=f(x0+Δx)f(x0)=AΔx+o(Δx),приΔx0\Delta y = f(x_0 + \Delta x)-f(x_0) = A\Delta x + o(\Delta x), {при} \Delta x \to 0

Главная, линейная часть приращения AΔxA \Delta x называется дифференциалом функции и обозначается dydy или df(x0)df(x_0)

Число AA в этом определении равно значению производной функции в точке x0x_0, то есть A=f(x0)A = f'(x_0)

Из определения дифференцируемости не сложно вывести теорему Ролля:

Теорема Ролля

Пусть функция f(x)f(x), дифференцируема на (a,b)(a,b), непрерывна на [a,b][a,b] и f(a)=f(b)f(a) = f(b). Тогда существует хотя бы одна точка c(a,b)c \in (a,b), такая что производная функции в этой точке равна нулю.

Рассмотрим два случая:

  1. Случай 1: Функция f(x)f(x) постоянна на отрезке [a,b][a, b]. Тогда для любой точки c(a,b)c \in (a, b) производная f(c)=0f'(c) = 0.

  2. Случай 2: Функция f(x)f(x) не является постоянной. По теореме Вейерштрасса, непрерывная на компакте функция достигает своих наибольшего и наименьшего значений, то есть имеет в этой точке локальный экстремум, производная которого равна нулю.

Таким образом, в обоих случаях существует точка c(a,b)c \in (a, b), для которой f(c)=0f'(c) = 0. Теорема доказана.

Из теоремы Ролля, в свою очередь получаем теорему о среднем значении (Теорема Лагранжа):

Теорема о среднем значении (Теорема Лагранжа)

Если функция непрерывна на [a,b][a, b] и дифференцируема на (a,b)(a, b), то найдется точка с(a,b)с \in (a, b), такая что f(с)=(f(b)f(a))/(ba)f'(с) = (f(b) - f(a)) / (b - a)

Рассмотрим вспомогательную функцию:

g(x)=f(x)f(a)f(b)f(a)ba(xa)g(x) = f(x) - f(a) - \frac{f(b) - f(a)}{b - a}(x - a)
Эта функция удовлетворяет условиям теоремы Ролля:

  1. Непрерывность на [a,b][a, b]: Функция g(x)g(x) является линейной комбинацией непрерывных функций f(x)f(x) и xx, поэтому непрерывна на [a,b][a, b].

  2. Дифференцируемость на (a,b)(a, b): Функция g(x)g(x) дифференцируема на (a,b)(a, b), так как f(x)f(x) дифференцируема, а остальные слагаемые — линейные.

  3. Равенство значений на концах:

    g(a)=f(a)f(a)f(b)f(a)ba(aa)=0g(a) = f(a) - f(a) - \frac{f(b) - f(a)}{b - a}(a - a) = 0
    g(b)=f(b)f(a)f(b)f(a)ba(ba)=0g(b) = f(b) - f(a) - \frac{f(b) - f(a)}{b - a}(b - a) = 0
    Следовательно, g(a)=g(b)g(a) = g(b).

По теореме Ролля существует точка c(a,b)c \in (a, b), такая что g(c)=0g'(c) = 0. Найдем производную:

g(x)=f(x)f(b)f(a)bag'(x) = f'(x) - \frac{f(b) - f(a)}{b - a}
Приравнивая к нулю в точке cc, получаем:
f(c)=f(b)f(a)baf'(c) = \frac{f(b) - f(a)}{b - a}
Теорема доказана.

Гладкость

Понятие гладкости уточняет и усиливает понятие непрерывности.

Понятие гладкости

Функция называется гладкой (или гладкой класса C1C^1 на интервале), если она непрерывно дифференцируема на этом интервале. Это означает:

  1. Она дифференцируема в каждой точке (т.е. существует производная f(x)f'(x))

  2. Ее производная f(x)f'(x) является непрерывной функцией.

Гладкая функция не только непрерывна, но и не имеет "углов" или "изломов". Ее график — плавная, изгибающаяся кривая с непрерывно меняющимся наклоном касательной.

Классы гладкости

    C-классификация — инструмент для классификации функций по степени их гладкости.

  • Класс C0C^0: Множество всех непрерывных функций.

  • Класс C1C^1: Функции, которые имеют непрерывную первую производную. Это гладкие функции в базовом смысле.

  • Класс Cn(nN)C^n (n \in \mathbb{N}): Функции, которые имеют непрерывные производные до порядка n включительно.

  • Класс CC^{\infty}: Функции, имеющие непрерывные производные всех порядков. Такие функции называются бесконечно дифференцируемыми.

Иерархия гладкости

Иерархия гладкости имеет вид:

C...C2C1C0C^{\infty} \subset . . . \subset C^2 \subset C^1 \subset C^0

Чем выше класс, тем более гладкая функция.