Билинейные и квадратичные формы

Билинейные формы

Билинейная форма

Пусть $L$ — векторное пространство над полем $K$ . Билинейной формой называется отображение $F \colon L \times L \to K$ , линейное по каждому из аргументов и подчиняющееся правилам дистрибутивнисти:

F(x+z,y)=F(x,y)+F(z,y)

F(x,y+z)=F(x,y)+F(x,z)

и однородности:

F(\lambda x,y)=\lambda F(x,y)

F(x,\lambda y)=\lambda F(x,y)

для всех $x, y, z \in L$ и $\lambda \in K$ .

Рассмотрим любое пространство конечной размерности, например $\mathbb{R}^n$ . Выберем в пространстве произвольный базис $\EEE = (\e_1, \e_2, \dotsc, \e_n)$ и возьмём два произвольных вектора $x = (x_1, x_2, \dotsc, x_n)$ и $y = (y_1, y_2, \dotsc, y_n)$ .

Векторы $x$ и $y$ можно представить в виде $x_1 e_1+x_2 e_2+\dotsc+x_n e_n$ и $y_1 e_1 + y_2 e_2 + \dotsc + y_n e_n$ соответственно.

Теперь подставим их в $F(x,y)$ , применяя правила дистрибутивности и однородности, описанные выше.

Получим,что

F(x,y)=x_1 y_1 F(e_1, e_1) + x_1 y_2 F(e_1, e_2) + \dotsc + x_1 y_n F(e_1, e_n) + \dotsc + x_n y_n F(e_n, e_n)

Где $F(e_i,e_j)$ — элементы поля $K$ . Для удобства давайте обозначим их как $a_{ij} = F(e_i,e_j)$ .

Тогда

F(x,y) = \sum\limits_{i,j=1}^n a_{ij} x_i y_j = x^\T A y

Матрица $A$ имеет вид

A = \pmatrix{ a_{1, \- 1} & a_{1, \- 2} & \cdots & a_{1, \- n} \\ a_{2, \- 1} & a_{2, \- 2} & \cdots & a_{2, \- n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n, \- 1} & a_{n, \- 2} & \cdots & a_{n, \- n} }

и называется матрицей билинейной формы.

Матрица билинейной формы

В конечномерном пространстве при выбранном базисе $e_1, e_2, \dotsc, e_n$ любая билинейная форма однозначно определяется матрицей билинейной формы.

Очевидно, что при выборе другого базиса $\EEE' = (\e_1', \e_2', \dotsc, \e_n')$ билинейная форма будет определена матрицей $A'$ . Найдём взаимосвязь между матрицами билинейной формы в разных базисах:

Преобразование матрицы при замене базиса

Пусть $A$ — матрица билинейной формы $F$ в базисе $\EEE = (\e_1, \e_2, \dotsc, \e_n)$ , и $C$ — матрица перехода к новому базису $\EEE' = (\e_1', \e_2', \dotsc, \e_n')$ . Тогда матрица $A'$ билинейной формы $F$ в новом базисе равна

A' = C^\T A C

Пусть $x$ и $y$ — координатные столбцы векторов в старом базисе, а $x'$ и $y'$ — в новом базисе. Тогда

x = C x', \quad y = C y'

Подставляя в выражение для билинейной формы получим:

F(x, y) = x^\T A y = (C x')^\T A (C y') = (x')^\T (C^\T A C) y'

Следовательно, матрица формы в новом базисе действительно равна $C^\T A C$ .

Симметричные билинейные формы

Симметричная билинейная форма

Билинейная форма $F$ называется симметричной, если

F(x, y) = F(y, x) \quad \text{для всех} \quad x, y \in L

Для симметричной билинейной формы матрица $A$ всегда симметрична: $a_{ij} = F(e_i, e_j) = F(e_j, e_i) = a_{ji}$ , то есть $A^\T = A$ .

Существование ортогонального базиса

Для любой симметричной билинейной формы $F$ на конечномерном пространстве над полем с характеристикой $K \neq 2$ существует базис, в котором её матрица диагональна:

A = \pmatrix{ a_{1, \- 1} & 0 & \cdots & 0 \\ 0 & a_{2, \- 2} & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_{n, \- n} }

Такой базис называется ортогональным базисом относительно формы $F$ .

Доказательство проводим индукцией по размерности пространства $n = \dim L$ .

База индукции ( $n = 1$ )

Если $\dim L = 1$ , то в единственном базисе $\{e_1\}$ матрица формы имеет вид $A = (F(e_1, e_1))$ , то есть уже диагональна. Утверждение верно.

Шаг индукции

Пусть утверждение верно для всех пространств размерности $n-1$ . Рассмотрим пространство $L$ размерности $n \geq 2$ с симметричной билинейной формой $F$ и её матрицей $A$ в базисе $\EEE = (e_1, \dots, e_n)$ :

A = \pmatrix{ a_{1, \- 1} & a_{1, \- 2} & \cdots & a_{1, \- n} \\ a_{2, \- 1} & a_{2, \- 2} & \cdots & a_{2, \- n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n, \- 1} & a_{n, \- 2} & \cdots & a_{n, \- n} }

$F \equiv 0$ .

Если $F(x, y) = 0$ для всех $x, y \in L$ , то матрица $A$ — нулевая, а значит, диагональна в любом базисе. Утверждение верно.
$F \not\equiv 0$

Рассмотрим два подслучая:
1. Пусть существует вектор $v \in L$ , для которого $F(v, v) \neq 0$ . Без ограничения общности считаем, что $F(e_1, e_1) \neq 0$ (иначе перенумеруем базис или заменим $e_1$ на вектор $v$ , где $v$ — любой вектор пространства, для которого $F(v, v) \neq 0$ . Для каждого $k = 2, \dots, n$ выполним преобразование базиса:
  $e_k' = e_k - \frac{F(e_1, e_k)}{F(e_1, e_1)} e_1$
  Матрица перехода $C$ к новому базису $\EEE' = (e_1, e_2', \dots, e_n')$ имеет вид:
  $C = \pmatrix{ 1 & 0 & \cdots & 0 \\ -\frac{a_{12}}{a_{11}} & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ -\frac{a_{1n}}{a_{11}} & 0 & \cdots & 1 }$
  По теореме о преобразовании матрицы при замене базиса:
  $A' = C^\T A C$
  Прямым вычислением проверяем, что $A'$ имеет блочную структуру:
  $A' = \pmatrix{ a_{11} & 0 \\ 0 & B }$
  где $B$ — симметричная матрица размера $(n-1) \times (n-1)$ . По предположению индукции существует матрица $D$ размера $(n-1) \times (n-1)$ , такая что $D^\T B D$ диагональна. Дополняем $D$ до матрицы $C'$ размера $n \times n$ :
  $C' = \pmatrix{ 1 & 0 \\ 0 & D }$
  Тогда матрица $C_{\text{итог}} = C \cdot C'$ преобразует $A$ к диагональному виду:
  $C_{\text{итог}}^\T A C_{\text{итог}} = (C')^\T (C^\T A C) C' = \pmatrix{ a_{11} & 0 \\ 0 & D^\T B D }$
2. Рассмотрим случай, когда $F(v, v) = 0$ для всех $v \in L$ . Поскольку $F$ симметрична и характеристика $K \neq 2$ , из тождества
  $F(x, y) = \frac{1}{2} \left[ F(x+y, x+y) - F(x, x) - F(y, y) \right]$
  следует, что $F \equiv 0$ , что противоречит условию $F \not\equiv 0$ . Следовательно, этот подслучай невозможен.

Во всех возможных случаях построена матрица перехода $C_{\text{итог}}$ , такая что $C_{\text{итог}}^\T A C_{\text{итог}}$ диагональна. Следовательно, в базисе, соответствующем этой матрице перехода, матрица формы $F$ диагональна. По принципу математической индукции утверждение верно для всех $n \geq 1$ .

Важное замечание

Условие $\operatorname{char}(K) \neq 2$ критически важно. Например, над полем $\mathbb{F}_2$ симметричная билинейная форма с матрицей

\pmatrix{0 & 1 \\ 1 & 0}

не допускает ортогонального базиса.

Квадратичные формы

Квадратичная форма

Пусть $L$ — векторное пространство над полем $K$ , и $\EEE = (e_1, \dots, e_n)$ — базис в $L$ . Отображение $Q \colon L \to K$ называется квадратичной формой, если её можно представить в виде

Q(x) = \sum\limits_{i,j=1}^n a_{ij} x_i x_j

где $x = x_1 e_1+x_2 e_2+\dotsc+x_n e_n$ , а $a_{ij}$ — некоторые элементы поля $K$ .

Аналогично билинейным формам, квадратичную форму можно представить в виде $x^\T A x$ , где $A$ — матрица квадратичной формы.

В случае, если характеристика поля $K$ не равна 2, можно считать, что матрица квадратичной формы симметрична, то есть $a_{ij} = a_{ji}$ . Так, например, квадратичную форму от двух переменных обычно записывают в виде

Q(x_1,x_2)=a_{11}x_1^2+a_{12}x_1x_2+a_{22}x_2^2

При замене базиса, матрица квадратичной формы $A$ изменяется аналогично матрице билинейной формы

A' = C^\T A C

где $C$ — матрица перехода к новому базису, а $A'$ — матрица квадратичной формы в новом базисе.

Метод Лагранжа приведения к каноническому виду

Каноническим видом квадратичной формы называется выражение, содержащее только квадраты переменных:

Q(x) = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \dotsb + \lambda_n y_n^2

где $y_1, y_2, \dotsc, y_n$ — новые переменные, линейно выражающиеся через старые.

Метод Лагранжа

Любую квадратичную форму над полем характеристики $\operatorname{char}(K) \neq 2$ невырожденным линейным преобразованием можно привести к каноническому виду.

Алгоритм метода Лагранжа:

Если в квадратичной форме есть ненулевой диагональный элемент $a_{ii} \neq 0$ , выделяем полный квадрат по соответствующей переменной
Если все диагональные элементы нулевые, но есть ненулевой недиагональный элемент $a_{ij} \neq 0$ , делаем замену $x_i = y_i + y_j$ , $x_j = y_i - y_j$
Повторяем процедуру для оставшихся переменных

Доказательство проводим индукцией по размерности пространства $n = \dim L$ над полем $K$ , где $\operatorname{char}(K) \neq 2$ .

База индукции ( $n = 1$ )

Квадратичная форма имеет вид $Q(x) = a_{11}x_1^2$ , что уже является каноническим видом. Матрица перехода — единичная, следовательно, преобразование невырожденное.

Шаг индукции

Пусть утверждение верно для всех пространств размерности $n-1$ . Рассмотрим квадратичную форму $Q(x_1, \dots, x_n) = \sum\limits_{i,j=1}^n a_{ij}x_i x_j$ в базисе $\EEE = (e_1, \dots, e_n)$ с симметричной матрицей $A = (a_{ij})$ (поскольку $\operatorname{char}(K) \neq 2$ , мы можем считать матрицу симметричной).

$Q \equiv 0$

В этом случае матрица $A$ нулевая, и форма уже имеет канонический вид. Утверждение верно.
$Q \not\equiv 0$

Рассмотрим два подслучая:
1. Существует индекс $i$ , для которого $a_{ii} \neq 0$ . Без ограничения общности положим $a_{11} \neq 0$ (иначе перенумеруем переменные). Выделим полный квадрат по переменной $x_1$ :
  $Q = a_{11}\left(x_1 + \sum\limits_{j=2}^n \frac{a_{1j}}{a_{11}}x_j\right)^2 + Q'(x_2, \dots, x_n)$
  где $Q'$ — квадратичная форма от $n-1$ переменной. Сделаем линейную замену:
  $y_1 = x_1 + \sum\limits_{j=2}^n \frac{a_{1j}}{a_{11}}x_j, \quad y_k = x_k \quad (k \geq 2)$
  Матрица перехода $C$ к новому базису $\EEE' = (e_1', \dots, e_n')$ имеет вид:
  $C = \pmatrix{ 1 & \frac{a_{12}}{a_{11}} & \cdots & \frac{a_{1n}}{a_{11}} \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 }$
  Её определитель $\det(C) = 1 \neq 0$ , следовательно, преобразование невырожденное. В новом базисе форма принимает вид $Q = a_{11}y_1^2 + Q'(y_2, \dots, y_n)$ . По предположению индукции $Q'$ приводится к каноническому виду невырожденным преобразованием $C'$ размера $(n-1) \times (n-1)$ . Дополним $C'$ до матрицы $C''$ размера $n \times n$ :
  $C'' = \pmatrix{ 1 & 0 \\ 0 & C'}$
  Тогда общая матрица перехода $C_{\text{итог}} = C \cdot C''$ невырожденна, так как $\det(C_{\text{итог}}) = \det(C) \cdot \det(C'') \neq 0$ , и форма принимает канонический вид.
2. Все диагональные элементы $a_{ii} = 0$ , но существует $a_{ij} \neq 0$ для $i \neq j$ . Без ограничения общности положим $a_{12} \neq 0$ (иначе перенумеруем переменные). Сделаем замену переменных:
  $x_1 = y_1 + y_2, \quad x_2 = y_1 - y_2, \quad x_k = y_k \quad (k \geq 3)$
  Подставляя в форму, получаем:
  $Q = a_{12}(y_1^2 - y_2^2) + \sum\limits_{k=3}^n 2a_{1k}y_1y_k + \sum\limits_{k=3}^n 2a_{2k}y_2y_k + \dots$
  Теперь коэффициенты при $y_1^2$ и $y_2^2$ ненулевые. Матрица перехода $C$ для первых двух переменных:
  $C' = \pmatrix{ 1 & 1 \\ 1 & -1 }$
  имеет определитель $\det(C') = -2 \neq 0$ (так как $\operatorname{char}(K) \neq 2$ ), а для остальных переменных — единичная матрица. Общая матрица перехода:
  $C = \pmatrix{ 1 & 1 & 0 & \cdots & 0 \\ 1 & -1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 }$
  невырожденна. После замены форма содержит ненулевые квадратичные члены, и мы сводим задачу к первому подслучаю.

Во всех случаях построено явное невырожденное линейное преобразование, приводящее форму к каноническому виду. По принципу математической индукции утверждение верно для всех $n \geq 1$ при условии $\operatorname{char}(K) \neq 2$ .

Закон инерции Сильвестра

Для любой квадратичной формы число положительных, отрицательных и нулевых коэффициентов в каноническом виде не зависит от способа приведения.

Сигнатура квадратичной формы

Сигнатурой квадратичной формы называется упорядоченная пара чисел $(p, q)$ , где:

$p$ — число квадратов с положительными коэффициентами в каноническом виде
$q$ — число квадратов с отрицательными коэффициентами в каноническом виде

Закон инерции утверждает, что сигнатура является инвариантом квадратичной формы и не зависит от выбора базиса, в котором форма приводится к каноническому виду.

Пусть квадратичная форма $Q$ имеет два канонических представления:

Q = \sum\limits_{i=1}^p \lambda_i y_i^2 - \sum\limits_{j=1}^q \mu_j z_j^2 = \sum\limits_{k=1}^r \alpha_k u_k^2 - \sum\limits_{l=1}^s \beta_l v_l^2

где $\lambda_i, \mu_j, \alpha_k, \beta_l > 0$ . Докажем, что $p = r$ и $q = s$ .

Шаг 1. Положительно определённые подпространства

В первом представлении рассмотрим подпространство $V = \{z_1 = \dots = z_q = 0\}$ . На $V$ форма принимает вид $Q_V = \sum\limits_{i=1}^p \lambda_i y_i^2$ и удовлетворяет условию $Q_V > 0$ для всех ненулевых векторов, то есть $V$ — положительно определённое подпространство размерности $p$ .

Во втором представлении любое положительно определённое подпространство имеет размерность, не превосходящую $r$ , так как только первые $r$ переменных дают положительные значения. Следовательно:

p \leq r

Шаг 2. Симметричный аргумент

Аналогично, во втором представлении рассмотрим подпространство $W = \{v_1 = \dots = v_s = 0\}$ . На $W$ форма положительно определена ( $Q_W > 0$ ) и $\dim W = r$ . В первом представлении максимальная размерность положительно определённого подпространства равна $p$ , поэтому:

r \leq p

Шаг 3. Инвариантность $p$ и $q$

Из неравенств $p \leq r$ и $r \leq p$ следует $p = r$ . Для отрицательных коэффициентов рассуждение аналогично: рассматриваем отрицательно определённые подпространства $\{y_1 = \dots = y_p = 0\}$ и $\{u_1 = \dots = u_r = 0\}$ , откуда получаем $q = s$ .

Для вырожденных форм (с нулевыми коэффициентами) ранг $r = p + q$ инвариантен, поэтому количество нулевых коэффициентов $n - r$ также не зависит от выбора базиса.

Положительно определенные матрицы

Положительно определенная матрица

Симметричная матрица $A$ называется положительно определенной, если соответствующая ей квадратичная форма положительно определена:

x^\T A x > 0 \quad \text{для всех } x \neq 0

Аналогично определяются:

Отрицательно определенная: $x^\T A x < 0$ для всех $x \neq 0$
Положительно полуопределенная: $x^\T A x \geq 0$ для всех $x$
Отрицательно полуопределенная: $x^\T A x \leq 0$ для всех $x$

Критерий Сильвестра

Симметричная матрица $A$ положительно определена тогда и только тогда, когда все её главные миноры положительны:

\begin{align*} \Delta_1 &= a_{11} > 0 \\ \Delta_2 &= \begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix} > 0 \\ &\vdots \\ \Delta_n &= \det A > 0 \end{align*}

Необходимость: Если $A$ положительно определена, то она положительно определена и на любом подпространстве. В частности, для векторов с первыми $k$ координатами, соответствующий главный минор должен быть положительным.

Достаточность: Докажем индукцией по размерности матрицы. Для $n=1$ утверждение очевидно.

Предположим, что для матриц размера $n-1$ критерий верен. Рассмотрим матрицу $A$ размера $n$ с положительными главными минорами.

По предположению индукции, левый верхний блок размера $n-1$ положительно определен. Выполним блочное $LDL^\T$ -разложение:

A = \begin{pmatrix} A_{n-1} & b \\ b^\T & a_{nn} \end{pmatrix} = \begin{pmatrix} I & 0 \\ b^\T A_{n-1}^{-1} & 1 \end{pmatrix} \begin{pmatrix} A_{n-1} & 0 \\ 0 & \delta \end{pmatrix} \begin{pmatrix} I & A_{n-1}^{-1} b \\ 0 & 1 \end{pmatrix}

где $I$ — единичная матрица $(n-1) \times (n-1)$ , а $\delta = a_{nn} - b^\T A_{n-1}^{-1} b$ . Так как $\det A = \det A_{n-1} \cdot \delta > 0$ и $\det A_{n-1} > 0$ , то $\delta > 0$ . Следовательно, матрица $A$ положительно определена.

Спектральная теорема и приведение к главным осям

Спектральная теорема для симметричных матриц

Для любой симметричной матрицы $A$ существует ортогональная матрица $Q$ такая, что

Q^\T A Q = \Lambda = \operatorname{diag}(\lambda_1, \lambda_2, \dotsc, \lambda_n)

где $\lambda_1, \dotsc, \lambda_n$ — собственные числа матрицы $A$ .

Доказательство проводим индукцией по размерности матрицы $n$ над полем вещественных чисел.

База индукции ( $n = 1$ )

Для матрицы размера $1 \times 1$ , $A = (a_{11})$ , утверждение очевидно: $Q = (1)$ , $\Lambda = (a_{11})$ .

Шаг индукции

Предположим, что теорема верна для всех симметричных матриц размерности $(n-1) \times (n-1)$ . Докажем её для симметричной матрицы $A$ размера $n \times n$ над полем $\mathbb{R}$ ( $n \geq 2$ ).

$A = 0$

Если матрица $A$ нулевая, то она уже диагональна. В качестве ортогональной матрицы $Q$ можно взять единичную матрицу. Утверждение верно.
$A \neq 0$

Рассмотрим характеристический многочлен матрицы $A$ :
$p(\lambda) = \det(A - \lambda I)$
Так как коэффициенты многочлена $p(\lambda)$ вещественны, комплексные корни встречаются сопряженными парами. Покажем, что все корни характеристического уравнения вещественны.

Пусть $\lambda$ — собственное значение матрицы $A$ , а $v$ — соответствующий собственный вектор ( $v \neq 0$ ). Тогда $Av = \lambda v$ . Рассмотрим скалярное произведение:
$(Av, v) = (\lambda v, v) = \lambda (v, v)$
С другой стороны, используя симметричность матрицы $A$ ( $A^\T = A$ ):
$(Av, v) = (v, A^\T v) = (v, Av) = (v, \lambda v) = \overline{\lambda} (v, v)$
Сравнивая полученные выражения, имеем $\lambda (v, v) = \overline{\lambda} (v, v)$ . Так как $(v, v) > 0$ , то $\lambda = \overline{\lambda}$ , то есть $\lambda$ — вещественное число.

Таким образом, существует хотя бы одно вещественное собственное значение $\lambda_1$ и соответствующий ему собственный вектор $v_1$ ( $v_1 \neq 0$ ). Нормируем вектор $v_1$ , то есть заменим его на $e_1 = \frac{v_1}{\|v_1\|}$ , где $\|v_1\| = \sqrt{(v_1, v_1)}$ . Тогда $\|e_1\| = 1$ и $Ae_1 = \lambda_1 e_1$ .

Дополним вектор $e_1$ до ортонормированного базиса $e_1, e_2, \dotsc, e_n$ пространства $\mathbb{R}^n$ . Это можно сделать, например, с помощью процесса Грама-Шмидта. Составим матрицу $Q_1$ , столбцами которой являются векторы этого базиса:
$Q_1 = \pmatrix{ e_1 & e_2 & \cdots & e_n }$
Матрица $Q_1$ ортогональна ( $Q_1^\T Q_1 = I$ ), так как её столбцы образуют ортонормированный базис.

Рассмотрим матрицу $Q_1^\T A Q_1$ :
$Q_1^\T A Q_1 = \pmatrix{ e_1^\T A e_1 & e_1^\T A e_2 & \cdots & e_1^\T A e_n \\ e_2^\T A e_1 & e_2^\T A e_2 & \cdots & e_2^\T A e_n \\ \vdots & \vdots & \ddots & \vdots \\ e_n^\T A e_1 & e_n^\T A e_2 & \cdots & e_n^\T A e_n}$
Упростим элементы этой матрицы, используя свойства собственных векторов и симметричности $A$ :

$e_1^\T A e_1 = e_1^\T (\lambda_1 e_1) = \lambda_1 (e_1^\T e_1) = \lambda_1$ , так как $\|e_1\| = 1$ .

Для $k \geq 2$ :
$e_1^\T A e_k = (A^\T e_1)^\T e_k = (A e_1)^\T e_k = (\lambda_1 e_1)^\T e_k = \lambda_1 (e_1^\T e_k) = 0$
так как векторы $e_1$ и $e_k$ ортогональны ( $e_1^\T e_k = 0$ ). Аналогично, $e_k^\T A e_1 = 0$ для $k \geq 2$ .

Обозначим блок правого нижнего угла как $B$ , то есть $B = (e_i^\T A e_j)_{i,j=2}^n$ . Матрица $B$ симметрична, так как $A$ симметрична и:
$b_{ij} = e_i^\T A e_j = (A^\T e_i)^\T e_j = (A e_i)^\T e_j = e_j^\T A e_i = b_{ji}$
Таким образом, матрица $Q_1^\T A Q_1$ имеет вид:
$Q_1^\T A Q_1 = \pmatrix{ \lambda_1 & 0^\T \\ 0 & B}$
где $0$ — нулевой вектор размерности $n-1$ , а $B$ — симметричная матрица размера $(n-1) \times (n-1)$ .

По предположению индукции для матрицы $B$ существует ортогональная матрица $R$ размера $(n-1) \times (n-1)$ , такая что:
$R^\T B R = \operatorname{diag}(\lambda_2, \lambda_3, \dotsc, \lambda_n)$
где $\lambda_2, \dotsc, \lambda_n$ — собственные значения матрицы $B$ (и, следовательно, матрицы $A$ , так как собственные значения инвариантны относительно ортогональных преобразований).

Построим матрицу $Q_2$ размера $n \times n$ следующим образом:
$Q_2 = \pmatrix{ 1 & 0^\T \\ 0 & R}$
Матрица $Q_2$ ортогональна, так как:
$Q_2^\T Q_2 = \pmatrix{ 1 & 0^\T \\ 0 & R^\T } \pmatrix{ 1 & 0^\T \\ 0 & R } = \pmatrix{ 1 & 0^\T \\ 0 & R^\T R } = \pmatrix{ 1 & 0^\T \\ 0 & I_{n-1} } = I_n$
Теперь рассмотрим матрицу $Q = Q_1 Q_2$ :
$Q^\T A Q = (Q_1 Q_2)^\T A (Q_1 Q_2) = Q_2^\T (Q_1^\T A Q_1) Q_2 = Q_2^\T \pmatrix{ \lambda_1 & 0^\T \\ 0 & B } Q_2$
Подставляя выражение для $Q_2$ , получаем:
$Q^\T A Q = \pmatrix{ 1 & 0^\T \\ 0 & R^\T } \pmatrix{ \lambda_1 & 0^\T \\ 0 & B } \pmatrix{ 1 & 0^\T \\ 0 & R } = \pmatrix{ \lambda_1 & 0^\T \\ 0 & R^\T B R } = \pmatrix{ \lambda_1 & 0^\T \\ 0 & \operatorname{diag}(\lambda_2, \dotsc, \lambda_n) }$
Таким образом, матрица $Q^\T A Q$ диагональна, а её диагональные элементы — собственные значения матрицы $A$ .

Ортогональность матрицы $Q$ следует из ортогональности матриц $Q_1$ и $Q_2$ :
$Q^\T Q = (Q_1 Q_2)^\T (Q_1 Q_2) = Q_2^\T Q_1^\T Q_1 Q_2 = Q_2^\T I Q_2 = Q_2^\T Q_2 = I$
Следовательно, построенная матрица $Q$ удовлетворяет условиям теоремы.

По принципу математической индукции спектральная теорема верна для всех симметричных матриц размерности $n \geq 1$ над полем вещественных чисел.

Спектральная теорема позволяет привести квадратичную форму к главным осям — новым координатам, в которых форма становится диагональной.

Приведение квадратичной формы к главным осям

Любую квадратичную форму $Q(x) = x^T A x$ ортогональным преобразованием можно привести к виду

Q(y) = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \dotsb + \lambda_n y_n^2

где $\lambda_1, \dotsc, \lambda_n$ — собственные значения матрицы $A$ , а новые переменные $y = Q^\T x$ получаются поворотом исходной системы координат.

Алгоритм приведения к главным осям:

Найти собственные значения матрицы квадратичной формы
Найти соответствующие ортонормированные собственные векторы
Составить матрицу $Q$ из собственных векторов
Выполнить замену переменных $x = Q y$

Исследование функций на экстремум

Квадратичные формы играют ключевую роль в анализе функций многих переменных на экстремум. Рассмотрим функцию $f \colon \mathbb{R}^n \to \mathbb{R}$ , дифференцируемую в точке $a$ .

Разложение в ряд Тейлора в окрестности точки $a$ :

f(a + h) = f(a) + \nabla f(a)^\T h + \frac{1}{2} h^\T H(a) h + o(\|h\|^2)

где $H(a)$ — матрица Гессе (гессиан), содержащая вторые частные производные.

Спектральный анализ матрицы Гессе позволяет определить её определенность через собственные значения:

Если все собственные значения $H(a)$ положительны ( $\lambda_1 > 0, \dots, \lambda_n > 0$ ), то матрица положительно определена → $a$ — точка локального минимума.
Если все собственные значения отрицательны, матрица отрицательно определена → $a$ — точка локального максимума.
Если собственные значения имеют разные знаки, матрица неопределена → $a$ — седловая точка.

Это следует из спектральной теоремы: симметричный гессиан $H(a)$ ортогонально диагонализируем, поэтому квадратичная форма $h^T H(a) h$ приводится к виду $\lambda_1 y_1^2 + \dots + \lambda_n y_n^2$ , где $y_i$ — новые координаты (главные оси).

Анализ многомерных распределений

Ковариационная матрица

Для случайного вектора $X = (X_1, X_2, \dotsc, X_n)^T$ с математическими ожиданиями $\mu_i = \mathbb{E}[X_i]$ , ковариационной матрицей называется

\Sigma = \mathbb{E}[(X - \mu)(X - \mu)^\T]

Элементы матрицы: $\Sigma_{ij} = \operatorname{cov}(X_i, X_j)$ .

Положительная полуопределенность ковариационной матрицы

Ковариационная матрица $\Sigma$ всегда симметрична и положительно полуопределена.

Симметричность следует из равенства $\operatorname{cov}(X_i, X_j) = \operatorname{cov}(X_j, X_i)$ .

Для любого вектора $a \in \mathbb{R}^n$ :

a^\T \Sigma a = a^\T \mathbb{E}[(X - \mu)(X - \mu)^\T] a = \mathbb{E}[a^\T (X - \mu)(X - \mu)^\T a] = \mathbb{E}[(a^\T (X - \mu))^2] \geq 0

так как математическое ожидание неотрицательной случайной величины неотрицательно.

Спектральный анализ ковариационной матрицы лежит в основе метода главных компонент:

Собственные векторы $Q = [q_1, \dots, q_n]$ матрицы $\Sigma$ определяют направления наибольшей дисперсии данных.
Собственные значения $\lambda_1 \geq \lambda_2 \geq \dots \geq \lambda_n \geq 0$ показывают, насколько "вытянуто" распределение вдоль соответствующих направлений.
Замена координат $Z = Q^T (X - \mu)$ преобразует данные в пространство независимых компонент, где ковариационная матрица становится диагональной: $\text{cov}(Z) = \Lambda$ .

Например, для двумерного нормального распределения с ковариационной матрицей

\Sigma = \pmatrix{2 & 1 \\ 1 & 2}

собственные значения $\lambda_1 = 3$ и $\lambda_2 = 1$ соответствуют дисперсиям вдоль осей эллипса рассеяния, а собственные векторы задают углы поворота этих осей.

Положительная полуопределенность ковариационной матрицы имеет важные следствия:

Все собственные значения неотрицательны
Определитель ковариационной матрицы неотрицателен
Главные миноры неотрицательны

Билинейные и квадратичные формы

Билинейные формы

Билинейная форма

Матрица билинейной формы

Преобразование матрицы при замене базиса

Симметричные билинейные формы

Симметричная билинейная форма

Существование ортогонального базиса

База индукции (n=1n = 1n=1)

Шаг индукции

Важное замечание

Квадратичные формы

Квадратичная форма

Метод Лагранжа приведения к каноническому виду

Метод Лагранжа

База индукции (n=1n = 1n=1)

Шаг индукции

Закон инерции Сильвестра

Закон инерции Сильвестра

Сигнатура квадратичной формы

Шаг 1. Положительно определённые подпространства

Шаг 2. Симметричный аргумент

Шаг 3. Инвариантность ppp и qqq

Положительно определенные матрицы

Положительно определенная матрица

Критерий Сильвестра

Критерий Сильвестра

Спектральная теорема и приведение к главным осям

Спектральная теорема для симметричных матриц

База индукции (n=1n = 1n=1)

Шаг индукции

Приведение квадратичной формы к главным осям

Исследование функций на экстремум

Анализ многомерных распределений

Ковариационная матрица

Положительная полуопределенность ковариационной матрицы

База индукции ( $n = 1$ )

База индукции ( $n = 1$ )

Шаг 3. Инвариантность $p$ и $q$

База индукции ( $n = 1$ )