Пусть L — векторное пространство над полем K.
Билинейной формой называется отображение F:L×L→K,
линейное по каждому из аргументов и подчиняющееся правилам дистрибутивнисти:
F(x+z,y)=F(x,y)+F(z,y)
F(x,y+z)=F(x,y)+F(x,z)
и однородности:
F(λx,y)=λF(x,y)
F(x,λy)=λF(x,y)
для всех x,y,z∈L и λ∈K.
Рассмотрим любое пространство конечной размерности, например Rn.
Выберем в пространстве произвольный базис E=(e1,e2,…,en) и возьмём два
произвольных вектора x=(x1,x2,…,xn) и y=(y1,y2,…,yn).
Векторы x и y можно представить в виде x1e1+x2e2+…+xnen и y1e1+y2e2+…+ynen соответственно.
Теперь подставим их в F(x,y), применяя правила дистрибутивности и однородности, описанные выше.
В конечномерном пространстве при выбранном базисе e1,e2,…,en любая билинейная форма однозначно определяется матрицей билинейной формы.
Очевидно, что при выборе другого базиса E′=(e1′,e2′,…,en′) билинейная форма
будет определена матрицей A′. Найдём взаимосвязь между матрицами билинейной формы в разных базисах:
Преобразование матрицы при замене базиса
Пусть A — матрица билинейной формы F в базисе E=(e1,e2,…,en),
и C — матрица перехода к новому базису E′=(e1′,e2′,…,en′).
Тогда матрица A′ билинейной формы F в новом базисе равна
A′=CTAC
Пусть x и y — координатные столбцы векторов в старом базисе,
а x′ и y′ — в новом базисе. Тогда
x=Cx′,y=Cy′
Подставляя в выражение для билинейной формы получим:
F(x,y)=xTAy=(Cx′)TA(Cy′)=(x′)T(CTAC)y′
Следовательно, матрица формы в новом базисе действительно равна CTAC.
Симметричные билинейные формы
Симметричная билинейная форма
Билинейная форма F называется симметричной, если
F(x,y)=F(y,x)длявсехx,y∈L
Для симметричной билинейной формы матрица A всегда симметрична: aij=F(ei,ej)=F(ej,ei)=aji,
то есть AT=A.
Существование ортогонального базиса
Для любой симметричной билинейной формы F на конечномерном пространстве
над полем с характеристикой K=2 существует базис, в котором её матрица диагональна:
A=a1,10⋮00a2,2⋮0⋯⋯⋱⋯00⋮an,n
Такой базис называется ортогональным базисом относительно формы F.
Доказательство проводим индукцией по размерности пространства n=dimL.
База индукции (n=1)
Если dimL=1, то в единственном базисе {e1} матрица формы имеет вид A=(F(e1,e1)), то есть уже диагональна. Утверждение верно.
Шаг индукции
Пусть утверждение верно для всех пространств размерности n−1.
Рассмотрим пространство L размерности n≥2 с симметричной билинейной формой F и её матрицей A в базисе E=(e1,…,en):
Если F(x,y)=0 для всех x,y∈L,
то матрица A — нулевая, а значит, диагональна в любом базисе. Утверждение верно.
F≡0
Рассмотрим два подслучая:
Пусть существует вектор v∈L, для которого F(v,v)=0.
Без ограничения общности считаем, что F(e1,e1)=0 (иначе перенумеруем базис или заменим e1 на вектор v,
где v — любой вектор пространства, для которого F(v,v)=0.
Для каждого k=2,…,n выполним преобразование базиса:
ek′=ek−F(e1,e1)F(e1,ek)e1
Матрица перехода C к новому базису E′=(e1,e2′,…,en′) имеет вид:
C=1−a11a12⋮−a11a1n01⋮0⋯⋯⋱⋯00⋮1
По теореме о преобразовании матрицы при замене базиса:
A′=CTAC
Прямым вычислением проверяем, что A′ имеет блочную структуру:
A′=(a1100B)
где B — симметричная матрица размера (n−1)×(n−1).
По предположению индукции существует матрица D размера (n−1)×(n−1),
такая что DTBD диагональна.
Дополняем D до матрицы C′ размера n×n:
C′=(100D)
Тогда матрица Cитог=C⋅C′ преобразует A к диагональному виду:
CитогTACитог=(C′)T(CTAC)C′=(a1100DTBD)
Рассмотрим случай, когда F(v,v)=0 для всех v∈L.
Поскольку F симметрична и характеристика K=2, из тождества
F(x,y)=21[F(x+y,x+y)−F(x,x)−F(y,y)]
следует, что F≡0, что противоречит условию F≡0.
Следовательно, этот подслучай невозможен.
Во всех возможных случаях построена матрица перехода Cитог,
такая что CитогTACитог диагональна.
Следовательно, в базисе, соответствующем этой матрице перехода, матрица формы F диагональна.
По принципу математической индукции утверждение верно для всех n≥1.
Важное замечание
Условие char(K)=2 критически важно.
Например, над полем F2 симметричная билинейная форма с матрицей
(0110)
не допускает ортогонального базиса.
Квадратичные формы
Квадратичная форма
Пусть L — векторное пространство над полем K,
и E=(e1,…,en) — базис в L.
Отображение Q:L→K называется квадратичной формой,
если её можно представить в виде
Q(x)=i,j=1∑naijxixj
где x=x1e1+x2e2+…+xnen,
а aij — некоторые элементы поля K.
Аналогично билинейным формам, квадратичную форму можно представить в виде xTAx, где A — матрица квадратичной формы.
В случае, если характеристика поля K не равна 2,
можно считать, что матрица квадратичной формы симметрична, то есть aij=aji.
Так, например, квадратичную форму от двух переменных обычно записывают в виде
Q(x1,x2)=a11x12+a12x1x2+a22x22
При замене базиса, матрица квадратичной формы A изменяется аналогично матрице билинейной формы
A′=CTAC
где C — матрица перехода к новому базису,
а A′ — матрица квадратичной формы в новом базисе.
Метод Лагранжа приведения к каноническому виду
Каноническим видом квадратичной формы называется выражение, содержащее только квадраты переменных:
Q(x)=λ1y12+λ2y22+⋯+λnyn2
где y1,y2,…,yn — новые переменные, линейно выражающиеся через старые.
Метод Лагранжа
Любую квадратичную форму над полем характеристики char(K)=2 невырожденным линейным преобразованием можно привести к каноническому виду.
Алгоритм метода Лагранжа:
Если в квадратичной форме есть ненулевой диагональный элемент aii=0,
выделяем полный квадрат по соответствующей переменной
Если все диагональные элементы нулевые, но есть ненулевой недиагональный элемент aij=0,
делаем замену xi=yi+yj, xj=yi−yj
Повторяем процедуру для оставшихся переменных
Доказательство проводим индукцией по размерности пространства n=dimL над полем K,
где char(K)=2.
База индукции (n=1)
Квадратичная форма имеет вид Q(x)=a11x12, что уже является каноническим видом.
Матрица перехода — единичная, следовательно, преобразование невырожденное.
Шаг индукции
Пусть утверждение верно для всех пространств размерности n−1. Рассмотрим квадратичную форму Q(x1,…,xn)=i,j=1∑naijxixj в базисе E=(e1,…,en) с симметричной матрицей A=(aij) (поскольку char(K)=2, мы можем считать матрицу симметричной).
Q≡0
В этом случае матрица A нулевая, и форма уже имеет канонический вид. Утверждение верно.
Q≡0
Рассмотрим два подслучая:
Существует индекс i, для которого aii=0.
Без ограничения общности положим a11=0 (иначе перенумеруем переменные). Выделим полный квадрат по переменной x1:
Q=a11(x1+j=2∑na11a1jxj)2+Q′(x2,…,xn)
где Q′ — квадратичная форма от n−1 переменной. Сделаем линейную замену:
y1=x1+j=2∑na11a1jxj,yk=xk(k≥2)
Матрица перехода C к новому базису E′=(e1′,…,en′) имеет вид:
C=10⋮0a11a121⋮0⋯⋯⋱⋯a11a1n0⋮1
Её определитель det(C)=1=0, следовательно, преобразование невырожденное.
В новом базисе форма принимает вид Q=a11y12+Q′(y2,…,yn).
По предположению индукции Q′ приводится к каноническому виду невырожденным преобразованием C′ размера (n−1)×(n−1).
Дополним C′ до матрицы C′′ размера n×n:
C′′=(100C′)
Тогда общая матрица перехода Cитог=C⋅C′′ невырожденна,
так как det(Cитог)=det(C)⋅det(C′′)=0,
и форма принимает канонический вид.
Все диагональные элементы aii=0,
но существует aij=0 для i=j.
Без ограничения общности положим a12=0 (иначе перенумеруем переменные).
Сделаем замену переменных:
Теперь коэффициенты при y12 и y22 ненулевые.
Матрица перехода C для первых двух переменных:
C′=(111−1)
имеет определитель det(C′)=−2=0 (так как char(K)=2),
а для остальных переменных — единичная матрица. Общая матрица перехода:
C=110⋮01−10⋮0001⋮0⋯⋯⋯⋱⋯000⋮1
невырожденна. После замены форма содержит ненулевые квадратичные члены, и мы сводим задачу к первому подслучаю.
Во всех случаях построено явное невырожденное линейное преобразование, приводящее форму к каноническому виду.
По принципу математической индукции утверждение верно для всех n≥1 при условии char(K)=2.
Закон инерции Сильвестра
Закон инерции Сильвестра
Для любой квадратичной формы число положительных, отрицательных и нулевых коэффициентов
в каноническом виде не зависит от способа приведения.
Сигнатура квадратичной формы
Сигнатурой квадратичной формы называется упорядоченная пара чисел (p,q), где:
p — число квадратов с положительными коэффициентами в каноническом виде
q — число квадратов с отрицательными коэффициентами в каноническом виде
Закон инерции утверждает, что сигнатура является инвариантом квадратичной формы
и не зависит от выбора базиса, в котором форма приводится к каноническому виду.
Пусть квадратичная форма Q имеет два канонических представления:
В первом представлении рассмотрим подпространство V={z1=⋯=zq=0}.
На V форма принимает вид QV=i=1∑pλiyi2 и удовлетворяет условию QV>0 для всех ненулевых векторов,
то есть V — положительно определённое подпространство размерности p.
Во втором представлении любое положительно определённое подпространство имеет размерность,
не превосходящую r, так как только первые r переменных дают положительные значения.
Следовательно:
p≤r
Шаг 2. Симметричный аргумент
Аналогично, во втором представлении рассмотрим подпространство W={v1=⋯=vs=0}.
На W форма положительно определена (QW>0) и dimW=r.
В первом представлении максимальная размерность положительно определённого подпространства равна p,
поэтому:
r≤p
Шаг 3. Инвариантность p и q
Из неравенств p≤r и r≤p следует p=r.
Для отрицательных коэффициентов рассуждение аналогично:
рассматриваем отрицательно определённые подпространства {y1=⋯=yp=0} и {u1=⋯=ur=0},
откуда получаем q=s.
Для вырожденных форм (с нулевыми коэффициентами) ранг r=p+q инвариантен,
поэтому количество нулевых коэффициентов n−r также не зависит от выбора базиса.
Положительно определенные матрицы
Положительно определенная матрица
Симметричная матрица A называется положительно определенной,
если соответствующая ей квадратичная форма положительно определена:
xTAx>0длявсехx=0
Аналогично определяются:
Отрицательно определенная: xTAx<0 для всех x=0
Положительно полуопределенная: xTAx≥0 для всех x
Отрицательно полуопределенная: xTAx≤0 для всех x
Критерий Сильвестра
Критерий Сильвестра
Симметричная матрица A положительно определена тогда и только тогда,
когда все её главные миноры положительны:
Δ1Δ2Δn=a11>0=a11a21a12a22>0⋮=detA>0
Необходимость: Если A положительно определена, то она положительно определена
и на любом подпространстве. В частности, для векторов с первыми k координатами,
соответствующий главный минор должен быть положительным.
Достаточность: Докажем индукцией по размерности матрицы.
Для n=1 утверждение очевидно.
Предположим, что для матриц размера n−1 критерий верен.
Рассмотрим матрицу A размера n с положительными главными минорами.
По предположению индукции, левый верхний блок размера n−1 положительно определен.
Выполним блочное LDLT-разложение:
где I — единичная матрица (n−1)×(n−1), а δ=ann−bTAn−1−1b.
Так как detA=detAn−1⋅δ>0 и detAn−1>0,
то δ>0. Следовательно, матрица A положительно определена.
Спектральная теорема и приведение к главным осям
Спектральная теорема для симметричных матриц
Для любой симметричной матрицы A существует ортогональная матрица Q такая, что
QTAQ=Λ=diag(λ1,λ2,…,λn)
где λ1,…,λn — собственные числа матрицы A.
Доказательство проводим индукцией по размерности матрицы n над полем вещественных чисел.
База индукции (n=1)
Для матрицы размера 1×1, A=(a11),
утверждение очевидно: Q=(1), Λ=(a11).
Шаг индукции
Предположим, что теорема верна для всех симметричных матриц размерности (n−1)×(n−1).
Докажем её для симметричной матрицы A размера n×n над полем R (n≥2).
A=0
Если матрица A нулевая, то она уже диагональна.
В качестве ортогональной матрицы Q можно взять единичную матрицу. Утверждение верно.
Так как коэффициенты многочлена p(λ) вещественны,
комплексные корни встречаются сопряженными парами.
Покажем, что все корни характеристического уравнения вещественны.
Пусть λ — собственное значение матрицы A,
а v — соответствующий собственный вектор (v=0).
Тогда Av=λv. Рассмотрим скалярное произведение:
(Av,v)=(λv,v)=λ(v,v)
С другой стороны, используя симметричность матрицы A (AT=A):
(Av,v)=(v,ATv)=(v,Av)=(v,λv)=λ(v,v)
Сравнивая полученные выражения, имеем λ(v,v)=λ(v,v).
Так как (v,v)>0, то λ=λ,
то есть λ — вещественное число.
Таким образом, существует хотя бы одно вещественное собственное значение λ1 и соответствующий ему собственный вектор v1 (v1=0).
Нормируем вектор v1, то есть заменим его на e1=∥v1∥v1,
где ∥v1∥=(v1,v1).
Тогда ∥e1∥=1 и Ae1=λ1e1.
Дополним вектор e1 до ортонормированного базиса e1,e2,…,en пространства Rn.
Это можно сделать, например, с помощью процесса Грама-Шмидта.
Составим матрицу Q1, столбцами которой являются векторы этого базиса:
Q1=(e1e2⋯en)
Матрица Q1 ортогональна (Q1TQ1=I),
так как её столбцы образуют ортонормированный базис.
где 0 — нулевой вектор размерности n−1,
а B — симметричная матрица размера (n−1)×(n−1).
По предположению индукции для матрицы B существует ортогональная матрица R размера (n−1)×(n−1), такая что:
RTBR=diag(λ2,λ3,…,λn)
где λ2,…,λn — собственные значения матрицы B (и, следовательно, матрицы A,
так как собственные значения инвариантны относительно ортогональных преобразований).
Построим матрицу Q2 размера n×n следующим образом:
По принципу математической индукции спектральная теорема верна для всех
симметричных матриц размерности n≥1 над полем вещественных чисел.
Спектральная теорема позволяет привести квадратичную форму к главным осям —
новым координатам, в которых форма становится диагональной.
Приведение квадратичной формы к главным осям
Любую квадратичную форму Q(x)=xTAx ортогональным преобразованием
можно привести к виду
Q(y)=λ1y12+λ2y22+⋯+λnyn2
где λ1,…,λn — собственные значения матрицы A,
а новые переменные y=QTx получаются поворотом исходной системы координат.
Алгоритм приведения к главным осям:
Найти собственные значения матрицы квадратичной формы
Найти соответствующие ортонормированные собственные векторы
Составить матрицу Q из собственных векторов
Выполнить замену переменных x=Qy
Исследование функций на экстремум
Квадратичные формы играют ключевую роль в анализе функций многих переменных на экстремум.
Рассмотрим функцию f:Rn→R, дифференцируемую в точке a.
Разложение в ряд Тейлора в окрестности точки a:
f(a+h)=f(a)+∇f(a)Th+21hTH(a)h+o(∥h∥2)
где H(a) — матрица Гессе (гессиан), содержащая вторые частные производные.
Спектральный анализ матрицы Гессе позволяет определить её определенность через собственные значения:
Если все собственные значения H(a) положительны (λ1>0,…,λn>0),
то матрица положительно определена → a — точка локального минимума.
Если все собственные значения отрицательны, матрица отрицательно определена → a — точка локального максимума.
Если собственные значения имеют разные знаки, матрица неопределена → a — седловая точка.
Это следует из спектральной теоремы: симметричный гессиан H(a) ортогонально диагонализируем,
поэтому квадратичная форма hTH(a)h приводится к виду λ1y12+⋯+λnyn2,
где yi — новые координаты (главные оси).
Анализ многомерных распределений
Ковариационная матрица
Для случайного вектора X=(X1,X2,…,Xn)T с математическими ожиданиями μi=E[Xi], ковариационной матрицей называется