1 2 3 4 5 6 7 8 9 ... 14 Ім'я файлу: linalg2008.pdf x, y ∈ Ker f , λ ∈ K, то f (x) = f (y) = 0, поэтому f (x + y) = 0, f (λx) = 0 и x + y, λx ∈ Ker f .Розширення: pdf Розмір: 612кб. Дата: 12.05.2022 скачати Пов'язані файли: загальна алгебра.pdf Проверка для образа оператора аналогична. ¤ Лемма 3.1.5 dim Ker f + dim Im f = dim V . Доказательство. Пусть e 1 , . . . , e r — базис в Ker f , дополним его до базиса e 1 , . . . , e r , e r+1 , . . . , e n всего пространства V . Докажем, что dim Im f = n − r. Для этого рассмотрим набор векторов f (e r+1 ), . . . , f (e n ) и докажем, что он является базисом в Im f . 1) линейная независимость. Пусть λ r+1 f (e r+1 ) + . . . + λ n f (e n ) = f (λ r+1 e r+1 + . . . + λ n e n ) = 0, следовательно λ r+1 e r+1 + . . . + λ n e n ∈ Ker f , но тогда λ r+1 e r+1 + . . . + λ n e n = µ 1 e 1 + . . . + µ r e r для некоторых µ 1 , . . . , µ r . Т.к. векторы e 1 , . . . , e n линейно независимы, то все λ i = 0 (и µ j тоже), следовательно векторы f (e r+1 ), . . . , f (e n ) линейно независимы. 2) полнота. Возьмем произвольный y ∈ Im f , следовательно существует такой x ∈ V , что f (x) = y. Если x = x i e i (суммирование по индексу i, пробегающему от 1 до n), то y = f (x) = f (x i e i ) = x i f (e i ), что является линейной комбинацией векторов f (e r+1 ), . . . , f (e n ), т.к. при i = 1, . . . , r e i ∈ Ker f и f (e i ) = 0. Следовательно f (e r+1 ), . . . , f (e n ) — базис в Im f , отсюда уже вытекает утверждение леммы. ¤ Если W = V , то мы получим отображение пространства в себя. Такие отображения называются линейными операторами. Матрица линейного оператора всегда квадратная, при этом в обоих экземплярах пространства V берется один и тот же базис. Тогда при переходе к другому базису матрица линейного оператора изменяется следующим образом: A 0 f = C −1 A f C, где C — матрица перехода, а A f — матрица оператора в старом базисе. Определение 3.1.6 Определим det f равенством det f = det A f Чтобы определение было корректным, надо, чтобы эта величина не зависела от выбора базиса в пространстве, т.е. возьмем два разным базиса с матрицей перехода C, тогда det A 0 f = det(C −1 A f C) = det C −1 det A f det C = det A f . Определение 3.1.7 Определим след tr f линейного оператора равенством tr f = tr A f (сумма диагональных элементов матрицы A f ). Аналогично проверяем, что определение корректно: tr A 0 f = tr(C −1 A f C) = tr(A f CC −1 ) = tr A f . Определение 3.1.8 Определим ранг rk f линейного оператора равенством rk f = rk A f Он тоже, очевидно, не будет зависеть от выбора базиса. Определение 3.1.9 Композицией двух линейных операторов f, g : V → V называются линейные операторы f ◦ g, g ◦ f : V → V , где (f ◦ g)(x) = f (g(x)) и (g ◦ f )(x) = g(f (x)). Можно легко показать, что в фиксированном базисе A f ◦g = A f · A g , также легко проверить, что для множества операторов выполнены все аксиомы кольца (если умножение — композиция), т.е. множество линейных операторов имеет структуру кольца с единицей, роль которой играет тождественный оператор. 21 3.2 Инвариантное подпространство Определение 3.2.1 Пусть дан линейный оператор f : W → W и V ⊂ W — подпространство в W . Оно называется инвариантным подпространством относительно f , если его образ лежит в нем самом, т.е. f (V ) ⊂ V . Примеры: 1) V = Ker f будет инвариантным подпространством, т.к. ∀x ∈ V f (x) = 0 ∈ V , 2) V = Im f будет инвариантным подпространством, т.к. по определению Im f образ любого элемента ему принадлежит. Рассмотрим подробнее матрицы операторов. Пусть V — инвариантное относительно f подпространство в W . Пусть e 1 , . . . , e r — базис в V , дополним его до базиса e 1 , . . . , e n в W . Пусть A f — матрица оператора в этом базисе, тогда она имеет следующий вид: A f = Ã ? ? 0 ? ! , т.е. ее можно разбить по ширине и высоте на две части, отвечающие векторам e 1 , . . . , e r и e r+1 , . . . , e n , причем в нижнем левом углу будут стоять одни нули. Действительно, т.к. V инвариантно, то f (e i ) ∈ V при 1 6 i 6 r, следовательно, f (e i ) = α 1 i e 1 + . . . + α r i e r . Коэффициенты в этом разложении по базису — это i-й столбец матрицы A f , а здесь на r + 1, . . . , n-ых местах стоят нули. Если W = V 1 ⊕ V 2 , где V 1 , V 2 — инвариантные подпространства, то и правый верхний угол матрицы A f будет нулевой, и эта матрица будет иметь следующий вид: A f = Ã ? 0 0 ? ! Доказательство этого аналогично предыдущему. Определение 3.2.2 Пусть V — инвариантное относительно f подпространство, тогда оператор f 1 : V → V , определенный равенством f 1 (v) = f (v), v ∈ V , называется ограничением оператора f на подпространство V и часто обозначается f | V Матрицей оператора f | V будет левый верхний угол матрицы оператора f , т.е. A f = µ A f 1 ? 0 ? ¶ 3.3 Невырожденные операторы. Собственные значения и собственные векторы Определение 3.3.1 Линейный оператор f : V → V называется невырожденным, если выполнено одно из следующих условий: 1) det f 6= 0; 2) Ker f = {0}; 3) Im f = V ; 4) rk f = dim V ; 5) ∃g : V → V , такой что g ◦ f = f ◦ g = id, т.е. существует обратный оператор. Лемма 3.3.2 Все эти пять свойств эквивалентны. Доказательство. 2) ⇐⇒ 3), т.к. dim V = dim Ker f + dim Im f . 1) ⇐⇒ 2): Пусть существует ненулевой вектор x ∈ Ker f . Выберем такой базис в V , чтобы x был первым вектором базиса, тогда в матрице оператора A f первый столбец будет нулевым, тогда det f = 0. Обратно, если det f = 0, то у системы уравнений A f X = 0 существует ненулевое решение, т.е. под действием оператора f некоторый ненулевой вектор переходит в 0. Но тогда Ker f 6= {0}. 1) ⇐⇒ 4) — это мы знаем из курса высшей алгебры. 1) ⇐⇒ 5). Если det f 6= 0 и A f — матрица оператора f , то det A f 6= 0, следовательно существует обратная матрица A −1 f , ей соответствует некоторый оператор g. Т.к. A f A −1 f = A −1 f A f = E, то f ◦ g = g ◦ f = id. Обратно, если существует обратный оператор, то его матрица будет обратной к матрице оператора f , следовательно det f = det A f 6= 0. Замечание. Обратный оператор (если он существует) единственен. Оператор, для которого ни одно из этих свойств не выполняется называется вырожденным. 22 Собственные значения и собственные векторы Определение 3.3.3 Пусть f — линейный оператор в линейном пространстве V . Если для некоторого числа λ ∈ K и для некоторого ненулевого вектора v ∈ V выполняется равенство f (v) = λv, то λ называется собственным значением оператора f , а v — собственным вектором оператора f , отвечающим собственному значению λ. Лемма 3.3.4 λ является собственным значением оператора f тогда и только тогда, когда оператор f − λ · id вырожден. Доказательство. =⇒: Если f (v) = λv, то (f −λ·id)(v) = 0, значит, ядро оператора (f −λ·id) содержит ненулевой вектор v, откуда следует вырожденность этого оператора. ⇐=: Вырожденность (f − λ · id) означает наличие нетривиального ядра у этого оператора. Возьмем в качестве v любой ненулевой вектор из ядра Ker(f − λ · id), тогда f (v) = λv. ¤ Рассмотрим пространство V (λ) = Ker(f − λ · id) — подпространство, состоящее из всех собственных векторов, отвечающих одному и тому же собственному значению λ, и из нулевого вектора. Лемма 3.3.5 Пространство V (λ) инвариантно относительно оператора f . Доказательство. Если x ∈ V (λ), т.е. (f − λ · id)(x) = 0, тогда f (x) = λx ∈ V (λ). ¤ Лемма 3.3.6 Пусть K — алгебраически замкнутое поле (т.е. любой многочлен f ∈ K n [x], deg f > 0, имеет корень), например, поле комплексных чисел. Тогда у любого оператора f : W → W , где dim W > 1, существует нетривиальное инвариантное подпространство (отличное от нуля и от всего пространства). Доказательство. Рассмотрим уравнение det(f − λ · id) = 0. В силу алгебраической замкнутости поля, это уравнение имеет корень λ 0 , тогда λ 0 будет собственным значением f и тогда dim V (λ 0 ) > 0 и V (λ 0 ) инвариантно. Если V (λ 0 ) 6= W , то оно нетривиально. Если же случайно получилось, что V (λ 0 ) = W , то f имеет вид f = λ 0 · id, т.е. является просто оператором умножения на число, и тогда любое подпространство будет инвариантным. ¤ 3.4 Проекторы Если W = V 1 ⊕V 2 , то для любого вектора w имеет место единственное разложение вида w = v 1 +v 2 , где v 1 ∈ V 1 , v 2 ∈ V 2 . Рассмотрим линейный оператор f : W → W , определенный формулой f (w) = v 1 . Т.к. v 1 = v 1 + 0, то f (V 1 ) ⊂ V 1 , т.е. V 1 инвариантно относительно f , более того на подпространстве имеем f | V 1 = id V 1 . Т.к. все вектора из V 2 переходят в 0, то V 2 ∈ Ker f . На самом деле V 2 = Ker f , т.к. если f (w) = 0, то в разложении w = v 1 + v 2 имеем v 2 = 0, т.е. w ∈ V 2 Определение 3.4.1 Операторы указанного вида называются операторами проектирования или просто проекторами вдоль V 2 на V 1 Проекторы обладают замечательным свойством: если f — проектор, то f 2 = f . Докажем обратное утверждение. Теорема 3.4.2 Если f 2 = f , то оператор f : W → W является оператором проектирования для некоторых V 1 и V 2 . Доказательство. Возьмем V 1 = Im f и V 2 = Ker f и докажем, что f — проектор вдоль V 2 на V 1 Сначала докажем, что W = V 1 ⊕ V 2 , т.е., что W = V 1 + V 2 и V 1 ∩ V 2 = {0}. Допустим, что существует ненулевой вектор a ∈ V 1 ∩ V 2 , тогда a ∈ Ker f , т.е. f (a) = 0 и a ∈ Im f , т.е. существует такой вектор b ∈ W , что f (b) = a. Тогда a = f (b) = f 2 (b) = f (a) = 0, 23 следовательно, a = 0. Мы получили, что V 1 и V 2 действительно образуют прямую сумму и V 1 ⊕ V 2 ⊂ W . Но, т.к. dim(V 1 ⊕ V 2 ) = dim V 1 + dim V 2 = dim Ker f + dim Im f = dim W, то V 1 ⊕ V 2 = W . Возьмем теперь произвольный вектор w ∈ W , тогда w = v 1 + v 2 , где v 1 ∈ V 1 , v 2 ∈ V 2 , следовательно, f (w) = f (v 1 + v 2 ) = f (v 1 ) + f (v 2 ) = f (v 1 ) + 0 = f (v 1 ), т.к. v 2 ∈ Ker f . Нам осталось доказать, что, если v 1 ∈ Im f , то f (v 1 ) = v 1 . Пусть b ∈ W — прообраз v 1 , т.е. f (b) = v 1 , тогда v 1 = f (b) = f 2 (b) = f (v 1 ), следовательно оператор f действительно является оператором проектирования вдоль V 2 на V 1 ¤ Матрица оператора проектирования в базисе, составленном из базисов подпространств V 1 и V 2 имеет следующий вид: 1 0 1 0 0 0 , где количество единиц равно размерности подпространства V 1 3.5 Многочлены от операторов Пусть f : V → V — линейный оператор. Тогда каждому многочлену p(t) ∈ K n [t] можно поставить в соответствие оператор по следующему правилу: a 0 + a 1 t + a 2 t 2 + . . . + a n t n 7→ a 0 id + a 1 f + a 2 f 2 + . . . + a n f n . Этот многочлен от оператора, также являющийся оператором, мы будем обозначать через p(f ). Аналогично, можно определить многочлен от матрицы. Для матрицы A определим p(A) формулой p(A) = a 0 E + a 1 A + a 2 A 2 + . . . + a n A n , где E — единичная матрица. Поскольку при фиксированном базисе имеется взаимно однозначное соотвествие между операторами и матрицами, все утверждения о многочленах от операторов допускают переформулировку для многочленов от матриц. Может так получиться, что p(f ) — нулевой оператор, тогда многочлен p(t) называется аннулирующим многочленом для оператора f . Пример: Если f = id, то p(t) = t − 1 будет аннулирующим многочленом, т.к. p(f ) = f − id = 0. Лемма 3.5.1 У любого оператора f существует аннулирующий многочлен. Доказательство. Пусть dim V = n, рассмотрим операторы f 0 = id, f 1 = f, f 2 , . . . , f n 2 | {z } n 2 +1 Размерность векторного пространства линейных операторов равна n 2 , следовательно эти операторы (поскольку их количество больше размерности) линейно зависимы, тогда существуют такие числа a 0 , a 1 , . . . , a n 2 , не все равные нулю, что a 0 id+a 1 f +. . .+a n 2 f n 2 = 0, но тогда получаем, что многочлен p(t) = a 0 + a 1 t + . . . + a n 2 t n 2 аннулирует оператор f . ¤ Минимальный многочлен Определение 3.5.2 Многочлен p(t) называется минимальным многочленом для оператора f , если он аннулирует этот оператор, имеет наименьшую степень среди всех аннулирующих многочленов и его старший коэффициент равен 1. Аналогично можно определить минимальный многочлен для матриц вместо операторов. Лемма 3.5.3 Для любого оператора f существует, и притом единственный, минимальный многочлен. 24 Доказательство. 1) Существование. Мы уже показали, что для любого оператора существует аннулирующий многочлен. Поэтому мы можем выбрать из всех аннулирующих многочленов многочлены с наименьшей степенью и поделить их на старший коэффициент. То, что получится, по определению будет минимальным многочленом. 2) Единственность. Допустим, что p 1 (t) и p 2 (t) — два минимальных многочлена для одногои того же оператора f , тогда deg p 1 = deg p 2 и их старшие коэффициенты равны 1, поэтому многочлен p 1 (t) − p 2 (t) будет аннулирующим многочленом меньшей степени, что противоречит предположению. ¤ Лемма 3.5.4 Число λ будет собственным значением оператора f тогда и только тогда, когда λ — корень минимального многочлена для f . Доказательство. Пусть λ — собственное значение оператора f , тогда существует такой ненулевой вектор x, что f x = λx. Пусть p(t) — минимальный многочлен, т.е. p(f ) ≡ 0, тогда p(f )x = 0, следовательно p(λ)x = a 0 x + a 1 λx + . . . + a n λ n x = a 0 x + a 1 f x + . . . + a n f n x = p(f )x = 0, поэтому p(λ) = 0 (так как x 6= 0). Обратно, пусть λ — корень минимального многочлена, тогда p(t) = (t − λ)q(t), deg q < deg p, поэтому q(t) не аннулирует f , следовательно, существует такой ненулевой вектор x, что q(f )x = y 6= 0. Тогда (f − λ · id)y = (f − λ · id)q(f )x = p(f )x = 0, следовательно, y — это собственный вектор оператора f , а λ — его собственное значение. ¤ 3.6 Характеристический многочлен Определение 3.6.1 Многочлен P f (t) = det(f − λ · id) называется характеристическим многочленом оператора f . Отметим, что характеристический многочлен можно определить и для в матриц (вместо операторов): P A (t) = det(A − λE), где A — матрица. Отметим роль некоторых коэффициентов характеристического многочлена. Если его записать в виде P f (t) = a 0 + a 1 t + . . . + a n t n , то тогда a n = (−1) n , a n−1 = (−1) n−1 tr f , a 0 = det f . Лемма 3.6.2 λ является собственным значением оператора f тогда и только тогда, когда λ — корень характеристического многочлена P f (t). Доказательство. Если λ — собственное значение, то оператор g = f − λ · id вырожденный, следовательно det(f − λ · id) = 0, т.е. λ — корень P f (t). Обратно, если λ — корень P f (t), то det(f −λ·id) = 0, следовательно оператор f −λ·id вырожденный, значит, λ является собственным значением оператора f . ¤ Если V ⊂ W — инвариантное подпространство, тогда, как мы знаем, матрица оператора f : W → W имеет вид: A f = µ A f 1 ? 0 A f 0 ¶ , где f 1 — ограничение f на V , а f 0 — фактор-оператор. Тогда, т.к. det f = det f 1 det f 0 , то P f (t) = P f 1 (t)P f 0 (t). Лемма 3.6.3 Пусть V (λ) — инвариантное подпространство, образованное собственными векторами, отвечающими собственному значению λ. Тогда кратность корня характеристического многочлена не меньше размерности подпространства V (λ). Доказательство. Если f 1 — ограничение оператора f на V (λ), то для любого x ∈ V (λ) будем иметь, что f 1 x = λx, поэтому матрица этого оператора имеет вид A f 1 = λ 0 0 λ , 25 а матрица оператора f — вид: A f = λ 0 ? 0 λ 0 A f 0 . Следовательно P f (t) = P f 1 (t)P f 0 (t) = (λ − t) dim V (λ) · P f 0 (t), поэтому кратность корня λ не меньше размерности подпространства V (λ) (но может быть и больше, если λ является корнем многочлена P f 0 (t)). ¤ Теорема 3.6.4 (Гамильтона-Кэли) Характеристический многочлен P f (t) оператора f : W → W аннулирует этот оператор, т.е. P f (f ) = 0. Доказательство. В силу взаимно однозначного соответствия между матрицами и операторами, мы докажем "матричный вариант" этой теоремы: P A (A) = 0 для произвольной матрицы A. Запишем обратную матрицу (для тех значений λ, для которых она определена) в виде (A − λE) −1 = 1 P A (λ) C(λ), где C(λ) — матрица, составленная из миноров матрицы A − λE. Отсюда (A − λE)C(λ) = P A (λ)E. (3) Это равенство очевидно выполняется для всех λ, кроме корней характеристического многочлена. А поскольку обе части этого матричного равенства состоят из многочленов, из их непрерывности следует выполнение этого равенства для всех значений λ. Разложим матрицу C(λ), состоящую из многочленов, по степеням λ: C(λ) = C 0 + C 1 λ + C 2 λ 2 + . . . + C n−1 λ n−1 , где C 0 , C 1 , . . . , C n−1 — числовые матрицы. В таком же виде запишем характеристический многочлен P A (λ) = a 0 + a 1 λ + a 2 λ 2 + . . . + a n λ n и распишем матричное равенство (3) по степеням λ, т.е. для каждой степени напишем равенство коэффициентов левой и правой части матричного равенства: AC 0 = a 0 E AC 1 − C 0 = a 1 E AC 2 − C 1 = a 2 E . . . . . . AC n−1 − C n−2 = a n−1 E −C n−1 = a n E. Умножим первое равенство на E, второе — на A, третье — на A 2 , и т.д., и сложим. Тогда в правой части получится a 0 E + a 1 A + a 2 A 2 + . . . + a n A n = P A (A), а в левой — все слагаемые взаимно уничтожатся. Т.е. получится, что P A (A) = 0. ¤ 3.7 Диагонализируемые операторы Определение 3.7.1 Оператор f называется диагонализируемым, если существует такой базис, что матрица этого оператора в этом базисе диагональна. Примеры: 1) операторы проектирования диагонализируемы, 2) нильпотентные операторы не диагонализируемы (если они не нулевые), так как любая диагональная нильпотентная матрица равна нулю. Лемма 3.7.2 Пусть характеристический многочлен P f (t) имеет n = dim W различных корней, тогда оператор f диагонализируемый. Доказательство. Пусть λ 1 , . . . , λ n — корни P f (t), т.е. собственные значения оператора f , а a 1 , . . . , a n — отвечающие им собственные векторы, т.е. f a i = λ i a i , i = 1, . . . , n. Если бы мы знали, что a 1 , . . . , a n — базис, то матрица оператора в этом базисе имела бы вид: A f = λ 1 0 0 λ n . 26 Докажем, что a 1 , . . . , a n является базисом. Для этого нам достаточно доказать линейную независимость этих векторов (так как их количество совпадает с размерностью пространства). Применим индукцию по количеству линейно независимых векторов. 1) База индукции. Вектор a 1 отличен от нуля, поэтому система, состоящая из него одного линейно независима. 2) Индуктивный переход. Пусть первые k−1 векторов линейно независимы. Докажем, что тогда и первые k векторов тоже линейно независимы. Предположим обратное, т.е. что т.е. существуют скаляры α 1 , . . . , α k , не все равные нулю, т.ч. α 1 a 1 + . . . + α k a k = 0. Поскольку первые k − 1 векторов по предположению линейно независимы, последний вектор есть линейная комбинация остальных, a k = − α 1 α k a 1 − . . . − α k−1 α k a k−1 . Применив оператор f к обеим частям этого равенства, получим, что f a k = f (− α 1 α k a 1 − . . . − α k−1 α k a k−1 ), т.е. λ k a k = − α 1 α k λ 1 a 1 − . . . − α k−1 α k λ k−1 a k−1 , но, с другой стороны, λ k a k = λ k (− α 1 α k a 1 − . . . − α k−1 α k a k−1 ). Приравняв выражения в правых частях равенств, получим, что (λ k − λ 1 ) α 1 α k a 1 + . . . + (λ k − λ k−1 ) α k−1 α k a k−1 = 0. Т.к. все λ i различны, то из линейной независимости векторов a 1 , . . . , a k−1 следует, что все коэффициенты α 1 , . . . , α k−1 равны нулю. Но тогда α k = 0, откуда следует линейная независимость системы из k векторов. ¤ Лемма 3.7.3 Над алгебраически замкнутым полем матрицу любого оператора можно привести к верхнетреугольному виду λ 1 ? . .. 0 λ n заменой базиса. Доказательство. Индукция по размерности пространства. 1) Если dim W = 1, то утверждение очевидно, т.к. любая матрица размера 1 является верхнетреугольной. 2) Пусть утверждение верно для dim W < n, докажем его для dim W = n. Т.к. поле алгебраически замкнуто, характеристический многочлен имеет корень λ, он будет собственным значением. Ему соответствует собственный вектор, который порождает одномерное инвариантное подпространство V , тогда матрица оператора f имеет вид A f = µ λ ? 0 A f 0 ¶ . По предположению индукции матрицу A f 0 можно привести к верхнетреугольному виду A f 0 = λ 1 ? 0 λ n−1 , тогда матрица A f = λ ? λ 1 ? 0 0 λ n−1 также будет верхнетреугольной. ¤ Лемма 3.7.4 Если матрица оператора верхнетреугольная, то на главной диагонали стоят собственные значения этого оператора. Доказательство. Пусть A f = λ 1 ? 0 λ n , тогда A f −t·id = λ 1 − t ? 0 λ n − t , и det(f − t · id) = (λ 1 − t) · . . . · (λ n − t), т.е. λ 1 , . . . , λ n — это корни характеристического многочлена, а значит собственные значения. ¤ Лемма 3.7.5 Пусть оператор f такой, что в алгебраически замкнутом поле характеристический многочлен P f (t) имеет единственный корень λ, тогда некоторая степень оператора g = f − λ · id равна нулю. Доказательство. Т.к. у оператора f только одно собственное значение λ, то в некотором базисе его матрица будет иметь вид A f = λ ? 0 λ . Матрица оператора g в этом базисе 27 имеет вид A g = 0 ? 0 0 . Характеристический многочлен оператора g имеет вид P g (t) = (−1) n t n , и, поскольку он является аннулирующим, то P g (g) = (−1) n g n = 0, значит, g n = 0. ¤ 3.8 Жордановы клетки Рассмотрим оператор f , заданный в базисе e 1 , . . . , e n матрицей J n (λ) = λ 1 λ 1 λ 1 λ . Такая матрица называется жордановой клеткой порядка n, с собственным значением λ. Действие такого оператора на базисных векторах устроено так: f (e 1 ) = λe 1 , f (e 2 ) = λe 2 + e 1 , f (e 3 ) = λe 3 + e 2 ,. . . , f (e n ) = λe n + e n−1 Нормальной или жордановой формой называется блочно-диагональная матрица, все блоки которой являются жордановыми клетками. 3.9 Присоединенные векторы и корневое подпространство Обозначим через V (1) λ подпространство собственных векторов оператора f , отвечающих собственному значению λ (вместе с нулевым вектором). Иначе это можно записать как V (1) λ = Ker(f − λ · id). Аналогично определим V (2) λ = Ker(f − λ · id) 2 , V (3) λ = Ker(f − λ · id) 3 и т.д. Получается цепочка вложенных друг в друга подпространств {0} ⊂ V (1) λ ⊂ V (2) λ ⊂ . . . ⊂ V . Вектор v называется присоединенным вектором 1-го порядка оператора f , отвечающих собственному значению λ, если v ∈ V (2) λ , v / ∈ V (1) λ . Аналогично, присоединенным вектором порядка k, если v ∈ V (k+1) λ , v / ∈ V (k) λ Покажем, что рост подпространств V (k) λ стабилизируется с ростом k. Поскольку пространство, в котором действует наш оператор, конечномерно, то неубывающая числовая последовательность размерностей dim V (1) λ 6 dim V (2) λ 6 dim V (3) λ 6 . . . не может неограничченно возрастать, значит, найдется какой-то номер k, для которого соседние члены этой последовательности совпадут. Утверждение 3.9.1 Если на каком-то шаге этой цепочки V (k−1) λ и V (k) λ совпали, то они будут совпадать и дальше, т.е. V (i) λ = V (i+1) λ при i > k. Доказательство. Обозначим f − λ · id через g. По условию мы имеем g k x = 0 ⇐⇒ x ∈ Ker g k ⇐⇒ x ∈ Ker g k−1 ⇐⇒ g k−1 x = 0. Докажем, что g k+1 x = 0 ⇐⇒ g k x = 0, т.е. что Ker g k+1 = Ker g k Если g k x = 0, то, очевидно, g k+1 x = g(g k x) = 0. Обратно, если g k+1 x = 0, то g k (gx) = 0 ⇐⇒ g k−1 (gx) = 0 (по условию), следовательно, g k x = 0. Мы доказали, что Ker g k+1 = Ker g k . Проделав эту операцию нужное число раз, получим что Ker g k+2 = Ker g k+1 и т.д. ¤ Обозначим через p тот номер, с которого происходит стабилизация цепочки подпространств V (k) λ . Тогда ∪ ∞ k=1 V (k) λ = V (p) λ . Обозначим это пространство через V λ и назовем его корневым подпространством оператора f , отвечающим собственному значению λ. Утверждение 3.9.2 Подпространство V λ ⊂ W инвариантно относительно оператора f . Доказательство. Возьмем произвольный вектор x ∈ V λ , т.е. (f − λ · id) p (x) = 0, тогда (f − λ · id) p f (x) = f (f − λ · id) p (x) = f (0) = 0, значит, f (x) ∈ V λ ¤ 28 3.10 Теорема о разложении пространства в прямую сумму корневых подпространств Лемма 3.10.1 Пусть f : V → V , λ — его собственное значение. Тогда имеет место разложение V в прямую сумму, V = V λ ⊕ W , где W — инвариантное подпространство, причем ограничение оператора f на W обратимо. Доказательство. Без ограничения общности можно считать, что λ = 0. Для этого достаточно перейти от оператора f к оператору f − λ · id. Положим W = Im f p и докажем, что V = V λ ⊕ W = Ker f n ⊕ Im f p . Инвариантность Im f p очевидна: если y ∈ Im f p , то существует такой x, что y = f p (x); тогда f (y) = f p+1 (x) ∈ Im f p+1 . Но Im f p+1 ⊂ Im f p , а размерности этих образов совпадают, т.к. совпадают размерности соотвтествующих ядер, поэтому Im f p+1 = Im f p Покажем, что сумма V 0 и W — прямая. Для этого достаточно доказать, что их пересечение равно нулю. Так как сумма размерностей ядра и образа равна размерности всего пространства, из того, что пересечение — нулевое, будет следовать, что dim V = dim V 0 +dim W , т.е. V = V 0 ⊕W . Пусть v ∈ V 0 ∩ W , v 6= 0. Т.к. v ∈ V 0 , то f p (v) = 0, а т.к. v ∈ W , то v = f p (w) для некоторого вектора w ∈ V . Тогда f p (w) = v 6= 0, f 2p (w) = f p (v) = 0. Из того, что f p (w) 6= 0, следует, что w / ∈ V 0 , а из того, что f 2p (w) = 0, следует, что w ∈ V (2p) 0 = V 0 . Полученное противоречие доказывает, что V 0 ∩ W = {0}. Докажем теперь, что ограничение f на W невырождено. Если бы это было не так, что 0 был бы собственным значением оператора f | W , т.е. существовал бы собственный вектор v ∈ W , v 6= 0, f (v) = 0. Но это бы означало, что v ∈ V 0 . Но V 0 ∩ W = {0}. Т.о., 0 не может быть собственным значением для f | W ¤ Теорема 3.10.2 Пусть дан оператор f : V → V (над алгебраически замкнутым полем). Тогда пространство V является прямой суммой всех корневых подпространств, т.е. V = V λ 1 ⊕ . . . ⊕ V λ k , где λ 1 , . . . , λ k — все собственные значения оператора f . Доказательство. Применим нужное число раз предыдущую лемму. После первого применения получим V = V λ 1 ⊕ W . Далее, из блочно-диагонального вида матрицы оператора f — она состоит из блоков, отвечающих ограничениям f | V λ1 и f | W — следует, что собственные значения f | W — λ 2 , λ 3 , . . . , λ k . Продолжая этот процесс, мы исчерпаем все пространство. Действительно, если после k-кратного применения леммы мы получим V = V λ 1 ⊕ V λ 2 ⊕ . . . ⊕ V λ k ⊕ W 0 , то W 0 = {0} — иначе оператор ограничения f | W 0 будет иметь еще одно собственное значение (поле алгебраически замкнуто), которого не было у f — противоречие. ¤ Отметим, что ограничение оператора на корневое подпространство имеет единственное собственное значение. 3.11 Жорданова нормальная форма оператора Теорема 3.11.1 (Жордана о приведении матрицы оператора к нормальной форме) Для любого оператора f существует базис, в котором его матрица A f будет жордановой. Такая матрица единственна с точностью до перестановки блоков (клеток). Доказательство. 1) Существование. По теореме о корневом разложении, в подходящем базисе матрица оператора f имеет блочно-диагональный вид A f = A f | Vλ1 A f | Vλ2 A f | Vλk , поэтому достаточно доказать теорему для операторов с единственным собственным значением, каковыми являются ограничения оператора f на корневые подпространства. 29 Поэтому мы можем предположить без ограничения общности, что f имеет единственное собственное значение. Также без ограничения общности можно считать, что это собственное значение равно нулю. Наша задача — построить базис в пространстве, в котором действует такой оператор, т.е. в корневом пространстве V = V 0 = V (p) 0 , которое является объединением подпространств V (1) 0 ⊂ V (2) 0 ⊂ . . . ⊂ V (p) 0 Для подпространства L ⊂ V система векторов e r+1 , . . . , e n называется относительным базисом (относительно подпространства L), если, будучи дополненной базисом подпространства L, она становится базисом всего пространства V . В любом (конечномерном) пространстве можно выбрать относительный базис относительно любого подпространства. На первом шаге рассмотрим подпространство V (p−1) 0 ⊂ V (p) 0 = V и выберем относительный базис e 1 , . . . , e q относительно этого подпространства. Очевидно, он будет состоять из присоединенных векторов порядка p − 1. Поскольку f (V (p) 0 ) = V (p) 0 , f (e 1 ), . . . , f (e q ) ∈ V (p−1) 0 Покажем, что система векторов f (e 1 ), . . . , f (e q ) линейно независима относительно предыдущего подпространства V (p−2) 0 : если α 1 f (e 1 ) + . . . + α q f (e q ) = f (α 1 e 1 + . . . + α q e q ) ∈ V (p−2) 0 , то α 1 e 1 + . . . + α q e q ∈ V (p−1) 0 , и из определения векторов e 1 , . . . , e q следует, что все α 1 = . . . = α q = 0. Дополним систему векторов f (e 1 ), . . . , f (e q ) до относительного базиса в V (p−1) 0 относительно подпространства V (p−2) 0 векторами g 1 , . . . , g s . Т.о. относительный базис V (p−1) 0 относительно подпространства V (p−2) 0 состоит из векторов f (e 1 ), . . . , f (e q ), g 1 , . . . , g s . К этому относительному базису применим оператор f и вновь полученную систему векторов опять дополним до относительного базиса V (p−2) 0 относительно подпространства V (p−3) 0 . Этот процесс можно продолжить до конца, т.е. до подпространства V (1) 0 и его нулевого подпространства. Запишем полученные векторы в виде таблицы: e 1 . . . e q f (e 1 ) . . . f (e q ) g 1 . . . g s f 2 (e 1 ) . . . f 2 (e q ) f (g 1 ) . . . f (g s ) h 1 . . . h r . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . f p−1 (e 1 ) . . . f p−1 (e q ) f p−2 (g 1 ) . . . f p−2 (g s ) f p−3 (h 1 ) . . . f p−3 (h r ) . . . l 1 . . . l t Векторы нижней строчки образуют базис подпространства V (1) 0 , векторы предпоследней строчки образуют относительный базис в V (2) 0 относительно V (1) 0 , поэтому векторы двух последних строчек составляют базис подпространства V (2) 0 . Добавляя к ним векторы третьей с конца строчки, получаем базис подпространства V (3) 0 , и т.д. В итоге, все векторы таблицы составляют базис пространства V . Осталось проверить, что это — такой базис, в котором матрица оператора состоит из жордановых клеток. Для этого рассмотрим вертикальные цепочки векторов таблицы. Обозначим f p−1 (e 1 ) = ˜ e 1 , f p−2 (e 1 ) = ˜ e 2 ,... e 1 = ˜ e p . Т.к. ˜ e 1 — собственный вектор, отвечающий нулевому собственному значению, то f (˜ e 1 ) = 0. Далее, по определению, f (˜ e 2 ) = f p−1 (e 1 ) = ˜ e 1 , f (˜ e 3 ) = ˜ e 2 ,.... Пусть L 1 = h˜ e 1 , . . . , ˜ e p i — линейная оболочка векторов первого стольбца. Тогда L 1 переходит в себя, т.е. является инвариантным подпространством, при этом матрица оператора f , ограниченного на L 1 , имеет вид жордановой клетки с нулевым собственным значением. Аналогично, векторы второго столбца образуют инвариантное подпространство L 2 , и матрица ограничения f на L 2 также является жордановой клеткой, и т.д. Таким образом, матрица оператора f состоит из стольких жордановых клеток, сколько столбцов в таблице. 2) Единственность. Надо показать, что каким бы способом мы не привели бы матрицу оператора f к жордановой нормальной форме, количество жордановых клеток фиксированной размерности с собственным значением λ одно и то же. Для этого зафиксируем собственное значение λ и посчитаем количество клеток, ему отвечающих. Введем числа r k (λ) = rk(f − λ · id) k и N k (λ) — количество жордановых клеток размерности k, отвечающих собственному значению λ. Для блочно-диагональных матриц ранги можно считать по каждому блоку отдельно, и суммировать. Легко заметить, что при вычислении разности 30 r k+1 (λ)−r k (λ) нужно учитывать только клетки, отвечающие собственному значению λ, поскольку ранги остальных клеток J m (λ i − λ) не меняются при возведении таких клеток в любую степень (эти клетки невырождены). Рассмотрим разность r 0 (λ) − r 1 (λ). Для каждой отдельно взятой клетки с собственным значением λ такая разность равна 1, т.к. ранг клетки размера k×k равен k − 1, т.е. на единицу меньше, чем размерность. Поэтому каждая клетка вносит в разность r 0 (λ) − r 1 (λ) вклад, равный единице, т.е. эта разность равна общему количеству клеток, следовательно r 0 (λ) − r 1 (λ) = N 1 (λ) + N 2 (λ) + N 3 (λ) + . . .. Рассмотрим разность r 1 (λ) − r 2 (λ). Для клеток размера 1×1 такая разность равна нулю, а для клеток размера n×n при n > 2 ранг клетки равен n − 1, а ранг ее квадрата равен n − 2, и их разность равна единице. Поэтому разность r 1 (λ) − r 2 (λ) равна количеству клеток размера n×n при n > 2, т.е. r 1 (λ) − r 2 (λ) = N 2 (λ) + N 3 (λ) + . . .. Аналогично получаем, что r 2 (λ) − r 3 (λ) = N 3 (λ)+N 4 (λ)+. . . и т.д., r i−1 (λ)−r i (λ) = N i (λ)+N i+1 (λ)+. . .. Вычитая из предыдущего равенства последующее, получаем N i (λ) = (r i−1 (λ) − r i (λ)) − (r i (λ) − r r+1 (λ)) = r i−1 (λ) − 2r i (λ) + r r+1 (λ). Т.к. ранги от выбора базиса не зависят, то и числа N i (λ) от базиса не зависят, следовательно количество клеток каждого размера будет одно и то же, поэтому нормальная форма оператора единственна с точностью до перестановки клеток, из которых она состоит. ¤ 3.12 Функции от операторов и от матриц Если функция f (x) достаточно гладкая, т.е. имеет достаточно много производных, то для нее можно написать формулу Тейлора, которая будет иметь достаточно много членов, f (t) = f (λ) + f 0 (λ) 1! (t − λ) + f 00 (λ) 2! (t − λ) 2 + . . . + f (m) (λ) m! (t − λ) m + r m (в качестве последнего слагаемого можно взять, например, остаточный член в форме Лагранжа). Если матрица A — жорданова клетка, A = λ 1 0 λ 1 0 λ , то f (A) = f (λ) f 0 (λ) 1! . . . f (n−1) (λ) (n−1)! f (λ) f 0 (λ) 1! 0 f (λ) , т.е. значение функции f (A) определяется только значением функции f (t) и ее n − 1 производной в точке t = λ, а все производные более высоких порядков (т.е. все последующие слагаемые формулы Тейлора) дают нулевой вклад. То есть, мы можем взять формулу Тейлора для этой функции, обрубить ее на n − 1-й производной, и мы получим многочлен p(t), причем p(A) = f (A), а вычислять значение многочлена от матрицы мы умеем. Если матрица произвольна, то ее нужно привести к жордановой форме, A 0 = A 1 0 0 A m , где A 1 , . . . , A m — жордановые клетки. Т.к. f (A 0 ) = f (A 1 ) 0 0 f (A m ) и f(A) = Cf(A 0 )C −1 , то формулу Тейлора нам достаточно обрубить на k−1-й производной, где k — максимальный размер жордановой клетки в жордановой форме матрицы A, тогда мы получим такой многочлен p(t), что p(A) = f (A). Этот многочлен называется интерполяционным. Вопрос: Почему определение f (A) не зависит от способа приведения к жордановой форме ? Проверьте, что если матрица A приведена к жордановому виду J(A) с помощью двух различных матриц перехода, C и D, т.е. если A = CJ(A)C −1 = DJ(A)D −1 , то матрицы D −1 C и f (J(A)) перестановочны для любой функции f , для которой определено f (J(A)). 3.13 Овеществление и комплексификация Овеществление Определение 3.13.1 Пусть V — векторное пространство над полем комплексных чисел C. Рассмотрим пространство V R , состоящее из тех же векторов, что и V , только вместо операции умножения на все комплексные числа мы ограничимся умножением только на вещественные 31 числа. Тогда V R будет линейным пространством над полем вещественных чисел R, оно называется овеществлением пространства V . Пусть e 1 , . . . , e n — базис в пространстве V , тогда он не будет базисом пространства V R , так как не все вектора являются их линейными комбинациями с вещественными числами, а на комплексные числа мы больше не можем умножать. Базисом в V R будут вектора e 1 , . . . , e n , ie 1 , . . . , ie n (проверьте), следовательно dim R V R = 2 dim C V (индекс у dim непоминает, над каким полем мы рассматриваем размерность пространства). Определение 3.13.2 Пусть дан оператор f : V → V , тогда этот оператор, рассматриваемый на пространстве V R , называется овеществлением оператора f и обозначается f R Посмотрим, как связаны матрицы операторов f и f R . Пусть в базисе e 1 , . . . , e n пространства V f (e k ) = c j k e j . Матрицу A f = (c j k ) оператора f можно разложить на вещественную и чисто мнимую часть, т.к. ее элементы — это комплексные числа, т.е. A f = A + iB, где A = (Re c j k ), B = (Im c j k ). Тогда матрица оператора f R в базисе e 1 , . . . , e n , ie 1 , . . . , ie n будет иметь вид A f R = µ A −B B A ¶ Посчитаем det A f R , для чего сделаем следующие элементарные преобразования над строками и столбцами матрицы A f R : µ A −B B A ¶ → µ A − iB −B − iA B A ¶ → → µ A − iB −B − iA + i(A − iB) B A + iB ¶ = µ A − iB 0 B A + iB ¶ , поэтому det A f R = det(A − iB) det(A + iB) = det(A f ) · det A f = | det A f | 2 . Комплексная структура Определение 3.13.3 Пусть V — векторное пространство над R. Комплексной структурой на V называется такой линейный оператор j : V → V , что j 2 = −id. Тогда пространство V можно рассматривать как векторное пространство над C, так как на V можно ввести операцию умножения на комплексные числа: (a + ib)v := av + bj(v). То, что это определение корректно (свойства v-viii определения векторного пространства), проверяется тривиально. Лемма 3.13.4 Пусть j — комплексная структура на вещественном векторном пространстве V . Тогда 1) dim V четна; 2) в подходящем базисе матрица оператора j имеет вид A j = µ 0 −E E 0 ¶ . Доказательство. 1. Обозначим через e V пространство V , рассматриваемое как комплексное (с помошью комплексной структуры j). Размерность пространства e V конечна, т.к. по базису пространства V можно разложить любой вектор (возможно неоднозначно). Пусть e 1 , . . . , e n — базис в e V , тогда e 1 , . . . , e n , e n+1 = j(e 1 ), . . . , e 2n = j(e n ) будет базисом в V , следовательно, dim V = 2n. 2. Т.к. j(e i ) = e n+i и j(e n+i ) = −e i для i = 1, . . . , n, то в этом базисе матрица оператора имеет указанный вид. ¤ 32 Комплексификация Определение 3.13.5 Пусть V — векторное пространство над полем R. Рассмотрим пространство V C = V ⊕ V = {(a, b) : a, b ∈ V } и определим комплексную структуру следующим образом: j(a, b) := (−b, a) (нетрудно убедиться, что j 2 = −id). Пространство с такой комплексной структурой называется комплексификацией пространства V . Покажем, что dim C V C = dim R V . Если e 1 , . . . , e n — базис в пространстве V , то (e 1 , 0), . . . , (e n , 0) будет базисом в пространстве V C . Действительно, поскольку j(e i , 0) = (0, e i ), то умножением на мнимую единицу мы можем получить вектора (0, e 1 ), . . . , (0, e n ) и, следовательно, любой вектор (a, b), где a, b ∈ V . Определение 3.13.6 Если дан оператор f : V → V , то оператор f C : V C → V C , заданный формулой f C (a, b) := (f a, f b), называется комплексификацией оператора f . Легко убедиться, что так определенный f C действительно будет линейным оператором. Если A f — матрица оператора f в базисе e 1 , . . . , e n , то эта же матрица будет матрицей оператора f C в базисе (e 1 , 0), . . . , (e n , 0). В дальнейшем мы будем использовать обозначение a + ib для пары (a, b) по аналгоии с комплексными числами. 3.14 Инвариантные подпространства в вещественном случае В случае алгебраически замкнутого поля каждый оператор имеет собственные значения, и, следовательно, одномерные инвариантные подпространства. В вещественном случае это, вообще говоря, неверно, но имеется более слабое утверждение о существовании по крайней мере двумерных инвариантных подпространств. Лемма 3.14.1 Если f : V → V — оператор в вещественном векторном пространстве и dim V > 1, то в пространстве V существует либо одномерное, либо двумерное инвариантное подпространство. Доказательство. Если dim V = 1, то утверждение леммы очевидно. Если dim V > 1, то пусть λ = α + iβ — собственное значение оператора f C . Тогда в V C есть собственный вектор a + ib, a, b ∈ V , отвечающий собственному значению λ. Тогда f C (a + ib) = (α + iβ)(a + ib) = αa − βb + i(αb + βa), но с другой стороны f C (a+ib) = f (a)+if (b), следовательно, f (a) = αa−βb и f (b) = αb+βa. Т.к. α и β — это вещественные числа, то f (a), f (b) ∈ ha, bi, значит, ha, bi — инвариантное подпространство. Очевидно, что оно либо одномерное, либо двумерное (на самом деле оно всегда будет получаться двумерным, если β 6= 0). ¤ 33 4 Операторы в евклидовых и унитарных пространствах 4.1 Сопряженный оператор Изучим теперь линейные операторы, действующие в евклидовых и эрмитовых пространствах, т.е. в пространствах со скалярным произведением. Определение 4.1.1 Если для оператора f : V → V существует такой оператор g, что для любых векторов a, b ∈ V выполняется равенство (f (a), b) = (a, g(b)), то g называется сопряженным оператором для f . Докажем единственность сопряженного оператора. Допустим, что g 1 и g 2 — два сопряженных оператора для f . Тогда (f (a), b) = (a, g 1 (b)) = (a, g 2 (b)), т.е. (a, g 1 (b) − g 2 (b)) = 0 для любого вектора a, следовательно при любом b имеем g 1 (b) − g 2 (b) = 0, следовательно, g 1 = g 2 Сопряженный оператор обозначается g = f ∗ Лемма 4.1.2 Если операторы f 1 и f 2 имеют сопряженные f ∗ 1 и f ∗ 2 соответственно, то операторы h = f 1 + f 2 и g = f 1 f 2 также имеют сопряженные h ∗ и g ∗ , причем h ∗ = f ∗ 1 + f ∗ 2 b g ∗ = f ∗ 2 f ∗ 1 . Доказательство. приведем доказательство для второго утверждения (для композиции операторов), т.к. для первого оно очевидно. (f 1 f 2 (a), b) = (f 2 (a), f ∗ 1 (b)) = (a, f ∗ 2 f ∗ 1 (b)). ¤ Лемма 4.1.3 Если в ортонормированном базисе матрица оператора f равна A и существует сопряженный оператор f ∗ , то матрица этого оператора в том же базисе равна A t (если пространство евклидово) или A t (если пространство эрмитово). Доказательство. Пусть матрица оператора f в ортонормированном базисе e 1 , . . . , e n есть A = a 1 1 . . . a 1 n a n 1 . . . a n n , а матрица оператора f ∗ (в том же базисе) есть B = b 1 1 . . . b 1 n b n 1 . . . b n n . Тогда a j i = (e j , a k i e k ) = (e j , f (e i )) = (f ∗ (e j ), e i ) = (b l j e l , e i ) = b i j , откуда получаем A = B t , или B = A t ¤ Отметим, что условие ортонормированности базиса в лемме является существенным. Лемма 4.1.4 Для любого оператора f существует ему сопряженный f ∗ . Доказательство. Выберем ортонормированный базис e 1 , . . . , e n , и пусть A f — матрица оператора f в этом базисе. Тогда матрица A t f будет (в этом же базисе) матрицей некоторого оператора g. Пусть A f = c 1 1 . . . c 1 n c n 1 . . . c n n . Возьмем произвольные векторы a = a i e i , b = b i e i Тогда f (b) = c 1 1 . . . c 1 n c n 1 . . . c n n b 1 b n ; g(a) = (a 1 . . . a n ) c 1 1 . . . c 1 n c n 1 . . . c n n , и легко видеть, что (a, f (b)) = (a 1 . . . a n ) c 1 1 . . . c 1 n c n 1 . . . c n n b 1 b n = (b, g(a)) = (g(a), b), т.е. g = f ∗ ¤ 34 Следствие 4.1.5 Если f ∗ — оператор, сопряженный к f , то (f ∗ ) ∗ = f . Лемма 4.1.6 Если V — инвариантное подпространство относительно f , то V ⊥ — инвариантное подпространство относительно f ∗ . Доказательство. Возьмем произвольный вектор v ∈ V ⊥ , тогда ∀u ∈ V имеем (f ∗ (v), u) = (v, f (u)) = 0, т.к. v ∈ V ⊥ , а f (u) ∈ V . Следовательно, f ∗ (v) ∈ V ⊥ для любого v ∈ V ⊥ ¤ В случае евклидовых пространств операция перехода к сопряженному оператору является линейным оператором в пространстве L(V ) линейных операторов, квадрат которого равен единице. Далее мы увидим, что его собственными значениями являются числа 1 и -1. Вопрос: 1 2 3 4 5 6 7 8 9 ... 14 |