Курс лекций по линейной алгебре и геометрии Механико-математический факультет i-й курс, 2-й семестр 2007/2008 уч год, поток механиков сторінка 6

3.2
Инвариантное подпространство
Определение 3.2.1 Пусть дан линейный оператор f : W → W и V ⊂ W — подпространство в W . Оно называется инвариантным подпространством относительно f , если его образ лежит в нем самом, т.е. f (V ) ⊂ V .
Примеры:
1) V = Ker f будет инвариантным подпространством, т.к. ∀x ∈ V f (x) = 0 ∈ V ,
2) V = Im f будет инвариантным подпространством, т.к. по определению Im f образ любого элемента ему принадлежит.
Рассмотрим подробнее матрицы операторов. Пусть V — инвариантное относительно f
подпространство в W . Пусть e
1
, . . . , e
r
— базис в V , дополним его до базиса e
1
, . . . , e
n
в W . Пусть
A
f
— матрица оператора в этом базисе, тогда она имеет следующий вид: A
f
=
Ã
? ?
0 ?
!
, т.е. ее можно разбить по ширине и высоте на две части, отвечающие векторам e
1
, . . . , e
r
и e
r+1
, . . . , e
n
,
причем в нижнем левом углу будут стоять одни нули. Действительно, т.к. V инвариантно, то
f (e
i
) ∈ V при 1 6 i 6 r, следовательно, f (e
i
) = α
1
i
e
1
+ . . . + α
r
i
e
r
. Коэффициенты в этом разложении по базису — это i-й столбец матрицы A
f
, а здесь на r + 1, . . . , n-ых местах стоят нули.
Если W = V
1
⊕ V
2
, где V
1
, V
2
— инвариантные подпространства, то и правый верхний угол матрицы A
f
будет нулевой, и эта матрица будет иметь следующий вид: A
f
=
Ã
? 0 0 ?
!
Доказательство этого аналогично предыдущему.
Определение 3.2.2 Пусть V — инвариантное относительно f подпространство, тогда оператор f
1
: V → V , определенный равенством f
1
(v) = f (v), v ∈ V , называется ограничением
оператора f на подпространство V и часто обозначается f |
V
Матрицей оператора f |
V
будет левый верхний угол матрицы оператора f , т.е. A
f
=
µ
A
f
1
?
0
?
¶
3.3
Невырожденные операторы.
Собственные значения и
собственные векторы
Определение 3.3.1 Линейный оператор f : V → V называется невырожденным, если выполнено одно из следующих условий:
1) det f 6= 0;
2) Ker f = {0};
3) Im f = V ;
4) rk f = dim V ;
5) ∃g : V → V , такой что g ◦ f = f ◦ g = id, т.е. существует обратный оператор.
Лемма 3.3.2 Все эти пять свойств эквивалентны.
Доказательство. 2) ⇐⇒ 3), т.к. dim V = dim Ker f + dim Im f .
1) ⇐⇒ 2): Пусть существует ненулевой вектор x ∈ Ker f . Выберем такой базис в V , чтобы
x был первым вектором базиса, тогда в матрице оператора A
f
первый столбец будет нулевым,
тогда det f = 0. Обратно, если det f = 0, то у системы уравнений A
f
X = 0 существует ненулевое решение, т.е. под действием оператора f некоторый ненулевой вектор переходит в 0. Но тогда
Ker f 6= {0}.
1) ⇐⇒ 4) — это мы знаем из курса высшей алгебры.
1) ⇐⇒ 5). Если det f 6= 0 и A
f
— матрица оператора f , то det A
f
6= 0, следовательно существует обратная матрица A
−1
f
, ей соответствует некоторый оператор g. Т.к. A
f
A
−1
f
= A
−1
f
A
f
= E, то
f ◦ g = g ◦ f = id. Обратно, если существует обратный оператор, то его матрица будет обратной к матрице оператора f , следовательно det f = det A
f
6= 0.
Замечание. Обратный оператор (если он существует) единственен.
Оператор, для которого ни одно из этих свойств не выполняется называется вырожденным.
22

Собственные значения и собственные векторы
Определение 3.3.3 Пусть f — линейный оператор в линейном пространстве V . Если для некоторого числа λ ∈ K и для некоторого ненулевого вектора v ∈ V выполняется равенство
f (v) = λv, то λ называется собственным значением оператора f , а v — собственным вектором
оператора f , отвечающим собственному значению λ.
Лемма 3.3.4 λ является собственным значением оператора f тогда и только тогда, когда
оператор f − λ · id вырожден.
Доказательство.
=⇒: Если f (v) = λv, то (f −λ·id)(v) = 0, значит, ядро оператора (f −λ·id) содержит ненулевой вектор v, откуда следует вырожденность этого оператора.
⇐=: Вырожденность (f − λ · id) означает наличие нетривиального ядра у этого оператора.
Возьмем в качестве v любой ненулевой вектор из ядра Ker(f − λ · id), тогда f (v) = λv.
¤
Рассмотрим пространство V (λ) = Ker(f − λ · id) — подпространство, состоящее из всех собственных векторов, отвечающих одному и тому же собственному значению λ, и из нулевого вектора.
Лемма 3.3.5 Пространство V (λ) инвариантно относительно оператора f .
Доказательство. Если x ∈ V (λ), т.е. (f − λ · id)(x) = 0, тогда f (x) = λx ∈ V (λ).
¤
Лемма 3.3.6 Пусть K — алгебраически замкнутое поле (т.е. любой многочлен f ∈ K
n
[x],
deg f > 0, имеет корень), например, поле комплексных чисел. Тогда у любого оператора f : W →
W , где dim W > 1, существует нетривиальное инвариантное подпространство (отличное от
нуля и от всего пространства).
Доказательство.
Рассмотрим уравнение det(f − λ · id) = 0. В силу алгебраической замкнутости поля, это уравнение имеет корень λ
0
, тогда λ
0
будет собственным значением f и тогда dim V (λ
0
) > 0 и V (λ
0
) инвариантно. Если V (λ
0
) 6= W , то оно нетривиально. Если же случайно получилось, что V (λ
0
) = W , то f имеет вид f = λ
0
· id, т.е. является просто оператором умножения на число, и тогда любое подпространство будет инвариантным.
¤
3.4
Проекторы
Если W = V
1
⊕V
2
, то для любого вектора w имеет место единственное разложение вида w = v
1
+v
2
,
где v
1
∈ V
1
, v
2
∈ V
2
. Рассмотрим линейный оператор f : W → W , определенный формулой
f (w) = v
1
. Т.к. v
1
= v
1
+ 0, то f (V
1
) ⊂ V
1
, т.е. V
1
инвариантно относительно f , более того на подпространстве имеем f |
V
1
= id
V
1
. Т.к. все вектора из V
2
переходят в 0, то V
2
∈ Ker f . На самом деле V
2
= Ker f , т.к. если f (w) = 0, то в разложении w = v
1
+ v
2
имеем v
2
= 0, т.е. w ∈ V
2
Определение 3.4.1 Операторы указанного вида называются операторами проектирования или просто проекторами вдоль V
2
на V
1
Проекторы обладают замечательным свойством: если f — проектор, то f
2
= f . Докажем обратное утверждение.
Теорема 3.4.2 Если f
2
= f , то оператор f : W → W является оператором проектирования
для некоторых V
1
и V
2
.
Доказательство. Возьмем V
1
= Im f и V
2
= Ker f и докажем, что f — проектор вдоль V
2
на
V
1
Сначала докажем, что W = V
1
⊕ V
2
, т.е., что W = V
1
+ V
2
и V
1
∩ V
2
= {0}. Допустим, что существует ненулевой вектор a ∈ V
1
∩ V
2
, тогда a ∈ Ker f , т.е. f (a) = 0 и a ∈ Im f , т.е. существует такой вектор b ∈ W , что f (b) = a. Тогда
a = f (b) = f
2
(b) = f (a) = 0,
23

следовательно, a = 0. Мы получили, что V
1
и V
2
действительно образуют прямую сумму и V
1
⊕
V
2
⊂ W . Но, т.к.
dim(V
1
⊕ V
2
) = dim V
1
+ dim V
2
= dim Ker f + dim Im f = dim W,
то V
1
⊕ V
2
= W .
Возьмем теперь произвольный вектор w ∈ W , тогда w = v
1
+ v
2
, где v
1
∈ V
1
, v
2
∈ V
2
,
следовательно, f (w) = f (v
1
+ v
2
) = f (v
1
) + f (v
2
) = f (v
1
) + 0 = f (v
1
), т.к. v
2
∈ Ker f . Нам осталось доказать, что, если v
1
∈ Im f , то f (v
1
) = v
1
. Пусть b ∈ W — прообраз v
1
, т.е. f (b) = v
1
,
тогда v
1
= f (b) = f
2
(b) = f (v
1
), следовательно оператор f действительно является оператором проектирования вдоль V
2
на V
1
¤
Матрица оператора проектирования в базисе, составленном из базисов подпространств V
1
и
V
2
имеет следующий вид:









1 0
1 0
0 0









, где количество единиц равно размерности подпространства V
1 3.5
Многочлены от операторов
Пусть f : V → V — линейный оператор. Тогда каждому многочлену p(t) ∈ K
n
[t] можно поставить в соответствие оператор по следующему правилу:
a
0
+ a
1
t + a
2
t
2
+ . . . + a
n
t
n
7→ a
0
id + a
1
f + a
2
f
2
+ . . . + a
n
f
n
.
Этот многочлен от оператора, также являющийся оператором, мы будем обозначать через p(f ).
Аналогично, можно определить многочлен от матрицы. Для матрицы A определим p(A)
формулой p(A) = a
0
E + a
1
A + a
2
A
2
+ . . . + a
n
A
n
, где E — единичная матрица. Поскольку при фиксированном базисе имеется взаимно однозначное соотвествие между операторами и матрицами, все утверждения о многочленах от операторов допускают переформулировку для многочленов от матриц.
Может так получиться, что p(f ) — нулевой оператор, тогда многочлен p(t) называется
аннулирующим многочленом для оператора f .
Пример: Если f = id, то p(t) = t − 1 будет аннулирующим многочленом, т.к. p(f ) = f − id = 0.
Лемма 3.5.1 У любого оператора f существует аннулирующий многочлен.
Доказательство.
Пусть dim V = n, рассмотрим операторы f
0
= id, f
1
= f, f
2
, . . . , f
n
2
|
{z
}
n
2
+1
Размерность векторного пространства линейных операторов равна n
2
, следовательно эти операторы (поскольку их количество больше размерности) линейно зависимы, тогда существуют такие числа a
0
, a
1
, . . . , a
n
2
, не все равные нулю, что a
0
id+a
1
f +. . .+a
n
2
f
n
2
= 0, но тогда получаем,
что многочлен p(t) = a
0
+ a
1
t + . . . + a
n
2
t
n
2
аннулирует оператор f .
¤
Минимальный многочлен
Определение 3.5.2 Многочлен p(t) называется минимальным многочленом для оператора
f , если он аннулирует этот оператор, имеет наименьшую степень среди всех аннулирующих многочленов и его старший коэффициент равен 1.
Аналогично можно определить минимальный многочлен для матриц вместо операторов.
Лемма 3.5.3 Для любого оператора f существует, и притом единственный, минимальный
многочлен.
24

Доказательство.
1) Существование. Мы уже показали, что для любого оператора существует аннулирующий многочлен. Поэтому мы можем выбрать из всех аннулирующих многочленов многочлены с наименьшей степенью и поделить их на старший коэффициент. То,
что получится, по определению будет минимальным многочленом.
2) Единственность. Допустим, что p
1
(t) и p
2
(t) — два минимальных многочлена для одногои того же оператора f , тогда deg p
1
= deg p
2
и их старшие коэффициенты равны 1, поэтому многочлен p
1
(t) − p
2
(t) будет аннулирующим многочленом меньшей степени, что противоречит предположению.
¤
Лемма 3.5.4 Число λ будет собственным значением оператора f тогда и только тогда,
когда λ — корень минимального многочлена для f .
Доказательство.
Пусть λ — собственное значение оператора f , тогда существует такой ненулевой вектор x, что f x = λx. Пусть p(t) — минимальный многочлен, т.е. p(f ) ≡ 0, тогда
p(f )x = 0, следовательно
p(λ)x = a
0
x + a
1
λx + . . . + a
n
λ
n
x = a
0
x + a
1
f x + . . . + a
n
f
n
x = p(f )x = 0,
поэтому p(λ) = 0 (так как x 6= 0).
Обратно, пусть λ — корень минимального многочлена, тогда p(t) = (t − λ)q(t), deg q < deg p,
поэтому q(t) не аннулирует f , следовательно, существует такой ненулевой вектор x, что q(f )x =
y 6= 0. Тогда
(f − λ · id)y = (f − λ · id)q(f )x = p(f )x = 0,
следовательно, y — это собственный вектор оператора f , а λ — его собственное значение.
¤
3.6
Характеристический многочлен
Определение 3.6.1 Многочлен P
f
(t) = det(f − λ · id) называется характеристическим
многочленом оператора f .
Отметим, что характеристический многочлен можно определить и для в матриц (вместо операторов): P
A
(t) = det(A − λE), где A — матрица.
Отметим роль некоторых коэффициентов характеристического многочлена. Если его записать в виде P
f
(t) = a
0
+ a
1
t + . . . + a
n
t
n
, то тогда a
n
= (−1)
n
, a
n−1
= (−1)
n−1
tr f , a
0
= det f .
Лемма 3.6.2 λ является собственным значением оператора f тогда и только тогда, когда
λ — корень характеристического многочлена P
f
(t).
Доказательство. Если λ — собственное значение, то оператор g = f − λ · id вырожденный,
следовательно det(f − λ · id) = 0, т.е. λ — корень P
f
(t). Обратно, если λ — корень P
f
(t), то det(f −λ·id) = 0, следовательно оператор f −λ·id вырожденный, значит, λ является собственным значением оператора f .
¤
Если V ⊂ W — инвариантное подпространство, тогда, как мы знаем, матрица оператора f :
W → W имеет вид: A
f
=
µ
A
f
1
?
0
A
f
0
¶
, где f
1
— ограничение f на V , а f
0
— фактор-оператор.
Тогда, т.к. det f = det f
1
det f
0
, то P
f
(t) = P
f
1
(t)P
f
0
(t).
Лемма 3.6.3 Пусть
V (λ)
—
инвариантное
подпространство,
образованное
собственными векторами, отвечающими собственному значению λ. Тогда кратность корня
характеристического многочлена не меньше размерности подпространства V (λ).
Доказательство.
Если f
1
— ограничение оператора f на V (λ), то для любого x ∈ V (λ)
будем иметь, что f
1
x = λx, поэтому матрица этого оператора имеет вид A
f
1
=


λ
0 0
λ

,
25

а матрица оператора f — вид: A
f
=




λ
0
?
0
λ
0
A
f
0



. Следовательно P
f
(t) = P
f
1
(t)P
f
0
(t) =
(λ − t)
dim V (λ)
· P
f
0
(t), поэтому кратность корня λ не меньше размерности подпространства V (λ)
(но может быть и больше, если λ является корнем многочлена P
f
0
(t)).
¤
Теорема 3.6.4 (Гамильтона-Кэли) Характеристический многочлен P
f
(t) оператора f :
W → W аннулирует этот оператор, т.е. P
f
(f ) = 0.
Доказательство.
В силу взаимно однозначного соответствия между матрицами и операторами, мы докажем "матричный вариант" этой теоремы: P
A
(A) = 0 для произвольной матрицы A.
Запишем обратную матрицу (для тех значений λ, для которых она определена) в виде (A −
λE)
−1
=
1
P
A
(λ)
C(λ), где C(λ) — матрица, составленная из миноров матрицы A − λE. Отсюда
(A − λE)C(λ) = P
A
(λ)E.
(3)
Это равенство очевидно выполняется для всех λ, кроме корней характеристического многочлена.
А поскольку обе части этого матричного равенства состоят из многочленов, из их непрерывности следует выполнение этого равенства для всех значений λ. Разложим матрицу C(λ), состоящую из многочленов, по степеням λ: C(λ) = C
0
+ C
1
λ + C
2
λ
2
+ . . . + C
n−1
λ
n−1
, где C
0
, C
1
, . . . , C
n−1
—
числовые матрицы. В таком же виде запишем характеристический многочлен P
A
(λ) = a
0
+ a
1
λ +
a
2
λ
2
+ . . . + a
n
λ
n
и распишем матричное равенство (3) по степеням λ, т.е. для каждой степени напишем равенство коэффициентов левой и правой части матричного равенства:
AC
0
= a
0
E
AC
1
− C
0
= a
1
E
AC
2
− C
1
= a
2
E
. . .
. . .
AC
n−1
− C
n−2
= a
n−1
E
−C
n−1
= a
n
E.
Умножим первое равенство на E, второе — на A, третье — на A
2
, и т.д., и сложим. Тогда в правой части получится a
0
E + a
1
A + a
2
A
2
+ . . . + a
n
A
n
= P
A
(A), а в левой — все слагаемые взаимно уничтожатся. Т.е. получится, что P
A
(A) = 0.
¤
3.7
Диагонализируемые операторы
Определение 3.7.1 Оператор f называется диагонализируемым, если существует такой базис, что матрица этого оператора в этом базисе диагональна.
Примеры:
1) операторы проектирования диагонализируемы,
2) нильпотентные операторы не диагонализируемы (если они не нулевые), так как любая диагональная нильпотентная матрица равна нулю.
Лемма 3.7.2 Пусть характеристический многочлен P
f
(t) имеет n = dim W различных
корней, тогда оператор f диагонализируемый.
Доказательство. Пусть λ
1
, . . . , λ
n
— корни P
f
(t), т.е. собственные значения оператора f , а
a
1
, . . . , a
n
— отвечающие им собственные векторы, т.е. f a
i
= λ
i
a
i
, i = 1, . . . , n. Если бы мы знали,
что a
1
, . . . , a
n
— базис, то матрица оператора в этом базисе имела бы вид: A
f
=


λ
1 0
0
λ
n

.
26

Докажем, что a
1
, . . . , a
n
является базисом. Для этого нам достаточно доказать линейную независимость этих векторов (так как их количество совпадает с размерностью пространства).
Применим индукцию по количеству линейно независимых векторов.
1) База индукции. Вектор a
1
отличен от нуля, поэтому система, состоящая из него одного линейно независима.
2) Индуктивный переход. Пусть первые k−1 векторов линейно независимы. Докажем, что тогда и первые k векторов тоже линейно независимы. Предположим обратное, т.е. что т.е. существуют скаляры α
1
, . . . , α
k
, не все равные нулю, т.ч. α
1
a
1
+ . . . + α
k
a
k
= 0. Поскольку первые k − 1
векторов по предположению линейно независимы, последний вектор есть линейная комбинация остальных, a
k
= −
α
1
α
k
a
1
− . . . −
α
k−1
α
k
a
k−1
. Применив оператор f к обеим частям этого равенства,
получим, что f a
k
= f (−
α
1
α
k
a
1
− . . . −
α
k−1
α
k
a
k−1
), т.е. λ
k
a
k
= −
α
1
α
k
λ
1
a
1
− . . . −
α
k−1
α
k
λ
k−1
a
k−1
, но,
с другой стороны, λ
k
a
k
= λ
k
(−
α
1
α
k
a
1
− . . . −
α
k−1
α
k
a
k−1
). Приравняв выражения в правых частях равенств, получим, что (λ
k
− λ
1
)
α
1
α
k
a
1
+ . . . + (λ
k
− λ
k−1
)
α
k−1
α
k
a
k−1
= 0. Т.к. все λ
i
различны, то из линейной независимости векторов a
1
, . . . , a
k−1
следует, что все коэффициенты α
1
, . . . , α
k−1
равны нулю. Но тогда α
k
= 0, откуда следует линейная независимость системы из k векторов.
¤
Лемма 3.7.3 Над алгебраически замкнутым полем матрицу любого оператора можно
привести к верхнетреугольному виду


λ
1
?
. ..
0
λ
n

 заменой базиса.
Доказательство. Индукция по размерности пространства.
1) Если dim W = 1, то утверждение очевидно, т.к. любая матрица размера 1 является верхнетреугольной.
2) Пусть утверждение верно для dim W < n, докажем его для dim W = n. Т.к. поле алгебраически замкнуто, характеристический многочлен имеет корень λ, он будет собственным значением. Ему соответствует собственный вектор, который порождает одномерное инвариантное подпространство V , тогда матрица оператора f имеет вид A
f
=
µ
λ
?
0 A
f
0
¶
. По предположению индукции матрицу A
f
0
можно привести к верхнетреугольному виду A
f
0
=


λ
1
?
0
λ
n−1

,
тогда матрица A
f
=




λ
?
λ
1
?
0 0
λ
n−1



 также будет верхнетреугольной.
¤
Лемма 3.7.4 Если матрица оператора верхнетреугольная, то на главной диагонали стоят
собственные значения этого оператора.
Доказательство. Пусть A
f
=


λ
1
?
0
λ
n

, тогда A
f −t·id
=


λ
1
− t
?
0
λ
n
− t

, и det(f − t · id) = (λ
1
− t) · . . . · (λ
n
− t), т.е. λ
1
, . . . , λ
n
— это корни характеристического многочлена,
а значит собственные значения.
¤
Лемма 3.7.5 Пусть
оператор
f
такой,
что
в
алгебраически
замкнутом
поле
характеристический многочлен P
f
(t) имеет единственный корень λ, тогда некоторая
степень оператора g = f − λ · id равна нулю.
Доказательство.
Т.к. у оператора f только одно собственное значение λ, то в некотором базисе его матрица будет иметь вид A
f
=


λ
?
0
λ

. Матрица оператора g в этом базисе
27

имеет вид A
g
=


0
?
0 0

. Характеристический многочлен оператора g имеет вид P
g
(t) =
(−1)
n
t
n
, и, поскольку он является аннулирующим, то P
g
(g) = (−1)
n
g
n
= 0, значит, g
n
= 0.
¤
3.8
Жордановы клетки
Рассмотрим оператор f , заданный в базисе e
1
, . . . , e
n
матрицей
J
n
(λ) =






λ 1
λ
1
λ
1
λ






.
Такая матрица называется жордановой клеткой порядка n, с собственным значением λ. Действие такого оператора на базисных векторах устроено так: f (e
1
) = λe
1
, f (e
2
) = λe
2
+ e
1
, f (e
3
) =
λe
3
+ e
2
,. . . , f (e
n
) = λe
n
+ e
n−1
Нормальной или жордановой формой называется блочно-диагональная матрица, все блоки которой являются жордановыми клетками.
3.9
Присоединенные векторы и корневое подпространство
Обозначим через V
(1)
λ
подпространство собственных векторов оператора f , отвечающих собственному значению λ (вместе с нулевым вектором). Иначе это можно записать как V
(1)
λ
=
Ker(f − λ · id).
Аналогично определим V
(2)
λ
= Ker(f − λ · id)
2
, V
(3)
λ
= Ker(f − λ · id)
3
и т.д.
Получается цепочка вложенных друг в друга подпространств {0} ⊂ V
(1)
λ
⊂ V
(2)
λ
⊂ . . . ⊂ V .
Вектор v называется присоединенным вектором 1-го порядка оператора f , отвечающих собственному значению λ, если v ∈ V
(2)
λ
, v /
∈ V
(1)
λ
. Аналогично, присоединенным вектором порядка k, если v ∈ V
(k+1)
λ
, v /
∈ V
(k)
λ
Покажем, что рост подпространств V
(k)
λ
стабилизируется с ростом k.
Поскольку пространство, в котором действует наш оператор, конечномерно, то неубывающая числовая последовательность размерностей dim V
(1)
λ
6 dim V
(2)
λ
6 dim V
(3)
λ
6 . . . не может неограничченно возрастать, значит, найдется какой-то номер k, для которого соседние члены этой последовательности совпадут.
Утверждение 3.9.1 Если на каком-то шаге этой цепочки V
(k−1)
λ
и V
(k)
λ
совпали, то они
будут совпадать и дальше, т.е. V
(i)
λ
= V
(i+1)
λ
при i > k.
Доказательство.
Обозначим f − λ · id через g. По условию мы имеем g
k
x = 0 ⇐⇒ x ∈
Ker g
k
⇐⇒ x ∈ Ker g
k−1
⇐⇒ g
k−1
x = 0. Докажем, что g
k+1
x = 0 ⇐⇒ g
k
x = 0, т.е. что Ker g
k+1
=
Ker g
k
Если g
k
x = 0, то, очевидно, g
k+1
x = g(g
k
x) = 0. Обратно, если g
k+1
x = 0, то g
k
(gx) = 0 ⇐⇒
g
k−1
(gx) = 0 (по условию), следовательно, g
k
x = 0. Мы доказали, что Ker g
k+1
= Ker g
k
. Проделав эту операцию нужное число раз, получим что Ker g
k+2
= Ker g
k+1
и т.д.
¤
Обозначим через p тот номер, с которого происходит стабилизация цепочки подпространств
V
(k)
λ
. Тогда ∪
∞
k=1
V
(k)
λ
= V
(p)
λ
. Обозначим это пространство через V
λ
и назовем его корневым
подпространством оператора f , отвечающим собственному значению λ.
Утверждение 3.9.2 Подпространство V
λ
⊂ W инвариантно относительно оператора f .
Доказательство.
Возьмем произвольный вектор x ∈ V
λ
, т.е. (f − λ · id)
p
(x) = 0, тогда
(f − λ · id)
p
f (x) = f (f − λ · id)
p
(x) = f (0) = 0, значит, f (x) ∈ V
λ
¤
28

3.10
Теорема о разложении пространства в прямую сумму корневых подпространств
Лемма 3.10.1 Пусть f : V → V , λ — его собственное значение. Тогда имеет место
разложение V в прямую сумму, V = V
λ
⊕ W , где W — инвариантное подпространство, причем
ограничение оператора f на W обратимо.
Доказательство.
Без ограничения общности можно считать, что λ = 0. Для этого достаточно перейти от оператора f к оператору f − λ · id.
Положим W = Im f
p
и докажем, что V = V
λ
⊕ W = Ker f
n
⊕ Im f
p
. Инвариантность Im f
p
очевидна: если y ∈ Im f
p
, то существует такой x, что y = f
p
(x); тогда f (y) = f
p+1
(x) ∈
Im f
p+1
. Но Im f
p+1
⊂ Im f
p
, а размерности этих образов совпадают, т.к. совпадают размерности соотвтествующих ядер, поэтому Im f
p+1
= Im f
p
Покажем, что сумма V
0
и W — прямая. Для этого достаточно доказать, что их пересечение равно нулю. Так как сумма размерностей ядра и образа равна размерности всего пространства,
из того, что пересечение — нулевое, будет следовать, что dim V = dim V
0
+dim W , т.е. V = V
0
⊕W .
Пусть v ∈ V
0
∩ W , v 6= 0. Т.к. v ∈ V
0
, то f
p
(v) = 0, а т.к. v ∈ W , то v = f
p
(w) для некоторого вектора w ∈ V . Тогда f
p
(w) = v 6= 0, f
2p
(w) = f
p
(v) = 0. Из того, что f
p
(w) 6= 0, следует,
что w /
∈ V
0
, а из того, что f
2p
(w) = 0, следует, что w ∈ V
(2p)
0
= V
0
. Полученное противоречие доказывает, что V
0
∩ W = {0}.
Докажем теперь, что ограничение f на W невырождено. Если бы это было не так, что 0 был бы собственным значением оператора f |
W
, т.е. существовал бы собственный вектор v ∈ W , v 6= 0,
f (v) = 0. Но это бы означало, что v ∈ V
0
. Но V
0
∩ W = {0}. Т.о., 0 не может быть собственным значением для f |
W
¤
Теорема 3.10.2 Пусть дан оператор f : V → V (над алгебраически замкнутым полем).
Тогда пространство V является прямой суммой всех корневых подпространств, т.е. V = V
λ
1
⊕
. . . ⊕ V
λ
k
, где λ
1
, . . . , λ
k
— все собственные значения оператора f .
Доказательство.
Применим нужное число раз предыдущую лемму. После первого применения получим V = V
λ
1
⊕ W . Далее, из блочно-диагонального вида матрицы оператора
f — она состоит из блоков, отвечающих ограничениям f |
V
λ1
и f |
W
— следует, что собственные значения f |
W
— λ
2
, λ
3
, . . . , λ
k
. Продолжая этот процесс, мы исчерпаем все пространство.
Действительно, если после k-кратного применения леммы мы получим V = V
λ
1
⊕ V
λ
2
⊕ . . . ⊕
V
λ
k
⊕ W
0
, то W
0
= {0} — иначе оператор ограничения f |
W
0
будет иметь еще одно собственное значение (поле алгебраически замкнуто), которого не было у f — противоречие.
¤
Отметим, что ограничение оператора на корневое подпространство имеет единственное собственное значение.
3.11
Жорданова нормальная форма оператора
Теорема 3.11.1 (Жордана о приведении матрицы оператора к нормальной форме)
Для любого оператора f существует базис, в котором его матрица A
f
будет жордановой.
Такая матрица единственна с точностью до перестановки блоков (клеток).
Доказательство.
1) Существование. По теореме о корневом разложении, в подходящем базисе матрица оператора
f имеет блочно-диагональный вид
A
f
=






A
f |
Vλ1
A
f |
Vλ2
A
f |
Vλk






,
поэтому достаточно доказать теорему для операторов с единственным собственным значением,
каковыми являются ограничения оператора f на корневые подпространства.
29

Поэтому мы можем предположить без ограничения общности, что f имеет единственное собственное значение. Также без ограничения общности можно считать, что это собственное значение равно нулю.
Наша задача — построить базис в пространстве, в котором действует такой оператор, т.е. в корневом пространстве V = V
0
= V
(p)
0
, которое является объединением подпространств V
(1)
0
⊂
V
(2)
0
⊂ . . . ⊂ V
(p)
0
Для подпространства L ⊂ V система векторов e
r+1
, . . . , e
n
называется относительным базисом
(относительно подпространства L), если, будучи дополненной базисом подпространства L, она становится базисом всего пространства V . В любом (конечномерном) пространстве можно выбрать относительный базис относительно любого подпространства.
На первом шаге рассмотрим подпространство V
(p−1)
0
⊂ V
(p)
0
= V и выберем относительный базис e
1
, . . . , e
q
относительно этого подпространства. Очевидно, он будет состоять из присоединенных векторов порядка p − 1. Поскольку f (V
(p)
0
) = V
(p)
0
, f (e
1
), . . . , f (e
q
) ∈ V
(p−1)
0
Покажем, что система векторов f (e
1
), . . . , f (e
q
) линейно независима относительно предыдущего подпространства V
(p−2)
0
: если α
1
f (e
1
) + . . . + α
q
f (e
q
) = f (α
1
e
1
+ . . . + α
q
e
q
) ∈ V
(p−2)
0
, то
α
1
e
1
+ . . . + α
q
e
q
∈ V
(p−1)
0
, и из определения векторов e
1
, . . . , e
q
следует, что все α
1
=
. . . = α
q
= 0. Дополним систему векторов f (e
1
), . . . , f (e
q
) до относительного базиса в V
(p−1)
0
относительно подпространства V
(p−2)
0
векторами g
1
, . . . , g
s
. Т.о. относительный базис V
(p−1)
0
относительно подпространства V
(p−2)
0
состоит из векторов f (e
1
), . . . , f (e
q
), g
1
, . . . , g
s
. К этому относительному базису применим оператор f и вновь полученную систему векторов опять дополним до относительного базиса V
(p−2)
0
относительно подпространства V
(p−3)
0
. Этот процесс можно продолжить до конца, т.е. до подпространства V
(1)
0
и его нулевого подпространства.
Запишем полученные векторы в виде таблицы:
e
1
. . .
e
q
f (e
1
)
. . .
f (e
q
)
g
1
. . .
g
s
f
2
(e
1
)
. . .
f
2
(e
q
)
f (g
1
)
. . .
f (g
s
)
h
1
. . .
h
r
. . .
. . .
. . .
. . .
. . .
. . .
. . .
. . .
. . .
. . . . . . . . . . . .
f
p−1
(e
1
) . . . f
p−1
(e
q
) f
p−2
(g
1
) . . . f
p−2
(g
s
) f
p−3
(h
1
) . . . f
p−3
(h
r
) . . .
l
1
. . .
l
t
Векторы нижней строчки образуют базис подпространства V
(1)
0
, векторы предпоследней строчки образуют относительный базис в V
(2)
0
относительно V
(1)
0
, поэтому векторы двух последних строчек составляют базис подпространства V
(2)
0
. Добавляя к ним векторы третьей с конца строчки, получаем базис подпространства V
(3)
0
, и т.д. В итоге, все векторы таблицы составляют базис пространства V . Осталось проверить, что это — такой базис, в котором матрица оператора состоит из жордановых клеток.
Для этого рассмотрим вертикальные цепочки векторов таблицы. Обозначим f
p−1
(e
1
) = ˜
e
1
,
f
p−2
(e
1
) = ˜
e
2
,... e
1
= ˜
e
p
. Т.к. ˜
e
1
— собственный вектор, отвечающий нулевому собственному значению, то f (˜
e
1
) = 0. Далее, по определению, f (˜
e
2
) = f
p−1
(e
1
) = ˜
e
1
, f (˜
e
3
) = ˜
e
2
,.... Пусть
L
1
= h˜
e
1
, . . . , ˜
e
p
i — линейная оболочка векторов первого стольбца. Тогда L
1
переходит в себя,
т.е. является инвариантным подпространством, при этом матрица оператора f , ограниченного на L
1
, имеет вид жордановой клетки с нулевым собственным значением. Аналогично, векторы второго столбца образуют инвариантное подпространство L
2
, и матрица ограничения f на L
2
также является жордановой клеткой, и т.д. Таким образом, матрица оператора f состоит из стольких жордановых клеток, сколько столбцов в таблице.
2) Единственность. Надо показать, что каким бы способом мы не привели бы матрицу оператора f к жордановой нормальной форме, количество жордановых клеток фиксированной размерности с собственным значением λ одно и то же. Для этого зафиксируем собственное значение λ и посчитаем количество клеток, ему отвечающих.
Введем числа r
k
(λ) = rk(f − λ · id)
k
и N
k
(λ) — количество жордановых клеток размерности k,
отвечающих собственному значению λ. Для блочно-диагональных матриц ранги можно считать по каждому блоку отдельно, и суммировать. Легко заметить, что при вычислении разности
30

r
k+1
(λ)−r
k
(λ) нужно учитывать только клетки, отвечающие собственному значению λ, поскольку ранги остальных клеток J
m
(λ
i
− λ) не меняются при возведении таких клеток в любую степень
(эти клетки невырождены).
Рассмотрим разность r
0
(λ) − r
1
(λ). Для каждой отдельно взятой клетки с собственным значением λ такая разность равна 1, т.к. ранг клетки размера k×k равен k − 1, т.е. на единицу меньше, чем размерность. Поэтому каждая клетка вносит в разность r
0
(λ) − r
1
(λ) вклад, равный единице, т.е. эта разность равна общему количеству клеток, следовательно r
0
(λ) − r
1
(λ) =
N
1
(λ) + N
2
(λ) + N
3
(λ) + . . ..
Рассмотрим разность r
1
(λ) − r
2
(λ). Для клеток размера 1×1 такая разность равна нулю, а для клеток размера n×n при n > 2 ранг клетки равен n − 1, а ранг ее квадрата равен n − 2, и их разность равна единице. Поэтому разность r
1
(λ) − r
2
(λ) равна количеству клеток размера n×n
при n > 2, т.е. r
1
(λ) − r
2
(λ) = N
2
(λ) + N
3
(λ) + . . .. Аналогично получаем, что r
2
(λ) − r
3
(λ) =
N
3
(λ)+N
4
(λ)+. . . и т.д., r
i−1
(λ)−r
i
(λ) = N
i
(λ)+N
i+1
(λ)+. . .. Вычитая из предыдущего равенства последующее, получаем N
i
(λ) = (r
i−1
(λ) − r
i
(λ)) − (r
i
(λ) − r
r+1
(λ)) = r
i−1
(λ) − 2r
i
(λ) + r
r+1
(λ).
Т.к. ранги от выбора базиса не зависят, то и числа N
i
(λ) от базиса не зависят, следовательно количество клеток каждого размера будет одно и то же, поэтому нормальная форма оператора единственна с точностью до перестановки клеток, из которых она состоит.
¤
3.12
Функции от операторов и от матриц
Если функция f (x) достаточно гладкая, т.е. имеет достаточно много производных, то для нее можно написать формулу Тейлора, которая будет иметь достаточно много членов, f (t) =
f (λ) +
f
0
(λ)
1!
(t − λ) +
f
00
(λ)
2!
(t − λ)
2
+ . . . +
f
(m)
(λ)
m!
(t − λ)
m
+ r
m
(в качестве последнего слагаемого можно взять, например, остаточный член в форме Лагранжа). Если матрица A — жорданова клетка, A =




λ
1 0
λ
1 0
λ



, то f (A) =






f (λ)
f
0
(λ)
1!
. . .
f
(n−1)
(λ)
(n−1)!
f (λ)
f
0
(λ)
1!
0
f (λ)






, т.е. значение функции f (A) определяется только значением функции f (t) и ее n − 1 производной в точке
t = λ, а все производные более высоких порядков (т.е. все последующие слагаемые формулы
Тейлора) дают нулевой вклад. То есть, мы можем взять формулу Тейлора для этой функции,
обрубить ее на n − 1-й производной, и мы получим многочлен p(t), причем p(A) = f (A), а вычислять значение многочлена от матрицы мы умеем. Если матрица произвольна, то ее нужно привести к жордановой форме, A
0
=


A
1 0
0
A
m

, где A
1
, . . . , A
m
— жордановые клетки.
Т.к. f (A
0
) =


f (A
1
)
0 0
f (A
m
)

 и f(A) = Cf(A
0
)C
−1
, то формулу Тейлора нам достаточно обрубить на k−1-й производной, где k — максимальный размер жордановой клетки в жордановой форме матрицы A, тогда мы получим такой многочлен p(t), что p(A) = f (A). Этот многочлен называется интерполяционным.
Вопрос: Почему определение f (A) не зависит от способа приведения к жордановой форме ?
Проверьте, что если матрица A приведена к жордановому виду J(A) с помощью двух различных матриц перехода, C и D, т.е. если A = CJ(A)C
−1
= DJ(A)D
−1
, то матрицы D
−1
C и f (J(A))
перестановочны для любой функции f , для которой определено f (J(A)).
3.13
Овеществление и комплексификация
Овеществление
Определение 3.13.1 Пусть V — векторное пространство над полем комплексных чисел C.
Рассмотрим пространство V
R
, состоящее из тех же векторов, что и V , только вместо операции умножения на все комплексные числа мы ограничимся умножением только на вещественные
31

числа. Тогда V
R
будет линейным пространством над полем вещественных чисел R, оно называется
овеществлением пространства V .
Пусть e
1
, . . . , e
n
— базис в пространстве V , тогда он не будет базисом пространства V
R
,
так как не все вектора являются их линейными комбинациями с вещественными числами,
а на комплексные числа мы больше не можем умножать. Базисом в V
R
будут вектора
e
1
, . . . , e
n
, ie
1
, . . . , ie
n
(проверьте), следовательно dim
R
V
R
= 2 dim
C
V (индекс у dim непоминает,
над каким полем мы рассматриваем размерность пространства).
Определение 3.13.2 Пусть дан оператор f : V → V , тогда этот оператор, рассматриваемый на пространстве V
R
, называется овеществлением оператора f и обозначается f
R
Посмотрим, как связаны матрицы операторов f и f
R
. Пусть в базисе e
1
, . . . , e
n
пространства V
f (e
k
) = c
j
k
e
j
. Матрицу A
f
= (c
j
k
) оператора f можно разложить на вещественную и чисто мнимую часть, т.к. ее элементы — это комплексные числа, т.е. A
f
= A + iB, где A = (Re c
j
k
), B = (Im c
j
k
).
Тогда матрица оператора f
R
в базисе e
1
, . . . , e
n
, ie
1
, . . . , ie
n
будет иметь вид A
f
R
=
µ
A −B
B
A
¶
Посчитаем det A
f
R
, для чего сделаем следующие элементарные преобразования над строками и столбцами матрицы A
f
R
:
µ
A −B
B
A
¶
→
µ
A − iB −B − iA
B
A
¶
→
→
µ
A − iB −B − iA + i(A − iB)
B
A + iB
¶
=
µ
A − iB
0
B
A + iB
¶
,
поэтому det A
f
R
= det(A − iB) det(A + iB) = det(A
f
) · det A
f
= | det A
f
|
2
.
Комплексная структура
Определение 3.13.3 Пусть V — векторное пространство над R. Комплексной структурой
на V называется такой линейный оператор j : V → V , что j
2
= −id.
Тогда пространство V можно рассматривать как векторное пространство над C, так как на
V можно ввести операцию умножения на комплексные числа: (a + ib)v := av + bj(v). То, что это определение корректно (свойства v-viii определения векторного пространства), проверяется тривиально.
Лемма 3.13.4 Пусть
j
—
комплексная
структура
на
вещественном
векторном
пространстве V . Тогда
1) dim V четна;
2) в подходящем базисе матрица оператора j имеет вид A
j
=
µ
0
−E
E
0
¶
.
Доказательство.
1. Обозначим через e
V пространство V , рассматриваемое как комплексное (с помошью комплексной структуры j). Размерность пространства e
V конечна, т.к. по базису пространства
V можно разложить любой вектор (возможно неоднозначно). Пусть e
1
, . . . , e
n
— базис в e
V , тогда
e
1
, . . . , e
n
, e
n+1
= j(e
1
), . . . , e
2n
= j(e
n
) будет базисом в V , следовательно, dim V = 2n.
2. Т.к. j(e
i
) = e
n+i
и j(e
n+i
) = −e
i
для i = 1, . . . , n, то в этом базисе матрица оператора имеет указанный вид.
¤
32

Комплексификация
Определение 3.13.5 Пусть V — векторное пространство над полем R. Рассмотрим пространство V
C
= V ⊕ V = {(a, b) : a, b ∈ V } и определим комплексную структуру следующим образом: j(a, b) := (−b, a) (нетрудно убедиться, что j
2
= −id). Пространство с такой комплексной структурой называется комплексификацией пространства V .
Покажем, что dim
C
V
C
= dim
R
V . Если e
1
, . . . , e
n
— базис в пространстве V , то (e
1
, 0), . . . , (e
n
, 0)
будет базисом в пространстве V
C
. Действительно, поскольку j(e
i
, 0) = (0, e
i
), то умножением на мнимую единицу мы можем получить вектора (0, e
1
), . . . , (0, e
n
) и, следовательно, любой вектор
(a, b), где a, b ∈ V .
Определение 3.13.6 Если дан оператор f : V → V , то оператор f
C
: V
C
→ V
C
, заданный формулой f
C
(a, b) := (f a, f b), называется комплексификацией оператора f .
Легко убедиться, что так определенный f
C
действительно будет линейным оператором. Если
A
f
— матрица оператора f в базисе e
1
, . . . , e
n
, то эта же матрица будет матрицей оператора f
C
в базисе (e
1
, 0), . . . , (e
n
, 0).
В дальнейшем мы будем использовать обозначение a + ib для пары (a, b) по аналгоии с комплексными числами.
3.14
Инвариантные подпространства в вещественном случае
В случае алгебраически замкнутого поля каждый оператор имеет собственные значения, и,
следовательно, одномерные инвариантные подпространства. В вещественном случае это, вообще говоря, неверно, но имеется более слабое утверждение о существовании по крайней мере двумерных инвариантных подпространств.
Лемма 3.14.1 Если f : V → V — оператор в вещественном векторном пространстве и
dim V > 1, то в пространстве V существует либо одномерное, либо двумерное инвариантное
подпространство.
Доказательство.
Если dim V = 1, то утверждение леммы очевидно. Если dim V > 1, то пусть λ = α + iβ — собственное значение оператора f
C
. Тогда в V
C
есть собственный вектор a + ib,
a, b ∈ V , отвечающий собственному значению λ. Тогда
f
C
(a + ib) = (α + iβ)(a + ib) = αa − βb + i(αb + βa),
но с другой стороны f
C
(a+ib) = f (a)+if (b), следовательно, f (a) = αa−βb и f (b) = αb+βa. Т.к. α и
β — это вещественные числа, то f (a), f (b) ∈ ha, bi, значит, ha, bi — инвариантное подпространство.
Очевидно, что оно либо одномерное, либо двумерное (на самом деле оно всегда будет получаться двумерным, если β 6= 0).
¤
33

4
Операторы в евклидовых и унитарных пространствах
4.1
Сопряженный оператор
Изучим теперь линейные операторы, действующие в евклидовых и эрмитовых пространствах,
т.е. в пространствах со скалярным произведением.
Определение 4.1.1 Если для оператора f : V → V существует такой оператор g, что для любых векторов a, b ∈ V выполняется равенство (f (a), b) = (a, g(b)), то g называется
сопряженным оператором для f .
Докажем единственность сопряженного оператора. Допустим, что g
1
и g
2
— два сопряженных оператора для f . Тогда (f (a), b) = (a, g
1
(b)) = (a, g
2
(b)), т.е. (a, g
1
(b) − g
2
(b)) = 0 для любого вектора a, следовательно при любом b имеем g
1
(b) − g
2
(b) = 0, следовательно, g
1
= g
2
Сопряженный оператор обозначается g = f
∗
Лемма 4.1.2 Если операторы f
1
и f
2
имеют сопряженные f
∗
1
и f
∗
2
соответственно, то
операторы h = f
1
+ f
2
и g = f
1
f
2
также имеют сопряженные h
∗
и g
∗
, причем h
∗
= f
∗
1
+ f
∗
2
b
g
∗
= f
∗
2
f
∗
1
.
Доказательство.
приведем доказательство для второго утверждения (для композиции операторов), т.к. для первого оно очевидно. (f
1
f
2
(a), b) = (f
2
(a), f
∗
1
(b)) = (a, f
∗
2
f
∗
1
(b)).
¤
Лемма 4.1.3 Если в ортонормированном базисе матрица оператора f равна A и
существует сопряженный оператор f
∗
, то матрица этого оператора в том же базисе равна
A
t
(если пространство евклидово) или A
t
(если пространство эрмитово).
Доказательство.
Пусть матрица оператора f в ортонормированном базисе e
1
, . . . , e
n
есть
A =


a
1 1
. . . a
1
n
a
n
1
. . . a
n
n

, а матрица оператора f
∗
(в том же базисе) есть B =


b
1 1
. . . b
1
n
b
n
1
. . . b
n
n

.
Тогда a
j
i
= (e
j
, a
k
i
e
k
) = (e
j
, f (e
i
)) = (f
∗
(e
j
), e
i
) = (b
l
j
e
l
, e
i
) = b
i
j
, откуда получаем A = B
t
, или
B = A
t
¤
Отметим, что условие ортонормированности базиса в лемме является существенным.
Лемма 4.1.4 Для любого оператора f существует ему сопряженный f
∗
.
Доказательство.
Выберем ортонормированный базис e
1
, . . . , e
n
, и пусть A
f
— матрица оператора f в этом базисе. Тогда матрица A
t
f
будет (в этом же базисе) матрицей некоторого оператора g. Пусть A
f
=


c
1 1
. . . c
1
n
c
n
1
. . . c
n
n

. Возьмем произвольные векторы a = a
i
e
i
, b = b
i
e
i
Тогда
f (b) =


c
1 1
. . . c
1
n
c
n
1
. . . c
n
n




b
1
b
n

 ;
g(a) = (a
1
. . . a
n
)


c
1 1
. . . c
1
n
c
n
1
. . . c
n
n

 ,
и легко видеть, что
(a, f (b)) = (a
1
. . . a
n
)


c
1 1
. . . c
1
n
c
n
1
. . . c
n
n




b
1
b
n

 = (b, g(a)) = (g(a), b),
т.е. g = f
∗
¤
34