Szacunkowe odwrotności macierzy i Numer Stan


Original: http://www.efgh.com/math/invcond.htm
Copyright: Philip J. Erdelsky

LOGO

Philip J. Erdelsky
09 czerwca 2001

Prosimy o e-mail, komentarze, poprawki i uzupełnienia do webmastera w pje@efgh.com.

Około 32 lat temu, opublikowałem co niektórzy opisane jako “wynik” na eleganckiej liczby stan matrycy. Stwierdza on, że nieosobliwych macierz ma bardzo zróżnicowaną przybliżonych prawe i lewe odwrotności, wtedy i tylko wtedy, gdy jest źle uwarunkowane. Ja jednak nie opublikowała dowód. Dowód nie jest szczególnie trudne. Jest publikowany po raz pierwszy tutaj.

Wszystkie poniższe wyniki zajmować skończenie wymiarowych przestrzeni wektorowych rzeczywistych. Wektory są tradycyjnie reprezentowane przez wektory kolumnowe. Wszystkie wektory są tej samej wielkości i wszystkie schematy prawdziwe kwadratowych macierzy o tej samej liczbie wierszy jako wektorów.

Istnieją standardowe rozszerzenia do skończenie wymiarowych przestrzeni wektorowych złożonych, ale niektóre wyniki nie są prawdziwe w przypadku nieskończenie-wymiarowej.

Definition. Norma wektora jest funkcja o wartościach rzeczywistych | | x | | z A x wektora takie, że dla wszystkich wektorów x i y i wszystkich skalarów c:

| | X | |> = 0 z równości, wtedy i tylko wtedy, gdy x jest równe zero.
| | Cx | | = | c | | | x | |.
| | X + y | | <= | | x | | + | | y | |.

Przykładem normy wektora jest euklidesowa norma:

| | X | | = sqrt (XT X).

Kolejnym jest “maksymalna norma”:

| | X | | = max (| x1 |, | x2 |, …, | xn |),

gdzie x1, x2, …, xn są wpisy w wektora x.

Definition. Norma macierzy odpowiada normie wektora jest funkcja o wartościach rzeczywistych | | | | macierzy zdefiniowanej przez

||A|| = sup ||x|| = 1 ||Ax||.

Argumenty wskazują, że zwartość supremum zawsze istnieje i jest osiągnięty, dlatego zawsze jest co najmniej jeden niezerowy wektor x, dla których

||Ax|| = ||A|| ||x||.

Alternatywnie ||A|| mogą być zdefiniowane jako takie, że liczba

||Ax|| <= ||A|| ||x||,, dla wszystkich x, z równości przynajmniej jednego niezerowych x. Jest to dość łatwe do udowodnienia, że ​​jeśli A i B są macierzami a c jest skalarem, ||A|| >= 0  z równością, wtedy i tylko wtedy, gdy A = 0.
| | CA | | = | c | | | | |.
| | A + B | | <= | | | | + | | B | |.
| | AB | | <= | | | | | | B | |.

Definition. Liczba warunek, nieosobliwych macierzy A w odniesieniu do normy macierzy jest

||A|| ||A-1||.

Matryca o wysokiej liczbie stan mówi się źle uwarunkowane.

Dowód następującego twierdzenia wymaga trochę teorii wypukłości (patrz dodatek A).

Propozycja. Dla każdej normy wektorowej i każdej pary wektorów x i y, gdzie x jest niezerowe, jest taka, że ​​macierz Ax = y i | | | | = | | y | | / | | x | |.

Dowód. Zbiór {z | | | z | | <= | | x | |} jest ograniczony, wypukłe i x jest na granicy. Dlatego nie jest wsparcie hiperpłaszczyzną (czasami nazywany hiperpłaszczyzną styczne) w X. Następnie jest podstawą

x, S2, S3, …, SN,

wektory, w których wszystkie, z wyjątkiem X równoległych do hiperpłaszczyzny wsparcia.

Niech teraz A będzie macierzą odwzorowania liniowego, który prowadzi X do Y i każdy inny wektor podstawa do zera, tzn. dla dowolnego wektora w.

w = cx + c2s2 + c3s3 + … + Cnsn,

Aw = cy.

Następnie, jeśli C nie jest równa zero,

W / C = X + (C2 / C) + S2 (C3 / C) + … S3 + (CN / C) SN.

Od w / c jest hiperpłaszczyzny wsparcia, musi znajdować się na krawędzi lub w zewnętrznej z zestawu {| | | z | | <= | | X | |}. Stąd | | W / c | |> = | | x | |,

| | W | |> = | c | | | x | |.

Stąd

| | Aw | | / | | w | | = | | cy | | / | | w | | <= (| c | | | r | |) / (| c | | | x | |) = | | y | | / | | x | |.

Jeżeli c = 0, to | | Aw | | = 0, więc nierówność wciąż trzyma. Ponadto, mamy równość, gdy w = x. Stąd

||A|| = ||y|| / ||x||.

Twierdzenie. Dla każdej macierzy nieosobliwych rzeczywistym i każdy prawdziwy B matryca nie równa odwrotności,

||AB – I|| / ||BA – I|| <= ||A|| ||A-1||,

z równości jakiegoś macierzy B dowolnie blisko do odwrotności A.

Ponadto

||BA – I|| / ||AB – I|| <= ||A|| ||A-1||,

z równości jakiegoś macierzy B dowolnie blisko do odwrotności A.

Dowód. Niech D = BA – I. Następnie Pierwsze twierdzenie staje

||ADA-1|| / ||D|| <= ||A|| ||A-1||,,

z równości pewnym niezerowym D. Możemy D dowolnie bliskie zera, po prostu jej skalowania. Teraz, (4) powyżej, nierówności łatwo udowodnić. Aby udowodnić istnienie macierzy D, dla których równość ma, niech x i y będą niezerowe wektory takie, że

||A-1x|| = ||A-1|| ||x||,

||Ay|| = ||A|| ||y||.

Niech D będzie taka, że ​​macierz

D (-1x) = Y, | | D | | = | | y | | / | |-1x | |.

Następnie ||ADA-1|| ||x|| >= ||ADA-1x|| = ||Ay|| = ||A|| ||y|| = ||A|| ||A-1x|| ||D|| = ||A|| ||A-1|| ||x|| ||D||,,

, z którego wynika natychmiast pożądany skutek.

Dowód drugiej twierdzenia jest podobny.
Dodatek A – trochę teorii wypukłość

Ta część została dodana w dniu 30 października 2006 roku.

C podzbiór rn (N-wymiarową przestrzeń realna Vector) jest nazywany wypukły, gdy dla każdego x i y w C, segment łącząca je również w C, tj. tx + (1-t) y w C dla wszystkich t pomiędzy 0 i 1.

To pokazuje, że jest łatwo i wnętrza zamknięcia zestawu wypukłego są wypukłe, a punkt przecięcia dwóch zestawów wypukłych jest wypukła.

M-wymiarowy simplex Rn jest zbiorem wszystkich kombinacji liniowych z m +1 punktach x0, x1, x2, … , Xm (zwanych wierzchołkami) o współczynnikach nieujemnych, których suma wynosi 1:

{A0x0 + a1x1 + a2x2 + … + Amxm | a0 + a1 + a2 + … + Am = 1, A0> = 0, A1> = 0, A2> = 0, …, am> = 0},

i gdzie wektory x1-x0, x2-x0, … , Xm-x0 są liniowo niezależne.

Jednowymiarowa simplex jest odcinek; dwuwymiarowy simplex jest trójkąt i trójwymiarowy simplex jest czworościan.

Jest to łatwo wykazać, że, jeśli zawiera wszystkie wypukłe zestaw wierzchołków simplex, że zawiera każdy punkt simplex.

Hiperpłaszczyzna jest przetłumaczony (n-1)-wymiarową podprzestrzenią Rn, tzn. jest postaci {h + s | S w S}, gdzie h jest punkt w hiperpłaszczyzny a S (n-1) -wymiarowa podprzestrzeń S Rn. (Ta reprezentacja nie jest wyjątkowy, ponieważ h może być dowolny punkt na hiperpłaszczyzny.) Hiperpłaszczyzną mówi się, że odejście hiperpłaszczyzną przez godzinę i równoległa do S. hiperpłaszczyzną w R1 jest punkt, hiperpłaszczyzna w R2 jest linia prosta , a R3 jest w hiperpłaszczyzną samolot.

Twierdzenie A.1 .. Hiperpłaszczyzną w Rn Rn dzieli się na dwie części; dokładniej uzupełnieniem hiperpłaszczyzny składa się z dwóch rozłącznych zbiorów otwartych, które nazywane są dwie strony hiperpłaszczyzny. Ponadto, odcinek z jednego boku na drugi przechodzi hiperpłaszczyzny.

Dowód. Załóżmy hiperpłaszczyzną przechodzi przez godzinę i jest równoległa do S i niech s1, s2, …, sn-1 stanowi podstawę do S. Dla każdego x w Rn Niech f (x) będzie wyznacznikiem macierzy, której kolumny są S1, S2, …, 1 i sn-XH. Wtedy f (x) = 0 wtedy i tylko wtedy, gdy x jest na hiperpłaszczyzny. Ponieważ f jest ciągła, dwa zbiory {x w Rn | f (x) <0} i {x w Rn | f (x)> 0} są wymagane zbiory otwarte.

Twierdzenie pośrednie można wykazać w innej części.

Twierdzenie A.2. Biorąc niepusty wypukłe zestaw C rn i punkt X w C zewnątrz, jest oddzielenie hiperpłaszczyzną C z X, tj. leżą, X i C po przeciwnych stronach hiperpłaszczyzny.

Dowód. Rozważmy punkt C w zamknięcia C najbliżej X (zwykle metryka euklidesowa), standardowe argumenty zwartości pokazać, że taki punkt musi istnieć. (Można również okazały się być unikalna, ale wyjątkowość nie jest wymagana dla tego dowodu.)

X jest od zewnątrz w C, różni się od C X. Istnieje zatem (n-1) S wymiarowa podprzestrzeń Rn prostopadłej do linii łączącej segmentu C i X, i nie jest hiperpłaszczyzną przechodzącej przez punkt środkowy odcinka linii, równoległej do S.

Punktów X i C znajdują się po przeciwnych stronach hiperpłaszczyzny.

Załóżmy teraz, w celu sprzeczności, że nie jest w punkcie D na hiperpłaszczyzny C lub po tej samej stronie, co X. Od zamknięcia C jest wypukła, odcinek z D na C leży całkowicie w zamknięcia C. towarzyszący Ilustracja przedstawia zależność w dwuwymiarowej płaszczyźnie zawierającej D, C i X. Kąt DCX jest ostra, więc niektóre punkt segmentu linii wystarczająco blisko C musi być bliżej X niż C, co jest w sprzeczności, ponieważ c było najbliższym punktem w zamknięcia C do X.

ilustracja

Następne twierdzenie opiera się na następujących propozycji, co jest oczywiste dla zbiorów wypukłych w rodzaju stosowanych tutaj, ale w rzeczywistości jest to do wszystkich zestawów wypukłych.

Twierdzenie A.3. Niech S będzie zbiorem wypukłym w Rn i niech b będzie punktem granica S. Następnie wskazuje na zewnątrz S, które są dowolnie blisko ur.

Dowód. Załóżmy dla celów sprzeczności, że niektóre okolica b. nie zawiera żadnych punktów w zewnętrznej S. Stąd każdy punkt w okolicy jest

illustration

albo punkt graniczny lub wnętrze punktu S.

Teraz skonstruować n-wymiarową simplex wewnątrz dzielnicy z b w jego wnętrzu.

Wierzchołki simplex musi być albo punkty S lub punkty graniczne S. W obu przypadkach istnieją punkty dowolnie blisko nich, że kłamią w S.

Wybierz takie punkty do skonstruowania nieco zniekształcony simplex, które nadal obejmuje b.

Ilustracja

Ponieważ S jest wypukły, to zawiera wszystkie punkty znajdujące się na zniekształconym simplex. Stąd b punkt jest punktem wewnętrznym S. To

jest pożądana sprzeczność.

Hiperpłaszczyzną nazywamy styczną hiperpłaszczyznę lub hiperpłaszczyzną pomocy zestawu w Rn w punkcie granicznym, jeżeli (1)

illustration

hiperpłaszczyzną zawiera punkt brzegowy i (2) wszystkie pozostałe punkty w zbiorze, które nie są na kłamstwie hiperpłaszczyzny na jednym stronie hiperpłaszczyzny.

Twierdzenie A.4. Zestaw wypukła w Rn ma co najmniej jeden styczny w każdym punkcie hiperpłaszczyzny granicznej.

Dowód. Niech b będzie punktem granica zestaw wypukłej S i niech x1, x21, … Sekwencja jest punktów B zbliża zewnętrznych. Z twierdzenia A.3 dla każdego xi istnieje hiperpłaszczyzna Hi oddzielenie b od S. Some podciąg zbieżny do tych hiperpłaszczyzn pożądanego hiperpłaszczyzny stycznej.

Można zapytać, jak hiperpłaszczyzny może zbieżne. Hi skojarzyć tylko z punktu, w którym przecina linię łączącą XI do najbliższego punktu, w zamknięciu i znormalizowana S podstawę jego podprzestrzeni S. współrzędne tych wektorów są ograniczone, to wszystkie one mają zbieżne podciągów.

Comments are closed.