rozn. geom_ - jerzy kijowski

320
Geometria różniczkowa jako narzędzie nauk przyrodniczych Wersja robocza in statu nascendi (30 września 2014) Jerzy Kijowski Centrum Fizyki Teoretycznej PAN Warszawa 2013

Upload: mikolajbugzilla

Post on 23-Jan-2016

275 views

Category:

Documents


5 download

DESCRIPTION

Klekle

TRANSCRIPT

Page 1: Rozn. Geom_ - Jerzy Kijowski

Geometria różniczkowajako narzędzie nauk przyrodniczych

Wersja robocza in statu nascendi(30 września 2014)

Jerzy KijowskiCentrum Fizyki Teoretycznej PAN

Warszawa 2013

Page 2: Rozn. Geom_ - Jerzy Kijowski

Spis treści

1 Wstęp 11.1 Geometria a nauki przyrodnicze . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Układy współrzędnych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.3 Koncepcja wykładu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2 Rozwój pojęcia wektora stycznego 112.1 Eksperyment czy spekulacja myślowa? . . . . . . . . . . . . . . . . . . . . 112.2 Przestrzeń afiniczna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132.3 Wymiar przestrzeni afinicznej . . . . . . . . . . . . . . . . . . . . . . . . . 172.4 Współrzędne prostoliniowe w przestrzeni afinicznej . . . . . . . . . . . . . 192.5 Wektor zaczepiony w punkcie jako operator różniczkowy . . . . . . . . . . 202.6 Współrzędne wektora w krzywoliniowym układzie współrzędnych . . . . . 242.7 Zmiana współrzędnych wektora odpowiadająca zmianie układu współrzędnych 282.8 Rozmaitości różniczkowe zanurzone w przestrzeni afinicznej. Przestrzeń stycz-na . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.9 Forma uwikłana a forma parametryczna rozmaitości zanurzonej . . . . . . 332.10 Abstrakcyjna rozmaitość różniczkowalna i jej przestrzeń styczna . . . . . . 372.11 Wiązka styczna do rozmaitości . . . . . . . . . . . . . . . . . . . . . . . . . 392.12 Odwzorowania między rozmaitościami różniczkowalnymi. Odwzorowanie stycz-ne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2.13 Krzywe sparametryzowane. Wektor styczny do krzywej . . . . . . . . . . . 432.14 Superpozycja odwzorowań transportu. Inna definicja odwzorowania stycznego 462.15 Podrozmaitości . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472.16 Własności globalne a własności lokalne . . . . . . . . . . . . . . . . . . . . 49

3 Algebra pól wektorowych. Układy dynamiczne 543.1 Pole wektorowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543.2 Komutator pól wektorowych . . . . . . . . . . . . . . . . . . . . . . . . . . 553.3 Sens analityczny a sens geometryczny . . . . . . . . . . . . . . . . . . . . . 573.4 Pole wektorowe jako układ dynamiczny. Jednoparametrowe grupy diffeomor-fizmów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

3.5 Pole wektorowe jako infinitezymalna postać grupy diffeomorfizmów . . . . 683.6 Uniwersalna postać pola wektorowego . . . . . . . . . . . . . . . . . . . . . 693.7 Pochodna Lie’go . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 713.8 Komutator pól a przemienność grup diffeomorfizmów . . . . . . . . . . . . 753.9 Dystrybucje i ich symetrie . . . . . . . . . . . . . . . . . . . . . . . . . . . 813.10 Twierdzenie Frobeniusa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 833.11 Ważny przykład pola wektorowego: prawa Keplera . . . . . . . . . . . . . . 86

Page 3: Rozn. Geom_ - Jerzy Kijowski

4 Kowektory 954.1 Kowektor jako infinitezymalna funkcja kosztów. Różniczka funkcji. Wiązkako-styczna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

4.2 Transport odwrotny („pull back”) kowektora . . . . . . . . . . . . . . . . . 984.3 Całkowanie pola kowektorowego po krzywych. Orientacja rozmaitości . . . 1004.4 Rozmaitość z brzegiem. Najprostsza wersja twierdzenia Stokes’a . . . . . . 1034.5 Potencjalne pole sił. Najprostsza wersja Lematu Poincare . . . . . . . . . . 1064.6 Uwagi na temat rozkładu jedności i „gładkiego dzielenia tortu” . . . . . . . 1084.7 Uwagi o „całkach niezorientowanych” . . . . . . . . . . . . . . . . . . . . . 110

5 Formy różniczkowe 1115.1 Multi-kowektory. Wyznacznik jako forma objętości . . . . . . . . . . . . . 1115.2 Formy różniczkowe. Całkowanie form po podrozmaitościach . . . . . . . . . 1175.3 Iloczyn zewnętrzny. Współrzędniowy opis multikowektorów i form różnicz-kowych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

5.4 Przykład: całkowanie sił wywołanych ciśnieniem. Zewnętrzna a wewnętrznaorientacja powierzchni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

5.5 Różniczka zewnętrzna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1285.6 Transport i pochodna Liego pola kowektorowego oraz formy różniczkowej . 1335.7 Twierdzenie Stokesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1375.8 Przykłady i ćwiczenia dotyczące Twierdzenia Stokesa . . . . . . . . . . . . 1425.9 Przykład zastosowania Twierdzenia Stokes’a: prawo Archimedesa . . . . . 1475.10 Lemat Poincare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1485.11 Postać dualna formy różniczkowej . . . . . . . . . . . . . . . . . . . . . . . 1545.12 Geometryczny opis pola elektromagnetycznego . . . . . . . . . . . . . . . . 160

6 Geometria Riemanna 1636.1 Struktura euklidesowa w przestrzeni afinicznej . . . . . . . . . . . . . . . . 1636.2 Uwagi na temat geometrii pseudo-euklidesowej . . . . . . . . . . . . . . . . 1666.3 Struktura Riemanna i tensor metryczny na rozmaitości . . . . . . . . . . . 1676.4 Obraz odwrotny („pull back”) tensora metrycznego . . . . . . . . . . . . . 1726.5 Izomorfizm miedzy przestrzenią styczną a ko-styczną generowany przez struk-turę Riemanna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

6.6 Długość kowektora oraz multi-kowektora . . . . . . . . . . . . . . . . . . . 1746.7 Przykład: jak obliczyć Laplasjan funkcji w zmiennych krzywoliniowych . . 1776.8 Całki „pierwszego rodzaju”: długość krzywej, pole powierzchni itd. . . . . 1826.9 Forma objętości . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1846.10 Dualizm („gwiazdka”) Hodge’a . . . . . . . . . . . . . . . . . . . . . . . . 1856.11 Gradient, dywergencja, Laplasjan . . . . . . . . . . . . . . . . . . . . . . . 1926.12 Interpretacja fizyczna całek z form różniczkowych . . . . . . . . . . . . . . 1946.13 Analiza wektorowa w przestrzeni trójwymiarowej. Iloczyn wektorowy i rotacja1986.14 Pochodna Liego metryki. Pola Killinga . . . . . . . . . . . . . . . . . . . . 2036.15 Tensory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206

Page 4: Rozn. Geom_ - Jerzy Kijowski

6.16 Przykład: funkcje sferyczne . . . . . . . . . . . . . . . . . . . . . . . . . . . 212

7 Teoria powiązania („koneksji”) 2197.1 Pole grawitacyjne jako pole układów inercjalnych . . . . . . . . . . . . . . 2197.2 Problem ortodromy i geometrie nie-euklidesowe . . . . . . . . . . . . . . . 2227.3 Matematyczny opis teorii powiązania . . . . . . . . . . . . . . . . . . . . . 2257.4 Ważny przykład przestrzeni z powiązaniem: opis ruchu w układzie nieiner-cjalnym . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

7.5 Krzywizna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2347.6 Normalny układ współrzędnych . . . . . . . . . . . . . . . . . . . . . . . . 2407.7 Znikanie tensora krzywizny jako warunek dostateczny płaskości . . . . . . 2427.8 Pochodna kowariantna i transport równoległy . . . . . . . . . . . . . . . . 2457.9 Powiązanie według metody Koszula . . . . . . . . . . . . . . . . . . . . . . 2497.10 Tożsamości Bianchi’ego drugiego rodzaju . . . . . . . . . . . . . . . . . . . 2497.11 Tensor Riemanna jako niesymetryczna część drugiej pochodnej kowariantnej 2517.12 Koneksja metryczna i symbole Christoffela . . . . . . . . . . . . . . . . . . 2527.13 Pochodna Liego metryki i koneksji. Równanie Killinga . . . . . . . . . . . 2567.14 Krzywizna zewnętrzna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2577.15 Współrzędne Gaussa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260

8 Geometria symplektyczna 2638.1 Symplektyczne układy kontrolne . . . . . . . . . . . . . . . . . . . . . . . . 2638.2 Wersja wektorowa geometrii symplektycznej. Mody kontrolne . . . . . . . . 2698.3 Transformacje Legendre’a . . . . . . . . . . . . . . . . . . . . . . . . . . . 2728.4 Rozmaitość symplektyczna. Pola Hamiltonowskie i nawiasy Poissona . . . . 2778.5 Redukcja symplektyczna . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2808.6 Twierdzenie Darboux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2818.7 Miara Liouville’a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2838.8 Symplektyczna teoria kontroli w pełnej wersji nieliniowej. Przykłady z ter-modynamiki i mechaniki . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284

8.9 Wersja infinitezymalna symplektycznej teorii kontroli: rozważania heury-styczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288

8.10 „Trójka” Tulczyjewa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2928.11 Składanie relacji symplektycznych. Zasady wariacyjne . . . . . . . . . . . . 2978.12 Równania Eulera-Lagrange’a . . . . . . . . . . . . . . . . . . . . . . . . . . 2998.13 Teoria Hamiltona-Jacobi’ego . . . . . . . . . . . . . . . . . . . . . . . . . . 3018.14 Linie geodezyjne jako ortodromy koneksji metrycznej . . . . . . . . . . . . 302

9 Posłowie 3059.1 Grupy Liego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3059.2 Abstrakcyjne wiązki włókniste . . . . . . . . . . . . . . . . . . . . . . . . . 3069.3 Koneksja w wiązce abstrakcyjnej . . . . . . . . . . . . . . . . . . . . . . . 3099.4 Cięcia wiązek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309

Page 5: Rozn. Geom_ - Jerzy Kijowski

9.5 Jety . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3109.6 Rachunek wariacyjny całek wielokrotnych i związana z nim kanoniczna struk-tura symplektyczna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311

Page 6: Rozn. Geom_ - Jerzy Kijowski
Page 7: Rozn. Geom_ - Jerzy Kijowski

1 Wstęp

1.1 Geometria a nauki przyrodnicze

Geometria różniczkowa jest stosunkowo młodą gałęzią matematyki. Wyrosła z geometriiEuklidesa, a więc tej dziedziny nauki, której kodyfikacja, dokonana już w starożytnościprzez jednego z największych myślicieli wszechczasów, stanowi odtąd niedościgły wzór pięk-na myśli ludzkiej. Wyodrębnienie się geometrii różniczkowej jako samodzielnej gałęzi naukiwiąże się zazwyczaj z nazwiskami Bernharda Riemanna, Luigiego Bianchi’ego, wreszcie ElieCartana. Jednak idee te są mocno zakorzenione w dużo starszych rozważaniach, wyrosłychna gruncie analizy wszelkiego rodzaju zjawisk „nieliniowych”, jakie życie stawiało przedmatematykami na różnych – mniej lub bardziej dramatycznych – etapach historii naszejcywilizacji. Gdy podążać za rozumowaniem Archimedesa, dotyczącym np. pola powierzchnirozmaitych brył, trudno oprzeć się wrażeniu, że wymienieni wyżej genialni twórcy nowo-żytni bynajmniej nie tworzyli z niczego nowej dziedziny nauki, a jedynie wydobywali naświatło dzienne i systematyzowali to, co – w mniej precyzyjnej formie – istniało zawszejako istotny składnik myślenia matematycznego.Najważniejszym ze źródeł geometrii różniczkowej była geometria sferyczna: podsta-

wowe narzędzie nawigatorów i astronomów służące do opisu ruchu rozmaitych obiektów(okrętów lub planet i komet) po powierzchni sferycznej: czy to powierzchni globu, czy teżpowierzchni abstrakcyjnej „sfery niebieskiej”. Póki z Aten żeglowano co najwyżej na Cykla-dy, geometria płaszczyzny euklidesowej w zupełności wystarczała do opisu takiej podróży.Jednak już około 230 roku przed Chrystusem Eratostenes bardzo dokładnie wyznaczyłrozmiary kuli ziemskiej. Dokładność ta została poprawiona dopiero w 1736 roku – a więcblisko dwa tysiące lat później! (Dokonał tego francuski matematyk, P. Maupertuis). Rela-cje marsylskiego żeglarza Pyteasza, który wypłynął daleko na ocean, prawdopodobnie ażdo Islandii, rozchodziły się szeroko w hellenistycznym świecie, a świadomość, że poruszałsię on „po powierzchni krzywej”, była powszechna. Dało to silny impuls do licznych roz-ważań, które obecnie zostałyby zakwalifikowane do działu „geometria sferyczna”. Od niejjuż bardzo bliska droga do uogólnień, jak uwzględnienie poprawek nawigacyjnych wynika-jących ze spłaszczenia kuli ziemskiej, czy wreszcie precyzyjny opis dowolnej powierzchnikrzywej. Taka analiza umożliwiła podobno genialnemu Gaussowi dokładne wyliczenie polapowierzchni księstwa Brunszwiku, co ze względu na znaczne pofałdowanie terenu wymykałosię klasycznym metodom geodezji wywodzącym się z płaskiej geometrii euklidesowej.Były to początki geometrii różniczkowej. Łącznikiem z liczącą sobie ponad dwa tysiące

lat klasyczną geometrią Euklidesa było przekonanie filozoficzne, że co prawda opisywaneobiekty są krzywe, jednak żyją (powiedzielibyśmy dzisiaj: są zanurzone) w „normalnym”, toznaczy płaskim (euklidesowym) świecie. „Zakrzywienie” było postrzegane jako odstępstwood „płaskości”, której wzorcem był właśnie ten zewnętrzny, idealnie płaski świat, do któregowyidealizowanych własności można było odnosić rozmaite, żmudnie odkrywane własnościobiektów krzywych. I w ten sposób geometria różniczkowa wyrastała w gorsecie przekonańo konieczności odnoszenia własności krzywych powierzchni do idealnego, euklidesowegoWszechświata. Tymczasem jednak coraz częściej okazywało się, że niektóre własności tych

1

Page 8: Rozn. Geom_ - Jerzy Kijowski

obiektów mają charakter „wewnętrzny”, niezależny od tego zanurzenia, podczas gdy inne,nazywane „zewnętrznymi”, opisują właśnie sposób zanurzenia. Typowym tego przykłademjest następująca obserwacja: wyginając kartkę papieru zakrzywiamy jedynie jej zanurzeniew otaczającym Świecie, jednak nie ma to żadnego wpływu na jej geometrię wewnętrzną,która pozostaje płaska.Gorset ten został odrzucony właśnie przez Bernharda Riemanna który pokazał, że do

badania wewnętrznej geometrii ewentualnych przestrzeni krzywych hipoteza o istnieniuzewnętrznego, płaskiego świata zupełnie nie jest potrzebna. Dostarczyło to odpowied-nich narzędzi pojęciowych dla współczesnej, geometrycznej teorii Wszechświata, opartejna „ogólnej teorii względności” Einsteina. Dzięki Riemannowi nie musimy sobie już wy-obrażać, że nasz zakrzywiony Wszechświat jest zanurzony w jakimś dużo większym, ale zato płaskim „meta-świecie” pełniącym rolę „wzorca płaskości”, gdzie zakrzywienie czaso-przestrzeni byłoby jedynie „odchyleniem” od tego wzorca. Geometria różniczkowa pozwalaopisać łatwo krzywiznę (lub jej brak) jako wewnętrzną własność badanej przestrzeni.Powyższe wątki są z powodzeniem wykorzystywane w większości wykładów z geometrii

różniczkowej jako argumenty heurystyczne uzasadniające definicje rozmaitych struktur naabstrakcyjnych rozmaitościach różniczkowalnych. W niniejszym wykładzie proponujemyinny punkt widzenia. Budowę podstawowego aparatu pojęć geometrycznych zamierzamyoprzeć na obserwacji, iż prawdziwa geometria różniczkowa „wkracza do akcji” natychmiast,gdy tylko zaczynamy posługiwać się współrzędnymi krzywoliniowymi dbając jednocześnieo to, by uzyskane wyniki archiwizować (zapisywać) w sposób niezależny od wyboru tychwspółrzędnych. Tak więc nawet w kontekście zwykłej, euklidesowej przestrzeni (w prostychujęciach pomyślanych na użytek fizyków czy inżynierów, identyfikowanej zazwyczaj z prze-strzenią liczbową R3) warto posługiwać się dobrymi narzędziami geometrycznymi, znaczniebowiem upraszcza to rachunki. Złudzenie wielu wykładowców mechaniki, hydrodynamiki,teorii elastyczności, elektrodynamiki, teorii kontroli czy termodynamiki, że stosując osiem-nastowieczne formalizmy ułatwiają życie swoim słuchaczom bardzo boleśnie zderza się zrzeczywistością, gdy zdanie egzaminu zależy od wyuczenia się na pamięć formułek na „La-plasjan, rotację czy przyśpieszenie w zmiennych sferycznych”. W gąszczu tych formuł gubisię wspaniały postęp myśli ludzkiej zawarty w tych dziedzinach nauki. Opór takich wykła-dowców przeciw posługiwaniu się adekwatnymi narzędziami, oferowanymi przez współcze-sną geometrię różniczkową, przypomina opór wczesnośredniowiecznych myślicieli przeciwwprowadzeniu układu pozycyjnego w arytmetyce, który burzył nawyki oparte na rzymskimsposobie zapisywania liczb.Klasyczne rozumowanie Newtona prowadzące do wniosku, że prawa Keplera opisujące

ruch planet są konsekwencją trzech prostych „zasad dynamiki” oraz prawa powszechnegociążenia, stanowi przecież modelowy przykład stosowania narzędzi geometrii różniczkowej!Chodzi tutaj o obserwację, że dwa pola wektorowe, których wartości są w każdym punkciewzajemnie proporcjonalne, mają te same krzywe całkowe (różniące się jedynie parametry-zacją). I w ten sposób, nawet pozostając wewnątrz przestrzeni płaskiej, jesteśmy zmuszenido budowania struktur geometrii różniczkowej, gdy tylko zabieramy się za analizę takichproblemów fizycznych czy inżynierskich, które nie dają się rozwiązać w układzie współrzęd-nych prostoliniowych. Najprostsze przykłady tego rodzaju problemów to: opis linii prostej

2

Page 9: Rozn. Geom_ - Jerzy Kijowski

we współrzędnych sferycznych, czy wyrażenie operatora Laplace’a (występującego w bar-dzo wielu zagadnieniach fizycznych czy inżynierskich) we współrzędnych krzywoliniowych.Wieloletnie doświadczenie dydaktyczne pokazuje niezbicie, że geometria jest najsłab-

szą stroną matematycznego wykształcenia fizyków i inżynierów. Strumienie (płynu czy polamagnetycznego) wpędzają w kompleksy nawet dobrych studentów, którzy – otrzymawszyjakiś paradoksalny wynik – z trudem przypominają sobie, że „chyba należało to wszystkojeszcze pomnożyć przez jakiś wyznacznik”. Prawo Archimedesa (ubarwione niezbyt mądry-mi anegdotami o tym wielkim uczonym) potrafi zapewne wyrecytować każde dziecko: ciałozanurzone w cieczy traci pozornie na swym ciężarze tyle, ile wynosi ciężar cieczy przez niewypartej. Ta siła wyporu jest po prostu wypadkową sił ciśnienia hydrostatycznego działa-jących na powierzchni zanurzonego ciała, zawsze prostopadłych do tej powierzchni. Próbaobliczenia tej wypadkowej, czyli wyprowadzenia prawa Archimedesa z prawa Pascala, pod-cina skrzydła większości adeptów studiów matematycznych, fizycznych czy inżynierskich.A przecież jest ono prostą, geometryczną konsekwencją twierdzenia Stokesa. No a samotwierdzenie Stokesa, jeśli już jest wykładane, to zazwyczaj bardzo abstrakcyjnie, podczasgdy jest to jedynie twierdzenie podstawowe rachunku różniczkowego i całkowego („całka zpochodnej funkcji jest równa przyrostowi tej funkcji”), obudowane inteligentnym sposobemkatalogowania danych, niewrażliwym na zamianę układu współrzędnych. I właśnie o takiejgeometrii różniczkowej będzie mowa w niniejszym wykładzie.

1.2 Układy współrzędnych

W czasach, gdy ludzie byli przekonani, że żyją w płaskiej, euklidesowej przestrzeni trójwy-miarowej, geometria różniczkowa była nauką o liniach krzywych i krzywych powierzchniach.Stanowiła po prostu dział analizy matematycznej, gdzie własności krzywej opisywano zapomocą rachunku różniczkowego i całkowego. I tak: krzywą na płaszczyźnie dwuwymiaro-wej P lubimy (jeśli tylko się da!) opisywać we współrzędnych (x, y) jako wykres funkcji

x 7→ y = f(x) ,

Wszystkie jej własności z powodzeniem można wyrazić w języku pochodnych funkcji f . Naprzykład: kierunek wektora stycznego do krzywej opisuje pierwsza pochodna f ′(x) = tgα,równa tangensowi kąta zawartego między tym kierunkiem a osią współrzędnej x. Natomiastna to, czy krzywa jest wypukła czy wklęsła, wskazuje znak drugiej pochodnej.Niestety, opis ten zaczyna się komplikować gdy przechodzimy do współrzędnych krzy-

woliniowych.Przykład: Tę samą płaszczyznę P możemy opisywać we współrzędnych (ξ, η), zwią-

zanych z poprzednimi następującą transformacją:

ξ = x

η = y − x2 ,

3

Page 10: Rozn. Geom_ - Jerzy Kijowski

lub, równoważnie:

x = ξ

y = η + ξ2 .

Parabola będąca wykresem funkcji f(x) = 12x2 wydaje się, że jest wypukła, bo

f ′′ = 1 > 0 .

Ale w nowych współrzędnych tej samej krzywej odpowiada równanie

0 = y − 12x2 = η + ξ2 − 1

2ξ2 = η +

12ξ2 .

Oznacza to, że nasza krzywa jest wykresem funkcji:

ξ 7→ η = f(ξ) = −12ξ2 , (1)

a więc mamy:f ′′ = −1 < 0 .

Czyżby krzywa zmieniła swój charakter z wypukłej na wklęsłą? Oczywiście nie! Przykładten pokazuje jedynie, że rozmaite analityczne charakterystyki badanych obiektów geome-trycznych mogą transformować się w wysoce nietrywialny sposób podczas nieliniowej (aczęsto i liniowej!) transformacji współrzędnych.Ktoś mógłby się żachnąć: „Ale dlaczego mielibyśmy komplikować sobie życie używając

współrzędnych krzywoliniowych! Czyż nie łatwiej używać zawsze współrzędnych prostoli-niowych?” Otóż jeśli chcemy badać powierzchnie krzywe, to musimy pogodzić się z faktem,że na takiej powierzchni nie ma współrzędnych prostoliniowych i wszystkie układy współ-rzędnych musimy traktować jako równie dobre. Jako przykład rozważmy powierzchnię sfe-ryczną o promieniu R (zob. Rys. 1). To najważniejszy obiekt geometryczny dla żeglarzaprzygotowującego się do nawigacji po oceanie. Punkty tej powierzchni możemy łatwo spa-rametryzować za pomocą współrzędnych geograficznych: długości i szerokości geograficznej.W matematyce stosujemy zazwyczaj konwencję, w której szerokość geograficzna nie jestliczona od równika w górę i w dół, jak w geografii, lecz raczej od bieguna północnego wdół. Taka parametryzacja bierze się z opisu przestrzeni trójwymiarowej R3 we współrzęd-nych sferycznych (r, θ, ϕ). Związek między tymi współrzędnymi a zwykłymi, kartezjańskimiwspółrzędnymi (x, y, z) ∈ R3 dany jest następującymi wzorami:

x = r sin θ cosϕ ,

y = r sin θ sinϕ , (2)

z = r cos θ .

4

Page 11: Rozn. Geom_ - Jerzy Kijowski

Rysunek 1: Siatka współrzędnych geograficznych na sferze S2.

Transformacja odwrotna jest opisana następującymi wzorami:

r =√x2 + y2 + z2 ,

θ = arc cos

(z√

x2 + y2 + z2

), (3)

ϕ = arc tg(y

x

).

Parametryzacja ta zawodzi na osi ziemskiej, tzn. gdy x2 + y2 = 0, bo wartość długościgeograficznej dana ostatnim wzorem nie ma żadnego sensu i wtedy trzeba stosować jakieśinne mapy. Oczywiście również poza tą osią „arcus tangens” występujący w tym wzorzewymaga jakiegoś ujednoznacznienia. Ale płynąc z dala od obszarów polarnych żeglarz mado dyspozycji lokalnie poprawną parametryzację punktów sfery zmiennymi (θ, ϕ), jeślitylko ustali wartość zmiennej radialnej na wartości promienia ziemskiego: r = R. W tymukładzie współrzędnych każdy równoleżnik jest wykresem funkcji stałej:

ϕ 7→ θ = f(ϕ) = const. (4)

Jej druga pochodna znika, co można byłoby naiwnie interpretować jako dowód na to, żekrzywa ta nie jest ani wypukła, ani wklęsła, a zatem. . . prosta? Czujemy jednak intuicyjnie,że tylko równik (odpowiadający wartości θ = π

2) jest — no może nie „prosty”, ale „naj-

mniej krzywy”. Natomiast wszystkie inne równoleżniki są w oczywisty sposób wypukłe lubwklęsłe.

5

Page 12: Rozn. Geom_ - Jerzy Kijowski

Ten układ współrzędnych nie jest w żaden sposób wyróżniony. Nawet jeśli przywiąza-liśmy się do idei „współrzędnych geograficznych”, i tak położenie bieguna północnego nasferze nie jest wyróżnione żadną własnością geometryczną, zatem każdy inny punkt sferyrównież może tę rolę pełnić. Poza tym, gdy już ustalimy położenie bieguna, całą siatkęmożna jeszcze obracać wokół osi ziemskiej, zmieniając w ten sposób położenie „południkazerowego”, od którego mierzymy długość geograficzną ϕ. Obie te dowolności pozwalajązatem na rozważanie całej trójparametrowej rodziny „geograficznych układów współrzęd-nych” na sferze. Każdy z nich wyznacza siatkę południków i równoleżników na globusie.Wyobraźmy sobie, że globus ten spoczywa w swoim drewnianym łożu, jak słynny Glo-bus Jagielloński w Muzeum Uniwersytetu Jagiellońskiego w Collegium Maius w Krakowie.Transformację od jednego do drugiego z tych układów współrzędnych można sobie wyobra-zić jako obrócenie globusa w łożu, w wyniku czego cała ta siatka współrzędnych przesuwasię po sferze w odpowiedni sposób. Wybierzmy teraz równoleżnik odpowiadający warto-ści θ = 1

6π (w konwencji geografów oznacza to 60 szerokości geograficznej północnej).

Jeśli zawiesić nad globusem odpowiednio skonstruowaną lampę, która wąską smugą oświe-tli właśnie ten równoleżnik (pogrubiona linia na Rys. 2), ta smuga na globusie może byćtraktowana jako wykres funkcji stałej, jak we wzorze (4). Obróćmy jednak globus w tensposób, by smuga świetlna zbliżyła się nieco do równika. I znów (przynajmniej lokalnie,w pobliżu punktu styczności) jest to wykres jakiejś funkcji. Widzimy wyraźnie, że funkcjata ma w punkcie styczności lokalne, niezdegenerowane maksimum, a zatem jest wklęsła.Jeśli natomiast obócimy globus w drugą stronę, np. tak, by smuga świetlna była stycznado równoleżnika θ = 1

12π (w konwencji geografów oznacza to 85 szerokości geograficznej

północnej), funkcja opisująca tę samą smugę w nowym układzie współrzędnych ma lokalne,niezdegenerowane minimum, a zatem jest wypukła.

Rysunek 2: Równoleżnik jako wykres funkcji θ = f(ϕ).

Nauka płynąca z powyższych przykładów jest taka, że sam rachunek różniczkowy niewystarcza: należy poszukiwać opisu obiektów geometrycznych niezależnego od układuwspółrzędnych.I właśnie tym zajmuje się geometria różniczkowa. Upraszczając całą sprawę można by

powiedzieć: Geometria różniczkowa to sztuka mądrego posługiwania się krzywo-

6

Page 13: Rozn. Geom_ - Jerzy Kijowski

liniowymi układami współrzędnych. Jest to rzeczywiście wielkie uproszczenie i wieluwybitnych geometrów oburzyłoby się na takie trywializowanie roli tej wspaniałej dziedzi-ny matematyki. Podzielając (częściowo) ich oburzenie, zaproponujmy zatem poprawionądefinicję: Geometria różniczkowa to sztuka stosowania rachunku różniczkowegoi całkowego w taki sposób, by informacje uzyskane za ich pomocą nie zależałyod wyboru układu współrzędnych.Taka definicja też nie znajdzie powszechnego uznania wśród matematyków. Powiedzą,

że przecież najpiękniejsze rozdziały geometrii różniczkowej to te, w których potrafimy cał-kowicie się uwolnić od jakiegokolwiek układu współrzędnych i dowodzić relacji międzyróżnymi obiektami geometrycznymi w sposób zupełnie abstrakcyjny.Tu trzeba częściowo przyznać rację polemistom, bo rzeczywiście łatwo wpaść w zachwyt

nad dowodem prowadzonym bez użycia współrzędnych. Jednak chcąc stosować geometrięw naukach przyrodniczych, na przykład chcąc budować modele rzeczywistości fizyczneja następnie konfrontować je z wynikami doświadczeń, nie wystarczą nam abstrakcyjne„dowody istnienia” czy też abstrakcyjne tożsamości. Musimy wszak rozwiązywać konkretnerównania różniczkowe i badać konkretne własności otrzymanych rozwiązań. A to potrafimyzrobić tylko w konkretnej parametryzacji.Dla zilustrowania powyższej myśli sięgnijmy do przykładu Izaaka Newtona. Postulo-

wane przezeń prawa dynamiki można rzeczywiście sformułować abstrakcyjnie: przestrzeńw której żyjemy jest Euklidesowa (płaska), istnieje układ inercjalny, równania ruchu sądrugiego (a nie – jak u Arystotelesa – pierwszego) rzędu. To ostatnie zdanie oznacza, żeskutkiem działania siły („przyczyny”) nie jest prędkość lecz przyśpieszenie. Drugim skład-nikiem teorii Newtona jest prawo powszechnego ciążenia, według którego siła grawitacjidziałająca między dowolną parą ciał ciężkich jest proporcjonalna do r−2, gdzie r jest odle-głością tych ciał. Na jakiej podstawie Newton sformułował te prawa? W szczególności: jakzmierzył siłę przyciągania Ziemi przez Słońce? Skąd wiedział, że to ma być dokładnie r−2,a nie na przykład: r−2,00079?Otóż dowód prawdziwości przypuszczeń Newtona co do praw rządzących dynamiką i

grawitacją polegał na konfrontacji zbudowanego na nich modelu matematycznego z ob-serwacjami ruchów planet. Najbardziej spektakularnym argumentem było wyprowadzenieprzez Newtona trzech praw Keplera zaobserwowanych uprzednio jako pewne „ciekawe re-gularności” tych ruchów. No i sam fakt, że orbity ruchu były zamknięte, czyli ruch planet– okresowy. Matematyk o bardzo teoretycznym nastawieniu powiedziałby, że wystarczyzapisać odpowiednie równanie różniczkowe:

mx = −α x

‖x‖3 ,

gdzie x ∈ E3 oznacza położenie planety kodowane jako wektor w trójwymiarowej przestrze-ni Euklidesowej, kropki – pochodne po czasie, zaś ‖x‖ to długość wektora x (czyli odległośćod Słońca, które dla prostoty umieściliśmy w zerze przestrzeni E3). Prawa strona jest wła-śnie siłą grawitacyjną, z jaką Słońce przyciąga planetę. Żaden układ współrzędnych niejest tu potrzebny, a programy numeryczne służące do rozwiązywania takich równań są takdostępne, że zapewne można je znaleźć na każdym tablecie, jaki rząd funduje dzieciom

7

Page 14: Rozn. Geom_ - Jerzy Kijowski

rozpoczynającym naukę w zerówce. Moja rola – powie ten matematyk – kończy się na do-wodzie istnienia i jednoznaczności rozwiązania zagadnienia Cauchy’ego dla tego równania.Reszta to są problemy techniczne!A tymczasem Newton byłby czekał zapewne do dziś na uznanie dla swej teorii, gdyby

nie zdołał był wyciągnąć konkretnych wniosków ze swojego równania. Niestety, rozwią-zania nie wyrażają się za pomocą funkcji elementarnych. Jednak stosując krzywoliniowyukład współrzędnych, dostosowany do symetrii problemu, można nietrudno wyprowadzićprawa Keplera. Newton zapełnił tym całą książkę, bo musiał w tym celu stworzyć ra-chunek różniczkowy i całkowy. Nam pójdzie łatwiej, bo analizę matematyczną już znamy.Podkreślamy jednak, że konkretne rachunki potrafimy przeprowadzić jedynie w konkretnymukładzie współrzędnych. Natomiast geometria różniczkowa będzie nam podpowiadała, wjaki sposób z nieskończenie wielu pochodnych i całek, które można sobie dowolnie wyli-czać, wybrać tylko te, które mają sens, bo odpowiadają niezależnym od parametryzacjistrukturom geometrycznym.

1.3 Koncepcja wykładu

Niniejszy wykład został pomyślany tak, by był dostępny dla studentów drugiego roku,którzy przeszli wstępny kurs analizy matematycznej oraz algebry liniowej z elementamigeometrii analitycznej. Zasadniczymi narzędziami są: rachunek różniczkowy i całkowy orazpojęcie przestrzeni wektorowej, macierzy i wyznacznika. Zakładając znajomość tych struk-tur, wiele uwagi poświęciliśmy pojęciu wektora stycznego do rozmaitości. Wychodzimyod pierwotnego wyobrażenia wektora jako „strzałki”, czyli uporządkowanej pary punktóww przestrzeni afinicznej. Pokazujemy następnie, że opis ten jest bardzo niewygodny, jeślichcemy używać nieliniowych układów współrzędnych. Cały rozdział zatytułowany „Rozwójpojęcia wektora stycznego” poświęciliśmy konstrukcji nowoczesnego formalizmu, w którymwektor styczny jest reprezentowany jako operator różniczkowy pierwszego rzędu i obudowa-niu go niezbędnymi intuicjami geometrycznymi. Wykład zawiera również wszystkie inne,równoważne definicje wektora stycznego. Rozpoczynamy jednak od tej, bo oparty na niejformalizm rachunkowy jest najprostszy.Przekonałem się wielokrotnie, że „blokada mentalna”, którą odczuwa wielu fizyków i

inżynierów przeciwko używaniu języka geometrii różniczkowej, wynika właśnie z niezrozu-mienia pojęcia wektora stycznego. Kiedyś na Uniwersytecie Rzymskim uczestniczyłem wdługiej dyskusji, której tematem było: Czy „(dxi)” jest wektorem, czy też ko-wektorem.Mam wrażenie, że zrozumiałem wtedy przyczyny tej blokady. Jej rezultatem jest kata-strofalna w skutkach ucieczka w świat matematyki XVIII-wiecznej. Niniejszy tekst jestpomyślany między innymi jako lekarstwo na tę chorobę.Następny rozdział dotyczy własności pól wektorowych, generowanych przez nie lokal-

nych grup dyfeomerfizmów oraz pochodnej Liego. Następuje po nim wykład form różnicz-kowych, oparty na intuicyjnym pojęciu „kosztów procesu”. Sporo miejsca zajmuje nambudowanie intuicji dotyczących „form całkowicie antysymetrycznych” jako realizacji poję-cia „objętości równoległościanu”. Pokazujemy, że antysymetria jest najprostszym sposobemrealizacji postulatu niezmienniczości objętości względem „pochyleń” równoległościanu, co

8

Page 15: Rozn. Geom_ - Jerzy Kijowski

w tradycyjnych wykładach jest „podane do wierzenia” w formie aksjomatycznej. Dowódtwierdzenia Stokes’a prowadzimy w taki sposób, by było jasne, że jest to po prostu zwykłetwierdzenie podstawowe rachunku różniczkowego i całkowego:

∫ b

a

dfdtdt = f(b)− f(a) ,

obudowane inteligentnymi „technikaliami”.Z punktu widzenia zastosowań bardzo ważna jest „postać dualna” formy różniczkowej.

Pozwala ona na prosty zapis dualności Hodge’a, dzięki czemu np. równania elektrodynamikiMaxwella uzyskują przejrzystą formę.Najbardziej tradycyjną częścią naszego tekstu jest wykład geometrii Riemanna, z na-

ciskiem na zastosowania. Tę część kończymy krótką informacją na temat pojęcia tensora.W tradycyjnych wykładach stanowi ono często punkt centralny, natomiast u nas pozostajeraczej na marginesie rozważań. Dla zilustrowania algebry tensorowej podajemy klarowną,geometryczną konstrukcję funkcji sferycznych, tak ważną z punktu widzenia zastosowań.Wykład teorii powiązania (koneksji) jest całkowicie oryginalny. Takiego sformułowania

nie ma w znanej mi literaturze. Również teoria krzywizny jako „obstrukcji przeciwko wy-prostowaniu współrzędnych” jest oryginalna. Wywodzi się ona z prac autora niniejszegowykładu na temat struktury Ogólnej Teorii Względności Einsteina, gdzie użycie takiegowłaśnie sformułowania teorii koneksji i krzywizny skutkowało znacznym uproszczeniemrachunków. Oczywiście, cała ta „intryga” znajduje szczęśliwe rozwiązanie i okazuje się,że nasze sformułowanie jest równoważne tradycyjnemu, a nasz „tensor krzywizny” jest wjedno-jednoznacznej odpowiedniości z tensorem Riemanna. Takiemu sformulowaniu byłam.in. poświęcona praca magisterska Krzysztofa Drachala, napisana na UKSW pod mo-im kierunkiem. Jestem mu wdzięczny za tę współpracę. Mam wrażenie, że lektura tegorozdziału może być pożyteczna nawet dla bardzo „czystego” matematyka.Wykład geometrii symplektycznej jest również bardzo nietypowy, oparty bowiem na

intuicji czerpanej z teorii kontroli. Nie pominięto jednak spojrzenia klasycznego i pokazanorównoważność obu podejść.Końcowy rozdział zawiera wskazówki dla Czytelnika, który chciałby poszerzyć swoją

wiedzę z zakresu nowoczesnej geometrii różniczkowej.Niniejszy tekst jest wynikiem wieloletnich przemyśleń. Prowadziłem wykłady z Analizy,

Algebry, Geometrii Analitycznej i Geometrii Różniczkowej, a także z takich działów fizykijak Mechanika Teoretyczna, Elektrodynamika, Mechanika Ośrodków Ciągłych, Mechani-ka Kwantowa, na Uniwersytecie Warszawskim, Politechnice Warszawskiej, UniwersytecieKardynała Stefana Wyszyńskiego, Uniwersytecie Mediolańskim i Rzymskim, a także wie-lokrotnie na wykładach dla asystentów i doktorantów Centrum Fizyki Teoretycznej PAN.Dwukrotnie rezultatem tych wykładów były skrypty spisane przez zainteresowanych słu-chaczy: w roku 1978 na ich podstawie Witold Kondracki i Jan Rogulski wydali „MetodyGeometryczne w mechanice klasycznej i klasycznej teorii pola”, opublikowane przez Wy-dawnictwa Uniwersytetu Warszawskiego. Natomiast w roku 1991 Dario Bambusi i GiulioMagli pomogli mi spisać skrypt na podstawie moich wykładów na Uniwersytecie Medio-lańskim. Zatytułowany: „Elasticita finita e ralativistica: introduzione ai metodi geometrici

9

Page 16: Rozn. Geom_ - Jerzy Kijowski

della teoria dei campi” tekst opublikowało pod moim nazwiskiem Włoskie TowarzystwoMatematyczne (Unione Matematica Italiana). Zawiera on między innymi sformułowanierelatywistycznej teorii elastyczności, która potem znalazła zastosowanie w konstrukcji mo-deli astrofizycznych.Jednak obecny tekst jest znacznie bardziej dojrzały w stosunku do tamtych, wstęp-

nych wersji. Podkreślam, że prezentowane tu idee wyrosły z badań teoretycznych w fizyce,jako próba zasypania przepaści między językiem czystej matematyki a tym, co niezbęd-ne w bezpośrednim rozwiązywaniu skomplikowanych problemów fizycznych i inżynierskich.Dojrzewaniu tych idei bardzo pomogły dyskusje z moimi byłymi uczniami a obecnie współ-pracownikami, Jackiem Jezierskim i Szymonem Charzyńskim. Bardzo im za to dziękuję.

Warszawa, 21 lipca 2014 r.

10

Page 17: Rozn. Geom_ - Jerzy Kijowski

2 Rozwój pojęcia wektora stycznego

2.1 Eksperyment czy spekulacja myślowa?

Idee geometrii euklidesowej pochodzą z doświadczenia. Aby się o tym przekonać wystarczyzwiedzić na przykład resztki osiedli jońskich na wyspie Chios, pochodzące z VIII wiekuprzed Chrystusem. Nie ma żadnej wątpliwości, że tamtejsi budowniczowie wiedzieli co tojest kąt prosty i umieli go wyznaczyć na placu budowy (w odróżnieniu od swoich bar-dziej północnych kolegów z Biskupina, gdzie wszystko jest krzywe, czy też budowniczychwspółczesnych domów, w których również nie uświadczysz kąta prostego). Jak możemywyczytać z późniejszych opisów, używali w tym celu zamkniętego sznura, tworząc trójkątpitagorejski o bokach 3, 4 i 5 jednostek (zob. Rys. 3), który jest doskonałym wzorcemkąta prostego. Fakt ten wynika z równości: 32 + 42 = 52 i został później sformalizowany wpostaci twierdzenia Pitagorasa.

Rysunek 3: Urządzenie do wyznaczania kątów prostych: linka ze związanymi końcami ipodzielona na 12 równych części.

Dokonana przez Euklidesa ok. roku 300 p.C. formalizacja geometrii w postaci układuaksjomatów i twierdzeń stanowi jeden z najwspanialszych pomników myśli ludzkiej. Nieulega dla mnie wątpliwości, że poprzedziły ją wieki eksperymentowania, gdzie własnościlinii, punktów, figur i brył geometrycznych poznawano doświadczalnie. Wykonajmy i mytakie doświadczenie na kartce papieru aby przekonać się, że aksjomatyka Euklidesa niejest po prostu dziełem artystycznym, wyrażającym preferencje estetyczne jej autora, leczopisem własności Świata, w którym żyjemy. Do wykonania tego doświadczenia potrzebnenam będą: ołówek, cyrkiel, ekierka i linijka. Zaznaczmy na kartce 3 punkty, które nie sąwspółliniowe, stawiając po prostu trzy kropki: A, O oraz B. Zajmiemy się wyznaczonymiprzez te punkty odcinkami OA i OB. A teraz używając ekierki i linijki: 1) narysujmy linięrównoległą do odcinka OA, przechodzącą przez punkt B, a następnie: 2) przenieśmy nanią odcinek OA w ten sposób, by jego początek O znalazł się w B. W tym celu musimyna tej linii odmierzyć cyrklem odcinek o tej samej długości co długość OA, startujący z B.Punkt będący końcem nowego odcinka nazwiemy C.A teraz zamieńmy rolami A i B, to znaczy: 1) narysujmy linię równoległą do odcinka

OB, przechodzącą przez punkt A, a następnie: 2) przenieśmy na nią odcinek OB tak, by

11

Page 18: Rozn. Geom_ - Jerzy Kijowski

jego początek O znalazł się w A. W tym celu musimy na tej nowej linii odmierzyć cyrklemodcinek o tej samej długości co długość OB, startujący z A. Punkt będący końcem tegoodcinka nazwiemy C.

O

A

B

C = C

Rysunek 4: Doświadczalna weryfikacja przemienności dodawania wektorów.

Celem całego tego eksperymentu jest zaobserwowanie, iż zachodzi ważne prawo przyro-dy: C = C. Ale każdy eksperyment obarczony jest jakimś błędem! Może się zatem zdarzyć,że kropeczki odpowiadające punktom C i C nie pokryją się. Widać to na Rysunku 4. Wtedyzapewne zrzucimy winę na niedostatecznie zaostrzony ołówek lub niedostatecznie sztywnycyrkiel, lub niedostatecznie precyzyjną ekierkę, lub niedostatecznie precyzyjne prowadzenieołówka wzdłuż ekierki, i powtórzymy eksperyment starając się wyeliminować te wszystkiebłędy. Możemy w ten sposób zdobyć dużo mocniejsze przeświadczenie, że jednak naprawdęzachodzi C = C. Ale czy zdobędziemy w ten sposób przekonanie absolutne? Nawet ma-leńka kropka, uczyniona znakomicie zaostrzonym ołówkiem, staje się jedynie bezkształtnąplamą, gdy obejrzeć ją pod mikroskopem. Nie może być ona zatem utożsamiana z punk-tem C lub C! Czujemy intuicyjnie, że stanowi ona jedynie mniej lub bardziej użytecznąwizualizację tego punktu. Ta sama obserwacja dotyczy linii, narysowanej nawet najlepiejzaostrzonym ołówkiem: jej niedoskonałość rzuca się w oczy natychmiast, gdy tylko obejrzy-my ją pod mikroskopem. Nawet gdyby udało się zmniejszyć plamkę reprezentującą punktdo rozmiarów jednego atomu substancji, z której sporządzona jest kartka, oraz rysowaćlinie składające się z odpowiednio uszeregowanych pojedynczych atomów, to i tak naszaintuicja podpowiada nam, że to nie o takich obiektach jest mowa w aksjomatach Euklide-sa! Punkty powinny być przecież nieskończenie małe a linie nieskończenie cienkie! Takichobiektów nie umiemy stworzyć przy pomocy najbardziej nawet wyrafinowanych narzędzi.Ktoś mógłby powiedzieć, że nie ma ich w przyrodzie. Czy zatem istnieją one jedynie wmoim umyśle, jako wyraz tęsknoty za ideałem? W takim razie geometria byłaby częściąpsychologii, badającą produkty naszej wyobraźni i opisującą relacje między nimi.Takiej konkluzji stanowczo zaprzecza między-osobowy (interpersonalny) charakter tych

doświadczeń: jeśli mam urojenia, to inni ludzie nie mają do nich dostępu. Natomiast co doprawdziwości lub fałszu twierdzenia geometrycznego potrafimy się zgodzić nawet z ludźmiinnego języka czy innej kultury. Kilka lat temu prowadziłem roczny wykład uniwersytec-ki pt. „Matematyka dla Humanisty”. Omawialiśmy różne dowody twierdzenia Pitagorasa.Oczywiście każde dziecko, a tym bardziej student polonistyki czy historii, zna to twier-dzenie na pamięć. Ale wszyscy (nawet osoby przedstawiające się słowami: „ jestem noga

12

Page 19: Rozn. Geom_ - Jerzy Kijowski

x

y

v = (x, y)

Rysunek 5: Wektor w przestrzeni afinicznej to uporządkowana para punktów.

z matematyki”) byli w stanie, po krótszym czy dłuższym namyśle, zrozumieć wszystkiete dowody. Zmiana miny z „marsowej”, związanej z wysiłkiem umysłu, na „świetlaną”,znamionującą iż umysł stanął nagle wobec niesłychanego piękna, była dla mnie dowodemna to, jak bardzo obiektywne są fakty geometryczne.Wszystko to prowadzi do wniosku, że idealne obiekty geometryczne, o których będzie

mowa w tym wykładzie, istnieją naprawdę, a nie tylko w moim umyśle. W świecie mate-rialnym spotykamy jedynie ich przybliżone wizualizacje („cienie w pieczarze” — wedługterminologii zaproponowanej przez Platona). Jednak badając te „nieudolne przybliżenia”jesteśmy w stanie zdobyć sporą wiedzę na temat „prawdziwych” (czyli „idealnych”) obiek-tów. Wiedza ta na poziomie doświadczalnym jest zawsze przybliżona: zastępując ołówekpromieniem laserowym jesteśmy w stanie zweryfikować twierdzenie Pitagorasa z ogromnądokładnością. Ale tylko w naszym umyśle znajdziemy siłę i zdolności do tego, by uzupełnićtę przybliżoną wiedzę doświadczalną na temat „przybliżonych” obiektów geometrycznych,do wiedzy absolutnie pewnej na temat obiektów idealnych. Tak pewnej wiedzy, jak abso-lutnie pewne a nie tylko przybliżone, jest twierdzenie Pitagorasa.Nie znajduję lepszego sposobu na wyrażenie powyższych myśli niż idee zawarte w filo-

zofii Platona.

2.2 Przestrzeń afiniczna

Areną klasycznej geometrii euklidesowej była zatem idealna płaszczyzna (dla planimetrii)lub idealna przestrzeń (dla stereometrii ). Ich własności opisywał Euklides przy pomocysystemu aksjomatów, łącznie ze słynnym piątym, który mówił o istnieniu i jednoznacznościlinii ℓ′, równoległej do danej linii ℓ i przechodzącej przez dany punkt p /∈ ℓ. W nowoczesnymjęzyku własności te wyraża się prosto stosując pojęcie „przestrzeni wektorowej”. Pojęcie tostudiuje się zazwyczaj na pierwszym roku studiów w ramach wykładu z Algebry liniowej i wdalszym ciągu będę zakładał, że czytelnik opanował podstawowe umiejętności tej dziedzinymatematyki. W języku współczesnej algebry aksjomaty Euklidesa oznaczają tyle, że każdapara punktów (x, y) ∈ A rozważanej przestrzeni A wyznacza „wektor” v ∈ V . Wektor tenmożna sobie wyobrażać jako „strzałkę”, to znaczy zorientowany odcinek (zob. Rysunek 5)którego początkiem jest punkt x zaś końcem (czyli ”ostrzem strzałki”) – punkt y.Gdyby jednak spytać o matematyczną definicję wektora, to prawidłowa odpowiedź na

to pytanie brzmi: „Wektor, to element przestrzeni wektorowej.” Widać, że problem nieleży w tym jak sobie wyobrażamy jeden, poszczególny wektor: naiwny obraz „strzałki”

13

Page 20: Rozn. Geom_ - Jerzy Kijowski

u

vu+ v

Rysunek 6: Suma wektorów.

jest do wielu celów przydatny i wcale nie zamierzam go zwalczać (choć wkrótce zastąpimygo czymś lepszym!). Istotą rzeczy jest fakt, że zbiór V wszystkich tych obiektów stanowiprzestrzeń wektorową. Przypomnę teraz pokrótce znaczenie tego zdania. Otóż oznacza ono,iż w zbiorze V są określone dwa działania: dodawanie wektorów oraz oraz ich skalowanie(zwane też często „mnożeniem przez liczbę” z wybranego ciała liczbowego). W naszymwykładzie ograniczymy się wpierw do przestrzeni wektorowych rzeczywistych, to znaczy żewybieramy ciało liczb rzeczywistych R.Odwołując się ponownie do obrazu „strzałek” przypomnę, że oba te działania omawiano

w szkole, co najmniej na lekcjach fizyki. Suma „v + u” wektorów v oraz u to nic innegojak ich „wypadkowa”, czyli przekątna równoległoboku zbudowanego na tych wektorach.Doświadczenie, które wykonywaliśmy w poprzednim paragrafie przy użyciu cyrkla, ekierkii linijki, a którego przybliżony rezultat ilustruje Rysunek 4, przekonuje nas, że jest todziałanie przemienne (abelowe), tzn. spełniające tożsamość: v + u = u+ v.Natomiast skalowanie α · v wektora v liczbą α polega na zmianie jego długości w sto-

sunku |α| oraz (ewentualna) zmiana kierunku jeśli α jest liczbą ujemną. Jest to przepiskonstruktywny: gdy α jest liczbą wymierną:

|α| = m

n,

gdzie m,n ∈ N są liczbami naturalnymi, konstrukcja przeskalowanego wektora |α| · v po-lega na m-krotnym wydłużeniu strzałki reprezentującej v a następnie podzieleniu jej na nrównych części i wzięciu jednej z nich. Podział na równe części jest dobrze zdefiniowanykonstrukcyjnie (zob. Rysunek (7)) dzięki twierdzeniu Talesa z Miletu.Gdy α nie jest liczbą wymierną, odpowiadające jej skalowanie definiujemy jako granicę

powyższych operacji odpowiadających dowolnemu ciągowi liczb wymiernych αk aproksy-mujących α, tzn. takich, że α = limk→∞ αk.Oba te działania są łączne. Łączność dodawania oznacza tożsamość: v + (u + w) =

(v+u)+w. Natomiast przez łączność mnożenia rozumiemy tożsamość: α ·(β ·v) = (α ·β)·v.Terminologia ta jest oczywistym nadużyciem, bowiem w tym ostatnim wyrażeniu pierw-sza kropka oznacza mnożenie w ciele liczbowym, podczas gdy druga, to właśnie omawianeprzez nas działanie skalowania wektorów. Używanie tej samej „kropki” na oznaczenie dwuróżnych operacji nie prowadzi jednak do żadnych nieporozumień. Zresztą kropkę tę bę-dziemy zazwyczaj opuszczali. Jak pokazuje doświadczenie licznych pokoleń matematyków,ta uproszczona notacja znacznie ułatwia życie, nie prowadząc przy tym do żadnych dwu-

14

Page 21: Rozn. Geom_ - Jerzy Kijowski

15v

v

Rysunek 7: Podział odcinka na 5 równych części przy użyciu Twierdzenia Talesa.

znaczności.Działania te muszą spełniać własności charakterystyczne dla przestrzeni wektorowej.

Należy rzypomnieć, że można je zebrać w postaci następujących trzech punktów:

1. Działanie dodawania czyni z V grupę przemienną (abelową). Oznacza to istnienieelementu neutralnego dodawania, który nazywamy wektorem zerowym i oznaczamy1

przez 0 ∈ V . Jego „neutralność” oznacza, że dla dowolnego wektora v ∈ V zachodzi:v + 0 = 0 + v = v. Poza tym, dla każdego elementu v ∈ V istnieje jedyny elementodwrotny, który oznaczamy „−v”, a który spełnia równanie: v + (−v) = 0.

2. „Jedynka” w ciele R, to znaczy liczba 1 ∈ R, wyróżniona jako element neutralnymnożenia, jest również elementem neutralnym skalowania wektorów:

1 · v = v .

3. Oba działania są ze sobą „zgodne”. Oznacza to, że zachodzi rozdzielność jednego znich względem drugiego, tzn zachodzi:

α · (v + u) = α · v + α · u , oraz (α+ β) · v = α · v + β · v .

Przypomnimy teraz pokrótce czym jest przestrzeń afiniczna. Jest to mianowicie para(A, V ), gdzie A stanowi zbiór zaś V przestrzeń wektorową, wyposażona w odwzorowaniektóre uporządkowanej parze (x, y) punktów x, y ∈ A, przypisuje jednoznacznie wektorv ∈ V , oznaczany jako

v = y − x , (5)

(możemy go nazywać „strzałką startującą z punktu x i kończącą się w punkcie y) przy czymkażde dwa elementy występujące w tym „równaniu” jednoznacznie wyznaczają trzeci. I taknp. dla danego punktu x ∈ A oraz wektora (strzałki) v ∈ V jest tylko jeden punkt y ∈ Aspełniający równanie (5). Element ten wygodnie oznaczyć:

y = x+ v . (6)

1Zwracamy znów uwagę na formalną „nieścisłość” notacji: tym samym symbolem oznaczamy „zeroskalarne”, tzn liczbę zero, oraz „zero wektorowe”, to znaczy element neutralny dodawania w przestrzeniwektorowej. W praktyce nie zdarzają się sytuacje, w których prowadziłoby to do nieporozumień!

15

Page 22: Rozn. Geom_ - Jerzy Kijowski

W ten sposób każdy wektor v ∈ V generuje transformację gv przestrzeni A, zwaną „trans-lacją o wektor v”:

gv(x) := x+ v .

Zakłada się, że jest to transformacja odwracalna i że zbiór tych transformacji stanowi grupęprzemienną, izomorficzną z grupą (V,+), to znaczy z grupą jaką stanowi sama przestrzeńV wyposażona w działanie „+”. Oznacza to między innymi, że elementem odwrotnym dotranslacji o wektor „v” jest translacja o wektor „−v”, co zapisujemy w postaci równania

x = y − v = g−v(y) . (7)

Postulowane przez Euklidesa własności przestrzeni A, odpowiadają temu, że każde z trzechpowyższych równań, mianowicie (5), (6) oraz (7), implikuje pozostałe dwa.Zwracam uwagę, że i tutaj nadużywamy nieco notacji, bowiem „plus” w równaniu (6),

oznaczający translację punktu x o wektor v, to nie ten sam plus, który oznacza dodawaniewektorów. Być może stosowanie takiej notacji, niezupełnie ścisłej z formalnego punktuwidzenia, powinno być obwarowane klauzulą: „Tylko dla dorosłych”. Ale tak właśnie —jako osobę dojrzałą, umiejącą oddzielić istotę rzeczy od pedantycznego przestrzegania zasadpisowni — zamierzam traktować mojego czytelnika. Podkreślam natomiast, że w notacjitej aksjomaty Euklidesa sprowadzają się do postulatu obowiązywania konwencjonalnychreguł algebraicznych przez te wszystkie, występujące we wzorach plusy, minusy i kropki.To znacznie upraszcza notację. Podsumujmy zatem:Definicja: Przestrzeń afiniczna, to trójka (A, V,+), gdzie A jest „zbiorem punktów

przestrzeni”, V jest rzeczywistą przestrzenią wektorową, zaś „+” jest reprezentacją prze-strzeni V w grupie przekształceń przestrzeni A:

A ∋ x 7→ gv(x) =: x+ v , (8)

spełniającą omówione wyżej aksjomaty.Przestrzeń wektorową V nazywa się niekiedy „przestrzenią styczną do przestrzeni afi-

nicznej A”. Jej elementy odpowiadają temu, co w nauczaniu szkolnym nazywa się „wekto-rem wolnym”, w odróżnieniu od „wektora zaczepionego w punkcie”. Rzeczywiście, wektor-strzałkę v ∈ V można „zaczepić” w dowolnym punkcie x ∈ A, w rezultacie czego „koniecstrzałki” ustawi się w punkcie y = x + v. To, co w szkole nazywaliśmy „wektorem za-czepionym w punkcie”, to byłaby zatem para: (x, v), gdzie x ∈ A oznacza właśnie punktzaczepienia, zaś v — sam wektor. W dalszym ciągu niniejszego wykładu okaże się, że ist-nienie „wektorów wolnych” jest cechą bardzo szczególnych przestrzeni, które nazwiemy„płaskimi”. Ta szczególna cecha, to możliwość kanonicznej identyfikacji wektorów zacze-pionych w różnych punktach. W naszej notacji jest to oczywiste: wektory (x, v) oraz (y, v),zaczepione w dwóch różnych punktach x, y ∈ A, można identyfikować, ponieważ są wy-znaczone przez ten sam wektor „wolny” v ∈ V . Jednak w ogólnych przestrzeniach, którezamierzamy studiować w tym wykładzie, taka identyfikacja nie będzie możliwa. Zanim wy-tłumaczę precyzyjnie w następnych rozdziałach o co mi chodzi, chciałbym odwołać się dointuicji czytelnika przy pomocy następującego obrazu. Wyobraźmy sobie powierzchnię sfe-ryczną — na przykład powierzchnię globu ziemskiego. Na tej powierzchni rolę „wektorów

16

Page 23: Rozn. Geom_ - Jerzy Kijowski

zaczepionych w punkcie” będą odgrywały wektory styczne do tej powierzchni. Ale wektorystyczne do globu w Warszawie nie mają na ogół nic wspólnego z wektorami stycznymiw Nowym Yorku! Nie istnieje żadna naturalna identyfikacja elementów jednej przestrze-ni stycznej z drugą. A zatem pojęcie uniwersalnego, niezależnego od punktu zaczepienia„wektora wolnego” nie daje się tutaj zdefiniować. Natomiast pojęcie wektora stycznego(zaczepionego w punkcie!) jest centralnym pojęciem geometrii różniczkowej i cały obecnyrozdział jemu właśnie poświęcimy.

2.3 Wymiar przestrzeni afinicznej

Każda przestrzeń wektorowa ma bazę, to znaczy liniowo niezależny zbiór wektorów, któ-ry rozpina całą przestrzeń. To „rozpinanie” oznacza, iż każdy inny wektor tej przestrzenijest kombinacją liniową wektorów z bazy. Liniowa niezależność implikuje, że ta kombinacjaliniowa jest jednoznacznie wyznaczona przez sam wektor. Jeśli zatem oznaczyć elemen-ty bazy jako eι, gdzie indeksy ι ∈ I przebiegają jakiś zbiór I, to każdy wektor v ∈ Vprzedstawia się jednoznacznie w postaci:

v =∑

ι∈Ivιeι . (9)

Jednoznacznie dane współczynniki2 tego rozkładu, to znaczy liczby vι ∈ R, nazywa sięwspółrzędnymi wektora v w bazie e = (eι)ι∈I .Dwie różne bazy tej samej przestrzeni są równoliczne. Liczebność bazy nazywa się wy-

miarem przestrzeni wektorowej. W niniejszym wykładzie będziemy rozważali przestrzeniewymiaru skończonego, to znaczy takie, że liczebność zbioru indeksów I jest liczbą na-turalną. Mówiąc na przykład, że dana przestrzeń wektorowa V ma wymiar równy 2, cooznaczamy:

dimV = 2 ,

mamy na myśli, że można wybrać dwa wektory (e1, e2) takie, że każdy wektor v ∈ Vprzedstawia się jednoznacznie jako ich kombinacja liniowa:

v =2∑

i=1

viei = v1e1 + v2e2 .

Współrzędne (vi) = (v1, v2) stanowią dogodną parametryzację przestrzeni V . W ten spo-sób, ustalając bazę przestrzeni wektorowej, ustalamy w niej „parametryzację” to znaczyprzyporządkowanie

R2 ∋[v1

v2

]→ κ

([v1

v2

])=2∑

i=1

viei ∈ V , (10)

2Dla każdego wektora v jedynie skończona liczba tych współczynników może być różna od zera. Takwięc powyższa suma jest zawsze sumą skończoną. Suma nieskończona to granica sum skończonych, apojęcie granicy nie istnieje w ogólnej przestrzeni wektorowej, nie wyposażonej w topologię. Natomiast wwektorowych przestrzeniach topologicznych – np. przestrzeniach Banacha czy Hilberta – rozważa się innepojęcie bazy przestrzeni, bowiem dopuszcza się sumy nieskończone.

17

Page 24: Rozn. Geom_ - Jerzy Kijowski

które każdemu punktowi w przestrzeni parametrów R2 przypisuje jednoznacznie elementbadanej przestrzeni wektorowej V .Oczywiście wybierając inną bazę otrzymujemy inną parametryzację. Wśród interesują-

cych pytań, którymi zajmuje się algebra liniowa, następujące pytanie należy do najważniej-szych: „Jak wyliczyć nowe parametry danego elementu v, gdy znamy stare?”. Odpowiedźna takie pytania będziemy w przyszłości szczegółowo analizowali w odniesieniu do różnychmożliwych parametryzacji wektorów stycznych w ogólnej sytuacji geometrycznej.Wymiarem przestrzeni afinicznej A nazywa się wymiar jej przestrzeni stycznej. A zatem

płaszczyzna euklidesowa — środowisko, w którym odgrywa się akcja planimetrii euklideso-wej — to dwuwymiarowa przestrzeń afiniczna, którą będziemy oznaczali: (A2, V 2,+) lub,gdy nie prowadzi to do nieporozumień, po prostu jako A2. Natomiast euklidesowa stereome-tria to teoria dotycząca trójwymiarowej przestrzeni afinicznej, oznaczanej jako (A3, V 3,+),lub po prostu jako A3.Nic nie stoi na przeszkodzie, by wyobrazić sobie przestrzeń afiniczną dowolnego, skoń-

czonego wymiaru n ∈ N. Oznaczamy ją jako An. Do parametryzacji jej punktów potrze-bujemy aż n współrzędnych! W latach sześćdziesiątych ubiegłego wieku mówiło się, żepani profesor Wanda Szmielew, która prowadziła wykłady z geometrii na UniwersytecieWarszawskim, potrafi wyobrazić sobie nawet siedem wymiarów, natomiast profesor KarolBorsuk, gdy się mocno skoncentruje, dociąga nawet do dziesięciu! Jednak ten płaski dowcipzupełnie zaciemnia istotę rzeczy. Przecież bardzo łatwo wyobrazić sobie przestrzeń wielo-wymiarową jako zbiór wszystkich konfiguracji takiego układu fizycznego, do których opisupotrzeba wielu parametrów. I tak, o ile położenie planety w polu sił grawitacyjnych Słońcamożna było modelować położeniem punktu w trójwymiarowej przestrzeni euklidesowej A3,to znaczy używać trzech parametrów, jak to uczynił Newton3, aby jednak opisać dodatkoworuch Księżyca musimy dodać jeszcze jego trzy współrzędne. W ten sposób przekonujemysię, że konfiguracje układu „Ziemia + Księżyc” tworzą przestrzeń sześcio-wymiarową.Ogólniejszego przykładu dostarcza nam fabryka chemiczna, w której kotłach odbywają

się jakieś skomplikowane procesy, sterowane od pulpitu przy pomocy 25 pokręteł. Przyich pomocy ustala się np. 25 parametrów produkcji, takich jak temperatura, ciśnienieczy stężenia interesujących nas substancji w poszczególnych kotłach, a także regulowaneprzekroje łączących je rur, czy też wydajności licznych pomp napędzających przepływymiędzy nimi. Konfiguracje tego skomplikowanego układu stanowią więc przestrzeń 25-ciowymiarową, natomiast wydajność odbywającego się tam procesu chemicznego może byćtraktowana jako funkcja na tej przestrzeni.Ten prosty przykład zachęca nas, by nie obawiać się przestrzeni o większym wymiarze,

a także funkcji określonych na tych przestrzeniach. Stanowić one będą podstawowy budulecteorii, której poświęcony jest niniejszy wykład.

3W analizie problemu Keplera można dość łatwo pokazać, że orbita jest płaska, to znaczy pozostajeprzez cały czas w pewnej dwuwymiarowej płaszczyźnie przechodzącej przez centrum działających sił gra-witacyjnych (położenie Słońca). Zatem rachunek wykonany przez Newtona dotyczy nawet nie w A3, ale wA2.

18

Page 25: Rozn. Geom_ - Jerzy Kijowski

2.4 Współrzędne prostoliniowe w przestrzeni afinicznej

Idea parametryzacji, to znaczy lokalizowania punktu w wielowymiarowej przestrzeni napodstawie znajomości jego współrzędnych, wiązana jest zazwyczaj z nazwiskiem Kartezju-sza i z pojęciem „współrzędnych Kartezjańskich”. W najprostszym, afinicznym wydaniupolega ona na rozważaniu odwzorowania:

Rn ∋ τ → κ(τ) = y := x+n∑

k=1

τkek ∈ An . (11)

Każdemu zestawowi n współrzędnych τ = (τk), gdzie k = 1, 2, . . . , n; przypisany jestjedno-jednoznacznie punkt y = κ(τ) parametryzowanej przestrzeni powstały, jak wynikato z powyższej formuły, przez przesunięcię ustalonego punktu x ∈ An o wektor

v =n∑

k=1

τkek .

Klauzula „jedno-jednoznaczności” oznacza, że znając wartości współrzędnych znamy od-powiadający im punkt przestrzeni, ale i na odwrót: każdemu punktowi y przestrzeni odpo-wiada jednoznacznie zestaw jego n współrzędnych, to znaczy punkt modelowej przestrzeniliczbowej Rn. Są to po prostu współrzędne wektora v = y − x w bazie ek. Zwróćmy uwagęna stosowany tutaj zapis:

τ = (τk) , (12)

który oznacza, że punkt przestrzeni liczbowej Rn to nic innego jak zestaw jego współrzęd-nych.Odwzorowanie κ dane formułą (11) będziemy nazywali parametryzacją, zaś odwrotne

doń:An ∋ y → κ−1(y) = (τk) ∈ Rn , (13)

przypisujące punktowi zestaw jego współrzędnych, mapą lub układem współrzędnych. Dojego konstrukcji potrzebne są nam następujące dwa składniki:

1. dowolny punkt x ∈ An przestrzeni, który nazywamy „początkiem układu współrzęd-nych”

2. dowolna baza e = (ek), gdzie k = 1, 2, . . . , n, przestrzeni wolnych wektorów V n, którejelementy nazywamy „osiami współrzędnych”.

W odróżnieniu od konstrukcji „prawdziwego” układu Kartezjańskiego, nie zakładamytutaj żadnej „ortonormalności” używanej bazy, to znaczy tego, że wektory ek mają „jed-nostkową długość” lub że są „wzajemnie prostopadłe”. Nie zakładamy, bo nie mamy dotego celu żadnego narzędzia! Nie wiemy bowiem jak w dowolnej przestrzeni wektoro-wej mierzyć długość wektorów czy też kąty między nimi. Aby opisywać takie własnościwektorów potrzebna nam będzie struktura metryczna, które to narzędzie poznamy dopierow dalszym ciągu niniejszego wykładu. Obecnie jedyną strukturą rozważanej przestrzenistycznej V jest struktura wektorowa. Aby uniknąć nieporozumień, układy współrzędnychuzyskane w przestrzeni afinicznej przy pomocy konstrukcji (11) będziemy nazywali „pro-stoliniowymi”, a nie „Kartezjańskimi”.

19

Page 26: Rozn. Geom_ - Jerzy Kijowski

2.5 Wektor zaczepiony w punkcie jako operator różniczkowy

Do przybliżonego opisu wielu zjawisk fizycznych, technicznych, ekonomicznych czy społecz-nych wystarczają nam modele liniowe oparte na założeniu, że skutek jest proporcjonalnydo przyczyny. W takich modelach do parametryzacji przestrzeni opisujących konfiguracjerozważanych układów wystarczą współrzędne liniowe, zaś zależności między parametra-mi kontroli (np. tymi, których wartość regulowana jest za pomocą 25 pokręteł na konsolisterowniczej operatora w fabryce chemicznej) a parametrami odpowiedzi (np. wydajnościąsterowanej w ten sposób reakcji chemicznej) dane są w postaci odwzorowań liniowych.W takich sytuacjach wystarczają nam współrzędne prostoliniowe. Pozwalają one efek-

tywnie wyznaczyć współrzędne wektora v = y − x, o początku w x i końcu w y, zgodniez konwencją przyjętą we wzorze (5). Po prostu odejmujemy współrzędne (xk) punktu po-czątkowego strzałki x od współrzędnych (yi) jej punktu końcowego y:

vk = yk − xk . (14)

Rozmaite pytania (dotyczące np. optymalizacji opisywanych procesów) polegają w takichteoriach na rozwiązywaniu układów równań liniowych. Używane w tym celu narzędziamatematyczne należą do algebry. Jednak prawdziwa geometria rozpoczyna się wtedy, gdymamy opisać zjawiska nieliniowe, w których skutek nie jest proporcjonalny do przyczyny,lecz wyraża się funkcją nieliniową. Do analizy takich zjawisk — jak to widzieliśmy jużna przykładzie problemu Keplera — nie wystarczają już współrzędne prostoliniowe, leczzmuszeni jesteśmy używać ogólniejszych, „krzywoliniowych” układów współrzędnych, jakwspółrzędne sferyczne w A3, dane wzorami (2) czy (3). Odejmowanie od siebie wartościwspółrzędnych sferycznych początku i końca strzałki, a następnie identyfikowanie na tejpodstawie odpowiadającego im wektora, nie ma tu żadnego sensu. Widać, że na użytekteorii nieliniowych potrzebna jest jakaś inna, lepsza definicja wektora stycznego, lepiejprzystosowana do pracy w krzywoliniowych układach współrzędnych.Okazuje się, że taka definicja wynika z interpretacji wektora zaczepionego w punkcie x

jako różniczkowania, czyli operatora różniczkowego pierwszego rzędu.Pokażemy teraz, że taka interpretacja jest rzeczywiście możliwa. Weźmy wektor v ∈ V n

i punkt x ∈ An. Para (x, v), czyli wektor zaczepiony w punkcie x, wyznacza operatorróżniczkowy vx pierwszego rzędu „zaczepiony w punkcie x”, działający na funkcje różnicz-kowalne określone na An w otoczeniu punktu x. Wartość tego operatora na danej funkcjif ∈ C1(An) jest równa pochodnej kierunkowej tej funkcji w kierunku wektora v, obliczonejw punkcie x:

C1(A) ∋ f −→ vx(f) := f ′(x) · v = ∇vf(x) ∈ R1 . (15)

Oba symbole: f ′(x) · v oraz ∇vf(x) są równorzędnie używane w literaturze i oznaczająnastępującą wielkość:

vx(f) = limǫ→0

f(x+ ǫv)− f(x)ǫ

. (16)

Symbol C1(A) oznacza przestrzeń funkcji jeden raz różniczkowalnych w sposób ciągły naprzestrzeni An, wyposażoną w topologię zbieżności jednostajnej wraz z pierwszymi pochod-nymi.

20

Page 27: Rozn. Geom_ - Jerzy Kijowski

Z własności pochodnej, które studiujemy na wykładzie z analizy matematycznej, wy-nikają następujące własności tego operatora:

1. liniowość: vx(αf + βg) = αvx(f) + βvx(g),

2. ciągłość: jeśli ciąg funkcji fn ∈ C1(A) jest zbieżny do f0 ∈ C1(A) (w topologii C1,tzn. jednostajnie, wraz z pierwszymi pochodnymi) to vx(fn) zbiega do vx(f0),

3. reguła Leibniza: vx(fg) = f(x)vx(g) + g(x)vx(f).

Ostatnią formułę znamy z kursu Analizy Matematycznej jako wzór na pochodną iloczy-nu funkcji. Określenie „operator zaczepiony w punkcie x” odnosi się do tego, że we wzorzetym pojawiają się wartości funkcji f i g obliczone właśnie w tym punkcie.Okazuje się, że powyższe własności można przyjąć za aksjomaty definiujące wektor

styczny do przestrzeni afinicznej i zaczepiony w punkcie x:Twierdzenie 1: Każdy operator różniczkowy pierwszego rzędu zaczepiony w x, to

znaczy odwzorowanievx : C1(An) 7→ R ,

spełniające powyższe trzy aksjomaty, jest powyższego typu, tzn. jest zadany przez pewienwektor styczny, zaczepiony w punkcie x ∈ An, tzn. parę (x, v), gdzie v ∈ V n.

Zanim przejdziemy do dowodu tego twierdzenia uczynimy znów pewną uwagę na te-mat notacji stosowanej w tym dowodzie, a potem również w całym wykładzie. Używającwspółrzędnych prostoliniowych

κ(τ) = x+n∑

k=1

τkek , (17)

będziemy rozważali funkcję zależną od współrzędnych

Rn ∋ (τk) = τ → f(κ(τ)) ∈ R . (18)

Taka funkcja f κ, będąca superpozycją f oraz parametryzacji κ, której wartość możewyrażać się na przykład za pomocą wielomianów, funkcji wymierych, trygonometrycz-nych, wykładniczych, logarytmicznych, czy też może jeszcze ogólniejszych, od wartościwspółrzędnych τk, podlega badaniu metodami analizy matematycznej. Tymczasem samafunkcja f jest określona na abstrakcyjnej przestrzeni An i trudno badać ją bez konkretnejparametryzacji punktów x ∈ Ak przy pomocy konkretnych współrzędnych o wartościachliczbowych. Będziemy zatem stosowali parametryzację, a cała sztuka polegać ma na tym,żeby wyciągane wnioski nie zależały od jej wyboru. Można powiedzieć, że funkcja zmien-nych rzeczywistych f κ jest „konkretyzacją” abstrakcyjnej funkcji f .Podkreślamy, że podstawowymi obiektami są: abstrakcyjna przestrzeń An i funkcje okre-

ślone właśnie na niej. Jednak możliwość wykonywania konkretnych obliczeń zawdzięczamystosowaniu ich „konkretyzacji”. Jednak okazuje się, że bardzo często wygodnie będzie ozna-czać liczbową konkretyzację „f κ” abstrakcyjnej funkcji f tą samą literą. Na przykład

21

Page 28: Rozn. Geom_ - Jerzy Kijowski

pisząc symbol pochodnej cząstkowej funkcji f po zmiennej τk mamy na myśli to, że zostaławybrana pewna parametryzacja κ, a następnie obliczona pochodna funkcji f κ względemwspółrzędnej (τk):

∂τkf(x) :=

∂τkf(κ(τ))

∣∣∣∣∣τ=κ−1(x)

.

Utożsamianie funkcji „f” z funkcją „f κ” wygląda z punktu widzenia „analityka mate-matycznego” na poważne nadużycie. Jeśli „funkcja” to jej forma analityczna (na przykładfunkcja logarytmiczna) to oba te obiekty są czymś zupełnie różnym i utożsamianie ich jestnonsensem. Warto jednak przyjąć zaproponowany wyżej punkt widzenia, według któregofunkcja f to wielkość fizyczna, której wartości są przypisane punktom badanej przestrzeni,zaś f κ to jej konkretyzacja, bowiem zysk w postaci kolosalnego uproszczenia notacjijest ogromny!Mając to na uwadze przejdziemy do dowodu tego fundamentalnego twierdzenia.

Dowód Twierdzenia W otoczeniu punktu x funkcję f można rozłożyć w szereg Tay-lora:

f(κ(τ)) = f(x) +n∑

k=1

τkak +R(τ), (19)

gdzie R jest „resztą rzędu wyższego niż 1”, to znaczy funkcją, która znika w zerze wrazze swymi pochodnymi pierwszego rzędu. Współczynniki rozwinięcia ak są dane ze wzoruTaylora, jako wartości odpowiednich pochodnych funkcji f w punkcie x:

ak =ddτk

f(x+ τ iei)

∣∣∣∣∣τ=0

=:∂

∂τkf(x) . (20)

Wykażemy teraz, że operator różniczkowy vx daje wynik równy zeru, gdy zastosowaćgo do pierwszego (stałego) wyrazu w powyższym rozwinięciu (19) funkcji f . Wynika to zponiższego lematu:Lemat. vx(1) = 0 , gdzie 1 oznacza tutaj funkcję stałą o wartości równej 1.Dowód. Stosując regułę Leibniza mamy: vx(1) = vx(1 · 1) = vx(1) + vx(1).

Stosując ten lemat do dowolnej funkcji stałej f(τ) ≡ c ≡ c · 1(τ) otrzymujemy zliniowości vx(c) = cvx(1) = 0. Czyli vx znika na pierwszym wyrazie rozwinięcia (19).Okazuje się, że vx znika również na trzecim wyrazie rozwinięcia, bowiem – jak za chwilę

pokażemy – znika na dowolnej funkcji której wartość w x oraz wartość wszystkich jejpierwszych pochodnych w x jest równa zeru. W trakcie dowodu będzie nam potrzebnadowolna funkcja ψ zmiennej rzeczywistej, o następujących własnościach:

1. ψ(t) ≡ 1 dla t ¬ 12

2. ψ(t) ≡ 0 dla 1 ¬ t

3. ψ jest funkcją klasy C1.

22

Page 29: Rozn. Geom_ - Jerzy Kijowski

Istnienie takich funkcji (nawet klasy C∞) było wykazane na wykładzie z analizy matema-tycznej.Możemy teraz wykazać następujący

Lemat. Operator vx ma własność lokalności: jeśli dwie funkcje f i g są sobie równe wpewnym otoczeniu punktu x to vx ich nie rozróżnia, tzn. vx(f) = vx(g).Dowód. Rozważamy funkcję h := f − g, która znika w pewnym otoczeniu punktu x, tzn.– w języku współrzędnych (τ i) – w pewnym otoczeniu zera. Weźmy tak małą liczbę ǫ > 0,by to otoczenie zawierało kulę o promieniu ǫ w tych współrzędnych, to znaczy zbiór:

K(0, ǫ) = (τ i)|n∑

k=1

(τk)2 < ǫ2 . (21)

Jeśli teraz położyć

ψǫ(τ) := ψ(||τ ||ǫ) , (22)

gdzie

||τ || =√√√√n∑

k=1

(τk)2 , (23)

to ψǫ zeruje się tożsamościowo poza tym otoczeniem. A zatem funkcja h · ψǫ zeruje siętożsamościowo, bowiem h znika w epsilonowym otoczeniu zera zaś ψǫ – poza nim. Mamywięc:

0 = vx(0) = vx(h · ψǫ) = vx(h)ψǫ(0) + vx(ψǫ)h(0) = vx(h) = vx(f)− vx(g) , (24)

co kończy dowód lokalności operatora vx.

Aby wykazać, że vx(R) = 0 rozważymy teraz ciąg funkcji Rǫ := R · ψǫ. Ponieważ ψǫjest równa jedności w pewnym otoczeniu zera, to Rǫ pokrywa się z R w tym otoczeniu. Zlokalności wynika zatem: vx(Rǫ) = vx(R). Łatwo jednak udowodnić, że gdy R i jej pochodneznikają w zerze, to ciąg funkcji Rǫ zbiega do zera w sensie C1, to znaczy zachodzi:

limǫ→0

Rǫ = 0 .

Z ciągłości operatora vx mamy zatem:

0 = limǫ→0

vx(Rǫ) = limǫ→0

vx(R) = vx(R) . (25)

Ze znikania vx na pierwszym i ostatnim wyrazie rozwinięcia (19) funkcji f wynika, żepozostaje jedynie jej wartość na środkowym, liniowym wyrazie:

vx(f) = vx(n∑

k=1

τkak) =n∑

k=1

akvx(τk) . (26)

Oznaczmy wynik działania operatora vx na funkcji liniowej τk jako

vk := vx(τk) . (27)

23

Page 30: Rozn. Geom_ - Jerzy Kijowski

Wiemy jednak (patrz formuła (20)), że współczynniki ak są równe pochodnym cząstkowymfunkcji f . Otrzymujemy więc:

vx(f) =n∑

k=1

vk∂

∂τkf(x) =

ddǫf(x+ ǫ(

n∑

k=1

vkek))

∣∣∣∣∣ǫ=0

= f ′(x) ·(n∑

k=1

vkek

)(28)

a zatem vx jest rzeczywiście operatorem różniczkowania w kierunku wektora

v =n∑

k=1

vkek .

Widzimy, że składowe vk tego wektora w bazie e = (ek) można otrzymać jako wynikdziałania operatora vx na funkcje liniowe τk w tej parametryzacji. Od tej pory będziemyidentyfikować operator różniczkowy pierwszego rzędu vx z wektorem v, w którego kierunkuten operator różniczkuje, zaczepionym w punkcie x. W szczególności pochodna cząstowa∂∂τkbędzie identyfikowana z k-tym wektorem bazy:

ek =∂

∂τk. (29)

Gdy nie prowadzi to do nieporozumień, będziemy skracać notację pisząc ∂∂τk= ∂k. Używa-

jąc identyfikacji (29) piszemy zatem:

vx =n∑

k=1

vk∂

∂τk=: vk

∂τk= vk∂k . (30)

W ostatniej równości po raz pierwszy zastosowaliśmy konwencję sumacyjną Einsteinapolegającą na tym, że jeśli w danym wzorze ten sam wskaźnik pojawia się dwa razy: raz nadole i raz na górze, to należy rozumieć, że przed całym wyrażeniem stoi znak sumowaniapo wszystkich możliwych wartościach tego wskaźnika. Możliwość opuszczania znaku sumyznacznie upraszcza wzory i – jak się okazuje – nie prowadzi do żadnych nieporozumień,jeśli tylko poprawnie stosujemy konwencję Einsteina. Będziemy ją konsekwentnie stosowaliw niniejszym wykładzie.

2.6 Współrzędne wektora w krzywoliniowym układzie współ-rzędnych

W trójwymiarowej przestrzeni afinicznej A3 rozważmy układ współrzędnych prostolinio-wych (x, y, z) zbudowany poprzez wybór środka układu x oraz bazę przestrzeni stycznejzłożoną z trzech osi: (ex, ey, ez). Wektory te mogą być utożsamiane z odpowiadającymi imoperatorami różniczkowymi:

∂x= ex ,

∂y= ey ,

∂z= ez .

24

Page 31: Rozn. Geom_ - Jerzy Kijowski

Jednak nic nie stoi na przeszkodzie, by posługiwać się współrzędnymi krzywoliniowymi. Dlazilustrowania weźmy współrzędne sferyczne (r, θ, ϕ) związane z poprzednimi w następującysposób:

x = r sin θ cosϕ ,

y = r sin θ sinϕ , (31)

z = r cos θ .

Odpowiadające im operatory różniczkowe pierwszego rzędu: ∂∂r, ∂∂θ, ∂∂ϕteż są jakimiś wek-

torami tej samej przestrzeni V 3, zatem muszą być kombinacjami liniowymi wektorów po-przedniej bazy. Aby znaleźć zależność między dwiema bazami musimy stare współrzędnewyrazić przez nowe, to znaczy rozważyć funkcję złożoną nowych zmiennych:

f(x(r, θ, ϕ), y(r, θ, ϕ), z(r, θ, ϕ)) .

Z twierdzenia o różniczkowaniu superpozycji otrzymujemy natychmiast:

∂r=

∂x

∂r

∂x+∂y

∂r

∂y+∂z

∂r

∂z, (32)

∂θ=

∂x

∂θ

∂x+∂y

∂θ

∂y+∂z

∂θ

∂z, (33)

∂ϕ=

∂x

∂ϕ

∂x+∂y

∂ϕ

∂y+∂z

∂ϕ

∂z. (34)

Wykonując odpowiednie różniczkowania starych zmiennych po nowych otrzymujemy:

∂r= sin θ cosϕ

∂x+ sin θ sinϕ

∂y+ cos θ

∂z

=x

r

∂x+y

r

∂y+z

r

∂z=x

rex +

y

rey +

z

rez , (35)

∂θ= r cos θ cosϕ

∂x+ r cos θ sinϕ

∂y− r sin θ ∂

∂z

=zx√x2 + y2

ex +zy√x2 + y2

ey −√x2 + y2 ez , (36)

∂ϕ= −r sin θ sinϕ ∂

∂x+ r sin θ cosϕ

∂y

= −y ex + x ey . (37)

Wektory ∂∂r, ∂∂θ, ∂∂ϕstanowią bazę przestrzeni stycznej V 3 a powyższa relacja między

nimi a wyjściową bazą ∂∂x, ∂∂y, ∂∂zjest odwracalna. Zresztą twierdzenie o pochodnej super-

25

Page 32: Rozn. Geom_ - Jerzy Kijowski

pozycji, z którego wynikają relacje (32) – (34), natychmiast implikuje relację odwrotną:

∂x=

∂r

∂x

∂r+∂θ

∂x

∂θ+∂ϕ

∂x

∂ϕ, (38)

∂y=

∂r

∂y

∂r+∂θ

∂y

∂θ+∂ϕ

∂y

∂ϕ, (39)

∂z=

∂r

∂z

∂r+∂θ

∂z

∂θ+∂ϕ

∂z

∂ϕ. (40)

Jak widać, odwracalność tej relacji wynika z odwracalności macierzy:

∂x∂r

∂x∂θ

∂x∂ϕ

∂y∂r

∂y∂θ

∂y∂ϕ

∂z∂r

∂z∂θ

∂z∂ϕ

. (41)

A to z kolei wynika z faktu, że obie parametryzacje są regularne, a zatem zamiana jednejna drugą:

R3 ⊃ U ∋ (r, θ, ϕ)→ (x, y, z) ∈ R3 , (42)

jest odwzorowaniem odwracalnym. Owzorowanie to nie jest określone globalnie, to znaczyna całej przestrzeni R3, a jedynie na pewnym jej zbiorze otwartym U ⊂ R3, odpowiadają-cym dziedzinie zmienności naszych współrzędnych (r, θ, ϕ). W naszym przypadku:

U = (r, θ, ϕ) ∈ R3| r > 0 ; 0 < θ < π ; 0 < ϕ < 2π .

Jak widać, musimy pominąć: 1) środek układu współrzędnych, odpowiadający wartościr = 0; 2) oś współrzędnej „z”, odpowiadającą wartościom θ = 0 oraz θ = π; a także3) „linię zmiany daty”, na której następuje skok długości geograficznej ϕ o wartość 2π.Ustawienie linii daty w półpłaszczyźnie

P = (x, y, z) ∈ R3 | y = 0 ; x > 0 ,

jest oczywiście sprawą konwencji. W geografii dominuje „europocentryczny” punkt wi-dzenia, w którym odsuwamy tę niewygodną linię daleko na Pacyfik, tzn. na przeciwległąpółpłaszczyznę, odpowiadającą wartościom x < 0. Przyjmijmy jednak dla prostoty, żewspółrzędne sferyczne są określone na zbiorze otwartym

W = R3 \ P .

Macierz (41) jest pochodną (macierzą Jacobi’ego) odwzorowania (42). Macierz do niejodwrotna jest pochodną odwzorowania odwrotnego:

R3 ⊃ W ∋ (x, y, z)→ (r, θ, ϕ) ∈ R3 . (43)

Jej elementy są dane przez następujące pochodne cząstkowe:

∂r∂x

∂r∂y

∂r∂z

∂θ∂x

∂θ∂y

∂θ∂z

∂ϕ∂x

∂ϕ∂y

∂ϕ∂z

. (44)

26

Page 33: Rozn. Geom_ - Jerzy Kijowski

Powyższa argumentacja to właśnie dowód faktu, iż wektory ∂∂r, ∂∂θ, ∂∂ϕstanowią bazę

przestrzeni stycznej. W dowodzie tym odwołujemy się do innej bazy ∂∂x, ∂∂y, ∂∂z, wyznaczonej

przez współrzędne prostoliniowe (x, y, z). Jednak odwołanie takie nie jest wcale konieczne!Z punktu widzenia struktury przestrzeni wektorów zaczepionych w jednym punkcie, współ-rzędne prostoliniowe wcale nie są „lepsze” od jakichkolwiek innych współrzędnych. Aby sięo tym przekonać wystarczy od początku rozważać „konkretyzację” funkcji f odpowiadają-cą zmiennym sferycznym. I wtedy dowód Twierdzenia 1. z poprzedniego paragrafu stosujesię bez żadnych zmian. Jako tezę otrzymujemy fakt, iż każdy operator różniczkowy vx jestkombinacją liniową operatorów er = ∂

∂r, eθ = ∂

∂θoraz eϕ = ∂

∂ϕ.

Wektory te można sobie wyobrażać jako wektory styczne do odpowiedniej linii, na którejjedna ze współrzędnych zmienia się, podczas gdy pozostałe współrzędne pozostają stałe.A zatem er jest wektorem radialnym, stycznym do linii współrzednej r danej równaniami:

θ = const. , ϕ = const.

na której współrzędna r odgrywa rolę parametru. W terminach geograficznych jest towektor prostopadły do powierzchni globu. Podobnie wektor eθ jest styczny do „linii współ-rzędnej θ”, czyli do południka danego równaniami

r = const. , ϕ = const. ,

natomiast eϕ jest wektorem stycznym do równoleżnika.Korzystając z powyższych intuicji możemy teraz rozważyć sytuację ogólną, gdy punkty

przestrzeni afinicznej An są sparametryzowane przy pomocy jakiegokolwiek — niekoniecz-nie prostoliniowego — układu współrzędnych. Rozważamy zatem sytuację, gdy dysponu-jemy parametryzacją, to znaczy odwzorowaniem:

Rn ⊃ U ∋ (xk)→ κ(xk) = x ∈ O ⊂ An . (45)

W tym miejscu (xk) = (x1, x2, . . . , xn−1, xn) oznacza zestaw wartości wszystkich współ-rzędnych punktu κ(xk) naszej przestrzeni. Podobnie jak w przypadku omawianych wyżejwspółrzędnych sferycznych, ten układ współrzędnych nie musi być globalny, a wystarczyby był lokalny. Oznacza to, że zakres zmienności współrzędnych może być ograniczony dopewnego zbioru otwartego U w przestrzeni parametrów.Podkreślam, że parametryzacja punktu x współrzędnymi (xk) jest jednoznaczna, to

znaczy że κ jest odwzorowaniem odwracalnym. Odwzorowanie odwrotne oznaczamy sym-bolem:

An ⊃ O ∋ x→ κ−1(x) = (xk) ∈ U ⊂ Rn , (46)

i nazywamy mapą lub układem współrzędnych. Ono również nie musi być globalne, tzn. okre-ślone na całej przestrzeni An, a jedynie na jej podzbiorze O = κ(U).Niech vx będzie teraz operatorem różniczkowym pierwszego rzędu zaczepionym w punk-

cie x ∈ O i działającym na funkcje z przestrzeni C1(An), określone w otoczeniu punktu x.Zastępując współrzędne (τk), używane w Twierdzeniu 1, przez współrzędne (xk) dowodzi-my następującego twierdzenia:

27

Page 34: Rozn. Geom_ - Jerzy Kijowski

Twierdzenie 2: Operator vx jest kombinacją liniową operatorów ∂∂xk, a konkretnie

zachodzi wzór:

vx = vk∂

∂xk, (47)

gdzie współczynniki vk są równe wartości operatora vx na poszczególnych współrzędnychxk traktowanych jako funkcje na naszej przestrzeni Ak:

vk = vx(xk) . (48)

Uwaga: We wzorze (47) znów zastosowaliśmy konwencję sumacyjną Einsteina. Oznaczato, że jego prawa strona jest sumą odpowiednich wyrażeń odpowiadających wszystkimkolejnym wartościom indeksu k = 1, 2, . . . , n. Występujące w tej sumie współczynniki (48)będziemy nazywali „współrzędnymi wektora vx w bazie ∂

∂xk”.

2.7 Zmiana współrzędnych wektora odpowiadająca zmianie ukła-du współrzędnych

Gdy zmienimy parametryzację (45) na inną:

Rn ⊃ U ∋ (yl)→ κ(yl) = x ∈ O ⊂ An , (49)

to w punktach pokrywanych przez obie parametryzacje, tzn. należących do zbioru O ∩ O,można używać równorzędnie obu baz:

(∂∂xk

)oraz

(∂∂yl

):

vx = vk∂

∂xk= vl

∂yl. (50)

Związek między obiema bazami wynika z obliczenia macierzy Jacobi’ego funkcji złożonej

Rn ⊃ κ(O ∩ O) ∋ (yl)→ f(xk(yl)) ∈ R ,

a mianowicie∂

∂yl=∂xk

∂yl∂

∂xk

(=n∑

k=1

∂xk

∂yl∂

∂xk

). (51)

(Ostatnią wersję wypisaliśmy dla kolejnego przypomnienia o konwencji sumacyjnej.) Od-wrotna relacja dana jest wzorem:

∂xk=∂yl

∂xk∂

∂yl

(=n∑

l=1

∂yl

∂xk∂

∂yl

). (52)

Wstawiając to ostatnie wyrażenie do (50) otrzymujemy:

vx = vk∂

∂xk= vk

∂yl

∂xk∂

∂yl= vl

∂yl. (53)

Ponieważ współrzędne wektora w bazie ( ∂∂yl) są dane jednoznacznie, zatem ostatnia równość

implikuje następujące prawo transformacyjne dla współrzędnych wektora:

vl = vk∂yl

∂xk. (54)

Od tej pory przestaniemy już przypominać o konwencji sumacyjnej, która stale obowiązuje.

28

Page 35: Rozn. Geom_ - Jerzy Kijowski

2.8 Rozmaitości różniczkowe zanurzone w przestrzeni afinicznej.Przestrzeń styczna

Powierzchnię krzywą w trójwymiarowej przestrzeni euklidesowej definiuje się często jakozbiór rozwiązań jakiegoś równania. Na przykład sfera o promieniu R > 0 wokół środkaukładu współrzędnych (0, 0, 0) w przestrzeni sparametryzowanej zmiennymi Kartezjański-mi (x, y, z) to zbiór rozwiązań równania

G(x, y, z) = x2 + y2 + z2 − R2 = 0 . (55)

Intuicyjnie czujemy, że z trzech wymiarów jeden został „ustalony równaniem” zatem po-został nam obiekt dwuwymiarowy. Gdyby natomiast dodać jeszcze jedno równanie:

H(x, y, z) = z = 0 . (56)

to „ustalony” zostałby jeszcze jeden wymiar, zatem zbiór rozwiązań układu dwóch równańG(x, y, z) = 0H(x, y, z) = 0

(57)

powinien być obiektem jednowymiarowym. I rzeczywiście: zbiór ten jest równikiem sfery,czyli okręgiem o promieniu R, leżącym na płaszczyźnie „xy”.Miejsce geometryczne punktów spełniających oba te równania jest po prostu przecię-

ciem zbioru rozwiązań pierwszego równania, czyli sfery, ze zbiorem rozwiązań drugiegorównania, czyli płaszczyzny równikowej.Takie naiwne rozważania można natychmiast sprowadzić do absurdu następującym

kontrprzykładem. Jeśli

H(x, y, z) = x2 + y2 + (z − 2R)2 −R2 = 0 , (58)

to zbiorem rozwiązań równania H(x, y, z) = 0 znów jest sfera o promieniu R, ale o środkuw punkcie (0, 0, 2R). Punktem wspólnym tych dwóch sfer, czyli jedynym rozwiązaniemukładu dwóch równań (57), jest punkt (0, 0, R), to znaczy obiekt „zero-wymiarowy” a nieżadna jednowymiarowa krzywa.Można też podać przykład działający „w drugą stronę”, gdy rozwiązanie układu dwóch

równań w trójwymiarowej przestrzeni jest obiektem dwuwymiarowym. Dzieje się tak, gdyoba równania wyróżniają te same punkty. Wystarczy wziąćH = G2, lub ogólniejH = fG,gdzie f jest funkcją rzeczywistą o jedynym miejscu zerowym równym zeru. W takiej sytuacjipowiemy, że równania G = 0 oraz H = 0 nie są niezależne, bo H jest funkcją G, awięc nic dziwnego, że drugie nie niesie żadnej nowej informacji w stosunku do pierwszego.Chcemy uniknąć takich sytuacji i rozważać jedynie takie układy równań, które są od siebieniezależne. W przypadku równań liniowych pojęcie niezależności układu równań oznaczało,że ich lewe strony są liniowo niezależne jako wektory odpowiedniej przestrzeni wektorowej4.4W algebrze ten termin oznacza, że jedyna ich kombinacja liniowa, która jest tożsamościowo równa

zeru, to taka, której wszystkie współczynniki są równe zeru.

29

Page 36: Rozn. Geom_ - Jerzy Kijowski

–1 1

Rysunek 8: Lemniskata Bernoulliego.

Tymczasem w geometrii mamy na ogół do czynienia z równaniami nieliniowymi, dla którychpojęcie liniowej niezależności jest nieprzydatne: przecież G i G2 są liniowo niezależne jakofunkcje, tymczasem równania G = 0 oraz G2 = 0 są zdecydowanie zależne w tym sensie,że drugie nie niesie żadnej nowej informacji w stosunku do pierwszej.Okazuje się, że jest proste wyjście z tej sytuacji: równania Gi(x) = 0 będziemy uwa-

żać za niezależne wtedy, gdy różniczki funkcji Gi(x) są liniowo niezależne. Taka definicjadyskwalifikuje układ równań

x2 + y2 + z2 − R2 = 0x2 + y2 + (z − 2R)2 −R2 = 0

(59)

bowiemd(x2 + y2 + z2 −R2) = 2(xdx+ ydy + zdz) ,

natomiastd(x2 + y2 + (z − 2R)2 −R2) = 2(xdx+ ydy + (z − 2R)dz) .

Wynika stąd, że w punkcie (0, 0, R), będącym rozwiązaniem układu (59), pierwsza różniczkajest równa 2Rdz, natomiast druga jest równa −2Rdz, czyli są one liniowo zależne: jednajest równa minus drugiej.Również równanie zero-wymiarowej „sfery o promieniu równym 0”:

G(x, y, z, ) = x2 + y2 + z2 = 0 ,

jest wykluczone warunkiem liniowej niezależności różniczek, bowiem dG(0, 0, 0) = 0 wpunkcie (0, 0, 0) będącym jego jedynym rozwiązaniem.Warunek ten wyklucza również innego rodzaju patologie, polegające na „samoprze-

cinaniu się” rozwiązań. Jako przykład może służyć lemniskata Bernoulliego, czyli płaskakrzywa na płaszczyźnie A2 opisana równaniem:

F (x, y, z) = (x2 + y2)2 − 2a2(x2 − y2) = 0 . (60)

Jej wykres ma kształt położonej poziomo ósemki (zob. Rysunek 8). Prawie wszędziejest ona gładka, jednak punkt (0, 0, 0) jest w jakimś sensie osobliwy: kierunek styczny dotej krzywej nie jest tu jednoznaczny. A dzieje się tak dlatego, że

d((x2 + y2)2 − 2a2(x2 − y2)

)= 4

[(x2 + y2)(xdx+ ydy)− a2(xdx− ydy)

],

30

Page 37: Rozn. Geom_ - Jerzy Kijowski

a zatem dF = 0 w punkcie (0, 0, 0).Warunek liniowej niezależności różniczek funkcji, których wspólne miejsce zerowe chce-

my badać, ma zatem następujące znaczenie geometryczne. Rozważmy zbiór rozwiązań Mikażdego z równań Gi = 0:

An ⊃ Mi = x ∈ An| Gi(x) = 0 . (61)

Oczywiście zbiór rozwiązań kilku z tych równań jest przecięciem (częścią wspólną) zbiorówrozwiązań poszczególnych równań:

k⋂

i=1

Mi = x ∈ An| G1(x) = 0, . . . , Gk(x) = 0 . (62)

Otóż warunek niezależności różniczek tych funkcji oznacza, że dokładaniu kolejnych rów-nań odpowiada przecinanie zbioru ich rozwiązań z kolejną powierzchnią Mi w regularny(to znaczy transwersalny) sposób. Tej właśnie transwersalności brakowało w przykładzie(59), gdzie punkt wspólny obu kul był punktem ich styczności, a nie prawdziwego, trans-wersalnego przecięcia.Uwzględniając powyższe, heurystyczne uwagi przejmiemy w dalszym ciągu następującą

definicję:Definicja. Rozmaitością różniczkowalną wymiaru m, klasy C l, dobrze zanurzoną w n-wymiarowej przestrzeni afinicznej An, będziemy nazywali zbiór punktów M ⊂ An, zdefi-niowany jako zbiór wszystkich rozwiązań układu równań:

G1(x) = 0...

Gr(x) = 0

(63)

przy czym:

1. układ jest „regularny”, to znaczy, że w każdym punkcie x ∈ M zbiór różniczek(dGi(x)) funkcji Gi jest liniowo niezależny,

2. wymiar m oznacza, że zachodzi: m + r = n, czyli wymiar rozmaitości jest równywymiarowi przestrzeni n minus liczba równań r,

3. klasa C l oznacza, że funkcje definiujące Gi są różniczkowalne co najmniej l razy wsposób ciągły.

Zdefiniujemy teraz przestrzeń wektorów stycznych do rozmaitościM w punkcie x ∈M .Dla dowolnego wektora v ∈ V n z przestrzeni stycznej do An rozważmy linię prostą wycho-dzącą z punktu x w kierunku tego wektora, to znaczy jednoparametrowy zbiór punktów

R ∋ τ → x+ τv ∈ An .

31

Page 38: Rozn. Geom_ - Jerzy Kijowski

Prosta ta na ogół „wystaje” z M , bowiem dla τ 6= 0 jej punkty nie spełniają już rów-nań definiujących (63), choć spełnia je punkt wyjściowy odpowiadający wartości τ = 0.Rozwijając w szereg względem τ otrzymujemy jednak:

Gi(x+ τv) = Gi(x) + τ ·⟨dGi(x),v

⟩+Ri(τ) , (64)

gdzie symbol 〈·,v〉 oznacza wartość na wektorze v funkcji liniowej (tutaj akurat równejróżniczce funkcji Gi w punkcie x). Pierwszy, człon powyższego rozwinięcia znika, bowiempunkt x należy do M , tzn. spełnia równania definiujące (63). Ostatni człon jest „resztąrzędu wyższego niż 1”, a więc jest bardzo mały dla małych wartości parametru τ . Widaćwięc, że decydujący jest drugi człon, liniowo zależny od parametru τ i dany przez pochodnąfunkcji Gi w kierunku wektora v. Wektory styczne doM to takie, które „najmniej wystają”z powierzchniM , a zatem takie, na których ta pochodna jest równa zeru. Wtedy co prawdawarunki definiujące Gi = 0 nie są spełnione ściśle, ale błąd jest małą wyższego rzęduwzględem wartości parametru τ :

Gi(x+ τv) = Ri(τ) . (65)

Powyższe rozważanie uzasadnia następującą definicję wektora stycznego do M .Definicja. Przestrzenią styczną do M w punkcie x ∈ M nazywamy wspólne jądro różni-czek funkcji definiujących, to znaczy przestrzeń wektorową TxM ⊂ V n, na której zerująsię wszystkie te różniczki dGi(x):

TxM := v ∈ V n|⟨dGi(x),v

⟩= 0 . (66)

Z regularności warunku definiującego wynika, że TxM jest m-wymiarową podprzestrze-nią wektorową przestrzeni V n.Przykład. Wektor v = vk ∂

∂xk∈ V 3 jest styczny do sfery o promieniu R > 0:

S2 =

(xk) ∈ A3

∣∣∣∣∣G(xk) =

3∑

k=1

(xk)2 −R2 = 0

(67)

w punkcie x = (xk) wtedy i tylko wtedy gdy spełnia równanie

〈dG(x),v〉 = vk ∂

∂xkG(x) = 2

3∑

k=1

(vkxk

)= 0 ,

a więc jest „prostopadły” do samego „wektora wiodącego”, tzn. wektora o początku wśrodku układu współrzędnych i końcu w naszym punkcie x.W powyższym przykładzie posłużyliśmy się współrzędnymi prostoliniowymi x1 = x,

x2 = y oraz x3 = z. Opiszmy jednak ten sam fakt w zmiennych sferycznych (r, θ, ϕ).Wtedy równanie definiujące sfery wygląda następująco:

S2 =(r, θ, ϕ) ∈ A3

∣∣∣G(r, θ, ϕ) = r2 −R2 = 0. (68)

32

Page 39: Rozn. Geom_ - Jerzy Kijowski

Wektor

v = vr∂

∂r+ vθ

∂θ+ vϕ

∂ϕ∈ V 3

jest styczny do sfery w punkcie x = (R, θ, ϕ) wtedy i tylko wtedy gdy spełnia równanie

〈dG(x),v〉 = 2vrR = 0 ,

to znaczy gdy jego radialna składowa znika: vr = 0. A zatem jest on kombinacją wektorów:południkowego ∂

∂θoraz równoleżnikowego ∂

∂ϕ, które stanowią bazę tej przestrzeni. Mamy

zatem:

TxS2 =

vθ∂

∂θ+ vϕ

∂ϕ

.

2.9 Forma uwikłana a forma parametryczna rozmaitości zanu-rzonej

Wzór (67) definiuje sferę S2 w formie uwikłanej, jako zbiór rozwiązań równania G(x) = 0.Można ją też zdefiniować parametrycznie, jako zbiór wszystkich punktów postaci:

x = R sin θ cosϕ , (69)

y = R sin θ sinϕ , (70)

z = R cos θ , (71)

to znaczy takich, dla których jedna ze współrzędnych sferycznych, mianowicie współrzędnaradialna r, przyjmuje ustaloną wartość r = R. Taka forma jest bardzo wygodna, bowiempozostałe współrzędne (θ, ϕ) parametryzują punkty sfery. Funkcje określone na S2 mogąbyć konkretyzowane jako funkcje zależne od tych właśnie zmiennych, zaś liczone względemnich pochodne stanowią bazę przestrzeni stycznej.Okazuje się, że dla każdej rozmaitości M zanurzonej w przestrzeni afinicznej An, danej

jako zbiór rozwiązań regularnego układu równań (63), istnieje lokalnie, to znaczy w oto-czeniu każdego jej punktu x ∈M , jej forma parametryczna. Co więcej, istnieje taki układwspółrzędnych, w którym równania definiujące oznaczają ustalenie wartości pewnych rwspółrzędnych, podczas gdy pozostałe współrzędne w liczbie m = n − r stanowią układwspółrzędnych na samym M .Twierdzenie: Każdy punkt x ∈ M rozmaitości danej regularnym układem równań

(63) posiada otoczenie Ox w którym istnieje parametryzacja

Rm+r ⊃ W ∋ (xi, ζj)→ κ(xi, ζj) ∈ O ⊂ An ,

(gdzie i = 1, . . . , m, oraz j = 1, . . . , r) przekształcający układ definiujący (63) w układζj = 0, to znaczy:

M ∩O =κ(xi, ζj) ∈ A3

∣∣∣ ζj = 0 ; j = 1, . . . , r; (72)

zaś zestaw wszystkich wektorów ∂∂xistanowi bazę przestrzeni stycznej TxM .

33

Page 40: Rozn. Geom_ - Jerzy Kijowski

Dowód:Wybierzmy dowolną bazę (e1, . . . em) przestrzeni stycznej TxM . Uzupełnijmyją dowolnymi wektorami h1, . . . ,hr do bazy całej przestrzeni V n. Przyjmijmy sumę tychdwu zestawów wektorów jako kompletny zbiór osi prostoliniowego układu współrzędnychw An o środku w x:

y(τ i, ηj) = x+m∑

i=1

τ iei +r∑

j=1

ηjhj . (73)

W tej parametryzacji rozmaitość M jest zadana przy pomocy r równań

Gk(xi, ζj) = 0 (74)

na r niewiadomych ηj.Ponieważ różniczki funkcji Gi są liniowo niezależne, macierz

[∂Gj

∂ηk

], (75)

jest odwracalna. Wynika to z faktu, iż jej kolumny reprezentują jedyne niezerowe składoweróżniczek funkcji Gj , jako że pozostałe składowe ∂G

j

∂τ iznikają tożsamościowo: pochodna

funkcji Gk po τ i, to pochodna w kierunku wektora stycznego ei, zaś wektory styczne doMbyły właśnie zdefiniowane w ten sposób, że pochodne funkcji Gk w ich kierunku znikają.Zatem kolumny macierzy (74) muszą być niezależne liniowo, czyli sama macierz jest

odwracalna. Wobec tego układ równań (74) spełnia założenia twierdzenia o funkcjach uwi-kłanych, a więc równania te definiują, przynajmniej w pewnym otoczeniu zera 0 ∈ Rm,funkcję uwikłaną

Rm ∋ (τ i) −→ (F j(τ)) ∈ Rr (76)

i taką, że w pewnym otoczeniu punktu x punkty y ∈ An należą do M wtedy i tylko wtedygdy zachodzi równanie

ηj = F j(τ) . (77)

Zbiór M jest więc (lokalnie, w pobliżu punktu x) wykresem odwzorowania (76). W tensposób z opisu uwikłanego rozmaitości M , danej jako zbioru rozwiązań układu równań,możemy przejść do opisu parametrycznego, jako zbioru punktów postaci:

y(τ i) = x+m∑

i=1

τ iei +k∑

j=1

F j(τ)hj . (78)

Z twierdzenia o funkcjach uwikłanych otrzymujemy też:

∂F j

∂τ i(0) = −

(∂G

∂η(0)

)−1j

k

∂Gk

∂τ i(0) = 0 (79)

Układ współrzędnych (xi, ζj) zdefiniujemy teraz następująco:

xi = τ i , (80)

ζj = ηj − F j(τ) . (81)

34

Page 41: Rozn. Geom_ - Jerzy Kijowski

Równania definiujące (77) przyjmują zatem postać: ζj = 0, co dowodzi pierwszej częścitezy. Druga jej część wynika z wzoru na pochodną superpozycji, odpowiadającej przejściuod współrzędnych (τ i, ηj) do nowych współrzędnych (xi, ζj):

ei =∂

∂τ i=∂xk

∂τ i∂

∂xk+∂ζj

∂τ i∂

∂ζj=

∂xi− ∂F j

∂τ i∂

∂ζj=

∂xi,

gdzie ostatnia równość wynika ze znikania pochodnych funkcji uwikłanej F , patrz (79).

Zwróćmy uwagę, że operatory ∂∂ximają sens nawet dla funkcji C1(M), określonych je-

dynie na naszej rozmaitości M , a które wcale nie muszą być określone na całej, otaczającejją przestrzeni afinicznej An. Jeśli bowiem liczyć wartość tej pochodnej w układzie współ-rzędnych (xi, ζj), to wartości funkcji w punktach nie należących do M , to znaczy takich,dla których ζj 6= 0, wcale nie są potrzebne.Pokażemy jednak, że pochodną tę można liczyć również w innym układzie współrzęd-

nych w An, niekoniecznie „dostosowanym” do rozmaitości M . I rzeczywiście: spróbujmyobliczyć pochodną funkcji f ∈ C1(M) w kierunku wektora stycznego ei ∈ TxM stosującnajprostszy sposób, dany formułą (16):

ei(f) = limǫ→0

f(x+ ǫ · ei)− f(x)ǫ

. (82)

Taka naiwna próba nie może się udać, bowiem — jak to wynika z (65) — punkty prostej

ǫ→ x+ ǫ · ei ∈ An (83)

wystają (nieznacznie, ale jednak!) z M . Ale, na mocy (78), wystarczy niewielka poprawka,by leżały już w M :

x+ ǫ · ei +k∑

j=1

F j(ǫ · ei)hj ∈M . (84)

Zamieńmy więc w formule (82) „wystający zM” punkt (83) „poprawionym” punktem (84).Ponieważ wszystkie pochodne funkcji F j znikają w zerze (inaczej: ponieważ poprawka jestmałą wyższego rzędu w stosunku do samej wartości parametru ǫ), wynik wcale nie zależyod tej poprawki, bowiem mamy:

∂xif

= limǫ→0

f(x+ ǫ · ei +∑kj=1 F

j(ǫ · ei)hj)− f(x)ǫ

=ddǫ

f(x+ ǫ · ei +

k∑

j=1

F j(ǫ · ei)hj)∣∣∣∣∣∣ǫ=0

=ddǫf(x+ ǫ · ei)

∣∣∣∣∣ǫ=0

= limǫ→0

f(x+ ǫ · ei)− f(x)ǫ

= ei(f) .

35

Page 42: Rozn. Geom_ - Jerzy Kijowski

Równość w drugim wierszu wynika właśnie z faktu, że pochodne funkcji F znikają.Ściśle rzecz biorąc, wzory te zostały zapisane przy założeniu, że funkcja f jest określona

w całym otoczeniu punktu x ∈ An, a nie tylko na rozmaitości M . W przeciwnym razie jejwartość f(x+ ǫ · ei) nie byłaby określona. Widać jednak, że sposób, w jaki rozszerzyliśmydefinicję f z „cienkiej” rozmaitości M na całe jej „grube” otoczenia nie odgrywa żadnejroli, bowiem ostateczny wynik jest równy wartości pierwszego wyrażenia w powyższej for-mule, a ono odwołuje się jedynie do wartości funkcji f na M . Można zatem sformułowaćnastępujący przepis:Jeśli funkcję f , określoną jedynie na rozmaitościM zanurzonej w przestrzeni afinicznej,

chcesz zróżniczkować względem wektora do niej stycznego, to zamiast f różniczkuj jakie-kolwiek rozszerzenie tej funkcji na otoczenie rozmaitości, a wynik i tak nie będzie zależałod tego rozszerzenia lecz jedynie od samej funkcji.W ten sposób możemy identyfikować operator różniczkowy ∂

∂xi, czyli abstrakcyjny wek-

tor styczny do M , z „prawdziwym” wektorem ei („strzałką”), która żyje w przestrzeniafinicznej An ale jest styczna do M . O tej identyfikacji można jednak zapomnieć i w rezul-tacie uprawiać geometrię na samej przestrzeniM niejako „wewnętrznie”, nie interesując sięwcale w jaki sposóbM jest zanurzone w otaczającej ją przestrzeni afinicznej. To zanurzeniebyło potrzebne jedynie do konstrukcji map naM , czyli do przedstawienia M w postaci pa-rametrycznej. Takie mapy są, jak widzieliśmy, określone na ogół tylko w pewnym otoczeniupunktu x, a nie globalnie. Aby uprawiać geometrię na całymM nie wystarczy zatem jednamapa, ale ich zbiór (inaczej atlas) pokrywający całe M . Z konstrukcji map wynika, że gdydziedziny dwu różnych układów współrzędnych mają niepustą część wspólną, to przejścieod jednych współrzędnych do drugich jest tam lokalnym dyfeomorfizmem (odwzorowaniemróżniczkowalnym, odwracalnym, klasy C l), przestrzeni Rm.Abstrakcyjny wektor styczny do takiej abstrakcyjnej rozmaitości M w punkcie x ∈ M

definiujemy jako operator różniczkowy pierwszego rzędu, zaczepiony w x, działający nagładkie funkcje określone na M . Funkcje gładkie, to takie, które zależą w sposób gładkiod współrzędnych. I znów widzimy, że do określenia gładkości funkcji możemy zapomniećo całym An i posługiwać się jedynie lokalnymi mapami na M . Możemy więc zastosowaćtwierdzenie udowodnione poprzednio. A zatem każdy operator różniczkowy działający wpunkcie należącym do M ma postać:

v = vi∂

∂xi. (85)

Gdy jednak znów przypomnimy sobie o zanurzeniuM w An i o wykazanej powyżej równości

∂xi= ei ,

to widzimy, że te „abstrakcyjne” wektory styczne można utożsamiać z zupełnie konkret-nymi wektorami stycznymi do M , ale żyjącymi w przestrzeni afinicznej An.

36

Page 43: Rozn. Geom_ - Jerzy Kijowski

2.10 Abstrakcyjna rozmaitość różniczkowalna i jej przestrzeń stycz-na

W tej chwili możemy już zupełnie „odciąć pępowinę” wiążącą nas z geometrią afinicznąi zapomnieć o wszystkim poza M i jej atlasem. Oczywiście, geometria afiniczna pozwalanam skonstruować atlas dla rozmaitości definiowanych przy pomocy regularnego układurównań i wyobrażać sobie intuicyjnie wektory jako „strzałki” — co prawda wystające zM , ale jednak do niej styczne. Podkreślamy jednak, że do uprawiania geometrii na M teintuicje nie są potrzebne. Można zapomnieć skąd się wziął atlas. Interpretacja wektorastycznego v jako wektora w dużej przestrzeni wektorowej V n, stycznej do dużej przestrzeniAn, też nie jest konieczna. Wystarczy nam jego interpretacja jako operatora różniczkowegopierwszego rzędu, działającego na funkcje określone na M . Zanurzanie M w An było po-żyteczne, bo pozwalało nam konstruować wygodne parametryzacje punktów powierzchniM przy pomocy parametrów (τ i) ∈ Rm. Jeśli jednak już mamy jakąś parametryzację, tomożna zapomnieć skąd się wzięła i stosować ją do reprezentowania wektorów stycznych doprzestrzeni M (tzn. operatorów różniczkowych na M) jako kombinacji liniowych opera-torów (wektorów) postaci ∂

∂τ i, bez konieczności „wychodzenia” poza M i interpretowania

tych wektorów jako „strzałek” w większej przestrzeni An.Możemy zatem myśleć abstrakcyjnie o M jako o rozmaitości różniczkowalnej. Pod tą

nazwą będziemy rozumieli parę (M,A), gdzie M jest zbiorem punktów zaś A jest atlasemzupełnym, tzn. zbiorem lokalnych parametryzacji. Terminem tym oznaczamy odwracalneodwzorowanie typu

Rn ⊃ U ∋ (xk)→ κ(xk) = x ∈ O ⊂M , (86)

dla którego dziedzina U jest zbiorem otwartym. Zupełność altasu A oznacza, że obrazytych parametryzacji pokrywają cały zbiór M : każdy punkt x ∈ M leży w obrazie im(κ)jakiejś parametryzacji κ:

x ∈ im(κ) = O .

Mówimy, że atlas jest klasy C l, jeśli transformacja jednych współrzędnych na drugie:

(κ−1 κ) : Rm → Rm (87)

dla dwóch parametryzacji κ, κ ∈ A z tego atlasu, jest lokalnym dyfeomorfizmem (odwzoro-waniem odwracalnym, różniczkowalnym l-razy w sposób ciągły) wszędzie tam, gdzie obiete parametryzacje są określone.Funkcja gładka klasy Ck(M) na takiej abstrakcyjnej rozmaitości to taka funkcja f , której

każda „konkretyzacja”, to znaczy funkcja „f κ”, zależna od n zmiennych rzeczywistych,jest gładka klasy Ck(Rn) dla dowolnej mapy z atlasu A. Powyższa definicja ma oczywiściesens jedynie dla k ¬ l, bowiem przy zamianie zmiennych z jednej mapy do drugiej funkcja

f κ = (f κ) (κ−1 κ)

i tak nie ma szans na lepszą gładkość niż C l(Rn), skoro transformacja zamiany zmiennych(κ−1 κ) ma jedynie l ciągłych pochodnych.

37

Page 44: Rozn. Geom_ - Jerzy Kijowski

Przestrzeń styczną TxM do rozmaitości M w punkcie x ∈ M definiujemy jako prze-strzeń wszystkich operatorów różniczkowych „zaczepionych” w punkcie x. Jeśli wybierzemydowolną mapę (τ i) w otoczeniu x, to operatory ∂

∂τ istanowią bazę przestrzeni TxM . Oznacza

to, że każdy wektor jest kombinacją powyższych, czyli może być jednoznacznie przedsta-wiony w postaci v = vi ∂

∂τ i. Liczby vi nazywamy składowymi wektora v względem układu

współrzędnych (τ i). Jeśli wybierzemy jakąkolwiek inną parametryzaję (tk), to twierdzenieo różniczkowaniu superpozycji daje nam możliwość przedstawienia starej bazy względemnowej:

∂τ i=∂tk

∂τ i∂

∂tk. (88)

Wynika stąd wzór na zamianę składowych wektora przy przejściu do nowej parametryzacji:

v = vi∂

∂τ i= vi

∂tk

∂τ i∂

∂tk= vk

∂tk(89)

(uwaga na konwencję Einsteina), gdzie przez vk oznaczyliśmy składowe tego samego wek-tora v, ale względem nowej bazy:

vk = vi∂tk

∂τ i. (90)

Zwracamy uwagę, że wektory zaczepione w różnych punktach nie mają ze sobą nicwspólnego. Należą do różnych przestrzeni i np. nie można ich dodawać do siebie.Uwaga: Dla rozmaitości M zanurzonej w przestrzeni afinicznej An, wektory styczne

do M w różnych punktach można byłoby traktować jako elementy dużej przestrzeni wek-torowej V n. Wtedy takie wektory można byłoby na przykład dodawać do siebie. Wyniktakiej operacji nie jest na ogół styczny do M . Z punktu widzenia „wewnętrznej” geometriirozmaitości M , nie odwołującej się do niczego poza nią samą, taka operacja nie ma sensu.Dlatego też wektory zaczepione w różnych punktach będziemy zawsze traktowali jako różneobiekty.Rozmaitość różniczkowa nosi naturalną strukturę topologiczną: ciąg punktów xn ∈

M nazywamy zbieżnym do punktu x0 wtedy i tylko wtedy, gdy zachodzi to w którejśparametryzacji κ:

limn→∞xn = x0

⇐⇒

limn→∞

κ−1(xn) = κ−1(x0). (91)

Można też powiedzieć, że bazą otoczeń topologii w M są otoczenia współrzędnościowe,to znaczy zbiory takie jak zbiór O w definicji mapy (86). Natomiast nie zakładamy naobecnym etapie wykładu żadnej struktury metrycznej: nie umiemy liczyć długości wekto-rów, kątów między nimi czy odległości między punktami. Możemy sobie wyobrażać taką„gołą” (to znaczy odartą ze wszystkich dodatkowych struktur) rozmaitość jak gumowąpowierzchnię nadmuchiwanego balonika. Gdy nadmuchać go mocniej, czy też ścisnąć wpewnym miejscu, przez co w innym się rozszerzy, to nic się nie zmieni i będzie to wciążta sama powierzchnia: zbiór punktów, plus możliwość odróżniania rzeczy gładkich od kan-ciastych (nieróżniczkowalnych) czy nawet nieciągłych. Struktury pozwalające opisywać jejrozmiary i kształt będziemy studiowali w dalszej części niniejszego wykładu.

38

Page 45: Rozn. Geom_ - Jerzy Kijowski

Geometria, jakiej uczyliśmy się w szkole, kojarzy się nam z użyciem cyrkla i ekierki.Cyrkiel służy do porównywania długości wektorów, a ekierka do ich przenoszenia rów-noległego z punktu do punktu. Tymczasem w kilku najbliższych Rozdziałach całkowiciewyeliminujemy z naszych rozważań oba te popularne narzędzia. Takie „ogołocenie” geome-trii ze struktury metrycznej (długość) czy afinicznej (przesunięcie równoległe) jest bardzopłodne intelektualnie i pozwala głębiej zrozumieć relacje między fundamentalnymi obiek-tami geometrycznymi maskowane często właśnie obecnością tamtych struktur. A cyrkiel iekierka pojawią się w naszym wykładzie w odpowiednim czasie.

2.11 Wiązka styczna do rozmaitości

Będziemy natomiast rozważać kolekcję wszystkich wektorów stycznych do rozmaitości, toznaczy rozłączną sumę wszystkich przestrzeni stycznych:

TM :=⋃

x∈MTxM . (92)

Taki zbiór nazywa się „wiązką styczną” doM . Ogólne pojęcie „wiązki” wyjaśnimy później.Na razie powiedzmy tylko, że ma to związek z faktem, że jest ona właśnie sumą oddzielnychprzestrzeni TxM , które nazywają się „włóknami” tej wiązki.Wiązka styczna TM jest sama rozmaitością różniczkowalną wymiaru 2n i klasy C l−1,

jeśli M była wymiaru n i klasy C l. Aby nadać sens temu stwierdzeniu musimy podaćkonkretny atlas AT dla TM . Atlas ten skonstruujemy w naturalny sposób z atlasu A roz-maitości M . Wektor v ∈ TxM będziemy mianowicie parametryzowali za pomocą zestawu(xk, vl), gdzie (xk) są współrzędnymi punktu zaczepienia x ∈ M zaś (vl) są składowymiwektora w bazie

(∂∂xk

). Konstrukcję tę można formalnie zapisać w następujący sposób:

dla każdej parametryzacji (86) na M zdefiniujemy parametryzację na TM następującymwzorem

R2n ⊃ U × Rn ∋ (xk, vl)→ κT (xk, vl) = vx := vk∂

∂xk∈ OT =

x∈OTxM ⊂ TM . (93)

Wymiar 2n jest oczywisty: pierwsze n współrzędnych parametryzuje punkt zaczepienia,zaś pozostałe n wyróżnia konkretny wektor w przestrzeni stycznej TxM . Ponieważ wzorytransformacyjne na składowe wektora przy przejściu do innej mapy zawierają już pierw-sze pochodne funkcji przejścia dla samych współrzędnych, prawa transformacyjne w takskonstruowanym atlasie AT są jeden raz mniej różniczkowalne niż oryginalne prawa trans-formacyjne w oryginalnym atlasie A. Stąd właśnie wynika klasa C l−1 wiązki stycznej.Wiązka styczna jest wyposażona a priori w odwzorowanie:

τ : TM → M , (94)

które każdemu wektorowi v ∈ TM przypisuje ten punkt x = τ(v) ∈ M rozmaitości, wktórym wektor jest zaczepiony: v ∈ TxM ⊂ TM . Odwzorowanie to będziemy nazywali„kanonicznym rzutem TM na M”.

39

Page 46: Rozn. Geom_ - Jerzy Kijowski

W układzie współrzędnych (93) rzut kanoniczny polega zatem na „zapominaniu” owartości współrzędnych (vl) wektora:

TM ∋ (xk, vl)→ (xk) ∈M , (95)

co dowodzi, że jest on odwzorowaniem gładkim (i to maksymalnej klasy gładkości). Dlakażdego punktu x ∈M jego „przeciwobraz” to znaczy zbiór punktów, które rzutują się nax, jest równy przestrzeni stycznej do rozmaitości w tym właśnie punkcie:

τ−1(x) = TxM . (96)

Zauważmy ponadto, że w układzie współrzędnych (93) przestrzenie styczne w różnychpunktach wyglądają jak gdyby były identyczne, bowiem zostają utożsamione z przestrzeniąliczbową Rn, w której leżą składowe (vl) ich wektorów. Jak wiemy, utożsamienie to niema żadnego znaczenia geometrycznego: dwa wektory zaczepione w różnych punktach alemające identyczne składowe (vl) w jednym układzie współrzędnych, w innym układziewspółrzędnych będą na ogół miały już inne składowe. Jest to kolejne przypomnienie faktu,że obiekty geometryczne zaczepione w różnych punktach nie mogą być porównywane , wszaknależą do innych światów! Jednak możliwość takiego utożsamienia prowadzi do konstrukcjitzw. lokalnych trywializacji wiązki. Wyjaśnimy dokładniej to pojęcie: Jeśli O ⊂ M jestdziedziną układu współrzędnych (xk), to mamy jedno-jednoznaczne odwzorowanie:

O × Rn ⊃ (x, vl)→ vx := vk∂

∂xk(x) ∈ τ−1(O) ⊂ TM . (97)

Oznacza to, że τ−1(O) ⊂ TM jest izomorficzny z iloczynem kartezjańskim swojego rzutuO na M oraz „typowego włókna” Rn. Jednak na ogół konstrukcja ta nie daje się przepro-wadzić globalnie, to znaczy tak, by zbiór O można było zastąpić całą przestrzenią M i,odpowiednio, zbiór τ−1(O) — całą przestrzenią TMMożna zatem podsumować strukturę wiązki stycznej TM w następujący sposób: jest

to czwórka (TM, τ,M,H), gdzie H jest przestrzenią wektorową, pierwszy i trzeci składniksą rozmaitościami różniczkowalnymi, τ jest gładkim odwzorowaniem z TM w M takim,że każdy punkt tej ostatniej ma otoczenie O ⊂ M takie, że τ−1(O) jest izomorficzne ziloczynem kartezjańskimO×H . Pod nazwą „izomorfizm” rozumiemy tu jedno-jednoznacze,gładkie odwzorowanie

µ : O ×H 7→ τ−1(O) ⊂ TM , (98)

i takie, żeH ∋ h→ µ(x,h) ∈ TxM (99)

jest izomorfizmem przestrzeni wektorowych. W przypadku wiązki stycznej włóknem typo-wym jest przestrzeń liczbowa Rn.Odwzorowanie o powyższych własnościach nazywa się „lokalną trywializacją”, prze-

strzeń M nazywa się „bazą wiązki”, zaś przestrzeń H — „włóknem typowym”.

40

Page 47: Rozn. Geom_ - Jerzy Kijowski

2.12 Odwzorowania między rozmaitościami różniczkowalnymi. Od-wzorowanie styczne

Definiując w rozdziale 2.10 pojęcie funkcji różniczkowalnej na abstrakcyjnej rozmaitościróżniczkowalnej M przyjęliśmy zasadę heurystyczną, że „różniczkowalne na M jest to, cojest różniczkowalne w układzie współrzędnych”. A zatem: funkcja f na M jest różniczko-walna jeśli jej konkretyzacja f κ jest różniczkowalna na Rn. Zasadę tę stosujemy równieżdo odwzorowań między rozmaitościami. Niech więc będą dane dwie rozmaitości różniczko-walne M i N oraz odwzorowanie

M ⊃ O ∋ x→ F (x) ∈ N . (100)

Konkretyzacja tego odwzorowania to odwzorowanie λ−1 F κ, gdzie κ jest lokalną pa-rametryzacją na M zaś λ — lokalną parametryzacją na N . We współrzędnych: (xi) na Moraz (yj) na N , generowanych przez te mapy otrzymujemy:

Rm ⊃ W ∋ (xi)→ λ−1(F (κ(xi))) = F j(xi) ∈ Rn , (101)

gdzie m jest wymiarem M , zaś n jest wymiarem N . Tak więc konkretyzacja odwzorowaniaF wyraża się przez n funkcji F j zależnych od m zmiennych rzeczywistych (xi). Funkcje teokreślają wartość współrzędnych (yj) punktu F (x) ∈ N gdy znamy wartość współrzędnychpunktu x ∈M :

yi = F j(xi) . (102)

Zamieniając κ i λ na inne parametryzacje: κ i λ otrzymamy inną konkretyzację: (F j),powstałą przez superpozycję poprzedniej z operacjami transformacji współrzędnych: κ−1κna M oraz λ−1 λ na N , zgodnie z wzorem:

(F j) = λ−1 F κ =(λ−1 λ

)(λ−1 F κ

)(κ−1 κ

)

=(λ−1 λ

)(F j)(κ−1 κ

).

Zatem różniczkowalność Ck funkcji F j nie zależy od wyboru mapy pod warunkiem, żenie przekraczamy progu C l, (tzn. gdy zachodzi k ¬ l), powyżej którego transformacjewspółrzędnych już mogą być niedostatecznie gładkie.W szczególności ważnym przypadkiem odwzorowań rozmaitości są odwzorowania od-

wracalne i takie, że obrazem jest cała rozmaitość. Wtedy z twierdzenia o pochodnej od-wzorowania odwrotnego wynika, iż F−1 jest również klasy C l, jeśli F było tej klasy. Takieodwzorowania nazywamy diffeomorfizmami klasy C l. Dwie rozmaitości, które możnapołączyć diffeomorfizmem nazywamy diffeomorficznymi. Z punktu widzenia strukturyróżniczkowalnej są one nierozróżnialne.Odwzorowanie F :M → N przenosi w sposób naturalny funkcje z N doM . I rzeczywi-

ście: jeśli f jest funkcją określoną lokalnie na otoczeniu punktu y = F (x) ∈ N , to f F jestfunkcją określoną na otoczeniu punktu x ∈M . Takie „przeniesienie” lub „transport” okre-śla się również angielskim określeniem „pull back”, co dodatkowo precyzuje kierunek tego

41

Page 48: Rozn. Geom_ - Jerzy Kijowski

transportu, odwrotny do kierunku działania odwzorowania F . Będziemy stosowali równieżoznaczenie F ∗f . W dalszym ciągu okaże się, że jest to przykład bardzo szerokiej klasynaturalnych odwzorowań różnych obiektów geometrycznych, które też będziemy określalijako „pull back” i oznaczali gwiazdką u góry.Transport funkcji „do tyłu” generuje natychmiast transport wektorów stycznych „do

przodu”. I rzeczywiście: wektor styczny v ∈ TxM definiuje jednoznacznie wektor F∗vstyczny do N w punkcie F (x) ∈ N następującym wzorem

(F∗v) (f) := v (F ∗f) . (103)

Mówiąc językiem potocznym: aby zróżniczkować funkcję f względem wektora powstałegoz v przez przeniesienie go do przodu, trzeba wpierw przenieść tę funkcję do tyłu i zróż-niczkować ją względem wyjściowego wektora. Taki transport określa się często angielskimterminem „push forward”.W dalszym ciągu poznamy wiele innych obiektów geometrycznych. Niektóre z nich

transportują się w sposób naturalny do przodu, inne do tyłu. Powstała jeszcze w XIX wie-ku terminologia nazywa te pierwsze „kontrawariantnymi” a drugie : „kowariantnymi”. Jeśliodnosić tę terminologię do kierunku pierwszej, najważniejszej strzałki w (104), pokazującejw którą stronę działa odwzorowanie F , to terminologia ta wydaje się nienaturalna: przecież„kowariantny” to powinien być „współzmienniczy”, a tymczasem „kontra” to „przeciw”.Ale terminologia ta powstawała w odniesieniu do zupełnie innej heurystyki (chodziło oprawa transformacyjne obiektów przy zmianie układu współrzędnych) i . . . tak już zosta-ło. A zatem zapamiętajmy: obiekty „kontrawariantne” to takie, które transportują się doprzodu, zaś „kowariantne” — do tyłu. Wobec tego funkcja na rozmaitości jest obiektemkowariantnym, a wektor — kontrawariantnym. Mamy więc następujący wykres:

MF−→ N , (104)

Ck(M) F∗

←− Ck(N) , (105)

TxMF∗−→ TF (x)N . (106)

Definicja (103) implikuje następującą konkretyzację odwzorowania transportu we współ-rzędnych (xi) na M oraz (yj) na N :

(F∗

∂xi

)(f) =

∂xif(F ) =

∂F j

∂xi∂

∂yjf , (107)

a zatem

F∗

(∂

∂xi

)=∂F j

∂xi∂

∂yj. (108)

Tę „grzeczną” wersję formuły warto uzupełnić wersją „niegrzeczną”, czy „niepoprawną”polegającą na zastąpieniu funkcji F j przez współrzędną yj, zgodnie z równaniem yj =F j(xi), patrz (102). Wtedy powyższa formuła wygląda następująco:

F∗

(∂

∂xi

)=∂yj

∂xi∂

∂yj. (109)

42

Page 49: Rozn. Geom_ - Jerzy Kijowski

Ten — dla wielu purystów językowych całkowicie błędny — zapis ma ogromną zaletę:znakomicie skraca rachunki i każdy, kto używa języka geometrii różniczkowej w naukachstosowanych prędzej czy później doń się przekona. Zamierzam powoli przyzwyczajać czy-telnika niniejszej książki do tego języka.Jeśli zatem wektor v ma współrzędne vi:

v = vi∂

∂xi, (110)

to jego obraz ma współrzędne ∂Fj

∂xivi = ∂y

j

∂xivi we współrzędnych (yj), bowiem zachodzi

F∗ (v) =(∂F j

∂xivi)

∂yj=

(∂yj

∂xivi)

∂yj. (111)

W analizie matematycznej, gdy współrzędne reprezentują punkty przestrzeni liczbowej Rn anie abstrakcyjnej rozmaitościM , odwzorowanie F∗ reprezentuje po prostu pochodną odwzo-rowania F . Używa się też niekiedy terminu „odwzorowanie styczne”. Obu tych terminówmożna też używać w ogólnym kontekście abstrakcyjnych rozmaitości różniczkowalnych.Uwaga: Jeśli jako F wziąć odwzorowanie tożsamościowe (identycznościowe) „id” dane

wzorem:M ∋ x→ id(x) = x ∈M ,

to nic nie stoi na przeszkodzie, by rozważać dwa różne układy współrzędnych na M : układ(xi) na dziedzinie odwzorowania id oraz układ (yj) naM jako obrazie tegoż odwzorowania.Wtedy wzór (102) opisuje zależność nowych zmiennych od starych. Oczywiście transportid∗ („pull back”) funkcji też jest odwzorowaniem tożsamościowym:

id∗f = f id = f .

Wobec tego „push forward”wektorów jest tu również tożsamością:

id∗ (v) = v .

W tym przypadku wzór (111) pokrywa się zatem z (89) bowiem jest niczym innym niż for-mułą na transformację współrzędnych ustalonego wektora v przy zamianie układu współ-rzędnych na rozmaitości:

vi∂

∂xi= v = id∗ (v) =

(∂F j

∂xivi)

∂yj. (112)

2.13 Krzywe sparametryzowane. Wektor styczny do krzywej

Ważnym przykładem odwzorowań między rozmaitościami jest krzywa sparametryzowana,to znaczy odwzorowanie osi rzeczywistej, lub jakiegoś jej odcinka w daną rozmaitość róż-niczkowalną:

R ⊃]a, b[∋ t→ γ(t) ∈M . (113)

43

Page 50: Rozn. Geom_ - Jerzy Kijowski

Oś rzeczywista jest również rozmaitością różniczkowalną. Jednak jej struktura jest dużobogatsza: wśród różnych wektorów stycznych wyróżniony jest jeden szczególny, odpowia-dający liczbie „e = +1”, zwany również „wektorem jednostkowym”. Odpowiada on opera-torowi różniczkowania po naturalnej współrzędnej t na R:

e :=∂

∂t.

I właśnie jego obraz przy odwzorowaniu stycznym do γ nazywamy wektorem stycznym donaszej krzywej sparametryzowanej.Jeśli (xi) jest układem współrzędnych na M , to krzywa γ reprezentuje się układem n

funkcji zależnych od zmiennej t:γ(t) =

(xk(t)

), (114)

a na mocy formuły (111) współrzędne wektora stycznego są równe pochodnym tych funkcji:

γ∗∂

∂t=

(∂xi

∂t

)∂

∂xi= xi

∂xi.

Wprowadziliśmy tutaj oznaczenie, które bardzo się przydaje w zastosowaniach. Mianowiciepochodną — niby cząstkową, ale liczoną przecież względem jedynej zmiennej niezależnejt — oznaczamy kropką. Tak więc współrzędne wektora stycznego do krzywej sparametry-zowanej są równe pochodnym współrzędnych samego „bieżącego” punktu krzywej. Jeślimyśleć o parametrze t jako o czasie, to wektor styczny do krzywej odgrywa rolę wekto-ra prędkości. I stąd właśnie bierze się pomysł, żeby nawet abstrakcyjnie, nie mając namyśli żadnego konkretnego układu współrzędnych, wektor styczny do krzywej γ oznaczaćsymbolem γ:

γ = xi∂

∂xi. (115)

Uwaga: Gdy krzywa będzie wynikiem skomplikowanej superpozycji odwzorowań, nadktórą trudno postawić kropkę, wtedy będziemy wymiennie stosować oznaczenie pochodnejzwyczajnej:

γ(t) =ddτ

∣∣∣∣∣τ=t

γ(τ) . (116)

Wektor prędkości liczony w układzie współrzędnych (xi) ma zatem składowe równe(xi). Na przykład w układzie współrzędnych sferycznych (r, θ, ϕ), związanym ze współ-rzędnymi kartezjańskimi wzorem (2), prędkość jest wektorem o składowych (r, θ, ϕ). Tabanalna konstatacja nie byłaby zapewne godna wzmianki, gdyby nie fakt, że na wielu sza-cownych Wydziałach Politechnik i Uniwersytetów zmuszają do używania przedpotopowe-go, niezwykle utrudniającego życie formalizmu, w którym składowe tej prędkości wynoszą(r, rθ, rϕ sin θ). I jeszcze potem mają pretensję, że studenci nie nauczyli się na pamięćodpowiednich formułek . . .Ćwiczenie: Używając kartezjańskich i sferycznych współrzędnych mamy dwa równo-

ważne opisy wektora stycznego do krzywej:

v = x∂

∂x+ y

∂y+ z

∂z= r

∂r+ θ

∂θ+ ϕ

∂ϕ. (117)

44

Page 51: Rozn. Geom_ - Jerzy Kijowski

Związek między jednymi a drugimi składowymi można otrzymać różniczkując bezpośredniowzory (2):

x = r sin θ cosϕ+ rθ cos θ cosϕ− rϕ sin θ sinϕ , (118)

y = r sin θ sinϕ+ rθ cos θ sinϕ+ rϕ sin θ cosϕ , (119)

z = r cos θ − rθ sin θ . (120)

Tę samą relację możemy również otrzymać postępując odwrotnie: korzystając z wzorów(32) – (34) możemy wyrazić wektory ∂

∂r, ∂∂θoraz ∂

∂ϕ, w języku bazy ortonormalnej ∂

∂x, ∂∂y

oraz ∂∂z. Podstawiając te wyrażenia do prawej strony wzoru (117) i zbierając współczynniki

przy wektorach tej ostatniej otrzymamy wartość składowych (x, y, z) w funkcji składowych(r, θ, ϕ). Zachęcamy Czytelnika do wykonania tego ćwiczenia w celu przekonania się, iż wten sposób otrzymamy te same relacje (118) – (120).Przykład: Jako przykład krzywej sparametryzowanej rozważmy „linię k-tej współ-

rzędnej”. W ustalonym układzie współrzędnych (xk) na M wyraża się ona następującymwzorem:

t→ γ(t) := κ(x1, . . . , xk−1, xk + t, xk+1, . . . , xn) ∈M (121)

(ustalamy wszystkie współrzędne z wyjątkiem k-tej, której wartość zmieniamy o t). Wektorstyczny do tej krzywej to po prostu k-ty wektor bazy TxM związanej z tym układemwspółrzędnych, bowiem mamy:

γ(f) =∂

∂t(f γ)(x1, . . . , xk−1, xk + t, xk+1, . . . , xn) = ∂

∂xkf ,

a zatem

γ =∂

∂xk. (122)

Otrzymaliśmy w ten sposób interpretację wektora ∂∂xkjako wektora stycznego do linii k-tej

współrzędnej.Wniosek: Dla każdego wektora v ∈ TxM istnieje krzywa sparametryzowana, której

wektor styczny w punkcie x jest równy v.Dowód:Wybierzmy jakikolwiek układ współrzędnych (xk) w otoczeniu punktu x. Jeśli

współrzędne wektora v są równe (vk), zaś współrzędne punktu x są równe (xk0), to krzywadana w tym układzie następującym wzorem:

γ(t) := κ(xk0 + tvk)

ma żądany wektor styczny:

γ = vk∂

∂xk= v .

Oczywiście takich linii jest wiele: zależność proporcjonalna współrzędnych punktu na-szej krzywej od czasu nie jest żadną własnością geometryczną i zależy od wyboru układu

45

Page 52: Rozn. Geom_ - Jerzy Kijowski

współrzędnych. Jednak fakt, że dwie krzywe γ oraz λ startujące w chwili zero z tego sa-mego punktu: γ(0) = x = λ(0), mają ten sam wektor styczny w tym punkcie nie zależy odukładu współrzędnych: po postu ich opisy współrzędniowe są wzajemnie styczne w t = 0:

ddt

∣∣∣∣∣t=0

(κ−1 γ

)=ddt

∣∣∣∣∣t=0

(λ−1 γ

), (123)

dla dowolnej parametryzacji κ w otoczeniu punktu x. Jeśli ten warunek jest spełnionyw jednej mapie, to jest oczywiście spełniony w dowolnej innej. Spełnienie tego warunkustanowi relację równoważności w zbiorze krzywych sparametryzowanych, startujących zdanego punktu.Jedna z definicji wektora stycznego do rozmaitości wychodzi właśnie z powyższej obser-

wacji i określa wektor jako klasę równoważności krzywych, rozumianą w sensie powyższejrelacji. W naszym wykładzie będziemy jednak stosowali dużo prostszą i wygodniejszą ob-liczeniowo definicję w języku operatorów różniczkowych.

2.14 Superpozycja odwzorowań transportu. Inna definicja od-wzorowania stycznego

Jeśli mamy trzy rozmaitości różniczkowalne: M , N i P , oraz dwa odwzorowania międzykolejnymi parami:

F : M → N ,

G : N → P ,

to ich złożenie G F jest odwzorowaniem z M do P :

G F :M → P .

Mamy zatem następujący diagram:

MF−→ N

G−→ P

Ck(M) F ∗←− Ck(N) G∗←− Ck(P )TxM

F∗−→ TF (x)NG∗−→ TGF (x)P

Okazuje się, że odpowiadające im odwzorowania transportu też są odpowiednimi złożenia-mi:Twierdzenie: Zachodzą następujące tożsamości:

1. (G F )∗ = F ∗ G∗

2. (G F )∗ = G∗ F∗

Dowód:

46

Page 53: Rozn. Geom_ - Jerzy Kijowski

1. (G F )∗(f) = f(G F ) = (f G)(F ) = F ∗(f G) = F ∗ G∗(f).

2. ((G F )∗v) (f) = v(G F )∗(f) = v(f G) F = (F∗v) (f G) = (G∗ F ∗(v)) (f)

Jeśli γ jest krzywą sparametryzowaną w M , to F γ jest krzywą sparametryzowanąw N . Z powyższego twierdzenia wynika, że wektor styczny do tej krzywej jest obrazemwektora stycznego do γ przy odwzorowaniu stycznym F∗:

(F γ) = F∗γ .

A zatem odwzorowanie styczne przyporządkowuje wektorom stycznym do krzywych spa-rametryzowanych w M wektory styczne do ich obrazów w N . Ponieważ każdy wektormożna reprezentować jako klasę (wzajemnie stycznych) krzywych (patrz Wniosek na koń-cu paragrafu 2.13) zatem powyższa obserwacja może służyć jako równoważna definicjaodwzorowania stycznego.

2.15 Podrozmaitości

Przypuśćmy, że podzbiór M ⊂ N rozmaitości różniczkowalnej N sam jest rozmaitością(tzn. ma własny atlas). „Zanurzeniem”M w N nazywamy odwzorowanie identycznościowe„id” przyporządkowujące każdemu punktowi x ∈ M ten sam punkt, ale już traktowanyjako punkt w N :

M ∋ x→ id(x) = x ∈ N . (124)

Definicja 1: Jeśli zanurzenie jest gładkie klasy C l oraz takie, że jego pochodna id∗ maw każdym punkcie trywialne jądro, tzn. gdy id∗(v) 6= 0 dla (v) 6= 0, to wtedyM nazywamypodrozmaitością rozmaitości N .Twierdzenie: Jeśli M ⊂ N jest podrozmaitością różniczkowalną wymiaru (n − r)

rozmaitości N wymiaru n, to każdy punkt x ∈ M posiada otoczenie O ⊂ N , które jestotwarte w N , a w nim układ współrzędnych (xi, ζj):

Rm+r ⊃ W ∋ (xi, ζj)→ κ(xi, ζj) ∈ O ⊂ An

(gdzie i = 1, . . . , m, oraz j = 1, . . . , r) dostosowany do M w sensie Twierdzenia 2, toznaczy:

M ∩O =κ(xi, ζj)

∣∣∣ ζj = 0 ; j = 1, . . . , r. (125)

Dowód tego Twierdzenia jest dobrą ilustracją tezy przedstawionej we Wstępie: geo-metria różniczkowa to umiejętność mądrego posługiwania się krzywoliniowymi układamiwspółrzędnych. I rzeczywiście: gdy wybierzemy w otoczeniu punktu x jakikolwiek układwspółrzędnych (ξk), k = 1, . . . , n; parametryzujący punkty „grubej” rozmaitości N :

RN ∋ (ξk)→ ω(ξk) ∈ N ,

to możemy utożsamiać punkty rozmaitości M odpowiadającym im punktom w przestrzeni(wektorowej, a więc również afinicznej) RN . Wtedy można zapomnieć, iż cała „akcja”

47

Page 54: Rozn. Geom_ - Jerzy Kijowski

naszego Twierdzenia toczy się w rozmaitości różniczkowalnej a nie w przestrzeni An, jak tobyło w Twierdzeniu z rozdziału 2.9. Po takim utożsamieniu możemy po prostu zastosowaćtamten dowód. Oznacza to, że na przykład dodawanie wektorów we wzorze (73) rozumie sięjako dodawanie odpowiednich wartości współrzędnych. W ten sposób cały dowód pozostajew mocy.

Uwaga: Zmienne ζj spełniają oczywiście warunek niezależności, który nakładaliśmyw Rozdziale 2.9 na funkcje Gj . Nasze Twierdzenie oznacza zatem, że lokalnie każda pod-rozmaitość M ⊂ N wygląda jak miejsce geometryczne rozwiązań układu równań (63) (jakprzekonamy się w dalszym ciągu, nie jest to zazwyczaj prawdziwe globalnie!). Ta wła-sność zbioru M może być przyjęta jako definicja podrozmaitości. Jest ona tak ważna, żewypiszemy ją jeszcze raz explicite.Definicja 2: Podzbiór M ⊂ N rozmaitości różniczkowalnej N wymiaru n nazywamy

podrozmaitością różniczkowalną wymiaru k, klasy C l, jeśli każdy punkt x ∈ M posiadaotoczenie O ⊂ N , które jest otwarte w N , a w nim układ funkcji Gi, i = 1, . . . , r = n− k;taki że M ∩ O jest miejscem geometrycznym rozwiązań układu regularnego

G1(x) = 0...Gr(x) = 0

(126)

w sensie definicji z rozdziału 2.8.Aby przekonać się o równoważności obu definicji należy pokazać, że M jest rozma-

itością, to znaczy skonstruować atlas na M . W tym celu znów stosujemy rozumowanie zRozdziału 2.9, pozwalajace przejść od formy uwikłanej do formy parametycznej. Fakt, żetam wszystko odbywało się w przestrzeni afinicznej, a tutaj w abstrakcyjnej rozmaitościróżniczkowalnej nie ma istotnego znaczenia, skoro możemy używać lokalnych map na N iw ten sposób utożsamić otoczenie punktu x ∈ M ⊂ N ze zbiorem otwartym przestrzeniafinicznej Rn. To znów argument na poparcie tezy iż geometria różniczkowa to umiejęt-ność mądrego posługiwania się krzywoliniowymi układami współrzędnych. Rzeczywiście:ponieważ lokalnie rozmaitość różniczkowalna N jest nieodróżnialna od zbioru otwartego wprzestrzeni afinicznej, wszystkie dowody analityczne dotyczące lokalnej struktury możnaprowadzić tak, jak gdyby chodziło o własności obiektów żyjących w przestrzeni afinicznej.Przykład: Podrozmaitość M wymiaru 1 nazywa się również krzywą. Aby odróżnić to

pojęcie od pojęcia krzywej sparametryzowanej, będziemy niekiedy używali pojęcia „krzywejniesparametryzowanej”. Jeśli na takiej podrozmaitości wybrać „układ współrzędnych”, toznaczy jedną współrzędną (parametr) t, to otrzymamy krzywą sparametryzowaną γ, któ-rej obrazem będzie M . Operacja odwrotna, polegająca na „zapomnieniu” o konkretnejparametryzacji nie zawsze da nam rozmaitość. Przykładem może być np. lemniskata Ber-noulliego opisana w Rozdziale 2.8 i zilustrowana na rys. 8. Gdy tę „ósemkę” obiegać wczasie t ze stałą szybkością, to otrzymamy doskonały przykład krzywej sparametryzowa-nej. Wiemy jednak, że lemniskata nie jest rozmaitością, bowiem w punkcie samoprzecięciajej przestrzeń styczna nie jest dobrze określona. Krzywa sparametryzowana może również

48

Page 55: Rozn. Geom_ - Jerzy Kijowski

1

2

–1 1–2 2 3–3 4–4

x

Rysunek 9: Obraz gładkiej krzywej sparametryzowanej nie musi być gładki.

zawierać inne „patologie”, jak „dzióbki”, kolejne przebiegi tego samego odcinka w różnychkierunkach itp., które są wykluczone przez definicję podrozmaitości.Przykład: Rozpatrzmy krzywą sparametryzowaną na płaszczyźnie R2, daną równa-

niami:

x(t) := (sgn t)e−1|t| =

−e−1|t| dla t < 0 ,

e−1|t| dla t > 0 ,0 dla t = 0 ,

y(t) :=

e−

12|t| dla t 6= 0 ,0 dla t = 0 .

Mimo całej tej „składanki”, mimo zastosowania funkcji „moduł”, która nie jest gładka, tozarówno x(t) jak i y(t) są gładkie i to klasy C∞. Wynika to z faktu, że funkcja f(t) = e−

1|t|

dąży do zera w zerze wraz ze wszystkimi pochodnymi. I rzeczywiście: dowolna pochodna tejfunkcji ma postać wielomianu od wyrażenia 1|t| pomnożonego przez samą funkcję f . Jeślinawet ten wielomian rośnie w pobliżu zera do nieskończoności, to funkcja f dąży do zeraszybciej jako funkcja wykładnicza. A zatem

R ∋ t→ γ(t) = (x(t), y(t)) ∈ R2

jest krzywą (sparametryzowaną!) klasy C∞. Tymczasem jej obraz spełnia równanie

y =√|x| ,

przy czym zmienna „x” przebiega cały odcinek ]− 1, 1[⊂ R1. Nie jest to zatem podrozma-itość różniczkowalna płaszczyzny R2 (zob. Rysunek 9).

2.16 Własności globalne a własności lokalne

Rozmaitość różniczkowalna wygląda lokalnie jak kawałek przestrzeni liczbowej Rn. Uży-wając lokalnego układu współrzędnych wszystkie jej lokalne własności można wyrazić wjęzyku funkcji wielu zmiennych oraz operacji na nich. W tradycyjnych wykładach geometrii

49

Page 56: Rozn. Geom_ - Jerzy Kijowski

różniczkowej zwykło się definiować rozmaite struktury geometryczne przy pomocy ukła-dów współrzędnych, a następnie wykazywać, że dana definicja jest poprawna, to znaczy niezależy od wyboru układu współrzędnych.W niniejszym wykładzie przyjmujemy strategię odwrotną: wszystkie struktury będą

wprowadzane bez użycia układu współrzędnych. Jednak nie lekceważymy faktu, że przyopisie lokalnych struktur geometrycznych najczęściej posługujemy się twierdzeniami ana-lizy matematycznej, dotyczącymi odwzorowań z Rn w Rm, a zatem wymagającymi opisuwspółrzędniowego.Ważnym aspektem geometrii są natomiast globalne własności rozmaitości, których opis

wykracza poza zwykłą analizę współrzędniową. Wiąże się to z faktem, że ważne (równieżw zastosowaniach) rozmaitości różniczkowalne nie dopuszczają na ogół globalnego układuwspółrzędnych. Przykładem jest poznana już sfera S2: układ współrzędnych sferycznychjest bardzo wygodny do wielu obliczeń ale, jak już wiemy, nie można posługiwać się nimw otoczeniu „linii zmiany daty”. Zgodnie z Twierdzeniem 2, lokalne mapy można równieżuzyskać poprzez rzut na płaszczyznę styczną do sfery. Atlas złożony z takich map musiskładać się co najmniej z czterech map. Inną, ważną parametryzację sfery otrzymuje sięprzy pomocy tzw. rzutu stereograficznego

R2 ∋ (ξ, η)→ κ(ξ, η) = (x, y, z) ∈ R3 (127)

wyrażonego następującymi wzorami:

x =ξ

1 + ξ2+η2

4R2

,

y =η

1 + ξ2+η2

4R2

, (128)

z = R1− ξ2+η2

4R2

1 + ξ2+η2

4R2

.

Łatwo sprawdzić, że dla dowolnego punktu (ξ, η) ∈ R2 zachodzi:

x2 + y2 + z2 = R2 , (129)

zatem obraz tego punktu leży rzeczywiście na sferze o środku w zerze i o promieniu rów-nym R, przy czym punkty północnej półkuli otrzymuje się jako obrazy wnętrza koła ojednostkowym promieniu na płaszczyźnie (ξ, η), zaś punkty półkuli południowej jako ob-razy zewnętrza tego koła (zob. Rysunek 10).Odwzorowanie odwrotne polega na przyporządkowaniu punktom sfery różnym od bie-

guna południowego: (x, y, z) 6= (0, 0,−R), ich projekcji — wychodzącej właśnie z biegunapołudniowego — na płaszczyznę styczną do bieguna północnego, tzn. płaszczyznę (ξ, η, R).Jak widać z rysunku, zachodzi proporcja:

ξ

2R=

x

R + z,

η

2R=

y

R + z.

50

Page 57: Rozn. Geom_ - Jerzy Kijowski

(x1, y1, z1)

(x2, y2, z2)

(ξ1, η1)

(ξ2, η2)

Rysunek 10: Rzut stereograficzny sfery na płaszczyznę równikową.

Transformacja (128) wynika właśnie z rozwiązania powyższych równań ze względu nawspółrzędne (x, y) z uwzględnieniem równania definicyjnego sfery (129).Aby pokryć również otoczenie bieguna południowego, nie uwzględnionego w parame-

tryzacji (128), możemy po prostu zamienić rolami oba bieguny, to znaczy zamienić „z”na „−z” w powyższych proporcjach. Obie mapy stanowią atlas, który porywa już całąsferę. Warto sprawdzić, że przejście od jednego do drugiego układu współrzędnych jestodwzorowaniem klasy C∞, danym wzorem:

ξ =ξ

ξ2 + η2, η =

η

ξ2 + η2. (130)

Zobaczymy w dalszym ciągu niniejszego wykładu, że warto zmienić znak współrzędnej η wdrugiej mapie. Dzięki temu można połączyć obie zmienne rzeczywiste w jedną zespoloną:

ζ = ξ + iη , ζ = ξ + i η ,

i wtedy zamiast wzorów (130) na transformację współrzędnych uzyskujemy postać funkcjianalitycznej zmiennej zespolonej:

ζ =1ζ. (131)

Z punktu widzenia omawianych obecnie struktur oba atlasy są równie dobre. Jednak, jaksię przekonamy w dalszym ciągu, drugi z nich niesie na sobie orientację sfery, co będziemiało zasadnicze znaczenie dla dalszych konstrukcji.Innym, ważnym przykładem rozmaitości różniczkowalnej o nietrywialnych własnościach

globalnych jest tzw. wstęga Mobiusa . Powstaje ona przez sklejenie z półobrotem dwóchkońców wstążki, a konkretnie:Przykład: Weźmy wstążkę o długości nieco większej niż 2π i szerokości równej 2:

W := (ϕ, λ) ∈ R2| − π − ε < ϕ < π + ε ; −1 < λ < 1 .

Sklejamy jej wystające dłuższe końce, obracając przedtem jeden z nich w stosunku dodrugiego o pół obrotu pełnego. Oznacza to, że dokonujemy następującego utożsamienia:

(ϕ1, λ1) ∼ (ϕ2, λ2) ⇐⇒ |ϕ2 − ϕ1| = 2π ; λ2 = −λ2 .

51

Page 58: Rozn. Geom_ - Jerzy Kijowski

Utożsamienie to, uzupełnione relacją trywialną, definiuje relację równoważności, którą rów-nież oznaczmy symbolem „∼”. Wstęga Mobiusa, to wynik tego utożsamienia:

M :=W ∼ .

Klasę elementu (ϕ, λ) ∈ W będziemy jak zazwyczaj oznaczali przez [(ϕ, λ)] ∈ M. Za-uważmy, że dla ϕ ∈ [−π + ε, π − ε] klasa ta składa się z jednego tylko elementu, który niezostał sklejony z niczym innym. Natomiast wszystkie pozostałe elementy wstęgi Mobiusaskładają się z par sklejonych elementów:

[(ϕ, λ)] = (ϕ, λ), (ϕ+ 2π,−λ) ,

gdzie −π − ε < ϕ < −π + ε oraz −1 < λ < 1.Wyróżnimy teraz wM następujące dwie parametryzacje:

R2 ⊃ V1 =]− π − ε, ε[×]− 1, 1[∋ (ϕ, λ) −→ κ1(ϕ, λ) := [(ϕ, λ)] ∈M ,

R2 ⊃ V2 =]− ε, π + ε[×]− 1, 1[∋ (ϕ, λ) −→ κ2(ϕ, λ) := [(ϕ, λ)] ∈M .

Część wspólna O := imV1 ∩ imV2 dziedzin obu map składa się z dwóch rozłącznych obsza-rów:

O1 = [(ϕ, λ)]|ϕ ∈]− (π + ε), π + ε[ ,oraz

O2 = [(ϕ, λ)]|ϕ ∈]− ε,+ε[ .Łatwo widać, że w pierwszym z tych obszarów transformacja przejścia dana jest wzorem:

(κ2 κ1) (ϕ, λ) = (ϕ+ 2π,−λ) , (132)

zaś w drugim obszarze jest odwzorowaniem tożsamościowym:

(κ2 κ1) (ϕ, λ) = (ϕ, λ) . (133)

Pokazaliśmy w ten sposób, że wstęga Mobiusa jest rozmaitością różniczkowalną klasy C∞.Sposób konstrukcji — przy pomocy nożyczek i kleju ze zwykłej wstążki — pokazuje, żemożna ją także zanurzyć jako podrozmaitość w trójwymiarowej przestrzeni afinicznej A3.Lokalnie zatem, do zestawu współrzędnych (ϕ, λ) na wstędze można dobrać ich rozszerze-nie na „gruby” kawałek otaczającej przestrzeni trójwymiarowej, oraz trzecią współrzędnąζ tak, by M było zbiorem rozwiązań rónwania ζ = 0. Niestety, taka współrzędna (czylifunkcja na A3) nie istnieje globalnie, w otoczeniu całej wstęgi. Gdyby bowiem taka funkcjaistniała, to jej różniczka pozwalałaby wyróżnić jednoznacznie (na przykład przez zama-lowanie) jedną stronę wstęgi Mobiusa, tę mianowicie, po której stronie funkcja ζ rośnie(a musi rosnąć lub maleć, bowiem jej pochodna nie może być równa zeru!). Tymczasemwiemy, że jest to niemożliwe: rozpoczynając malowanie po którejkolwiek stronie wstęgiznajdziemy się za chwilę po jej drugiej stronie. Można powiedzieć, że wstęga Mobiusa matylko jedną stronę! Zjawisko to opiszemy wkrótce, mówiąc o orientacji (wewnętrznej lub

52

Page 59: Rozn. Geom_ - Jerzy Kijowski

zewnętrzej) rozmaitości różniczkowalnej. Choć jednak możliwość wyróżnienia jakiejś „stro-ny” rozmaitości będzie wymagała wprowadzenia odpowiedniego aparatu matematycznego,to już teraz widzimy, że będzie to własność globalna a nie lokalna, bowiem mały (czy-li lokalny) kawałek wstęgi Mobiusa jest nie do odróżnienia od kawałka zwykłej (tzn, niesklejonej, lub sklejonej bez półobrotu) wstążki.

53

Page 60: Rozn. Geom_ - Jerzy Kijowski

3 Algebra pól wektorowych. Układy dynamiczne

3.1 Pole wektorowe

Pole wektorowe to kolekcja wektorów: po jednym w każdym punkcie rozmaitości. Jeśli zatemzastosować je do funkcji f , to otrzymamy kolekcję wartości, po jednej w każdym punkcie,czyli nową funkcję. Można wobec tego podać następującą definicję pola wektorowego:Definicja. Pole wektorowe jest to operator różniczkowy, ciągły

X : C1loc −→ Cloc (134)

spełniający warunki:

1. X(af + bg) = aX(f) + bX(g) ,

2. X(fg) = fX(g) + gX(f).

Zastosowaliśmy tutaj zastrzeżenie „loc” w oznaczeniu zbioru funkcji, aby podkreślićlokalny charakter tych obiektów: funkcje nie muszą być określone na całej rozmaitości Ma jedynie lokalnie, na otoczeniu punktu, który nas interesuje. W takich przestrzeniachrozważamy topologię zbieżności niemal jednostajnej w Cloc i niemal jednostajnej wraz zpochodnymi pierwszego rzędu w C1loc.Jeśli X jest polem wektorowym, to jego wartość X(x) w punkcie x ∈M , dana wzorem:

(X(x))(f) := (X(f))(x) , (135)

jest oczywiście wektorem zaczepionym w punkcie x:

X(x) ∈ TxM .

Wobec tego powyższą definicję pola wektorowego można zapisać bardziej lokalnie, jakoodwzorowanie różniczkowalne z rozmaitości M w rozmaitość TM :

M ⊃ O ∋ x→ X(x) ∈ TM , (136)

jednak z zastrzeżeniem, że wartość tego odwzorowania w punkcie x musi być wektoremzaczepionym w tym samym punkcie. Różniczkowalność odwzorowania sprawdza się w ukła-dach współrzędnych. Jeśli zatem wybrać w M mapę daną przez (86) oraz odpowiadającąjej mapę w TM daną przez (93), to „konkretyzacja” odwzorowania X w tych mapachwygląda następująco:

Rn ⊃ U ∋ (xk)→ (xk, X l(xk)) ∈ R2n . (137)

Widzimy więc, że lokalnie, w układzie współrzędnych, całą informację o polu wektorowymniesie n funkcji X l których wartość koduje wartość współrzędnych wektora

X(x) = X l(x)∂

∂xl,

54

Page 61: Rozn. Geom_ - Jerzy Kijowski

w zależności od współrzędnych punktu zaczepienia x. Pole jest gładkie klasy Cs jeśli tefunkcje są takiej klasy. I znów ma to sens jedynie dla s ¬ l − 1, bowiem nawet gdyby wjednej mapie s było większe, to po transformacji do innej mapy nie ma szans na utrzyma-nie tak wysokiego stopnia gładkości, skoro prawa transformacyjne są jedynie (l − 1) razyróżniczkowalne.Można zatem patrzeć na pole wektorowe, jako na odwzorowanie gładkie:

X :M → TM (138)

z bazy M wiązki stycznej w samą przestrzeń wiązki TM i takie, że wartość X(x) tegoodwzorowania w punkcie x należy do włókna TxM wiązki. Ten ostatni warunek oznacza,że rzut τ czyni z X odwzorowanie tożsamościowe:

τ X = id . (139)

Gładkie odwzorowanie z bazy wiązki w jej przestrzeń, spełniające ten warunek nazywa sięcięciem wiązki. A zatem pole wektorowe, to po prostu cięcie wiązki stycznej.

3.2 Komutator pól wektorowych

Definicja: Komutatorem dwu pól wektorowych X i Y nazywamy operator różniczkowy[X, Y ] działający na funkcje w następujący sposób:

[X, Y ](f) := X(Y (f))− Y (X(f)) . (140)

Operator ten zawiera „pochodne pochodnych” więc na pierwszy rzut oka jest operato-rem drugiego a nie pierwszego rzędu. Okazuje się jednak, że zachodzi „mały cud”, dziękiktóremu „to co drugiego rzędu” w obu składnikach wyrażenia (140) upraszcza się i w końcupozostaje nam operator pierwszego rzędu, a zatem znów pole wektorowe:Twierdzenie: Komutator pól wektorowych też jest polem wektorowym, tzn. spełnia

powyższe aksjomaty.Uwaga:Warto, by właśnie powyższe sformułowanie tezy pozostało w pamięci czytelni-

ka! Jednak a priori jest ono nieścisłe, bowiem zawiera pewien skrót myślowy: otóż funkcjaf , pojawiająca się w definicji (140) musi a priori dopuszczać dwukrotne różniczkowania,aby prawa strona była określona. Okaże się jednak, że wynik jest ciągły w topologii C1, azatem rozszerza się w sposób naturalny na funkcje różniczkowalne tylko jeden raz.Dowód: Obliczymy składowe [X, Y ]i względem układu współrzędnych (xi), gdy znane

są składowe X i oraz Y i obu pól i pokażemy, że są one dane wzorem:

[X, Y ]j = X i∂iY j − Y i∂iXj = X i∂Y j

∂xi− Y i ∂X

j

∂xi. (141)

Niech zatem będą dane dwa pola:

X = X i∂

∂xi, (142)

Y = Y j∂

∂xj(143)

55

Page 62: Rozn. Geom_ - Jerzy Kijowski

i obliczmy działanie ich komutatora na dowolną funkcję f , różniczkowalną co najmniej dwarazy:

[X, Y ](f) = X i∂

∂xi

(Y j

∂f

∂xj

)−Y j ∂

∂xj

(X i

∂f

∂xi

)(144)

= X i∂Y j

∂xi∂f

∂xj+X iY j

∂2f

∂xi∂xj− Y jX i ∂2f

∂xj∂xi− Y j ∂X

i

∂xj∂f

∂xi(145)

=

(X i

∂Y j

∂xi− Y i∂X

j

∂xi

)∂

∂xj(f) , (146)

bowiem drugie pochodne są symetryczne:

∂2f

∂xi∂xj=

∂2f

∂xj∂xi

zatem upraszczają się. Natomiast ostatni człon powstał z ostatniego członu w (145) poprzez„przechrzczenie” wskaźnika „i” na „j” i odwrotnie. Taką operację stosuje się bardzo częstow rachunkach pojawiających się w geometrii różniczkowej. Jest ona oczywiście dopusz-czalna, bowiem oba wskaźniki są „martwe”: nie pozostają jako numer jakiejś składowejjakiegoś obiektu geometrycznego a jedynie numerują składniki sumy. To tak, jak gdyby„przechrzcić” nazwę zmiennej całkowania:

∫ b

af(x)dx =

∫ b

af(y)dy ,

która to operacja nie zmienia przecież wyniku całkowania! W naszym wypadku skorzysta-liśmy z tożsamości:

Y j∂X i

∂xj∂f

∂xi= Y i

∂Xj

∂xi∂f

∂xj,

bowiem obie strony są równe podwójnej sumie powyższych członów dla i = 1, . . . , n orazj = 1, . . . , n.Wzór (146) pokazuje, że istotnie, komutator jest ciągłym operatorem pierwszego rzędu,

choć był definiowany przy pomocy operatorów drugiego rzędu. Jego liniowość jest oczywi-sta. Sprawdzimy drugi aksjomat, czyli wzór Leibnitza:

[X, Y ](fg) = X(Y (fg))− Y (X(fg)) == X(fY (g)) + gY (f))− Y (fX(g) + gX(f))= X(f)Y (g) + fX(Y (g)) +X(g)Y (f) + gX(Y (f))+

− Y (f)X(g)− fY (X(g))− Y (g)X(f)− gY (X(f)) == f([X, Y ](g)) + g([X, Y ](f))

Zbiór pól wektorowych jest przestrzenią wektorową. Komutator jest działaniem na ele-mentach tej przestrzeni.Twierdzenie: Komutator pól [X, Y ] ma następujące własności:

56

Page 63: Rozn. Geom_ - Jerzy Kijowski

1. jest wyrażeniem bi-liniowym, to znaczy liniowym względem każdego z pól;

2. jest antysymetryczny tzn. zmienia znak gdy zamienić miejscami oba pola: [X, Y ] =−[Y,X];

3. spełnia tzw. tożsamość Jacobi’ego:

[X, [Y, Z]] + [Y, [Z,X]] + [Z, [X, Y ]] = 0 . (147)

Dowód: prosty, bezpośrednio z definicji oraz ze wzoru współrzędniowego (141).

Definicja: Skończenie wymiarowa przestrzeń wektorowa wyposażona w działanie speł-niające powyższe własności nazywa się algebrą Lie’ego .Zbiór wszystkich pól wektorowych na rozmaitości jest przestrzenią nieskończenie wy-

miarową, a w tym przypadku pojęcie algebry Lie’ego jest dużo trudniejsze. Jednak czę-sto rozważa się skończenie wymiarowe podprzestrzenie tej dużej przestrzeni, zamknięte zewzględu na działanie komutatora. I wtedy taka przestrzeń jest algebrą Lie’go.Przykład: Pola wektorów stycznych do linii współrzędnych w ustalonym układzie

współrzędnych „komutują” wzajemnie, tzn. ich komutator jest równy zeru. Wynika to zfaktu, że drugie pochodne są symetryczne, a zatem operatory ∂

∂xkoraz ∂

∂xlsą przemienne:

∂xk∂

∂xl=

∂xl∂

∂xk

a więc ich komutator, równy różnicy obu tych operatorów drugiego rzędu, znika tożsa-mościowo. Warto zauważyć, że fakt ten wynika również z wzoru współrzędnościowego.Rzeczywiście, współrzędne pola ∂

∂xksą funkcjami stałymi: współrzędna o numerze k jest

równa 1 a pozostałe są równe zeru. Warto w tym miejscu wprowadzić bardzo wygodneoznaczenie tzw. delty Kroneckera:Definicja: Delta Kroneckera oznacza elementy macierzy jednostkowej zapisane w na-

stępujący sposób:

δkl =

1 gdy k = l0 gdy k 6= l . (148)

Używając tego oznaczenia mamy:

∂xk= δjk

∂xj,

bowiem z sumy po wszystkich wartościach wskaźnika j pozostaje jedynie ten, który odpo-wiada wartości j = k.

3.3 Sens analityczny a sens geometryczny

Wyrażenie (141) na współrzędne komutatora zawiera różnicę dwóch wyrażeń. Warto za-uważyć, że poszczególne człony tej różnicy nie mają żadnego sensu geometrycznego. Rze-czywiście, gdyby — w ustalonym układzie współrzędnych — próbować naiwnie zdefiniować

57

Page 64: Rozn. Geom_ - Jerzy Kijowski

pole wektorowe „∇XY ” wzorem

„∇XY ” = X i∂Y j

∂xi∂

∂xj, (149)

a które wygląda jak „pochodna pola Y w kierunku pola X”, to operacja taka nie ma więk-szego sensu, bowiem jej wynik zależy od układu współrzędnych, w którym ją definiujemy.I rzeczywiście: przejdźmy do innego układu współrzędnych ηa w tej samej przestrzeni.Ponieważ mamy:

∂xi=∂ya

∂xi∂

∂ya, (150)

otrzymujemy zatem:

X = X i∂

∂xi= X i

∂ya

∂xi∂

∂ya= Xa

∂ya, (151)

Y = Y j∂

∂xj= Y j

∂ya

∂xj∂

∂ya= Y a

∂ya, (152)

gdzie (Xa) oraz (Y a) są współrzędnymi tych samych pól w nowym układzie współrzędnych.Wyrazimy zatem współrzędne definiowanego pola „∇XY ” w nowych współrzędnych:

„∇XY ” =(X i

∂xiY j)∂yb

∂xj∂

∂yb=

(X i

∂xiY b −X iY j ∂2yb

∂xi∂xj

)∂

∂yb

=

(Xa

∂yaY b)

∂yb−X iY j ∂2yb

∂xi∂xj∂

∂yb. (153)

Pierwszy człon jest rzeczywiście równy podobnemu wyrażeniu jak to definiujące (149), aleobliczonemu w nowych współrzędnych. Pozostaje jednak różny od zera dodatek zawierającydrugie pochodne nowych współrzędnych względem starych. Mamy więc:

„∇XY ” =(Xa

∂Y b

∂ya

)∂

∂yb−X iY j ∂2yb

∂xi∂xj∂

∂yb. (154)

Gdybyśmy natomiast liczyli składowe obiektu „∇XY ” we współrzędnych (ηa) według „de-finicji” (149), to wystąpiłby tylko pierwszy człon. A zatem „definicja” ta nie ma żadnegosensu geometrycznego, bowiem zależy od wyboru układu współrzędnych. Na podkreśleniezasługuje jednak fakt, że drugi człon w powyższym wzorze jest symetryczny względemzamiany X na Y , wobec tego upraszcza się w wyrażeniu:

„∇XY ”− „∇YX” = [X, Y ] , (155)

w wyniku czego otrzymujemy obiekt geometryczny, już niezależny od opisu współrzędnio-wego. Było to oczywiste od samego początku, bowiem obiekt ten zdefiniowaliśmy wzorem(140) przy pomocy operacji czysto geometrycznych, bez użycia żadnych układów współ-rzędnych.

58

Page 65: Rozn. Geom_ - Jerzy Kijowski

Ten prosty przykład ilustruje tezę, iż geometria jest nauką o inteligentnym stosowa-niu narzędzi analizy matematycznej. Wszystkie struktury geometryczne można definiowaćanalitycznie wzorami zapisanymi przy pomocy współrzędnych. Tak wyglądają stare pod-ręczniki z geometrii różniczkowej. Każdą taką definicję należy uzupełnić „dowodem po-prawności”, to znaczy wykazać, że użyte do definicji wyrażenie analityczne transformujesię poprawnie przy zmianie układu współrzędnych. Jest tak, bowiem wśród ogromnej masywyrażeń analitycznych, które można sobie zapisać w ustalonym układzie współrzędnych,te które mają sens geometryczny są bardzo wyjątkowe! I właśnie powyższa definicja (149)takiego testu nie przeszła, czyli nie jest poprawna. W naszym wykładzie przyjmujemy zu-pełnie inną strategię: podajemy definicje struktur geometrycznych bez odwoływania się doukładu współrzędnych, a dopiero potem pokazujemy jak — np. w celach rachunkowych —reprezentować daną strukturę geometryczną w języku współrzędniowym.Warto tu jeszcze zauważyć, że gdy pole Y znika w danym punkcie, wtedy kłopotliwy

dodatek we wzorze (154), zawierający drugie pochodne, znika w tym punkcie i nasz niepra-widłowo zdefiniowany obiekt „∇XY ” nabiera — ale jedynie w tym punkcie — sensu: jestdobrze określonym wektorem. Zresztą wektor ten jest po prostu równy wartości komuta-tora [X, Y ] w tym punkcie, bowiem drugi człon po lewej stronie równości, czyli wyrażenie„∇YX” zeruje się w tym punkcie.Nad obserwacją powyższą warto się zatrzymać w nieco szerszym kontekście krzywych

w wiązce stycznej. Jeśli mamy taką krzywą sparametryzowaną

]a, b[∋ t→ β(t) = vx(t) ∈ TM , (156)

to w układzie współrzędnych jest ona opisana przy pomocy 2n funkcji:

]a, b[∋ t→ (xk(t), vl(t)) , (157)

gdzie (xk(t)) są współrzędnymi punktu x(t), zaś vx(t) = vl(t) ∂∂xl. Wektor styczny do tej

krzywej jest równy:

β(t) = xk(t)∂

∂xk+ vl(t)

∂vl∈ T (TM) , (158)

to znaczy ma współrzędne (xk(t), vl(t)). Zwróćmy uwagę, że nie jest to wektor styczny doM , lecz do wiązki stycznej TM .Okazuje się, że jego pierwsza połowa reprezentuje również wektor styczny do samego

M . Wynika to z faktu, że gdy zapomnieć o „pionowej składowej” tej krzywej, to znaczyzrzutować ją na bazę wiązki stycznej,

γ(t) = τ β(t) ,

to otrzymamy krzywą w M , której wektor styczny jest oczywiście transportem wektora βprzy pomocy rzutu τ :

γ = τ∗β = xk(t)∂

∂xk.

59

Page 66: Rozn. Geom_ - Jerzy Kijowski

Tak więc „pierwsza połowa” (xk(t)) wektora (158) jest rzeczywiście wektorem stycznymdo M . Natomiast „druga połowa”: (vl) nie koduje informacji o żadnym obiekcie geome-trycznym. Aby się o tym przekonać, obliczmy ją w innym układzie współrzędnych (ya).Mamy:

vx = vl∂

∂xl= vl

∂ya

∂xl∂

∂ya= va

∂ya,

to znaczy:

˙va =ddt

(vl∂ya

∂xl

)= vl

∂ya

∂xl+ vl

∂2ya

∂xk∂xlxk . (159)

A zatem: nie znając pierwszej połówki (xk(t)), nie wiemy jak wygląda „druga połówka” wnowym układzie współrzędnych (ale znając obydwie potrafimy obydwie przetransformowaćdo nowego układu bo przecież są to współrzędne wektora stycznego do TM). Obserwacjata nie jest bardzo odkrywcza: do znalezienia nawet części składowych wektora w nowymukładzie współrzędnych musimy naogół znać wszystkie jego składowe w starym układzie!Jednak wzór (159) implikuje pewien bardzo ciekawy fakt: jeśli zachodzi (xk(t)) = 0, to nietylko umiemy obliczyć wartość pochodnych ˙va(t), ale transformują się one jak składowewektora stycznego do M , mamy bowiem:

˙va = vl∂ya

∂xl.

Warunek (xk(t)) = 0 odpowiada niezależnemu od współrzędnych, geometrycznemu warun-kowi znikania rzutu wektora stycznego β, a mianowicie warunkowi:

τ∗β = 0 .

Takie wektory styczne do wiązki T (TM) nazywa się „pionowymi”. W ten sposób wykaza-liśmy następujące, niezwykle użyteczneTwierdzenie 1: Podprzestrzeń wektorów pionowych, stycznych do TM w punkcie v,

jest kanonicznie izomorficzna z przestrzenią wektorów stycznych do M w punkcie τ(v).W układzie współrzędnych (97) izomorfizm ten polega na utożsamieniu wektora vl ∂

∂vl∈

T (TM) z wektorem vl ∂∂xl∈ TM .

Dowód: Przedstawione powyżej rozumowanie, zapisane przy pomocy współrzędnych,jest już pełnym dowodem. Można jednak przytoczyć nieco bardziej elegancki argument.Otóż gdyby cała krzywa β była pionowa, to znaczy gdyby jej rzut naM był stały: τ β(t) =x = const., lub inaczej: β(t) ∈ TxM , wtedy można byłoby zapomnieć o całej rozmaitości,bowiem β byłaby krzywą w przestrzeni wektorowej i w tym sensie jej pochodna byłabyelementem tej samej przestrzeni wektorowej. Oczywiście każdy wektor pionowy może byćreprezentowany jako wektor styczny do krzywej pionowej, co kończy dowód.

Uwaga: Powyższe rozważania można streścić jeszcze inaczej. Używając układu współ-rzędnych (93) można krzywej β(τ) = (xk(τ), vl(τ)) przypisać krzywą pionową (vl(τ)) wTx(t)M i obliczyć jej wektor styczny (vl(t)) w Tx(t)M . Jeśli jednak użyjemy innego ukła-du współrzędnych (yk(τ), vl(τ)), to otrzymamy inny wektor ( ˙vl(t)) ∈ Tx(t)M . Wzór (159)

60

Page 67: Rozn. Geom_ - Jerzy Kijowski

pokazuje jednak, że gdy rzut τ β naszej krzywej na M ma znikający wektor stycznyw punkcie t, to znaczy gdy (xk(t)) = 0, wtedy obie krzywe w M mają ten sam wektorstyczny. I to jest właśnie ten wektor styczny do M , który przyporządkowujemy wektorowipionowemu, stycznemu do TM .Równanie (159) pokazuje, że lewa strona jest wektorem stycznym do M również w

przypadku, gdy znika wektor vx, czyli znikają jego współrzędne (vl). A zatem obie „po-łówki”: (xk) oraz (vk), wektora (xk, vk) stycznego do TM , są w tym przypadku wektoramistycznymi do M . Otrzymaliśmy w ten sposóbTwierdzenie 2: Przestrzeń styczna do TM w zerze 0x ∈ TxM jest iloczynem karte-

zjańskim:T0x(TM) = TxM × TxM . (160)

3.4 Pole wektorowe jako układ dynamiczny. Jednoparametrowegrupy diffeomorfizmów

Krzywą całkową pola wektorowego X na rozmaitości M nazywamy taką krzywą sparame-tryzowaną γ, której wektor styczny pokrywa się w każdym jej punkcie z wartością pola Xw tym punkcie:

γ(t) = X(γ(t)) . (161)

W lokalnym układzie współrzędnych (xk) na M krzywa zapisuje się jako

γ(t) = (xk(t)) .

Pole wektorowe jest dane przez wartość swoich n współrzędnych:

X = Xk∂

∂xk

i wtedy warunek (161) jest układem równań różniczkowych zwyczajnych:

xk(t) = Xk(x(t)) , (162)

co w skrócie będziemy również zapisywali następująco:

xk = Xk . (163)

Taki układ nazywa się układem dynamicznym, co oznacza iż jego prawa strona nie zależyexplicite od „czasu” t a jedynie od zmiennych xk czyli od położenia punktu krzywej γ wrozmaitości M .Jeśli pole wektorowe X jest odpowiednio gładkie (na przykład klasy C1), to problem

początkowy jest lokalnie dobrze postawiony. Oznacza to, że dla każdego punktu x ∈ Mistnieje lokalnie jedyna krzywa całkowa

]− ε, ε[∋ t→ γx(t) ∈M (164)

61

Page 68: Rozn. Geom_ - Jerzy Kijowski

startująca z tego punktu, tzn. spełniająca warunek początkowy

γx(0) = x . (165)

Oznaczmy punkty tej krzywej w następujący sposób

γx(t) =: GXt (x) . (166)

Ponieważ dla dostatecznie gładkiego pola X rozwiązanie układu (163) zależy w sposóbgładki od warunku początkowego x, to otrzymaliśmy jednoparametrową „lokalną” rodzinęodwzorowań rozmaitości M w siebie samą:

GXt :M → M . (167)

Z warunku początkowego (165) wynika oczywiście, że GX0 jest identycznością:

GX0 = id . (168)

Dla ustalonej „chwili czasu” s ∈ ]− ε, ε[, leżącej w dziedzinie istnienia (164) lokalnegorozwiązania γx układu dynamicznego (163), możemy skonstruować inną krzywą całkową:

t→ λ(t) := γx(s+ t) . (169)

Dowód, że jest to również krzywa całkowa tego układu sprowadza się do trywialnego ra-chunku:

λ(t) = γx(s+ t) = X(γ(s+ t)) = X(λ(t)) ,

gdzie oczywiście wykorzystaliśmy fakt, iż pole X nie zależy od czasu, tzn. mamy do czynie-nia z układem dynamicznym . Oznaczmy punkt początkowy krzywej λ przez y := λ(0) =γx(s). Z jednoznaczności krzywej całkowej otrzymujemy zatem tożsamość

γx(s+ t) = λ(t) = γy(t) . (170)

Ta sama równość, wyrażona w języku odwzorowania (166) wygląda następująco:

GXs+t(x) = GXt (y) = GXt(GXs (x)

),

co można zapisać w postaci superpozycji odwzorowań GXt oraz GXs , a mianowicie:Twierdzenie 1: Zachodzi prawo składania:

GXt+s = GXt GXs . (171)

Powyższą własność można byłoby nazwać własnością grupową i stwierdzić, że rodzina od-wzorowań GXt stanowi reprezentację grupy addytywnej liczb rzeczywistych (R,+) w grupiediffeomorfizmów rozmaitości M , gdyby nie fakt, że — być może — nie ma tu żadnego

62

Page 69: Rozn. Geom_ - Jerzy Kijowski

diffeomorfizmu! I rzeczywiście: oznaczenie (167) jest nieco mylące5, bowiem musimy pa-miętać, że ε we wzorze (164) zależy od punktu x. Gdy posuwamy się na rozmaitości Mcoraz dalej, to odcinek czasu, dla którego istnieje lokalna krzywa całkowa może stawaćsię coraz mniejszy tak, że dla każdej ustalonej wartości t 6= 0 odwzorowanie GXt nie jestokreślone na całym M , więc nie jest globalnym diffeomorfizmem. Gdyby istniało jakieśograniczenie z dołu dla tych epsilonów, czyli jakieś ε0 takie, że krzywe całkowe istniejąprzynajmniej dla wartości |t| < ε0, wtedy korzystając z własności (170) można byłobyje przedłużać dowolnie w przód i w tył w czasie. W takim przypadku odwzorowania GXtbyłyby dane globalnie, to znaczy dla wszystkich wartości czasu t i dla wszystkich punktówrozmaitości x ∈M . Wtedy wzór (171) implikuje, że są to globalne diffeomorfizmy oraz żeodwzorowanie odwrotne otrzymuje się zamieniając „t” na „−t”:

(GXt

)−1= GX−t . (172)

Poza tym odwzorowania GXt odpowiadające różnym wartościom parametru t są przemienne(mówimy także: „komutują”) bowiem, na mocy (171), ich złożenie w dowolnej kolejnościdaje ten sam wynik, odpowiadający sumie obu wartości tego parametru:

GXt GXs = GXs GXt . (173)

Definicja: Pole wektorowe na rozmaitościM , które generuje globalną, to znaczy okre-śloną dla wszystkich x ∈ M i wszystkich t ∈ R, grupę diffeomorfizmów GXt , nazywamypolem zupełnym.W ogólnym przypadku pole nie jest zupełne. Wtedy takie uniwersalne ε0 nie istnieje i

(poza wartością t = 0) odwzorowania GXt są dane jedynie lokalnie. Powyższe trzy prawa:składania (171), wzór na transformację odwrotną (172) oraz prawo przemienności (173),obowiązują jedynie dla tych wartości parametrów, dla których obie strony „mają sens”,tzn. są określone.Przykład: Na osi rzeczywistej M = R rozważmy pole wektorowe

X(x) = x2∂

∂x.

Rozwiązując równanie różniczkowex = x2 ,

metodą rozdzielenia zmiennych otrzymujemy

dxdt= x2 ; dt =

dxx2= d

(−1x

); t− C = −1

x.

Wobec tego każda krzywa całkowa pola X ma postać:

γ(t) =1

C − t =1C

1− tC

.

5Ale i tak będziemy go używać.

63

Page 70: Rozn. Geom_ - Jerzy Kijowski

Aby spełnić warunek początkowy γ(0) = x musimy położyć 1C= x. Mamy zatem

γx(t) =x

1− tx ,

lub, inaczej:GXt (x) =

x

1− tx . (174)

Jak widać, dla ustalonego punktu na półosi dodatniej: 0 < x ∈ R, odwzorowanie to jestokreślone jedynie dla t < 1

x. Natomiast na półosi ujemnej x < 0 jest ono określone jedynie

dla t > 1x. Jedynie w punkcie x = 0 rozwiązanie można przedłużać w nieskończoność:

GXt (0) = 0 dla dowolnej wartości parametru t. Można tę własność pola X podsumowaćnastępującym stwierdzeniem: w skończonym czasie t pole X wynosi punkty rozmaitości Mdo nieskończoności. A zatem pole to nie jest zupełne.Można natomiast sprawdzić, że prawo składania (171) obowiązuje wszędzie tam, gdzie

obie strony równości mają sens. I rzeczywiście: jeśli oznaczyć y = GXt (x), to zachodzi:(GXs GXt

)(x) = GXs (y) =

y

1− sy =x1−tx

1− s x1−tx=

x

1− sx− tx= GXs+t(x) .

Uwaga: Warto zwrócić uwagę na to, że działanie pola wektorowego X na funkcjęf polega na różniczkowaniu jej wzdłuż trajektorii grupy GXt , bowiem trajektorie te sąkrzywymi całkowymi pola. Mamy bowiem

X(x)(f) =ddǫ

∣∣∣∣∣ǫ=0

f (γx(ǫ)) =ddǫ

∣∣∣∣∣ǫ=0

f(GXǫ (x)

), (175)

co można zapisać w skrócie następująco:

X(f) =ddǫ

∣∣∣∣∣ǫ=0

f GXǫ . (176)

Twierdzenie 2: Krzywe całkowe dwu pól proporcjonalnych do siebie różnią się odsiebie jedynie parametryzacją: jeśli γ(t) jest krzywą całkową pola X, to krzywą całkowąpola Y = f ·X jest γ(s) := γ(φ(s)) gdzie funkcja zamiany parametryzacji

R ∋ s→ φ(s) = t ∈ R

musi spełniać równanie różniczkowe zwyczajne: φ(s) = f(γ(φ(s))).Dowód: Wychodząc z tego samego twierdzenia o różniczkowaniu superpozycji otrzy-

mujemy:

˙γ(s) =dds(γ φ)(s) = γ(φ(s)) · φ(s) = φ(s)X(γ(φ(s))) = f(γ(s))X(γ(s)) = Y (γ(s)) .

64

Page 71: Rozn. Geom_ - Jerzy Kijowski

Ważnym przykładem jest liniowa zmiana parametryzacji: φ(t) = at, a ∈ R. Wtedyφ ≡ a jest funkcją stałą i otrzymujemy:

˙γ = aX . (177)

Wynika stąd, że to grupa GYt generowana przez pole Y = aX powstaje z grupy GXt ,generowanej przez pole X przez reparametryzację:

GaXt = GXat . (178)

Można obrazowo powiedzieć, że pole aX unosi punkty rozmaitości M po tych samychkrzywych całkowych (trajektoriach), ale z inną prędkością. W szczególności dla a < 0 ruchodbywa się w przeciwną stronę, zaś dla a = 0 nic się nie rusza i mamy G0t = id.Zachodzi również następująca, uniwersalna tożsamość:Twierdzenie 3: Grupa diffeomorfizmów generowana przez pole wektorowe X nie zmie-

nia tego pola podczas transportu:(GXt

)∗X = X . (179)

Dowód: Oznaczmy y = GXt (x). Transport stanowi odwzorowanie przestrzeni stycz-nych: (

GXt)∗: TxM → TyM .

Na mocy definicji transportu (103) dla wektorów oraz wzoru (175) na pochodną funkcjiwzdłuż pola wektorowego, możemy dla dowolnej funkcji f napisać następujący ciąg rów-ności:

[(GXt

)∗X(x)

](f) = X(x)

[(GXt

)∗f]= X(x)

[f GXt

]=ddǫ

∣∣∣∣∣ǫ=0

[f GXt

] (GXǫ (x)

)

=ddǫ

∣∣∣∣∣ǫ=0

[f GXt GXǫ

](x) =

ddǫ

∣∣∣∣∣ǫ=0

[f GXǫ GXt

](x)

=ddǫ

∣∣∣∣∣ǫ=0

[f GXǫ

] (GXt (x)

)=ddǫ

∣∣∣∣∣ǫ=0

[f GXǫ

](y)

=ddǫ

∣∣∣∣∣ǫ=0

f(GXǫ (y)

)= X(y)(f) .

Widzimy, że dwa operatory różniczkowe: ten na początku oraz ten na końcu powyższegociągu nierówności, dają ten sam wynik w działaniu na dowolną funkcję. Zatem są one sobierówne: (

GXt)∗X(x) = X(y) , (180)

co jest właśnie bardziej konkretnym zapisem tezy (179).

Zawarte w ostatnim zdaniu rozumowanie polega na „uproszczeniu” obu stron równościprzez funkcję f . Będziemy często stosować ten skrót myślowy w dalszym ciągu wykładu.

65

Page 72: Rozn. Geom_ - Jerzy Kijowski

Przykład: Niech Z będzie polem wektorowym na trójwymiarowej przestrzeni euklide-sowej, które w układzie współrzędnych sferycznych (2) jest zdefiniowane jako pole wektorówstycznych do linii współrzędnej ϕ, to znaczy:

Z =∂

∂ϕ.

Na mocy wzoru (37), to samo pole wyraża się we współrzędnych kartezjańskich (x, y, z)jako

Z = x∂

∂y− y ∂

∂x. (181)

We współrzędnych sferycznych zachodzi równość

GZt (r, θ, ϕ) = (r, θ, ϕ+ t) , (182)

a zatem GZt jest obrotem wokół osi „z” o kąt t. Odwzorowanie to jest dane globalnie, dlawszystkich punktów przestrzeni i dla wszystkich wartości parametru t. Oznacza to, że Zjest polem zupełnym.Widzimy, że zbiór wszystkich takich odwzorowań, odpowiadających wszystkim możli-

wym wartościom parametru „t” stanowi grupę obrotów wokół osi „z”, bowiem zachodzi:(GZs GZt

)(r, θ, ϕ) = GZs (r, θ, ϕ+ t) = (r, θ, ϕ+ t+ s) = GZt+s(r, θ, ϕ) ,

a więc GZs GZt = GZt+s. Jest to grupa przemienna lub – inaczej – abelowa, bowiem ostatniwzór implikuje również tożsamość GZs GZt = GZt GZs .Jako pożyteczne ćwiczenie opiszemy to samo odwzorowanie w zmiennych kartezjań-

skich. Zgodnie z wzrorem (162), krzywe całkowe pola (181) są dane układem równań róż-niczkowych:

x = −y ,y = x ,z = 0 .

Dowolne rozwiązanie tego układu równań przybiera postać:

(x(t), y(t), z(t)) = (a cos t− b sin t, a sin t+ b cos t, c) ,

gdzie a, b, c ∈ R są dowolnymi stałymi. Punkt GZt (x, y, z) może być wyznaczony z warunkupoczątkowego GZ0 (x, y, z) = (x, y, z), co daje: (a, b, c, ) = (x, y, z). Tak więc otrzymujemy:

GZt (x, y, z) = (x cos t− y sin t, x sin t+ y cos t, z) = (x, y, z) ,

gdzie współrzędne „obrazu”, czyli punktu GZt (x, y, z), oznaczyliśmy jako (x, y, z). Powyższarówność to kartezjańska wersja wzoru (182). Można ją zapisać również jako:

x = x cos t− y sin t ,y = x sin t+ y cos t ,z = z .

(183)

66

Page 73: Rozn. Geom_ - Jerzy Kijowski

A to jest opis współrzędniowy odwzorowania GZt działającego z przestrzeni parametryzowa-nej współrzędnymi (x, y, z) w przestrzeń parametryzowaną współrzędnymi (x, y, z) (nawetjeśli jest to ta sama przestrzeń i te same współrzędne!). Zgodnie zatem z formułą (107),lub jej skrótową wersją (108), odwzorowanie styczne do GZt działa w następujący sposób:

(GZt)∗

(∂

∂x

)=

∂x

∂x

∂x+∂y

∂x

∂y+∂z

∂x

∂z= cos t

∂x+ sin t

∂y, (184)

(GZt)∗

(∂

∂y

)=

∂x

∂y

∂x+∂y

∂y

∂y+∂z

∂y

∂z= − sin t ∂

∂x+ cos t

∂y, (185)

(GZt)∗

(∂

∂z

)=

∂x

∂z

∂x+∂y

∂z

∂y+∂z

∂z

∂z=

∂z. (186)

Warto zauważyć, że pole aZ generuje obroty wokół tej samej osi, ale z inną prędkościąkątową (gdy a < 0, to w przeciwną stronę). Wynika to bezpośrednio z wzoru (178).Dokonując cyklicznej zamiany zmiennych „x → y → z → x” we wzorze (181), otrzy-

mamy wyrażenie na pole wektorowe X, generujące grupę obrotów wokół osi „x” i polewektorowe Y , generujące obroty wokół osi „y”:

X = y ∂∂z− z ∂

∂y

Y = z ∂∂x− x ∂

∂z

Z = x ∂∂y− y ∂

∂x

. (187)

Ćwiczenie: Proszę pokazać, że zachodzą równości:

[X, Y ] = −Z , [Y, Z] = −X , [Z,X] = −Y , (188)

powstałe z pierwszej przez cykliczną zamianę zmiennych.Wniosek: Zbiór pól wektorowych generujących obroty względem dowolnej osi jest trój-

wymiarową przestrzenią kombinacji liniowych powyższych pólX, Y i Z. Jest ona zamkniętaze względu na komutator, a zatem stanowi algebrę Lie’ego.Ćwiczenie: Korzystając ze wzorów (184) — (186) możemy obliczyć transport pola X

względem pola Z:

(GZt)∗

(y∂

∂z− z ∂

∂y

)= y

(GZt)∗

(∂

∂z

)− z

(GZt)∗

(∂

∂y

)

= y∂

∂z− z

(− sin t ∂

∂x+ cos t

∂y

).

Teraz trzeba jeszcze wyrazić wartość funkcji y i z w języku współrzędnych (x, y, z) na mocyrównań (183), tzn.: z = z oraz y = −x sin t+ y cos t. Ostatecznie więc otrzymujemy:(GZt)∗(X) = (−x sin t+ y cos t) ∂

∂z− z

(− sin t ∂

∂x+ cos t

∂y

)= X cos t+ Y sin t (189)

67

Page 74: Rozn. Geom_ - Jerzy Kijowski

3.5 Pole wektorowe jako infinitezymalna postać grupy diffeomor-fizmów

Odpowiedniość między polami wektorowymi a lokalnymi grupami diffeomorfizmów jestjedno-jednoznaczna. Pole wyznacza grupę, a grupa jednoznacznie definiuje pole, bowiemzachodzi następujący fakt.Twierdzenie: Jeśli Gt jest lokalną grupą diffeomorfizmów rozmaitości M to istnieje

pole wektorowe X na M takie, że zachodzi

Gt = GXt . (190)

Dowód: Zdefiniujemy wartość pola X w punkcie x ∈ M jako wektor styczny w zerzedo krzywej

γx(t) := Gt(x) ,to znaczy kładziemy:

X(x) := γx(0) =ddǫ

∣∣∣∣∣ǫ=0

Gǫ(x) . (191)

Aby wykazać wzór (190) musimy dowieść, że wektor styczny do krzywych γx jest równywartości pola X nie tylko w zerze, co zostało już wymuszone powyższą definicją, ale teżdla każdej innej wartości parametru t. Mamy zatem do wykazania następującą tożsamość:

γx(t) = X(γx(t)) ,

i tutaj dopiero wykorzystamy własności grupowe odwzorowań Gt. Oznaczmy Gt(x) = y.Dla dowolnej funkcji f zachodzi wzór:

(γx(t)) (f) =ddτ

∣∣∣∣∣τ=t

f(γx(τ)) =ddτ

∣∣∣∣∣τ=t

f(Gτ (x)) =ddǫ

∣∣∣∣∣ǫ=0

f(Gǫ(Gt(x)))

=ddǫ

∣∣∣∣∣ǫ=0

f(γy(ǫ)) = γy(0)(f) = X(y)(f) .

„Upraszczając” obie strony tej tożsamości przez f otrzymujemy tezę:

γx(t) = X(y) = X(γx(t))

Na definicję (191) pola X generującego (lokalną) grupę transformacji Gt = GXt możnaspojrzeć jeszcze inaczej: jako na pierwszy wyraz rozwinięcia Taylora względem parametrut. Skoro bowiem GX0 (x) = x, a pierwsza pochodna po t w zerze jest równa X(x) to szeregTaylora z dokładnością do wyrazów pierwszego rzędu wyglądałby następująco:

GXt (x) = x+ tX(x) + o(t) . (192)

Wzór ten nie ma sensu geometrycznego, bowiem suma x+tX(x), składająca się z punktu xoraz wektora tX(x) ∈ TxM , ma sens jedynie w przestrzeni afinicznej, natomiast w ogólnej

68

Page 75: Rozn. Geom_ - Jerzy Kijowski

rozmaitości różniczkowalnej M nie jest w ogóle określona. Wzór ten można rozumieć wsensie współrzędniowym: jako dodawanie odpowiednich współrzędnych wektora do współ-rzędnych punktu. Ale w takim razie suma ta nie jest określona jednoznacznie, bowiemzależy od tego, w jakim układzie współrzędnych zdecydowaliśmy się ją przeprowadzić! Jed-nak wzór (192) mówi nam, że różnica wyników otrzymanych przy użyciu dwóch różnychukładów współrzędnych jest małą wyższego rzędu niż t.Powyższą obserwację można też sformułować w sposób niezależny od układu współrzęd-

nych. Ma ona ważny sens heurystyczny, do którego będziemy się wielokrotnie odwoływaćw tym wykładzie. Można mianowicie powiedzieć, że „translacja punktu x o wektor stycznyǫv ∈ TxM jest dobrze określona „z dokładnością do małych rzędu wyższego niż ǫ” i wynosiwłaśnie GXǫ (x), gdzie X jest dowolnym polem wektorowym przyjmującym w punkcie xwartość v:

X(x) = v .

Wynik nie jest określony jednoznacznie, bowiem dla danego wektora v ∈ TxM jest wielepól wektorowych przyjmujących akurat tę wartość w punkcie x. Jednak wzór (192) mówinam, że różnica wyników otrzymanych przy pomocy dwóch różnych pól spełniających tenwarunek jest „małą wyższego rzędu”. W starych podręcznikach geometrii różniczkowej takątransformację GXǫ (x) punktu x nazywano „infinitezymalnym przesunięciem” o wektor ǫv.Takie określenie niesie ważny potencjał heurystyczny i jeszcze nieraz będziemy się nimposługiwać.

3.6 Uniwersalna postać pola wektorowego

Znajdowanie lokalnej grupy diffeomorfizmów GXt dla danego pola X jest nazywane „cał-kowaniem” pola wektorowego. Ta — na ogół niewykonalna analitycznie — operacja jestszczególnie łatwa dla pól stałych w danym układzie współrzędnych. Nie różni się ona ana-litycznie od grupy przesunięć o stały wektor w przestrzeni afinicznej. Rzeczywiście, jeśliwspółrzędne Xk pola X = Xk ∂

∂xksą stałe, to

GXt (xk) = (xk + tXk) . (193)

W szczególności gdy Xk = δkj , to znaczy gdy X =∂∂xjjest polem stycznym do linii współ-

rzędnej j, to GX jest grupą przesunięć tej współrzędnej, zachowującą wartość pozostałychwspółrzędnych punktu. Tak było dla pola Z = ∂

∂ϕ, generującej przesunięcia wartości dłu-

gości geograficznej ϕ, czyli obroty.Pole X = ∂

∂xjjest wszędzie różne od zera. Okazuje się, że każde nieznikające pole można

lokalnie sprowadzić do tej postaci poprzez odpowiedni wybór układu współrzędnych.Twierdzenie: Jeśli X(x) 6= 0 to istnieje w otoczeniu punktu x ∈M taki układ współ-

rzędnych (xk), k = 1, . . . , dimM ; w którym X = ∂∂x1.

Dowód: Niech (τ i) będzie jakimkolwiek układem współrzędnych w otoczeniu punktu x.Ponieważ X 6= 0 to istnieje taka współrzędna X i pola X = X i ∂

∂τ i, która jest różna od zera.

Bez straty ogólności można przyjąć, że jest to pierwsza współrzędna X1 (gdyby tak niebyło, to wystarczyłoby zmienić numerację współrzędnych). Również bez straty ogólności

69

Page 76: Rozn. Geom_ - Jerzy Kijowski

można przyjąć, że współrzędne punktu x w tym układzie są równe zeru: x = (0, . . . , 0).Gdyby tak nie było, to wystarczyłoby przeskalować addytywnie współrzędne o wartośćodpowiadającą współrzędnym naszego punktu.Rozważmy teraz podrozmaitość K ⊂ M o wymiarze (n − 1), daną równaniem τ 1 = 0

oraz współrzędne (τ 2, . . . , τn) na tej powierzchni. Nowe współrzędne (xk) wybierzemy w tensposób, by na powierzchni K pokrywały się ze współrzędnymi (τk), (a więc w szczególnościpołożymy x1 = 0 na K), natomiast z powierzchni tej „rozpropagujemy” ich wartość na całe„grube” otoczenie przy pomocy grupy GX generowanej przez nasze pole X. Oznacza to, żedefiniujemy następujące odwzorowanie κ:

Rn ⊃ W ∋ (xk)→ κ(xk) := GXx1(x2, . . . , xn) ∈M . (194)

Obrazem zera jest znów punkt x. Jeśli parametryzację odpowiadającą pierwotnym współ-rzędnym oznaczymy przez λ, to złożenie λ−1 κ przyporządkowuje punktowi (xk) ∈ Rn

wartość (τ i) ∈ Rn współrzędnych punktu κ(xk), czyli jest dane jako n funkcji τ i = τ i(xk),spełniających τ i(0, . . . , 0) = 0. Ale dla x1 = 0, czyli na K, zachodzi: τ 1 = 0 oraz(τ 2, . . . , τn) = (x2, . . . , xn). Zatem dla k > 1 i dowolnego i mamy równość:

∂τ i

∂xk= δik .

Wszędzie natomiast zachodzi ∂∂x1= X, bowiem dla dowolnego punktu y ∈M krzywe x1 →

GXx1(y) są krzywymi całkowymi pola X. Stosując tę tożsamość do funkcji τ i otrzymujemy:

∂τ i

∂x1= X(τ i) = Xj

∂τ jτ i = X i . (195)

A zatem w punkcie x = (0, . . . , 0) zachodzą oba te wzory, to znaczy macierz Jacobiegoodwzorowania λ−1 κ ma w tym punkcie następującą postać:

(∂τ i

∂xk

)=

X1 0 . . . 0X2 1 . . . 0....... . ....

Xn 0 . . . 1

. (196)

Wyznacznik tej macierzy jest równy X1 6= 0, zatem jest ona odwracalna. Wynika stąd, żeκ jest lokalnie, w otoczeniu naszego punktu, odwzorowaniem odwracalnym, a zatem (xk)jest dobrym układem współrzędnych. Wzór (195) oznacza właśnie, że zrealizowaliśmy naszcel zawarty w tezie twierdzenia, bowiem

∂x1=∂τ i

∂x1∂

∂τ i= X i

∂τ i= X .

Twierdzenie powyższe nie ma wielkiego znaczenia praktycznego. Do definicji (194) no-wego układu współrzędnych użyliśmy przecież grupy GX generowanej przez pole X, czyli

70

Page 77: Rozn. Geom_ - Jerzy Kijowski

musieliśmy to pole scałkować. Strategia polegająca na znalezieniu wpierw układu współ-rzędnych „prostującego” dane pole wektorowe X, co sprowadziłoby problem całkowaniatego pola do trywialnego wzoru (193), niesie dokładnie te same trudności analityczne, cosam problem całkowania pola. Twierdzenie to jest więc jedynie konstatacją o wartości czy-sto teoretycznej. Jak zobaczymy wkrótce, ma ona jednak istotne znaczenie poznawcze ipozwala znacznie upraszczać wiele dowodów w geometrii różniczkowej. Jest też często bar-dzo ważną wskazówką co do wyboru praktycznego sposobu rozwiązywania danego problemutechnicznego czy fizycznego. Jak bowiem przekonujemy się ciągle, od czasów Newtona, klu-czem do uzyskania rozwiązania analitycznego jest często umiejętny wybór współrzędnychdostosowany do charakterystycznych cech opisywanego zjawiska.W erze superkomputerów mogłoby się wydawać, że tego rodzaju zabiegi teoretyczne tra-

cą na znaczeniu, bowiem procedury numerycznego rozwiązywania równań różniczkowych sąbardzo efektywne i na pozór wszystko im jedno jaką postać analityczną postawimy po pra-wej stronie równania xk = Xk. Takie przekonanie opiera się jednak na złudzeniu, bowiemstabilność rachunków bardzo zależy od tego, czy dana procedura numeryczna respektu-je podstawowe własności układu jak symetrie czy prawa zachowania. Poza tym, wynikiczysto teoretyczne co do istnienia i podstawowych własności geometrycznych rozwiązańporządkują wyniki numeryczne w bardzo istotny sposób. Bez teoretycznego rozeznania codo jakościowych własności badanego układu, wyniki numeryczne stanowią często bezuży-teczny plik zadrukowanego papieru, którego przeglądanie przyprawia jedynie o ból głowy.Twierdzenie, które wykazaliśmy można nazwać twierdzeniem o uniwersalnej postaci po-

la wektorowego i sformułować je w postaci następującego sloganu: wszystkie pola wektorowewyglądają tak samo, jeśli tylko dobrać odpowiedni układ współrzędnych. Podkreślamy, żeobowiązuje ono jedynie lokalnie w otoczeniu punktów, w których pole jest różne od zera.Klasyfikacja własności pola wektorowego w otoczeniu punktów, w których pole się zeruje,jest zupełnie innym, dużo trudniejszym problemem. A globalne własności pola to jeszczeinna dziedzina wiedzy!

3.7 Pochodna Lie’go

Wzór (16) na pochodną funkcji f w kierunku wektora v ∈ TxM :

v(f) = limǫ→0

f(x+ ǫv)− f(x)ǫ

, (197)

nie ma oczywiście sensu na ogólnej rozmaitości różniczkowalnej M , ponieważ translacjapunktu x o wektor ǫv jest operacją zupełnie pozbawioną sensu. Nawet gdy M jest roz-maitością zanurzoną w przestrzeni afinicznej, gdzie taka operacja jest określona, to — jakzauważyliśmy w Rozdziale 2.9 — punkt „x+ ǫv” wystaje naogół poza M , więc nie wiemyile wynosi wartość funkcji f ∈ C l(M) w tym punkcie.Jednak dyskusja zawarta w rozdziale 3.5, wykazuje, że taka „translacja” jest określona

„z dokładnością do poprawek rzędu wyższego niż ǫ” i jest równa GXǫ (x), gdzie X jest do-wolnym polem wektorowym przyjmującym wartość v w punkcie x. Ale poprawki wyższego

71

Page 78: Rozn. Geom_ - Jerzy Kijowski

rzędu nie będą miały wpływu na pochodną w zerze. Przypuszczamy więc, że gdy we wzorze(197) dokonamy zamiany:

„x+ ǫv” na GXǫ (x) , (198)

otrzymamy prawidłowy wynik. I rzeczywiście:

limǫ→0

f(GXǫ (x))− f(x)ǫ

=ddǫ

[(GXǫ

)∗f](x)

∣∣∣∣∣ǫ=0

= X(f)(x) .

Możemy też abstrahować od konkretnego punktu x ∈M rozmaitości i napisać ogólnie:

X(f) =ddǫ

[(GXǫ

)∗f]∣∣∣∣∣ǫ=0

= limǫ→0

[(GXǫ

)∗f]− f

ǫ= limǫ→0

f(GXǫ )− fǫ

. (199)

Zastanówmy się, czy można byłoby zastąpić funkcję f (czyli „pole skalarne”) polemA jakiejś innej wielkości geometrycznej. Dotychczas poznaliśmy jedynie pojęcie pola wek-torowego i to właśnie pole wektorowe będziemy różniczkować w tym rozdziale. Jednakczęść heurystyki, która prowadzi do pojęcia pochodnej Lie’go jest uniwersalna i zachowujeznaczenie również wtedy, gdy będziemy się zajmowali dużo ogólniejszymi polami: kowekto-rowymi, tensorowymi, polami „układów inercjalnych” i innymi, które poznamy w dalszymciągu tego kursu. Dlatego też pozwólmy sobie przez chwilę na taką — dość nieokreśloną— ogólność co do istoty pola A. W niniejszym rozdziale napiszemy konkretną definicjęjedynie dla pola wektorowego. Dla innych pól odpowiednie definicje pojawią się w dalszymciągu wykładu.Otóż zastąpienie funkcji f polem A powoduje, że iloraz różnicowy w punkcie x, zawarty

w formule (199), a mianowicie wyrażenie

A(GXǫ (x))−A(x)ǫ

,

nie ma na ogół sensu, ponieważ obiekty geometryczne „żyjące” w jednym punkcie (na przy-kład w punkcie x) nie mogą być porównywane z obiektami geometrycznymi żyjącymi winnym punkcie (na przykład w punkcie GXǫ (x)), nawet jeśli są to obiekty tego samego typu.Pole skalarne, czyli funkcja o wartościach liczbowych f była tutaj zupełnym wyjątkiem.Tę przykrą prawdę omówiliśmy obszernie dla przypadku wektorów i zachowuje ona aktu-alność dla wielu innych obiektów geometrycznych. Chcąc porównać te obiekty, należałobywpierw „przetransportować” pierwszy wyraz z punktu GXǫ (x) do punktu x. Otóż możnato zrobić przy pomocy odwzorowania transportu generowanego przez odwzorowania GXt .I teraz musimy już wyspecyfikować nasze rozważania do konkretnego przykładu, bowiemmusimy wiedzieć czy pole A jest kontrawariantne (to znaczy transportuje się „do przodu”)czy też jest „kowariantne” (to znaczy transportuje się „do tyłu”). Powiemy dość niepre-cyzyjnie, że dla tych ostatnich należy zastąpić obiekt A(GXǫ (x)) jego przetransportowanąwartością

(GXǫ

)∗A(x). Granicę takiego — teraz już poprawnie określonego — ilorazu róż-niczkowego nazywamy pochodną Lie’go polaA względem pola wektorowego X i oznaczamy

72

Page 79: Rozn. Geom_ - Jerzy Kijowski

następująco:

£XA := limǫ→0

(GXǫ

)∗A−Aǫ

=ddt

[(GXt

)∗A]∣∣∣∣∣t=0

. (200)

Dla pola skalarnego (funkcji), które jest kowariantne pochodna ta pokrywa się ze zwykłąpochodną, daną wzorem (199).Jeśli natomiast pole A jest kontrawariantne, to znaczy transportuje się do przodu,

wtedy aby przenieść obiekt geometryczny A(GXǫ (x)) z punktu GXǫ (x) z powrotem do punktux, musimy się posłużyć odwzorowaniem odwrotnym

(GXǫ

)−1= GX−ǫ

i generowanym przezeń transportem(GX−ǫ

)∗. Zatem dla pola kontrawariantnego pochodna

Lie’ego będzie określona wzorem:

£XA := limǫ→0

(GX−ǫ

)∗A−Aǫ

= − ddt

[(GXt

)∗A]∣∣∣∣∣t=0

. (201)

Te heurystyczne rozważania przydadzą się, gdy będziemy poznawali nowe obiekty geo-metryczne. Tymczasem prowadzą one do następującej, ścisłej definicji:Definicja: Pochodną Lie’go pola wektorowego Y względem pola wektorowego X na-

zywamy następujące pole wektorowe:

£XY := limǫ→0

(GX−ǫ

)∗Y − Yǫ

= − ddt

[(GXt

)∗Y]∣∣∣∣∣t=0

. (202)

Przykład: Jeśli w pewnym układzie współrzędnych składowe pola X są stałe, np. gdyX = ∂

∂x1, to składowe pochodnej Lie’go wyrażają się w nim zwykłymi pochodnymi cząst-

kowymi:

(£XY )k =

∂Y k

∂x1. (203)

Wynika to z faktu, że GXt działa w tym układzie współrzędnych jako przesunięcie w pierw-szej zmiennej:

GXt (x1, x2, . . . , xn) = (x1 + t, x2, . . . , xn) , (204)

lub, inaczej

F 1(x1, x2, . . . , xn) = x1 + t ,

F 2(x1, x2, . . . , xn) = x2 ,

. . . . . . . . . . . . . . . . . . . . .

F n(x1, x2, . . . , xn) = xn .

Mamy zatem:∂F k

∂xj= δkj ,

73

Page 80: Rozn. Geom_ - Jerzy Kijowski

a więc, zgodnie ze wzorem (111), transport(GXt

)∗nie zmienia składowych transportowa-

nego wektora: składowe wektora(GX−ǫ

)∗Y (x) we wzorze (202) są równe:

Y k(GXǫ (x)

)= Y k(x1 + ǫ, x2, . . . , xn) . (205)

Wstawiając te wartości do definicji (202) otrzymujemy

(£XY )k := lim

ǫ→0Y k(x1 + ǫ, x2, . . . , xn)− Y k(x1, x2, . . . , xn)

ǫ=∂Y k

∂x1. (206)

Uprzedzając fakty powiedzmy, że powyższa obserwacja jest uniwersalna i obowiązujenie tylko w przypadku pochodnej Lie’go pól wektorowych, ale również dowolnych innychpól obiektów geometrycznych. Można ją sformułować w postaci następującego, godnegozapamiętania, sloganu: „pochodna Lie’go względem pola ∂

∂x1to zwykła pochodna cząstko-

wa”. Oczywiście pojęcie „pola o stałych składowych” nie ma żadnego sensu geometrycz-nego bowiem zależy od wyboru układu współrzędnych względem którego wyrażamy teskładowe. Obserwacja ta pozwala jednak na znaczne uproszczenie niektórych dowodów atakże skomplikowanych rachunków. Wynika z niej natychmiast następujące twierdzenie ofundamentalnym znaczeniu geometrycznym:Twierdzenie: Pochodna Lie’go pola wektorowego Y względem pola wektorowego X

jest równa ich komutatorowi:

£XY = [X, Y ] = −£YX . (207)

Dowód: Druga równość wynika z pierwszej oraz z antysymetrii komutatora. Aby do-wieść pierwszą równość zauważmy, że oba wyrażenia są polami wektorowymi. Jeśli pokaże-my ich równość w jednym układzie współrzędnych, to będziemy wiedzieli, że są one równejako pola wektorowe, a zatem również w dowolnym innym układzie współrzędnych. Przy-puśćmy zatem, że pole X nie znika w punkcie x i wybierzmy układ współrzędnych (xk) wktórym ma ono uniwersalną postać

X =∂

∂x1.

Na podstawie powyższego przykładu wiemy, że w tym układzie współrzędnych zachodzi

(£XY )k =

∂Y k

∂x1.

Natomiast wzór (141) na współrzędne komutatora implikuje, że zachodzi również

([X, Y ])k =∂Y k

∂x1.

A zatem równość (207) została w tym wypadku wykazana we wszystkich punktach, wktórych pole X nie znika. Jeśli natomiast X(x) = 0 to są możliwe dwa przypadki:

74

Page 81: Rozn. Geom_ - Jerzy Kijowski

1. Jeśli X znika tożsamościowo w otoczeniu punktu x, to zarówno pochodna Lie’gozeruje się w tym punkcie (bowiem GXt = id w otoczeniu tego punktu) jak i komutatorznika na mocy definicji. A zatem teza Twierdzenia jest prawdziwa.

2. Jeśli X znika w x ale nie znika w żadnym jego otoczeniu, to istnieje ciąg punktówxl zbieżny do naszego punktu x i taki, że X(xl) 6= 0, a zatem takich, w którychobowiązuje równość (207). Ponieważ oba pola są ciągłe (gdy pola X i Y były klasyco najmniej C1) to równość ta przenosi się przez ciągłość do naszego punktu x.

Uwaga: W odróżnieniu od pochodnej funkcji skalarnej X(f), której wartość (197) wpunkcie x zależy jedynie od wartości pola v = X(x) w tym punkcie, pochodna Lie’gopola wektorowego £XY zależy w sposób „nieco mniej lokalny” od pola X, wzdłuż któregoróżniczkujemy. Rzeczywiście, wzór (141) zawiera nie tylko wartość współrzędnych pola X i

w punkcie, ale również wartość ich pochodnych ∂jX i. Wynika to z faktu, że do transportuwektora Y (y) nie wystarczy znajomość wartości pola X w punkcie y, ale trzeba wiedziećnieco więcej o jego zachowaniu w otoczeniu tego punktu. Przypadek funkcji skalarnej byłwyjątkowy, bowiem jej wartość (będąca liczbą) transportuje się w sposób absolutny. Z tegopunktu widzenia pochodna pola skalarnego jest „lokalna stopnia zerowego” względem polaX, podczas gdy pochodna Lie’go pola wektorowego jest „lokalna stopnia pierwszego”. Wdalszym ciągu poznamy inne obiekty geometryczne, których pochodna Lie’go zawiera nietylko pole X z pierwszymi pochodnymi, lecz także będą potrzebne wyższe pochodne.Ćwiczenie:W euklidesowej przestrzeni trójwymiarowej rozważamy pola wektorowe X,

Y , Z, będące generatorami obrotów wokół kolejnych osi. Obliczmy pochodną Liego pola Xwzględem pola Y . Korzystając bezpośrednio z definicji (202) oraz z wykazanej poprzedniorówności (189) otrzymujemy:

£ZX := −ddt

[(GZt)∗X]∣∣∣∣∣t=0

= − ddt[X cos t+ Y sin t]

∣∣∣∣∣t=0

= −Y , (208)

co zgadza się z uprzednio obliczoną we wzorze (188) wartością komutatora obu pól.

3.8 Komutator pól a przemienność grup diffeomorfizmów

Jeśli są dane dwa pola wektorowe X i Y to rozważmy pole powstałe z Y przez transportgrupą generowaną polem X, a mianowicie:

Yt :=(GXt

)∗Y .

Lemat: Zachodzi następująca zależność:

dds

∣∣∣∣∣s=t

Ys =(GXt

)∗[Y,X] . (209)

W szczególności dla Y = X zachodzi [X,X] = 0, a zatem otrzymujemy jako szczególnyprzypadek tezę Twierdzenia 3 z rozdziału 3.4.

75

Page 82: Rozn. Geom_ - Jerzy Kijowski

Dowód:Wyrażenie (202) na pochodną Lie’go pola wektorowego przepisujemy w językukomutatorów:

[Y,X] = −[X, Y ] = −£XY =dds

[(GXs

)∗Y]∣∣∣∣∣s=0

, (210)

a następnie poddajemy działaniu odwzorowania stycznego(GXt

)∗:

(GXt

)∗[Y,X] =

(GXt

)∗

(dds

[(GXs

)∗Y]∣∣∣∣∣s=0

)=dds

((GXt

)∗

[(GXs

)∗Y])∣∣∣∣∣s=0

=dds

((GXs+t

)∗Y)∣∣∣∣∣s=0

=

(dds

(GXs

)∗Y

)∣∣∣∣∣s=t

=dds

∣∣∣∣∣s=t

Ys .

Możliwość wyprowadzenia operacji różniczkowania spod odwzorowania stycznego wynikaz jego liniowości.

Całkując prawą stronę powyższej równości po parametrze s przebiegającym odcinek[0, t] otrzymujemy natychmiastowyWniosek Jeśli pola komutują: [X, Y ] = 0, to grupa generowana przez jedno z nich

zachowuje drugie pole: (GXt

)∗Y = Y (211)

Wynika stąd fakt podstawowej wagi:Twierdzenie 1: Dwa pola wektorowe komutują wtedy i tylko wtedy, gdy komutują

również generowane przez nie (lokalne) grupy diffeomorfizmów:

GXt GYs = GYs GXt . (212)

Uwaga: Dla pól nie będących zupełnymi równość ma miejsce tam, gdzie „ma sens”,tzn. tam, gdzie obie strony są określone.Dowód: Załóżmy zatem, że [X, Y ] = 0. Dla ustalonej wartości parametru t oraz punktu

x ∈M rozważmy następującą krzywą sparametryzowaną:

s→ γ(s) := GXt GYs (x) .

Pokażemy, że jest to krzywa całkowa pola Y . I rzeczywiście, różniczkując po parametrze sotrzymujemy na mocy wzoru (211) tożsamość:

γ(s) =(GXt

)∗Y (GYs (x)) = Y (γ(s)) , (213)

która oznacza, że krzywa γ jest krzywą całkową pola Y , a więc trajektorią działania grupyGY :

GXt GYs (x) = γ(s) = GYs (γ(0)) .Ale z definicji krzywej γ wynika, że γ(0) = GXt (x), co już daje nam wzór (212), a zatemkomutują grupy generowane przez oba pola. Na odwrót: jeśli komutują grupy, to różnicz-kując po parametrze „s” wzór (212) otrzymujemy tożsamość (211). Na mocy wzoru (210)fakt ten implikuje znikanie komutatora pól.

76

Page 83: Rozn. Geom_ - Jerzy Kijowski

Przemienność obu grup, zapisana wzorem (212), jest równoważna następującej tożsa-mości:

GY−s GX−t GYs GXt = id , (214)

powstałej przez działanie na obie trony równania (212) wpierw odwzorowaniem GX−t anastępnie odwzorowaniem GY−s. Oznacza ono, że gdy z dowolnego punktu x posunąć się o tw kierunku pola X, następnie kontynuować przesuwanie w kierunku pola Y o s, następniezawrócić o t po polu X i w końcu zawrócić o s po polu Y , to taki „czworokąt” zamknie sięi wrócimy do punktu wyjścia.Gdy pola X i Y nie komutują, wtedy grupy nie są przemienne i zazwyczaj powyższy

„czworobok” nie domknie się. Okazuje się, że wartość komutatora [X, Y ] stanowi właśniemiarę tego niedomknięcia. Wyjaśnimy to dokładniej.Dla każdego punktu x ∈M lewa strona wzoru (214) definiuje odwzorowanie, być może

tylko lokalne, określone jedynie w otoczeniu zera:

R2 ∋ (t, s)→ Fx(t, s) := GY−s GX−t GYs GXt (x) ∈ M , (215)

spełniające warunekFx(t, 0) ≡ x ≡ Fx(0, s) , (216)

dla dowolnych wartości parametru t i s. Oznacza to, że również wektor styczny do krzywychs→ Fx(0, s) oraz t→ Fx(t, 0) jest tożsamościowo równy wektorowi zerowemu w przestrzenistycznej TxM :

∂tFx(t, 0) = 0 =

∂sFx(0, s) . (217)

(Wbrew konwencji (116), wektor styczny do krzywej oznaczyliśmy tu wyjątkowo znakiempochodnej cząstkowej a nie zwyczajnej, bowiem mamy dwa różne parametry: „t” oraz „s”,i będziemy w dalszym ciągu rozważali bardzo różne krzywe, będące obrazem krzywych wdwuwymiarowej prestrzeni tych parametrów.) Zatem pierwsze pochodne odwzorowania Fmają sens jako krzywe w wiązce stycznej TM . Wzór (217) oznacza, że w punkcie (t, s) =(0, 0) przechodzą one przez zero w TxM . Widać, że jeśli tożsamość (214) jest złamana,to dopiero „w drugim rzędzie rozwinięcia” w parametrach (t, s). Ale co to znaczy? Jakisens miałyby drugie pochodne odwzorowania F czyli wektory styczne do tych krzywych?Pokazaliśmy w Rozdziale 3.3, że wektory styczne do TM nie definiują na ogół żadnegowektora stycznego do M chyba, że są pionowe! I właśnie ten przypadek ma tutaj miejsce,dzięki czemu drugie pochodne odwzorowania F w zerze są dobrze określone jako wektorystyczne do M . Tak więc Twierdzenie z Rozdziału 3.3 implikuje następujący fakt:Twierdzenie 2: Jeśli odwzorowanie

R2 ∋ (t, s)→ F (t, s) ∈M , (218)

ma tę własność, że jego pierwsze pochodne znikają w (0, 0), to drugie pochodne w tympunkcie są dobrze określone jako wektory z przestrzeni stycznej TF (0,0)M .Dowód: Pierwsze pochodne odwzorowania F definiują krzywe w TM . Na mocy wzoru

(217) ich wektor styczny (a więc pochodna pochodnej) jest pionowy w punkcie x = F (0, 0).

77

Page 84: Rozn. Geom_ - Jerzy Kijowski

Na mocy Twierdzenia 2. z Rozdziału 3.3 taki wektor w T (TM) definiuje jednoznaczniewektor styczny do M .Można też podać inny dowód. Dowolną drugą pochodną można mianowicie zdefiniować

jako operator różniczkowy działający na funkcje:

(∂2F )(f) := ∂2(f F ) . (219)

Na pierwszy rzut oka wydaje się, że jest to operator drugiego rzędu. Ale, podobnie jak tomiało miejsce w przypadku komutatora pól wektorowych, okazuje się, że dzięki znikaniupierwszych pochodnych odwzorowania F , jest to naprawdę operator pierwszego rzędu, czyliwektor. Obie metody dowodu są równie ważne: pierwsza ze względów praktycznych, druga— teoretycznych.

Obliczmy zatem drugie pochodne odwzorowania Fx. Zauważmy, że wzór (216) implikujewięcej, a mianowicie:

∂tFx(t, 0) ≡ 0 ≡

∂sFx(0, s) ,

więc, formalnie rzecz biorąc, mamy nie tylko

∂2

∂t2Fx(0, 0) = 0 =

∂2

∂s2Fx(0, 0)

ale nawet znikanie wyższych pochodnych! Pozostaje zatem do wyliczenia jedynie pochodnamieszana ∂2

∂t ∂sFx(0, 0), czyli:

∂2

∂t ∂s

(GY−s GX−t GYs GXt (x)

). (220)

W tym celu obliczymy pierwszą pochodną względem zmiennej s, ale w punktach t 6=0. Wynik jest sumą dwóch członów, wynikających z różniczkowania po dwóch miejscachwystępowania tej zmiennej w definicji odwzorowania Fx:

∂s

(GY−s GX−t GYs GXt (x)

)=

(GY−s GX−t

)∗Y (GYs GXt (x))

−(GY−s

)∗Y(GY−s GX−t GYs GXt (x)

).

Kładąc s = 0 otrzymujemy dla dowolnej wartości parametru t:

∂sFx(t, 0) =

(GX−t

)∗Y(GXt (x)

)− Y (x)

=(G−Xt

)∗Y(G−X−t (x)

)− Y (x) .

Drugi człon jest stały, więc znika pod następnym różniczkowaniem. Natomiast pochodnapierwszego członu po zmiennej t wynosi, jak wiemy z Lematu (209):

∂2

∂t ∂sFx(t, 0) =

(G−Xt

)∗[Y,−X]

(G−X−t (x)

)=(GX−t

)∗[X, Y ]

(GXt (x)

), (221)

78

Page 85: Rozn. Geom_ - Jerzy Kijowski

zatem otrzymujemy ostatecznie:

∂2

∂t ∂sFx(0, 0) = [X, Y ] (x) . (222)

Wynik ten pozwala nam znaleźć rozwinięcie Taylora odwzorowania Fx(t, s) z dokładnościądo członów kwadratowych w parametrach t i s. Zapiszemy je w następującej postaci:Twierdzenie 3: Dla dowolnych pól wektorowych zachodzi uniwersalny wzór

GY−s GX−t GYs GXt (x) = x+ t · s · [X, Y ](x) + o(t2 + s2) . (223)

Wzór ten zawiera nieokreśloną a priori operację polegającą na dodawaniu wektora dopunktu rozmaitości. Wiemy, że operacja taka ma sens jedynie w przestrzeni afinicznej, a naogólnej rozmaitości — nie. Jednak wzór ten można rozumieć tak, że dodawanie to odbywasię w ustalonej mapie. Jego wynik zależy od wyboru układu współrzędnych, ale różnicemiędzy różnymi mapami są wyższego rzędu w parametrach (t, s). Tak więc część głównatej„sumy” jest dobrze określona. Dzięki temu otrzymujemy nową interpretację komutatorapól jako miary niedomykania się czworoboku GY−s GX−t GYs GXt , a więc również miarynieprzemienności grup generowanych przez oba pola.Podobnie jak w Rozdziale 3.5, możemy jednak przyjąć bardziej geometryczną, nieza-

leżną od układu współrzędnych, interpretację powyższego wzoru. Na mocy formuły (192)translacja punktu x o wektor „ts[X, Y ](x)” jest dobrze określona z dokładnością do wy-razów wyższego rzędu i jest równa punktowi G[X,Y ]ts (x). Otrzymujemy zatem następującąformułę:

GY−s GX−t GYs GXt = G[X,Y ]ts + o(t2 + s2) . (224)

Warto ją zapamiętać w postaci następującego sloganu, zilustrowanego na Rysunku 11:Niedomknięcie czworoboku GY−s GX−t GYs GXt jest równe (z dokładnością do wyrazówwyższego rzędu!) infinitezymalnej translacji przy pomocy odwzorowania G[X,Y ]ts .Przykład 1: W przestrzeni dwuwymiarowej parametryzowanej przy pomocy dwóch

współrzędnych (x, y) rozważamy dwa pola wektorowe:

X =∂

∂x; Y = x

∂y.

Obliczymy ich komutator.

[X, Y ](f) =∂

∂x

(x∂f

∂y

)− x ∂

∂y

∂f

∂x=∂f

∂y,

zatem

[X, Y ] =∂

∂y.

Pola te łatwo scałkować:

GXt (x, y) = (x+ t, y) ; GYs (x, y) = (x, y + xs) ; G[X,Y ]τ (x, y) = (x, y + τ) .

79

Page 86: Rozn. Geom_ - Jerzy Kijowski

X

Y

−X

−Y

x

GXt (x)

GYs GXt (x)

GX−t GYs GXt (x)GY−s GX−t GYs GXt (x)

t · s · [X, Y ]

Rysunek 11: Komutator pól wektorowych mierzy „niedomknięcie czworoboku” wyznaczo-nego przez działanie odpowiadających im grup dyfeomerfizmów.

Wynikają stąd następujące wnioski:

GYs GXt (x, y) = (x+ t, y + (x+ t)s) = (x+ t, y + xs + ts) ,GX−t GYs GXt (x, y) = (x, y + xs+ ts) ,

GY−s GX−t GYs GXt (x, y) = (x, y + ts) = G[X,Y ]ts (x, y) .

A zatem poprawka o(t2 + s2) we wzorze (224) znika tożsamościowo i przybliżona równośćstaje się ścisła. Czworobok GY−sGX−tGYs GXt nie domyka się dokładnie o wielkość G

[X,Y ]ts (x).

Przykład 2: W przestrzeni trójwymiarowej parametryzowanej przy pomocy współ-rzędnych (x, y, z) rozważamy dwa pola wektorowe:

X =∂

∂x; Y =

∂y+ x

∂z. (225)

Obliczymy ich komutator.

[X, Y ](f) =∂

∂x

(∂f

∂y+ x

∂f

∂z

)−(∂

∂y+ x

∂z

)∂f

∂x=∂f

∂z,

zatem

[X, Y ] =∂

∂z.

Pola te łatwo scałkować:

GXt (x, y, z) = (x+ t, y, z) ; GYs (x, y, z) = (x, y + s, z + xs) .

Zatem

GXr GYs GXt (x, y, z) = GXr GYs (x+ t, y, z) = GXr (x+ t, y + s, z + (x+ t)s)= (x+ t+ r, y + s, z + (x+ t)s) .

80

Page 87: Rozn. Geom_ - Jerzy Kijowski

Widać, że możemy uzyskać przesunięcie naszego punktu do dowolnego punktu (x+ a, y +b, z + c), byle tylko było b 6= 0: wystarczy położyć s = b, t = c

b− x zaś r = a + x − c

b.

Łatwo wskazać odpowiednią kombinację przesunięć wzdłuż tych pól również w przypadku,gdy b = 0.Wynika stąd, że mając do dyspozycji jedynie dwuwymiarową rodzinę przesunięć wzdłuż

pól X i Y , jesteśmy w stanie dotrzeć do dowolnego punktu przestrzeni trójwymiarowej.

3.9 Dystrybucje i ich symetrie

Definicja: Rodzinę podprzestrzeni stycznych Dx ⊂ TxM nazywamy (odpowiednio6) gład-ką dystrybucją wymiaru k w M , jeśli zależność od punktu x ∈ M jest (odpowiednio)gładka, tzn. jeśli w otoczeniu każdego punktu x można znaleźć k pól wektorowych (od-powiednio) gładkich, których wartości rozpinają Dx dla każdego x z pewnego otoczeniapunktu x:

span

(1)

X, . . . ,(k)

X

= Dx . (226)

Dystrybucje występują najczęściej w zastosowaniach jako więzy nieholonomiczne, na-łożone na ruch układu mechanicznego. I tak przykładowo przestrzeń konfiguracyjna Młyżwiarza na lodowisku jest trójwymiarowa i może być parametryzowana dwiema współ-rzędnymi położenia na tafli oraz „azymutem” określającym kierunek ustawienia łyżew natafli. O ile łyżwiarz może zmieniać to ustawienie dowolnie w czasie ruchu, to jego poło-żenie na tafli może zmieniać się tylko w kierunku stycznym do łyżew. A zatem z całejtrójwymiarowej przestrzeni stycznej TxM łyżwiarz ma do dyspozycji w każdym punkciejedynie jej dwuwymiarową podprzestrzeń Dx ⊂ TxM . A jednak, używając jedynie tra-jektorii stycznych do Dx, łyżwiarz ma możliwość dotarcia do każdego punktu przestrzenikonfiguracyjnej M , to znaczy może znaleźć się w dowolnym punkcie tafli z łyżwami skiero-wanymi w dowolną stronę. Ta ostatnia własność dystrybucji jest bardzo szczególna i będziebadana w następnym Paragrafie.W badaniu własności dystrybucji ważną rolę odgrywa pojęcie symetrii, to znaczy dyfe-

omorfizmu zachowującego D, tzn. takiego, że F∗D = D, a także „infinitezymalnej symetrii”to znaczy pola wektorowego generującego lokalną grupę przekształceń, które są symetriamiD. Jeśli Y jest takim polem symetrii zaś X ∈ D – dowolnym polem wektorowym na M ,którego wartości leżą w podprzestrzeni D, to zachodzi:

£YX := limǫ→0

(GY−ǫ

)∗X −Xǫ

∈ D , (227)

bowiem w każdym punkcie x ∈ M granica ciągu wektorów leżących w podprzestrzeni Dxteż leży w tej podprzestrzeni.Mamy zatem warunek konieczny na to, by pole Y było polem symetrii dystrybucji D:

X ∈ D =⇒ [Y,X] ∈ D . (228)

6na przykład klasy Ci.

81

Page 88: Rozn. Geom_ - Jerzy Kijowski

Okazuje się, że jest to również warunek dostateczny:Twierdzenie: Pole Y jest polem symetrii dystrybucji D, to znaczy zachodzi

(GYt)∗D ⊂ D , (229)

wtedy i tylko wtedy, gdy spełnia warunek (228), czyli gdy jego nawias Lie’go z dowolnympolem z D też jest polem z D.Uwaga: Ponieważ GYt jest dyfeomorfizmem (lokalnym, ale jednak!) to warunek zawie-

rania (229) jest równoważny warunkowi równości:(GYt)∗D = D.

Dowód Twierdzenia: Pozostała do wykazania dostateczność tego warunku. Niech

zatem

((1)

X, . . . ,(k)

X

)będzie zestawem pól wektorowych, które lokalnie stanowią bazę dys-

trybucji D. Z warunku (229) wynika istnienie pola macierzy Aab realizujących rozkładkomutatorów z polem Y w samej bazie:

[Y,(a)

X

]=k∑

b=1

Aab(b)

X . (230)

Posłużymy się w dowodzie znanym nam już chwytem, polegającym na użyciu współrzęd-nych „prostujących” pole Y . Niech zatem (xk) będzie układem współrzędnych w otoczeniux ∈M , w którym zachodzi:

Y =∂

∂x1;(a)

X=(a)

Xi ∂

∂xi.

Jak wiemy, w takich współrzędnych komutator z polem Y sprowadza się do różniczkowaniapo x1. Zatem (230) można przepisać jako:

(∂

∂x1(a)

Xi

)∂

∂xi=k∑

b=1

Aab(b)

Xi ∂

∂xi,

lub równoważnie:∂

∂x1

(a)

Xi =

k∑

b=1

Aab(b)

Xi . (231)

Jak wiemy, grupa(GYt)działa (w tym układzie współrzędnych!) jak grupa przesunięć:

x1 → x1 + t, a pozostałe współrzędne nie zmieniają się. Dla uproszczenia oznaczymy:(GYt)(x) = (x + t) .

Natomiast odwzorowanie styczne do takiego przesunięcia po prostu przenosi wektory zpunktu do punktu bez zmiany współrzędnych (zob. wzory (204) i (205) w rozdziale 3.7).Zatem transport dowolnego wektora z punktu x wzdłuż Y ma współrzędne stałe, niezależneod t: (

GYt)∗

((a)

X (x))=(a)

Xi(x)

∂xi. (232)

82

Page 89: Rozn. Geom_ - Jerzy Kijowski

Rozważmy teraz następujące równanie różniczkowe zwyczajne względem zmiennej t:

ddtRab(t) = A

ac(t)R

cb(t) ,

z warunkiem początkowym R(0) = I, tzn. Rab(0) = δab . Dla uproszczenia notacji oznaczyli-

śmy Aab(t) := Aab(x1+ t, x2, . . . , xn). Macierz R jest oczywiście rezolwentą równania (231).

Oznacza to, że jego rozwiązanie wygląda następująco:

(a)

Xi(t) =

k∑

b=1

Rab(t)(b)

Xi(0) .

(Dowód polega na podstawieniu tego wzoru do (231) i sprawdzeniu, że spełnione jestzarówno równanie różniczkowe jak i warunek początkowy). Ale macierz rezolwenty jestodwracalna, zatem

(a)

Xi(0) =

k∑

b=1

(R−1

)ab(t)(b)

Xi(t) ,

co wobec tożsamości (232) oznacza, iż zachodzi:

(GYt)∗

((a)

X (x))=k∑

b=1

(R−1

)ab(t)(b)

X (x + t) . (233)

3.10 Twierdzenie Frobeniusa

Przypuśćmy, że dystrybucja D jest rozpinana przez rodzinę pól wzajemnie komutujących:[(a)

X,(b)

X

]= 0. Okazuje się, że wtedy sytuacja jest zasadniczo różna od sytuacji łyżwiarza

dyskutowanej w poprzednim rozdziale, bowiem przesuwając się wzdłuż tych pól od wy-branego punktu x pozostaniemy w pewnej k-wymiarowej „powierzchni” (podrozmaitości)Nx ⊂ M , zanurzonej w M , a więc wcale nie dotrzemy do dowolnego punktu przestrzeni.Aby się o tym przekonać rozważymy odwzorowanie:

Rk ⊃ O ∋ (t1, . . . , tk)→ G(k)

Xtk · · · G

(2)

Xt2 G

(1)

Xt1 (x) ∈M . (234)

Pola te komutują, więc na mocy twierdzenia (212) kolejność składania transformacji G(a)

Xta

w powyższym wzorze nie ma znaczenia. Parametry (ta) są dobrymi współrzędnymi na tejpowierzchni.Lemat 1: Zachodzi tożsamość:

∂ta=(a)

X .

Dowód: Oznaczmy

G(a−1)

Xta−1 · · · G

(2)

Xt2 G

(1)

Xt1 (x) = y ; G

(k)

Xtk · · · G

(2)

Xt2 G

(1)

Xt1 (x) = G

(k)

Xtk · · · G

(a)

Xta (y) = z .

83

Page 90: Rozn. Geom_ - Jerzy Kijowski

Mamy zatem:

∂taG(k)

Xtk · · · G

(2)

Xt2 G

(1)

Xt1 (x) =

∂taG(k)

Xtk · · · G

(a)

Xta (y)

=

(G(k)

Xtk

)

∗ · · · (G(a+1)

Xta+1

)

∗(a)

X (y) (235)

=(a)

X (z) , (236)

bowiem na mocy Wniosku (211) transport pola(a)

X wzdłuż pozostałych, komutujących znim pól, nie zmienia tego pola.

Wniosek: W każdym punkcie rozmaitości Nx jej przestrzeń styczna jest równa prze-strzeni D:

TzNx = Dz ⊂ TzM .

Definicja: Podrozmaitość N ⊂M nazywamy rozmaitością całkową dystrybucji D jeśliw każdym jej punkcie zachodzi Dz = TzN .Pokazaliśmy, że dystrybucja rozpinana przez komutujące pola wektorowe ma powierzch-

nie całkowe. Jest ich wiele, bowiem punkt wyjściowy x w konstrukcji (234) można wybraćdowolnie. Jeśli jednak zastąpić go innym punktem leżącym na tej samej powierzchni N ,to otrzymamy inną parametryzację tej samej podrozmaitości całkowej. Aby ponumerowaćróżne powierzchnie całkowe wystarczy wziąć dowolną (n − k)-wymiarową powierzchnięK ⊂M , transwersalną względem dystrybucji D i rozpoczynać naszą konstrukcję zawsze zpunktu leżącego na tej powierzchni: x ∈ K. Transwersalność powierzchni oznacza, że jejprzestrzeń styczna jest rozłączna z dystrybucją D, tzn.: Dx ∩ TxK = 0. Jeśli teraz (τ r),r = 1, . . . , n− k; to (τ r, ta) stanowią układ współrzędnych w całym M , według wzoru:

Rn ⊃ U ∋ (τ 1, . . . , τn−k, t1, . . . , tk)→ G(k)

Xtk · · · G

(1)

Xt1 (x(τ

r)) ∈M . (237)

Wniosek: Jeśli dystrybucja D jest rozpięta przez komutujące pola wektorowe, to wotoczeniu każdego punktu x ∈ M można wprowadzić współrzędne (τ r, ta) takie, że ichpierwsza grupa numeruje różne powierzchnie całkowe dystrybucji, zaś ona sama jest roz-pięta na różniczkowaniach względem współrzędnych z drugiej grupy:

Dx = span

∂t1, . . . ,

∂tk

⊂ TxM . (238)

Pokazaliśmy zatem jak „całkować” dystrybucję D, jeśli jest ona rozpięta przez komu-tujące pola wektorowe. Jednak w zastowaniach często występuje sytuacja, gdy badanastruktura fizyczna wyróżnia pewną dystrybucję (226) rozpiętą przez układ pól wektoro-wych, jednak wcale nie komutujących. Zachodzi pytanie: czy dystrybucja jest czy nie jestcałkowalna? Dystrybucję niecałkowalną spotkaliśmy już w przykładzie (225)). Rzeczywi-ście, dwuwymiarowa dystrybucja rozpięta na polachX i Y na pewno nie jest całkowalna, boposuwając się wzdłuż tych pól jesteśmy w stanie dotrzeć do każdego punktu trójwymiaro-wej przestrzeni, a zatem nie pozostaniemy wewnątrz żadnej hipotetycznej, dwuwymiarowej

84

Page 91: Rozn. Geom_ - Jerzy Kijowski

powierzchni całkowej. Podobna sytuacja miała miejsce w przykładzie więzów nieholono-micznych opisujących ruch łyżwiarza dyskutowany w poprzednim paragrafie.Zauważmy, że dla dystrybucji całkowalnej jej bazę tworzą pola ∂

∂ta. A zatem dowolne

dwa pola wektorowe X i Y leżące w takiej dystrybucji są kombinacjami

X = Xa∂

∂ta; Y = Y a

∂ta,

zatem ich komutator też leży w tej dystrybucji. [X, Y ] = (Xb∂bY a − Y b∂bXa) ∂∂ta∈ D.

Oznacza to, że dowolne pole wektorowe leżące w dystrybucji D jest jej polem symetrii.Wynika stąd warunek konieczny na całkowalność:

X, Y ∈ D =⇒ [X, Y ] ∈ D . (239)

Dystrybucja spełniająca ten warunek, czyli „domknięta ze względu na branie komuta-torów” nazywa się inwolutywną. Okazuje się, że jest to również warunek konieczny nacałkowalność.Twierdzenie Frobeniusa: Dystrybucja D jest całkowalna (tzn. zachodzi sytuacja jak

we Wniosku powyżej) wtedy i tylko wtedy, gdy jest inwolutywna.

Dowód Twierdzenia Frobeniusa: Pokażemy, że otoczeniu każdego punktu x ∈ Mda się skonstruować układ współrzędnych (τ r, ti) taki, że (τ r) numerują różne powierzchniecałkowe dystrybucji, zaś ona sama jest rozpięta na różniczkowaniach względem współrzęd-nych z drugiej grupy. W tym celu postąpimy identycznie jak w przypadku komutującym:wybierzemy dowolną (n− k)-wymiarową powierzchnię K transwersalną wzgledem dystry-bucji D a na niej jakiś układ współrzędnych (τ r). Następnie zdefiniujemy żądany układ

współrzędnych (τ r, ti) wzorem (237), gdzie jako

(1)

X, . . . ,(k)

X

wybierzemy dowolny układ

pól wektorowych rozpinających dystrybucję D. Pola te zapewne nie komutują. Zatem, w

odróżnieniu od sytuacji komutującej, wynik zależy od kolejności aplikowania grup G(i)

Xti do

punktu x(τ r) ∈ K. Decydujemy się na pewną kolejność, jak we wzorze (237). Ponieważpola są liniowo niezależne, wzór ten definiuje lokalny układ współrzędnych w otoczeniupunktu x ∈ M . Do zakończenia dowodu wystarczy pokazać, że powierzchnie N(τr) odpo-wiadające ustalonej wartości parametrów (τ r) są powierzchniami całkowymi dystrybucjiD. Ale przestrzeń styczna do takiej powierzchni jest rozpięta przez wektory ∂

∂ta. Stosując

oznaczenia z dowodu Lematu 1 widzimy, że zachodzi wzór (235), choć następny wzór (236)nie jest już prawdziwy, bowiem pola nie komutują. Tym niemniej zachodzi równość:

∂ta=

(G(k)

Xtk

)

∗ · · · (G(a+1)

Xta+1

)

∗(a)

X (y) ∈ Dz

na mocy Twierdzenia (229) z poprzedniego paragrafu. A zatem ∂∂ta∈ D, czyli

TzN(τr) = span

∂t1, . . . ,

∂tk

= Dz ,

co kończy dowód.

85

Page 92: Rozn. Geom_ - Jerzy Kijowski

3.11 Ważny przykład pola wektorowego: prawa Keplera

Jednym z najważniejszych osiągnięć nowożytnej nauki było wykazanie przez Isaaca Newto-na, że własności ruchu planet sformułowane przez Johannesa Keplera jako podsumowaniewiedzy uzyskanej dzięki precyzyjnym obserwacjom astronomicznym, wynikają prosto zdwóch hipotez czysto teoretycznych, znanych nam obecnie jako: 1) prawa dynamiki New-tona oraz 2) prawo powszechnego ciążenia. Obie te hipotezy nie mogły być zweryfikowanebezpośrednio, bo jak zmierzyć np. siłę, z jaką Słońce przyciąga Ziemię! Sprowadzały onejednak zagadnienie ruchu planet do równań różniczkowych, których rozwiązania wykazywa-ły właśnie te własności, o których mówiły prawa Keplera. I ten właśnie fakt został uznanyza dowód prawdziwości hipotez Newtona.Do sformułowania praw dynamiki oraz prawa powszechnego ciążenia nie wystarczy

uboga struktura rozmaitości różniczkowalnej, jaką dysponujemy na obecnym etapie naszegowykładu. Czytelnik, który rozpoczął lekturę niniejszego tekstu zapewne wie sporo na tentemat ze szkoły. W niniejszym rozdziale zamierzamy pokazać, że kluczowe narzędzie, dziękiktóremu Newton zdołał rozwiązać, a nie tylko sformułować równania ruchu planet, polegana inteligentnym opisie pewnego pola wektorowego.Tu dygresja, w której przypominamy pokrótce prawa dynamiki Newtona. Polegają one

na przypuszczeniu, że w pewnych sytuacjach można uważać przestrzeń fizyczną za trójwy-miarową przestrzeń afiniczną a ruch ciała o masiem jest rządzony równaniem różniczkowymdrugiego stopnia:

m~r = ~F ,

gdzie ~r oznacza położenie cząstki zaś ~F jest „wektorem siły”. Widać jednak, że znacznie wy-chodzimy tutaj poza zakres naszej znajomości geometrii różniczkowej, bo druga pochodna,oznaczona dwiema kropkami, wcale nie zachowuje się jak wektor przy nieliniowej zmianiewspółrzędnych! Chyba, że mamy tu jeszcze jakąś dodatkową strukturę, o której będzie mo-wa dużo dalej. Tymczasem ograniczmy się, tak jak w szkole, wyłącznie do Kartezjańskichukładów współrzędnych. Wtedy druga (a także dowolna inna) pochodna położenia po cza-sie jest wektorem. Natomiast prawo powszechnego ciążenia to przypuszczenie, że ciało omasie M przyciąga każde inne ciało o masie m z siłą równą GMm

r2, gdzie r jest odległością

tych ciał zaś G uniwersalną stałą przyrody.Umieścimy zatem Słońce, którego masa wynosi M , w środku Kartezjańskiego układu

współrzędnych, to siła, z jaką przyciąga ono ciało o masie m znajdujące się w punkcie ~rwynosi:

m~r = −GMm

r2· ~rr= −GMm

~r

r3,

gdzie r = ‖~r‖ jest długością wektora ~r, zatem ~n = ~rrjest wektorem jednostkowym skie-

rowanym ze Słońca w kierunku badanego ciała. Następnym przybliżeniem jest założenie,że masa Słońca M jest znacznie większa od masy m ≪ M badanego ciała, dzięki czemuSłońce, w dużym przybliżeniu, pozostaje w spoczynku. Widać, że można w tym mode-lu wyeliminować z rozważań masę m. Oznacza to, że (przynajmniej w tym przybliżeniu)trajektoria ciała poruszającego się w polu grawitacyjnym Słońca nie zależy od masy te-go ciała, bowiem trajektoria ta jest rozwiązaniem uniwersalnego układu trzech równań

86

Page 93: Rozn. Geom_ - Jerzy Kijowski

różniczkowych zwyczajnych drugiego rzędu

~r = −α ~rr3

. (240)

gdzie α = GM . Rozwiązania tego układu nie wyrażają się funkcjami elementarnymi. Jed-nak potrafimy, za Newtonem, znaleźć ważne własności tych nieznanych rozwiązań. W tymcelu posłużymy się wpierw tzw. prawami zachowania energii i momentu pędu:

E :=v2

2− α

r; ~J = ~r × ~v , (241)

gdzie ~v = ~r jest wektorem prędkości, v = ‖~r‖ — jego długością zaś „×” oznacza iloczynwektorowy7. Różniczkując po czasie obie te kombinacje położeń i prędkości widzimy, żena mocy równania ruchu (240) pochodne te znikają, zatem wielkości te muszą pozostawaćstałe. I rzeczywiście:

E = ~v · ~v − dds

r

)= ~r · ~r − d

ds

r

)= −α ~r

r3· ~r − d

ds

r

)

=dds

r

)− dds

r

)= 0 ,

J = ~r × ~v + ~r × ~v = ~v × ~v − α

r3~r × ~r = 0 .

Stałość wektora ~J oznacza, że zarówno położenie ~r jak i prędkość ~v leżą ciągle w tejsamej, dwuwymiarowej płaszczyźnie prostopadłej do tego wektora. Zatem nasz problemjest w istocie rzeczy dwuwymiarowy. Można wybrać osie naszego układu współrzędnych wten sposób, by ruch odbywał się w płaszczyźnie z = 0, a położenie było parametryzowanedwiema współrzędnymi: ~r = (x, y). Wtedy jedyną nietrywialną składową wektora momentupędu ~J jest Jz, zaś pozostałe składowe zerują się: Jx = Jy = 0. Można ustalić zwrot osi„z” w kierunku wektora momentu pędu tak, by było Jz > 0. Trajektoria ruchu jest zatemkrzywą dwuwymiarową

R ∋ t→ (x(t), y(t)) ∈ R2 ,

a prędkość jest jej wektorem stycznym:

~v = x∂

∂x+ y

∂y.

Wzory (241) wiążące stałe ruchu: E oraz J = ‖ ~J‖ = Jz przez położenie i prędkość wyglą-dają w tym układzie współrzędnych następująco:

E =12

(x)2 + (y)2

− α√

x2 + y2(242)

J = xy − yx . (243)

7Całkowita energia, tzn. suma energii kinetycznej i potencjalnej, jest równa mE, zaś moment pędu jestrówny m~J . Zatem nasze obiekty E i ~J są równe energii i momentowi pędu przypadającymi na jednostkęmasy poruszającego się ciała.

87

Page 94: Rozn. Geom_ - Jerzy Kijowski

I w tym momencie kończymy naszą dygresję na temat praw fizycznych odkrytych przezNewtona. Pozostało nam zadanie z czystej geometrii różniczkowej, polegające na badaniutrajektorii pewnego pola wektorowego X, to znaczy analizie układu dynamicznego:

[xy

]=

[Xx

Y y

], (244)

definiowanego dla ustalonych wartości parametrów E i J przez równania (242) – (243).W ramach tej dygresji musieliśmy skorzystać ze struktury metrycznej (Riemannowskiej),pozwalajacej liczyć długość wektora czy też iloczyn wektorowy dwóch wektorów. W naszymwykładzie będziemy te struktury analizować w Rozdziale 6. Tutaj skorzystaliśmy z ich„dziecinnej” wersji polegającej na założeniu, że istnieją wyróżnione układy współrzędnychzwanych kartezjańskimi w których ta struktura opisana jest znanymi ze szkoły wzorami8.Okazuje się, że dużo łatwiej będzie rozwiązywać ten układ posługując się nieliniowymi

współrzędnymi biegunowymi, czyli redukcją współrzędnych sferycznych (2) do płaszczyznyz = 0. Wtedy cos θ = 0, sin θ = 1 i mamy:

x = r cosϕ , (245)

y = r sinϕ . (246)

Wzory (118) i (119) pozwalające przeliczyć składowe prędkości z jednego układu współ-rzędnych do drugiego też znacznie się upraszczają:

x = r cosϕ− rϕ sinϕ , (247)

y = r sinϕ+ rϕ cosϕ , . (248)

Wstawiając ten wynik do równań (242) oraz (243) otrzymujemy:

E =12

(r2 + r2ϕ2

)− α

r, (249)

J = r2ϕ , (250)

lub, inaczej:

ϕ =J

r2, (251)

(r)2 = 2E +2αr− J2

r2= 2E +

α2

J2−(J

r− α

J

)2. (252)

To ostatnie wyrażenie musi być nieujemne jako kwadrat składowej Xr pola. Wynika stąd,że warunkiem koniecznym na istnienie rozwiązań jest nierówność, jaką muszą spełniać stałeruchu E i J :

2E +α2

J2> 0 ⇐⇒ 1 +

2EJ2

α2> 0 . (253)

8Oczywiście jest to sytuacja wyjątkowa, bowiem układ kartezjański istnieje jedynie dla bardzo szczegól-nej, płaskiej przestrzeni. W typowej, krzywej przestrzeni układ kartezjański nie istnieje i trzeba tę strukturędefiniować w inny sposób.

88

Page 95: Rozn. Geom_ - Jerzy Kijowski

Dwa pierwiastki z prawej strony równania (252): ujemny i dodatni, definiują dwa różnepola wektorowe. Jednak całkowanie tych pól to dwa równorzędne problemy. Odpowiadająone dwu połówkom trajektorii: 1) tej, gdy ciało zbliża się do Słońca i r maleje (czyli r ¬ 0),a potem: 2) tej kiedy się oddala po symetrycznym torze i r rośnie (czyli r ­ 0). A zatemwystarczy rozwiązać jeden z tych problemów, a rozwiązanie drugiego otrzymamy przezsymetrię.Mamy zatem następujący układ dynamiczny:

r = ∓√

2E +2αr− J2

r2=: Xr∓ , (254)

ϕ =J

r2=: Xϕ . (255)

to znaczy pole wektorowe

X∓ = Xr∓∂

∂r+Xϕ

∂ϕ, (256)

Xϕ =J

r2, (257)

Xr∓ = ∓√

2E +2αr− J2

r2. (258)

Ciągle jeszcze nie potrafimy znaleźć rozwiązania metodami analitycznymi. Jednak samkształt trajektorii (bez znajomości przebiegu czasowego) znajdziemy analitycznie stosującTwierdzenie 2 z rozdziału 3.4. Rozważmy zatem pole Y∓ = fX∓, gdzie jako funkcję fprzyjmiemy odwrotność ostatniego pierwiastka:

Y∓ =1√

2E + 2αr− J2r2

X∓ ,

i wtedy Y r = ∓1, co bardzo łatwo scałkować: r(t) = r0∓ t. Natomiast w obu przypadkachmamy:

ϕ = Y ϕ =Jr2√

2E + 2αr− J2r2

=Jr2√

2E + α2

J2−(Jr− αJ

)2

=

J

r2√2E+α

2

J2√√√√√1− J

r−αJ√

2E+α2

J2

2=ddrarc cos ρ(r) ,

gdzie oznaczyliśmy:

ρ(r) :=Jr− αJ√

2E + α2

J2

=J2

αr− 1

√1 + 2EJ

2

α2

=1ǫ

(p

r− 1

)(259)

89

Page 96: Rozn. Geom_ - Jerzy Kijowski

oraz

p :=J2

α; ǫ :=

1 +2EJ2

α2. (260)

Stałe p i ǫ są nieujemne (patrz nierówność (253)) i nazywają się odpowiednio „parametrem”oraz „mimośrodem” orbity.Ponieważ wartość cosinusa nie może przekraczać jedności, musi być spełniona nierów-

ność −1 ¬ ρ(r) ¬ 1, to znaczy1− ǫ ¬ p

r¬ 1 + ǫ .

Dla ǫ > 1, to znaczy dla dodatnich energii: E > 0, lewa nierówność jest zawsze spełniona,zatem odległość r badanego ciała od Słońca może być dowolnie duża. Natomiast dla ǫ < 1,to znaczy dla ujemnych energii: E < 0, otrzymujemy ograniczenie

p

1− ǫ =: rmax > r > rmin :=p

1 + ǫ.

Oba pola Y+ i Y− są zatem zdefiniowane jedynie w pierścieniu rmin ¬ r ¬ rmax, przy czymdla ǫ ­ 1 górne ograniczenie odchodzi do nieskończoności: rmax = ∞. Pozostaje jeszczegraniczny przypadek ǫ = 0, to znaczy gdy stałe ruchu spełniają tożsamość: E = − α2

2J2,

kiedy to pierścień degeneruje się do okręgu rmax = r = rmin, będącego wtedy jedynąmożliwą trajektorią.Ustalając znak „+” w definicji pola Y , musimy w pierścieniu tym rozwiązać równanie:

ϕ =dϕdt=dϕdr=ddrarc cos

(p

r− 1

).

Wynik otrzymujemy natychmiast:

ϕ(r) = arc cos1ǫ

(p

r− 1

)+ ϕ0 ,

lub, inaczej:p

r− 1 = ǫ cos(ϕ− ϕ0) ,

czylir =

p

1 + ǫ cos(ϕ− ϕ0). (261)

Polu Y+ odpowiada ta część trajektorii, dla której (ϕ− ϕ0) ∈ [0, π], bowiem wtedy znakiobu składowych pola: Y r oraz Y ϕ są dodatnie, tzn. r rośnie gdy ϕ rośnie (a to dlatego,że znajdujący się w mianowniku cosinus maleje!). Natomiast druga połówka trajektoriiodpowiada polu Y−: r maleje gdy ϕ rośnie. Wyrażenie (261) opisuje zatem całą trajektorię.Zauważmy, że dla ϕ = ϕ0 odległość r od Słońca przyjmuje najmniejszą wartość r = rmin.

Ten punkt trajektorii nazywa się perihelium. Dla ǫ < 0 punkt po przeciwnej stronie orbity,tzn. ϕ = ϕ0 + π odpowiada r = rmax i nazywa się aphelium. Dla ǫ > 1 orbita jest otwartai aphelium nie jest osiągane.

90

Page 97: Rozn. Geom_ - Jerzy Kijowski

Zmieniając wartość stałej obracamy trajektorię, bowiem zmieniamy jedynie południkod którego liczy się długość geograficzna. Do badania własności trajektorii można zatemprzyjąć ϕ0 = 0, co odpowiada liczeniu długości geograficznej od perihelium. Zauważmy, żerównanie (261) jest wtedy równoważne warunkowi

p = r + ǫr cosϕ = r + ǫx ,

lubx2 + y2 = r2 = (p− ǫx)2 = p2 − 2ǫpx+ ǫ2x2 . (262)

Dla ǫ = 1 (to znaczy dla wartości E = 0) krzywa ta jest parabolą:

x =p

2− 12py2 . (263)

W każdym innym przypadku możemy równanie (262) zapisać jeszcze inaczej:

(1− ǫ2

)(x+

ǫp

1− ǫ2)2+ y2 = p2 +

ǫ2p2

1− ǫ2 =p2

1− ǫ2 .

Wygodnie jest wprowadzić nową zmienną

x = x+ǫ

1− ǫ2 ,

i wtedy równanie uzyskuje prostą postać:

(1− ǫ2

)x2 + y2 =

p2

1− ǫ2 . (264)

Widzimy, że trajektoria jest elipsą lub hiperbolą, zależnie od znaku współczynnika (1− ǫ2).Planety krążą po orbitach zamkniętych. Odpowiada to przypadkowi (1− ǫ2) ­ 0, to

znaczy ujemnej energii: E < 0. Przypadek ten zachodzi gdy ujemna energia potencjal-na „−α

r” dominuje nad dodatnią energią kinetyczną „1

2v2”. Aby ciało mogło mieć orbitę

otwartą, tzn. by mogło opuścić układ słoneczny, musimy mu nadać tak dużą prędkość,by energia kinetyczna dominowała nad członem potencjalnym. Minimalna taka prędkość:v =

√2αr, odpowiadająca odległości r od Słońca nazywa się trzecią prędkością kosmiczną

w tym miejscu.Środkiem geometrycznym elipsy jest punkt, w którym zeruje się zmienna x, tzn. w któ-

rym x = − ǫ1−ǫ2 . Natomiast Słońce znajduje się w punkcie x = 0, odległym od środka elipsy

o wartość tzw. ogniskowej f = ǫ1−ǫ2 . Punkt ten nazywa się ogniskiem elipsy (zob. Rysunek

12). Rozmiary elipsy można odczytać, gdy przepiszemy równanie trajektorii (264) w jeszczeinny sposób:

(xp1−ǫ2

)2+

y

p√1−ǫ2

2

= 1 . (265)

91

Page 98: Rozn. Geom_ - Jerzy Kijowski

Widzimy, że dłuższa oś elipsy, odpowiadająca kierunkowi osi „x”, wynosi

a =p

1− ǫ2 ,

natomiast krótsza oś, odpowiadająca kierunkowi osi „y” wynosi

b =p√1− ǫ2

.

–0.5

–0.25

0.25

0.5

–1 –0.5 0.5 1

Rysunek 12: Ogniska elipsy w x = −1 i x = 1.

Uwaga 1: Z powyższej analizy wynikają właśnie prawa ruchu planet, które zostaływcześniej odkryte na drodze obserwacyjnej. Są to tzw. prawa Keplera. Pierwsze z nichmówi, że planety poruszają się po elipsach, i że Słonce leży w jednym z dwóch ognisk takiejorbity. Drugie prawo to prawo zachowania momentu pędu (250), które można zapisać wpostaci:

J = r2ϕ . (266)

Zauważmy, że r2∆ϕ = r2ϕ∆t jest powierzchnią pola „zamiecioną” na płaszczyźnie ruchuw czasie ∆t przez poruszającą się planetę. A zatem r2ϕ jest prędkością tego „zamiatania”.Nazywamy ją „prędkością polową”. A zatem drugie prawo Keplera mówi, że prędkośćpolowa pozostaje stała w czasie ruchu planety. Oznacza to, że blisko Słońca, gdy r jestmałe, planeta musi mieć większą prędkość kątową niż daleko od Słońca, gdzie r jest duże,bowiem iloczyn r2ϕ nie zmienia się (zob. Rysunek 13). Zjawisko takiego przyśpieszenia wpobliżu perihelium zostało wyraźnie zaobserwowane przez Keplera.Natomiast trzecie prawo Keplera wynika z praw skalowania równania (240). Jeśli ~r =

~F (t) jest rozwiązaniem tego równania, to dla dowolnej liczby c > 0 również

~r = ~G(t) = c2 ~F(t

c3

),

bowiem czynnik skalowania długości uprości się z czynnikiem skalowania czasu powsta-łym podczas dwukrotnego różniczkowania po czasie. Jeśli pierwsza orbita miała rozmiar

92

Page 99: Rozn. Geom_ - Jerzy Kijowski

Rysunek 13: Drugie prawo Keplera: prędkość „polowa” jest stała.

dłuższej osi równy a1, to druga, powstała z niej przez skalowanie, będzie miała rozmiara2 = c2a1. Jeśli natomiast okres obiegu pierwszej wynosił T1, to znaczy jeśli zachodziło

~F (t+ T ) = ~F (t) ,

to teraz mamy

~G(t+ c3T ) = c2 ~F

(t+ c3Tc3

)= c2 ~F

(t

c3+ T

)= c2 ~F

(t

c3

)= ~G(t) ,

zatem okres obiegu na drugiej orbicie wynosi T2 = c3T . Wobec tego zachodzi proporcja:

T 21a31=T 22a32

, (267)

czyli kwadraty czasów obiegu poszczególnych planet wokół Słońca są proporcjonalne dosześcianów rozmiarów ich orbit.Uwaga 2: Możemy teraz pokazać, że zależność położenia planety od czasu nie jest

funkcją elementarną, zatem próba analitycznego całkowania równania Newtona (240) lub(244) była z góry skazana na niepowodzenie. Rzeczywiście, równanie zachowania momentupędu (266) oznacza, że mamy:

dϕdt=J

r2=J

p2(1 + ǫ cosϕ)2 ,

lub

dt =p2

J

(1 + ǫ cosϕ)2.

Całka ta da się wyrazić poprzez funkcje elementarne, jednak otrzymane w ten sposóbrównanie na zmienną t = t(ϕ) jest przestępne i nie da się analitycznie rozwiązać ze względuna niewiadomą ϕ. Zależność ϕ = ϕ(t) (a zatem również r = r(t)) nie jest zatem danafunkcją elementarną.

93

Page 100: Rozn. Geom_ - Jerzy Kijowski

Uwaga 3: Oddziaływanie elektrostatyczne wygląda bardzo podobnie do grawitacyj-nego z tym, że w zależności od ładunków obu ciał, siła może być przyciągająca (jak dlagrawitacji) lub odpychająca. Ta ostatnia sytuacja odpowiada zmianie znaku współczynnikaα we wzorze (240) i następnych. Łatwo sprawdzić, że nasza metoda daje w tym przypadkutrajektorię hiperboliczną (zob. Rysunek 14) w postaci

r =p

−1 + ǫ cos(ϕ− ϕ0), (268)

gdzie, podobnie jak w (260) dla sił przyciągających, mamy:

p :=J2

|α| ; ǫ :=

1 +2EJ2

α2> 1 . (269)

–1

–0.5

0

0.5

1

–2 –1 1 2

Rysunek 14: Ogniska hiperboli w x = −1 i x = 1.

94

Page 101: Rozn. Geom_ - Jerzy Kijowski

4 Kowektory

4.1 Kowektor jako infinitezymalna funkcja kosztów. Różniczkafunkcji. Wiązka ko-styczna

Kowektory na rozmaitości M to obiekty dualne do wektorów, czyli funkcjonały liniowe nawektorach. Możemy wyobrażać sobie kowektor zaczepiony w punkcie x ∈ M jako „czarnąskrzynkę”, która ma jedno wejście i jedno wyjście. Na wejściu możemy „wkładać” wektoryzaczepione w x, a na wyjściu otrzymujemy wynik całej operacji w postaci liczby. Jeśliwynik zależy w sposób liniowy od wektora „włożonego” na wejściu, to taka czarna skrzynkajest właśnie kowektorem. Wartość działania kowektora α ∈ T ∗

xM na wektorze v ∈ TxM

oznaczamy jako α(v).Fizycznym modelem kowektora jest „infinitezymalna funkcja kosztów” potrzebna do

„infinitezymalnego przesunięcia” układu fizycznego znajdującego się w stanie x o wektorv ∈ TxM . Gdy odwołać się do obrazu „fabryki chemicznej”, wspomnianego w rozdziale 2.3,to mamy następującą sytuację: Używając pokręteł na desce rozdzielczej w sterowni fabryki,dyżurny operator może spowodować zmianę stanu przetwarzanej substancji chemicznej zx ∈M do sąsiedniego stanu GXε (x) ≃ x+εv, gdzie przez v oznaczyliśmy wartość pola X wpunkcie x, tzn. v = X(x). Każdemu takiemu procesowi odpowiada koszt F (X, ε): dodatni,gdy proces wymaga od nas poniesienia nakładów (np. wydatków na koszt energii elek-trycznej potrzebnych do napędu urządzeń sterujących) lub ujemny, gdy w trakcie procesuodnotujemy zysk (np. uzyskamy energię). Infinitezymalnie, to znaczy dla małych warto-ści parametru ε, możemy przybliżyć ten koszt jego pochodną, czyli wyrażeniem zależnymliniowo od infinitezymalnego przesunięcia εv:

F (X, ε) = εα(v) + o(ε) .

I właśnie to liniowe wyrażenie α(v) nazywa się często „infinitezymalną funkcję kosztów”.W odniesieniu do zjawisk czysto mechanicznych termin „koszt” zastępuje się często

terminem „praca”, a „praca infinitezymalna” to po prostu „siła”.A zatem siła nie jest wektorem lecz kowektorem! Zdezorientowany czytelnik ma prawo

żądać wyjaśnień. Przecież w szkole, a nawet w poprzednim rozdziale niniejszej książki, opi-saliśmy siłę ~F jako wektor! Należy natychmiast wyjaśnić, że opis kowektora przy pomocywektora jest możliwy dopiero przy zastosowaniu dodatkowej struktury, którą poznamy wRozdziale 6. Struktura ta pozwala rzeczywiście skonstruować izomorfizm między wektora-mi i kowektorami. W pewnych sytuacjach takie izomorficzne obiekty: kowektory i wektory,można utożsamiać, co niekiedy pozwala nawet uprościć pewne rachunki. Jednak dużo czę-ściej takie utożsamienie prowadzi do przykrych nieporozumień. Podkreślamy, że z punktuwidzenia podstawowych struktur geometrycznych siła jest „infinitezymalną funkcją kosz-tów” a więc kowektorem, a nie wektorem. Na obecnym etapie naszego wykładu nie mamyżadnej możliwości aby te zupełnie odmienne obiekty geometryczne utożsamiać.Będziemy również używać następującej notacji:

α(v) =: 〈α,v〉 . (270)

95

Page 102: Rozn. Geom_ - Jerzy Kijowski

Liniowość kowektora oznacza liniowość wyrażenia 〈· , · 〉 w drugim argumencie:

〈α, av + bw〉 = a 〈α,v〉+ b 〈α,w〉 . (271)

Zbiór wszystkich kowektorów zaczepionych w punkcie x ∈ M nazywamy przestrzenią ko-styczną do M w tym punkcie i oznaczamy:

T ∗xM := (TxM)

∗ . (272)

Nosi ona naturalną strukturę przestrzeni wektorowej dualnej (dwoistej) względem TxM ,gdzie dodawanie i skalowanie kowektorów definiuje się przy pomocy dodawania i skalowaniawyników ich działania na wektorach:

〈aα + bβ,v〉 := a 〈α,v〉+ b 〈β,v〉 , (273)

co formalnie odpowiada liniowości operacji 〈· , · 〉 również w pierwszym argumencie.Definicja. Różniczką funkcji f ∈ C1(M) w punkcie x nazywamy kowektor df(x), ktoregowartość na dowolnym wektorze vx jest równa pochodnej f względem tego wektora:

〈df(x),vx〉 := vx(f) . (274)

Pole kowektorowe, będące kolekcją kowektorów df(x) wziętych w punktach, w których fjest określona, nazywamy różniczką funkcji f i oznaczamy df .Twierdzenie: Zbiór (dxk) różniczek wszystkich współrzędnych xk stanowi bazę prze-

strzeni ko–stycznej T ∗xM w każdym punkcie x leżącym w dziedzinie tego układu współ-

rzędnych. W szczególności różniczka dowolnej funkcji f rozkłada się w tej bazie wedługwzoru:

df =∂f

∂xkdxk . (275)

Dowód: Niech będzie dany kowektor α ∈ T ∗xM . Na mocy liniowości jego wartość na

dowolnym wektorze TxM ∋ v = vi ∂∂xi wynosi:

〈α,v〉 = vi⟨α,

∂xi

⟩. (276)

Ale, jak to wiemy z podstawowej formuły (48), składowa vi wektora w danej mapie jestrówna wartości tego wektora w działaniu na odpowiednią współrzędną xi:

vi = v(xi) =⟨dxi,v

⟩. (277)

Oznaczając

αi :=

⟨α,

∂xi

⟩(278)

mamy:〈α,v〉 =

⟨dxi,v

⟩αi =

⟨αidxi,v

⟩. (279)

96

Page 103: Rozn. Geom_ - Jerzy Kijowski

Równość ta oznacza, że dwa funcjonały liniowe: „α” oraz „αidxi” dają ten sam wynik nadowolnym wektorze v. Są to zatem identyczne kowektory:

α = αidxi . (280)

Pokazaliśmy, że każdy kowektor może zostać przedstawiony jako kombinacja liniowa róż-niczek współrzędnych xi. Aby wykazać, że różniczki te stanowią bazę w przestrzeni T ∗

xM

musimy udowodnić, że różniczki te stanowią układ liniowo niezależny. Fakt ten wynika znastępującej obserwacji: ⟨

dxi,∂

∂xj

⟩=

∂xjxi = δij , (281)

a zatem układ (dxi) stanowi w przestrzeni ko–stycznej T ∗xM bazę dualną względem bazy

( ∂∂xj) w przestrzeni stycznej TxM . W szczególności wzór (275) wynika z (278), będącego

kowektorowym odpowiednikiem wektorowej formuły (277).

Zbiór wszystkich kowektorów, zaczepionych we wszystkich punktach rozmaitości Mnazywa się wiązką ko-styczną do M i oznacza T ∗M :

T ∗M :=⋃

x∈MT ∗xM . (282)

Rozkład (280) kowektora w bazie różniczek współrzędnych pozwala przypisać elementowiprzestrzeni ko-stycznej

αx := αidxi ∈ T ∗xMwartość parametrów (xk, αi), gdzie (xk) są współrzędnymi jego punktu zaczepienia x ∈M ,zaś (αi) — składowymi kowektora w bazie różniczek dxi. W ten sposób skonstruowaliśmylokalny układ współrzędnych (xk, αi) w T ∗M , dzięki czemu zbiór ten staje się rozmaito-ścią różniczkowalną. Podobnie jak w przypadku wiązki stycznej, mamy tu zdefiniowanąkanoniczną operację rzutowania na bazę M :

π : T ∗M 7→M , (283)

która dowolnemu kowektorowi przypisuje jego punkt zaczepienia wM . Czwórka (T ∗M,π,M,Rn)jest wiązką wektorową o włóknie typowym równym Rn.Zauważmy jeszcze, że formuła (275) implikuje następujące prawo transformacyjne dla

składowych kowektora przy przejściu do innego układu współrzędnych:

α = αidxi = αi∂xi

∂yjdyj = αjdyj , (284)

a zatem:

αj = αi∂xi

∂yj. (285)

97

Page 104: Rozn. Geom_ - Jerzy Kijowski

W odróżnieniu od prawa transformacyjnego (54) dla składowych wektora, w których wystę-powała macierz pochodnych nowych współrzędnych względem starych, tutaj występuje ma-cierz do niej odwrotna, odpowiadająca różniczkowaniu starych współrzędnych po nowych.Oczywiście nie warto uczyć się takich wzorów na pamięć, skoro wynikają one natychmiastz twierdzenia o pochodnej superpozycji, zapisanego bądź w wersji „wektorowej” (53):

∂yj=∂xi

∂yj∂

∂xi,

bądź w wersji „kowektorowej” (284):

dxi =∂xi

∂yjdyj .

4.2 Transport odwrotny („pull back”) kowektora

Ponieważ wektory transportują się do przodu przy odwzorowaniu stycznym, to kowektory,będące obiektami do nich dualnymi, transportują się „do tyłu”. Każde zatem odwzorowanieróżniczkowalne F :M → N oraz jego odwzorowanie styczne F∗ : TxM → TF (x)N definiujew naturalny sposób odwzorowanie:

F ∗ : T ∗F (x)N → T ∗xM (286)

dane oczywistym wzorem〈F ∗α,v〉 := 〈α, F∗v〉 . (287)

Odwzorowanie to nazywa się obrazem odwrotnym (inaczej: „pull back”) kowektora.Jeśli (xk) są lokalnymi współrzędnymi na M w otoczeniu punktu x zaś (yj) lokalnymi

współrzędnymi na N w otoczeniu punktu F (x), gdy ponadto odwzorowanie F jest opisanew tych współrzędnych funkcjami F j :

(xk)→ (F j(x)) = (yj) , (288)

zaś

α = αidyi , (289)

v = vk∂

∂xk, (290)

to otrzymujemy:

〈F ∗α,v〉 = 〈α, F∗v〉 =⟨α, vkF∗

∂xk

⟩=

⟨α, vk

∂F j

∂xk∂

∂yj

= vk∂F j

∂xk

⟨αidyi,

∂yj

⟩= vk

∂F j

∂xkαi

⟨dyi,

∂yj

⟩= vk

∂F j

∂xkαiδij

= vk∂F j

∂xkαj =

⟨dxk,v

⟩ ∂F j

∂xkαj =

⟨∂F j

∂xkαjdxk,v

⟩.

98

Page 105: Rozn. Geom_ - Jerzy Kijowski

„Upraszczając” ten wzór przez wektor v otrzymujemy wyrażenie współrzędniowe na prze-niesiony kowektor:

F ∗α =∂F j

∂xkαjdxk = αjdF j .

Prawdę mówiąc, uprawiając matematykę stosowaną zawsze warto pisać tę formułę w na-stępującej postaci:

F ∗α = αjdyj = αj∂yj

∂xkdxk , (291)

rozumiejąc, że w odróżnieniu od samej definicji (289) kowektora α, gdzie yj były niezależ-nymi współrzędnymi na N , tutaj należy je traktować jako funkcje zmiennych (xk) daneodwzorowaniem (288). Taki „nieścisły” zapis znacznie upraszcza notację. Daje to możliwośćwykonania trudnych rachunków w sytuacjach, gdy „ścisły” zapis czyniłby je niemożliwymido ogarnięcia. Wzór (291) należy rozumieć następująco: transport odwrotny („pull back”)kowektora jest „transformacją podstawienia”, gdzie na miejsce zmiennych yj należy podsta-wić odpowiednie funkcje zmiennych xk realizujące odwzorowanie F . Podobnie jak to miałomiejsce w rozdziale 2.12 dla wektorów (patrz wzór (112)), wzór ten odtwarza formułę (285)na trasformację składowych kowektora przy zmianie układu współrzędnych9 gdy jako Fwziąć identyczność: F = id.Twierdzenie 1: Zachodzi następujące prawo składania operacji obrazu odwrotnego

kowektorów, formalnie identyczne z pierwszym punktem Twierdzenia z rozdziału 2.14,dotyczącym obrazu odwrotnego funkcji:

(G F )∗ = F ∗ G∗ . (292)

Dowód: jest oczywisty, podobnie jak to było w rozdziale 2.14.

Twierdzenie 2: Operacja „pull back” jest przemienna z operacją różniczkowania funk-cji:

F ∗df = dF ∗f . (293)

Dowód: Przy zastosowaniu opisu współrzędnościowego dowód wynika natychmiast z(291) oraz ze wzoru na pochodną superpozycji. Dowód abstrakcyjny, wykorzystujący jedy-nie definicje obu operacji, jest jeszcze prostszy:

〈F ∗df,v〉 = 〈df, F∗v〉 = (F∗v)(f) = v(F ∗f)= 〈dF ∗f,v〉 .

Ćwiczenie: Niech M będzie trójwymiarową przestrzenią euklidesową, którą opisujemyprzy pomocy zmiennych kartezjańskich. Rozważmy odwzorowanie polegające na obrocieM o kąt „t” wokół osi „z”, to znaczy: F = GZt , gdzie Z jest generatorem obrotów, czyli9We wzorze (285) współrzędne xk były „stare” a yj były „nowe”. Natomiast we wzorze (291) jest

odwrotnie. Stąd zamiana roli „iksów” z „igrekami” w obu tych wzorach.

99

Page 106: Rozn. Geom_ - Jerzy Kijowski

polem wektorowym danym wzorem Z = x ∂∂y− y ∂

∂x(patrz wzór (181)). Jak wyliczyliśmy

poprzednio (patrz wzór (183)), mamy

F (x, y, z) = (x cos t− y sin t, x sin t+ y cos t, z) = (x, y, z) .Zatem obraz odwrotny funkcji x jest dany wzorem

F ∗(x) = x cos t− y sin t .Korzystając z Twierdzenia 2 możemy znaleźć obraz odwrotny ko-wektora dx przy obrociewokól osi „z”:

(GZt)∗(dx) = d

(GZt)∗(x) = d(x cos t− y sin t) = dx · cos t− dy · sin t . (294)

4.3 Całkowanie pola kowektorowego po krzywych. Orientacja roz-maitości

Pole kowektorowe, to cięcie wiązki ko-stycznej. Taka definicja, podobnie jak definicja polawektorowego w rozdziale 3.1, oznacza, iż pole kowektorowe α jest gładkim odwzorowaniem

α :M → T ∗M ,

z bazy M wiązki ko-stycznej w jej przestrzeń, spełniającym warunek, że rzut π czyni zeńtożsamość: π α = id. W potocznym języku „pole” oznacza rozległy obszar, na którymrosną gęsto jakieś rośliny: wektory w przypadku pola wektorowego czy kowektory w przy-padku pola kowektorowego. W ustalonym układzie współrzędnych (xk) pole kowektorowejest całkowicie określone przez podanie n = dimM funkcji αk = αk(x) równych składowympola w bazie dxk:

α(x) = αk(x) dxk .

Gładkość pola to gładkość tych funkcji.Każdy skończony proces, czyli krzywą sparametryzowaną R ⊃ [a, b] ∋ t → γ(t) ∈ M ,

możemy w myśli traktować jako sekwencję „procesów infinitezymalnych” w sensie Roz-działu 3.5 (zob. także wzór (192)):

M ∋ x→ x+ ǫv + o(ǫ) ∈M ,

gdzie v = γ(t) ∈ TxM jest wektorem stycznym do krzywej: γ(t) = γ∗ ∂∂t . Pole kowektoroweα na M pozwala obliczyć „infinitezymalny koszt”: α(v) = 〈α,v〉 takiego procesu infinite-zymalnego. Te infinitezymalne koszty można scałkować i w ten sposób obliczyć całkowitykoszt procesu α. Ten koszt całkowity jest zatem równy następującej wielkości:Definicja: Całką z pola kowektorowego α po krzywej sparametryzowanej γ nazywamy

liczbę:∫

γα :=

∫ b

a〈α(γ(t)), γ(t)〉dt =

∫ b

a

⟨α(γ(t)), γ∗

∂t

⟩dt

=∫ b

a

⟨γ∗α,

∂t

⟩dt . (295)

100

Page 107: Rozn. Geom_ - Jerzy Kijowski

W układzie współrzędnych (xk) na M transport odwrotny pola α = αidxi z M na ośliczbową R jest równy, zgodnie z formułą (291)

γ∗α = xiαidt = ϕ(t)dt . (296)

Można byłoby pomyśleć, że całka (295) jest po prostu całką z „funkcji” ϕ po osi liczbowej.Ale ϕ nie jest funkcją! Zależy bowiem od wyboru parametryzacji. Gdy zamiast t wybraćinny parametr s na osi liczbowej, wtedy pochodne xi zmienią się. Zmieni się zatem wartośćϕ. Ale zmieni się również dt na ds w taki sposób, że całe wyrażenie ϕ(t)dt nie ulegniezmianie. Jest to stwierdzenie banalne, bowiem zgodnie z (296) wyrażenie to jest polemkowektorowym na osi rzeczywistej, równym γ∗α. Mamy bowiem na mocy wzoru (296):

ϕ(t)dt =dxi

dtαidt =

dxi

dtαidtdsds =

dxi

dsαids = ϕ(s)ds , (297)

a zatem wyrażenie podcałkowe w formule (295) nie ulega zmianie przy zmianie parame-tryzacji. Widać więc, że to co naprawdę umiemy całkować to nie są żadne funkcje, ale polakowektorowe! Jakiż sens miałoby np. całkowanie temperatury, która jest funkcją skalarną?Tymczasem całkowanie siły — nieważne, czy wyrażamy ją w jednostkach energii na metrczy na cal przesunięcia — daje jednoznacznie wartość wykonanej pracy, niezależnie od tegojakiej parametryzacji użyjemy.Z powyższych rozważań wynikaTwierdzenie: Całka (295) (czyli koszt całkowity procesu) nie ulegnie zmianie, jeśli do

jej obliczenia użyjemy innej parametryzacji krzywej γ, ale takiej, by kierunek procesu nieuległ zmianie. Dokładniej: jeśli

[a, b] ∋ s→ φ(s) = t ∈ [a, b] ,

spełnia warunek φ′ = ∂t∂s> 0, to całka z dowolnego pola kowektorowego po reparametry-

zowanej krzywej:γ(s) := γ(φ(s)) = (γ φ)(s) ,

jest równa jego całce po γ: ∫

γα =

γα .

Dowód: Równość tych całek wynika z tożsamości (297). Można też podać prosty dowódnie posługujący się układem współrzędnych:

⟨· , ∂∂s

⟩ds =

⟨· , ∂t∂s

∂t

⟩ds =

⟨· , ∂∂t

⟩∂t

∂sds =

⟨· , ∂∂t

⟩dt , (298)

który natychmiast daje tezę jeśli w całce (295) zastosować podstawienie t = φ(s) i skorzy-stać z faktu, że φ(a) = a oraz φ(b) = b.

101

Page 108: Rozn. Geom_ - Jerzy Kijowski

Uwaga: Jeśli nowa parametryzacja zmienia kierunek procesu, tzn. jeśli mamy φ′ =∂t∂s< 0, to zachodzą tożsamości: φ(a) = b oraz φ(b) = a. Stosując powyższe argumenty

otrzymamy zatem:∫

γα =

∫ φ(a)

φ(b)

⟨γ∗α,

∂t

⟩dt =

∫ a

b

⟨γ∗α,

∂s

⟩ds = −

∫ b

a

⟨γ∗α,

∂s

⟩ds

= −∫

γα . (299)

Zmiana kierunku procesu powoduje więc zmianę jego kosztu na przeciwny! Zgadza się to znaszą podstawową intuicją dotyczącą funkcji kosztów: jeśli proces zakupu wiąże się z ponie-sieniem kosztu K, to w procesie przeciwnym, polegającym na odsprzedaniu zakupionegowcześniej przedmiotu, powinniśmy odzyskać tę kwotę, czyli ponieść koszt równy −K. Jeśliprzepompowanie wody do górnego zbiornika w elektrowni szczytowo-pompowej wymagawykonania pracy K, to następnie spuszczenie tej wody na turbiny elektrowni powinnoskutkować wyprodukowaniem tej samej energii, czyli wydatkiem równym −K. Wszystkoto są oczywiście modele wyidealizowane, ale w wielu sytuacjach dobrze opisujące sytuacjęfizyczną.Powyższe rozważania prowadzą do wniosku, że do całkowania pola wektorowego po

krzywej wcale nie potrzebujemy żadnej parametryzacji: może to zatem być krzywa niespa-rametryzowana, czyli jedno-wymiarowa podrozmaitość D ⊂M rozmaitości M . Koniecznyjest jednak wybór orientacji, to znaczy „kierunku” procesu ponieważ, jak pokazaliśmypowyżej, całka zmienia znak gdy zmienimy orientację na przeciwną. Jak pamiętamy z Roz-działu 2.15, struktura takiej podrozmaitości jest dana przez atlas A, to znaczy rodzinęparametryzacji. Gdy κ, λ ∈ A są dwiema takimi parametryzacjami, to mówimy, że są onezgodne, lub wyznaczają tę samą orientację jeśli λ−1 κ jest funkcją rosnącą — tam gdziejest określona. Oznacza to, że zachodzi nierówność:

(λ−1 κ

)′> 0 . (300)

Gdy D jest rozmaitością wymiaru k ­ 1, wtedy λ−1 κ jest odwzorowaniem z przestrzeniparametrów Rk w Rk, a jego pochodna jest reprezentowana przez macierz Jacobi’ego roz-miaru k×k. I wtedy zgodność map rozumiemy w ten sposób, że jej wyznacznik (Jacobian)ma być dodatni:

det(λ−1 κ

)′> 0 . (301)

Definicja: Orientacją rozmaitości D nazywamy wybór atlasu A zgodnego, to znaczytakiego, że dowolne dwie mapy z tego atlasu są zgodne w tym sensie, że spełniają nierów-ność (301). Gdy na D została wybrana orientacja, to parę (D,A) nazywamy rozmaitościązorientowaną.Przypadek wymiaru większego niż 1 będziemy szczegółowo omawiali w Rozdziale 5.

Natomiast w przypadku jednowymiarowym wybór orientacji na krzywej można sobie wy-obrażać jako dorysowanie do niej strzałki pokazującej kierunek przebiegu procesu.W praktyce chodzi o to, że na rozmaitości zorientowanej można wyróżnić dwie kla-

sy map: takie, dla których Jacobian transformacji do dowolnej mapy należącej do atlasu

102

Page 109: Rozn. Geom_ - Jerzy Kijowski

definiującego orientację jest dodatni i takie, dla których jest on ujemny. Mapy należącedo pierwszej klasy nazywamy zgodnymi z orientacją, a drugiego rodzaju – niezgodnymi zorientacją. Jeśli jednak mamy mapę tego drugiego rodzaju, to bardzo łatwo otrzymać ma-pę pierwszego rodzaju zamieniając kolejność jakichkolwiek dwu współrzędnych. Np. mapy(x, y, z) oraz (r, θ, ϕ) definiują w przestrzeni euklidesowej E3 tę samą orientację. Natomiastmapy (y, x, z) oraz (r, ϕ, θ) czy też (ϕ, θ, r) definiują orientację przeciwną.Istnieją rozmaitości nieorientowalne, to znaczy takie, na których nie udaje się wybrać

żadnej orientacji. Przykładem jest tu „wstęga Mobiusa” omówiona w Rozdziale 2.16. Gdy-by chcieć zacząć budować orientację, to można ją wybrać lokalnie, w małym kawałku.Dodając mapy tak, by jakobian przejścia do poprzednio wybranych map był dodatni, moż-na uzyskiwać coraz większe ich kolekcje. Nie uda się jednak uzyskać atlasu, bowiem — jakpokazują wzory (132) i (133) — próba pokrycia całej wstęgi Mobiusa zakończy się tym, żew jakimś kawałku jakobian przejścia będzie musiał być ujemny.

4.4 Rozmaitość z brzegiem. Najprostsza wersja twierdzenia Sto-kes’a

Gdy mamy jednowymiarową podrozmaitość zorientowaną D, to w zasadzie możemy zabraćsię do całkowania po niej pól kowektorowych. Chcemy jednak uniknąć całek niewłaściwych,które mogą być rozbieżne. Ograniczymy się więc na razie do przypadku gdy D jest zwarta.Chcemy też dopuścić krzywe z brzegiem, takie jak np. odcinek z końcami [a, b] ⊂ R, uży-wany w poprzednim rozdziale. Obie definicje podrozmaitości z Rozdziału 2.15 wykluczajątakie zbiory. Warto je zatem rozszerzyć, by objąć przypadki ważne w dalszych zastosowa-niach. Jako punkt wyjścia przyjmiemy Definicję 2 z tamtego rozdziału.Definicja: Podzbiór D ⊂ M rozmaitości różniczkowalnej M wymiaru n nazywamy

jednowymiarową podrozmaitością różniczkowalną z brzegiem, jeśli każdy punkt x ∈ Dposiada otoczenie O ⊂ M , które jest otwarte w M , a w nim układ funkcji (H,Gi), i =1, . . . , r = n−1 taki, że D∩O jest miejscem geometrycznym rozwiązań układu regularnego

G1(x) = 0 ,...Gr(x) = 0 ,

H(x) ¬ 0 ,

(302)

przy czym „regularność” oznacza, że w każdym punkcie x ∈ D różniczki dGi wszystkichfunkcji Gi są liniowo niezależne, natomiast w punktach, w których dodatkowo zeruje sięrównież funkcja H , to również układ różniczek (dGi, dH) jest liniowo niezależny.I teraz możemy juz obliczyć całkę z pola kowektorowego po zwartej, zorientowanej

podrozmaitości z brzegiem D ⊂M .Definicja: Gdy istnieje globalna parametryzacja naszej podrozmaitości:

R ⊃ [a, b] ∋ t→ γ(t) ∈ D ⊂M ,

103

Page 110: Rozn. Geom_ - Jerzy Kijowski

i to zgodna z orientacją D, to kładziemy∫

Dα :=

γα . (303)

Gdy ta parametryzacja jest niezgodna z orientacją, to prawą stronę opatrujemy znakiem„minus”. Możemy też wziąć inną parametryzację: „s = −t” i ta już będzie zgodna z orienta-cją. W każdym razie wiemy, że tak zdefiniowana całka nie zależy od wyboru parametryzacji.Gdy nie istnieje globalna parametryzacja, wtedy dzielimy D na kawałki, dla których

istnieje globalna parametryzacja i definiujemy całkę jako sumę całek po tych kawałkach.Addytywne własności całki gwarantują niezależność wyniku od takiego podziału.

W wielu wykładach Analizy Matematycznej symbol „dt” występujący w całce

Dα :=

∫ b

aϕ(t)dt ,

traktuje się po macoszemu, jako „światło latarni na końcu pociągu”. Tak może myślećjedynie matematyk abstrakcyjny, dla którego zmienna t jest jedyną, absolutną parametry-zacją osi liczbowej, czyli sceny, na której odbywa się cała operacja całkowania. Tymczasemmatematyk stosowany, który chce modelować realną rozmaitość różniczkową, opisującąnp. zbiór możliwych stanów układu fizycznego, musi traktować t jako jedną z wielu możli-wych parametryzacji konkretnego procesu fizycznego. Teatrem wszystkich tych działań niejest zatem oś liczbowa R, czy jej podzbiór, ale rozmaitość różniczkowalna D ⊂M . Do róż-nych celów można stosować jej różne parametryzacje. Jedne są wygodniejsze rachunkowo,inne mniej, ale żadna z nich nie jest wyróżniona. Przyjmując tę filozofię widzimy, że niewolno pominąć symbolu „dt” w powyższym wzorze, bowiem funkcja podcałkowa ϕ danawzorem (296) też zależy od wyboru parametryzacji. Pomijając „dt” otrzymalibyśmy coś,co jest jedynie „napisem” bez żadnego sensu matematycznego.Przykład: Gdy pole kowektorowe jest różniczką funkcji: α = df , i gdy istnieje globalna

parametryzacja, wtedy na mocy definicji (295) otrzymujemy:

Ddf :=

∫ b

a

⟨df(γ(t)), γ∗

∂t

⟩dt =

∫ b

a

∂t(f(γ(t))) dt = f(γ(b))− f(γ(a)) .

Ostatnia równość to nic innego jak podstawowe twierdzenie rachunku różniczkowego icałkowego: całka z różniczki jest równa różnicy wartości funkcji na brzegach! W naszymprzypadku brzeg rozmaitościD to dwa punkty: γ(a) i γ(b). Odgrywają one jednak odmiennąrolę: punkt odpowiadający wartości a parametru jest początkiem zaś punkt odpowiadającywartości b jest końcem naszej rozmaitości. Warto spojrzeć na różnicę „f(γ(b))− f(γ(a))”jako na „całkę” z „pola skalarnego” reprezentowanego funkcją f po „zero-wymiarowejrozmaitości” składającej się z tych dwóch punktów: początku γ(a) oraz końca γ(b). Punktyte niosą jednak różną orientację: koniec jest zorientowany „dodatnio”, to znaczy „całkaz pola skalarnego” po tym punkcie jest po prostu wartością funkcji opatrzoną znakiem„plus”, natomiast początek jest zorientowany „ujemnie”, to znaczy „całka” jest równa

104

Page 111: Rozn. Geom_ - Jerzy Kijowski

wartości funkcji opatrzonej znakiem „minus”. Taki skończony zestaw punktów opatrzonychznakami „plus” lub „minus” możemy nazwać „zorientowaną rozmaitością wymiaru zero”.W wypadku rozważanym powyżej zestaw „plus koniec oraz minus początek” nazywa siębrzegiem rozmaitości zorientowanej D i oznacza się jako ∂D:

∂D := +γ(b),−γ(a) . (304)

W ten sposób twierdzenie podstawowe rachunku różniczkowego i całkowego możemy zapi-sać w następujący sposób: ∫

Ddf =

∂Df . (305)

Pisząc w rozdziale 4.3, że nigdy nie całkujemy funkcji , to myśleliśmy o całkowaniu pokrzywej, powierzchni dwuwymiarowej, czy też jeszcze więcej wymiarowym obszarze. Tutajnatomiast całkujemy po „rozmaitości zero-wymiarowej”, czyli operujemy wartością funkcjiw punkcie. I to jest to, do czego zostały stworzone funkcje!Jak się okaże w dalszym ciągu niniejszego wykładu, jest to szczególny przykład niezwy-

kle ogólnego prawa, które nosi nazwę Twierdzenia Stokes’a, a które unifikuje bardzo różnezjawiska odkrywane w naukach przyrodniczych począwszy od XVIII-go wieku. Zauważmyjeszcze, że w ogólnym przypadku mogą zachodzić następujące zjawiska.

1. Globalna parametryzacja może nie istnieć i w celu całkowania jesteśmy zmuszenidzielić D „na kawałki”. Wtedy brzeg jest sumą brzegów poszczególnych kawałków.Zauważmy, że punkty podziału pojawiają się w brzegu dwukrotnie: raz jako konieckolejnego kawałka, opatrzony znakiem plus, a następnie jako początek następnegokawałka, opatrzony znakiem minus. Widać zatem, że te punkty podziału odejmują sięi znów pozostaje tylko koniec opatrzony znakiem plus i początek opatrzony znakiemminus, a wybór konkretnego podziału nie wpływa na wartość całki z f po ∂D.

2. Rozmaitość D może się składać z kilku rozłącznych kawałków, zatem ∂D będzieskładało się z wielu punktów, a nie tylko dwóch.

3. Rozmaitość D może być zamknięta, tak jak okrąg, który parametryzujemy kątemprzebiegającym odcinek [0, 2π], ale utożsamiamy oba końce. Dla ogólnej krzywejzamkniętej punkt początkowy również pokrywa się z końcowym: γ(a) = γ(b), bo-wiem oba są jedynie sztucznie wprowadzonym punktem podziału. Ale opatrzone sąone przeciwnymi znakami, zatem wynik całkowania po ∂D da zawsze zero:

∫∂D f =

f(γ(a))− f(γ(b)) = 0. Piszemy w tym przypadku: ∂D = 0.

Wszystkie powyższe obserwacje można zebrać do następującej definicji brzegu.Definicja: Brzegiem ∂D zorientowanej, zwartej, jedno-wymiarowej rozmaitości róż-

niczkowalnej z brzegiem D jest zbiór punktów, w których nierówność w definicji (302)przechodzi w równość, to znaczy zachodzi H(x) = 0. Punkty te są opatrzone znakami:plusem, jeśli parametryzacja punktów D w otoczeniu x wartością funkcji H jest zgodna zorientacją D i minusem jeśli jest przeciwna. Całka z funkcji po brzegu to suma wartościfunkcji w tych punktach, opatrzonych tymi znakami.

105

Page 112: Rozn. Geom_ - Jerzy Kijowski

Innymi słowy: punkt x ∈ D należy do brzegu jeśli w opisie uwikłanym (302) zachodziH(x) = 0. Opatrujemy go znakiem plus jeśli funkcja H rośnie w kierunku strzałki wyzna-czającej orientację D, czyli gdy strzałka wskazuje na zewnątrz D, oraz znakiem minus jeślimaleje, czyli gdy strzałka wskazuje do wewnątrz D. Zauważmy, że gdy zmienić orientacjęsamego D na przeciwną, czyli wybrać przeciwną strzałkę, to również brzeg ∂D zmieniaznak na przeciwny: koniec staje się początkiem i vice versa. Wtedy obie strony we wzorze(305) zmieniają znak na przeciwny, ale równość pozostaje prawdziwa.

4.5 Potencjalne pole sił. Najprostsza wersja Lematu Poincare

Gdy x0,x ∈ M są dwoma punktami rozmaitości M , zaś D jednowymiarową, zwartą pod-rozmaitością z brzegiem i taką, że

∂D = +x,−x0 ,

wtedy mówimy, że D jest krzywą o początku w punkcie x0 i końcu w punkcie x, lub poprostu „krzywą łączącą x0 z x”. Twierdzenie Stokes’a z poprzedniego Rozdziału mówi, żecałka z różniczki dowolnej funkcji f jest równa

Ddf = f(x)− f(x0) ,

zatem nie zależy od drogi łączącej oba punkty: gdy D jest inną krzywą łączącą te sa-me punkty, to wynik całkowania jest ten sam:

∫D df =

∫D df . Okazuje się, że własność

powyższa wyróżnia różniczki spośród wszystkich pól kowektorowych.Twierdzenie: Jeśli gładkie pole kowektorowe α ma tę własność, że dla dowolnej pary

punktów x,y ∈ M całka z α nie zależy od drogi łączącej te punkty, to istnieje funkcja f ,której różniczką jest α.Dowód: Wybierzmy dowolny punkt x0 ∈ M i zdefiniujmy funkcję

f(x) =∫

Dα ,

gdzie D jest dowolną krzywą łączącą x0 z x. Ponieważ prawa strona przyjmuje tę samąwartość dla wszystkich krzywych łączących x0 z x, można napisać:

f(x) =∫x

x0

α , (306)

rozumiejąc, że wybieramy do całkowania którąkolwiek z nich. (GdyM jest spójna, to f jestokreślona na całej rozmaitości. W przeciwnym razie naszą procedurę musimy przeprowadzićoddzielnie na każdej jej składowej spójnej.) Jeśli v ∈ TxM jest wektorem zaczepionym wpunkcie x to weźmy dowolne pole wektorowe X które przybiera tę wartość: X(x) = v.Oznaczmy y = GXt (x). Będziemy całkowali nasze pole kowektorowe α po krzywej

[0, t] ∋ τ → γ(τ) := GXτ (x) .

106

Page 113: Rozn. Geom_ - Jerzy Kijowski

Jest to krzywa łącząca punkt x z punktem y. Ale można też wybrać inną krzywą Dłączącą oba te punkty: taką mianowicie, która przechodzi przez punkt x0. Obie całki sąrówne. Mamy zatem

γα =

Dα =

∫x0

x

α +∫y

x0

α = −∫x

x0

α +∫y

x0

α

= f(y)− f(x) .

Druga równość w pierwszym wierszu oznacza, że krzywą D podzieliliśmy na dwa kawałki:pierwszy kawałek od x do x0, a drugi kawałek od x0 do y. W ten sposób, stosując równieżdefinicję (295), otrzymaliśmy wzór:

f(GXt (x))− f(x) =∫

γα =

∫ t

0〈α(γ(τ)), X(γ(τ))〉dτ ,

bowiem to właśnie pole X jest styczne do krzywej γ. Wynika stąd, że funkcja podcałkowajest pochodną prawej strony równania. W szczególności dla t = 0 otrzymujemy:

〈df(x),v〉 = ddtf(GXt (x))

∣∣∣∣∣t=0

= 〈α(γ(0)), X(γ(0))〉 = 〈α(x),v〉 ,

czyli:df = α .

W fizyce i naukach inżynierskich pole kowektorowe, które jest różniczką funkcji, nazy-wamy potencjalnym, a tę funkcję nazywamy potencjałem pola10. Oczywiście potencjał jestzawsze określony z dokładnością do stałej addytywnej, której różniczka zeruje się tożsa-mościowo. Ta dowolność figuruje w definicji (306) w postaci dowolnego punktu x0, którywybraliśmy jako punkt odniesienia, to znaczy ustaliliśmy, że potencjał f ma być równyzeru w tym właśnie punkcie. Ale dowolny inny punkt byłby równie dobry! Tak to jest zdefinicją potencjału pola kowektorowego: definiujemy jego wartość w punkcie x jako pra-cę, potrzebną do przeprowadzenia procesu polegającego na przeprowadzeniu opisywanegoukładu z ustalonego punktu odniesienia x0 do naszego punktu. Definicja ta ma sens wtedyi tylko wtedy gdy całka nie zależy od drogi.Ta metoda poszukiwania potencjału jest szczególnym przypadkiem dużo ogólniejszego

zjawiska, które poznamy w dalszym ciągu i które znane jest w literaturze pod nazwą„lematu Poincare”.

10W zależności od tego, czy α opisuje koszt procesu poniesiony przez nas, czy też uzyskany, funkcjęf nazywa się „potencjałem” lub „minus potencjałem”. W mechanice stosuje się zazwyczaj konwencję wmyśl której siła jest infinitezymalnym kosztem uzyskanym w procesie, równym minus różniczce potencjału(energii potencjalnej). W tej konwencji praca, czyli koszt całkowity, jest równa minus przyrostowi energiipotencjalnej. Jest ona dodatnia, gdy podczas procesu wznieśliśmy stan fizyczny układu na wyższy poziomenergii a ujemna, gdy układ spadł na niższy poziom energetyczny.

107

Page 114: Rozn. Geom_ - Jerzy Kijowski

Przykład:W trójwymiarowej przestrzeni A3 parametryzowanej współrzędnymi (x, y, z)usuńmy początek układu współrzędnych. Na pozostałej rozmaitości różniczkowalnejM po-łóżmy

f(x, y, z) :=1√

x2 + y2 + z2=1r.

Różniczka tej funkcji wynosi:

df = −12

1

(x2 + y2 + z2)32

d(x2 + y2 + z2

)= −xdx+ ydy + zdz

(x2 + y2 + z2)32

= − xr3dx− y

r3dy − z

r3dz .

Właśnie to pole kowektorowe (modulo współczynnik liczbowy) jest obiektem geometrycz-nym reprezentującym adekwatnie siłę przyciągania grawitacyjnego (240), opisywaną wRozdziale 3.11. Energia potencjalna, czyli potencjał tego pola, jest równa właśnie „−f”.

4.6 Uwagi na temat rozkładu jedności i „gładkiego dzielenia tor-tu”

Gdy krzywa D jest zawarta w dziedzinie jednej mapy to „twierdzenie Stokes’a” (305)sprowadza się do podstawowego twierdzenia rachunku różniczkowego i całkowego, w myślktórego całka z różniczki jest równa przyrostowi funkcji na odcinku całkowania. Gdy nieistnieje jedna mapa, która pokrywałaby cały interesujący nas obszar rozmaitości M , toz biurokratycznego punktu widzenia sprawa nieco się komplikuje, bowiem musimy dzie-lić D na kawałki zawarte w poszczególnych mapach a następnie dowodzić, że sztuczniewprowadzone punkty podziału nie dają wkładu do całki brzegowej. Komplikacji tej moż-na uniknąć jeśli posłużyć się tak zwanym „rozkładem jedności”. Wybieg taki jest zawszemożliwy w rozmaitości parazwartej, a takie są na ogół rozmaitości różniczkowalne ważne wzastosowaniach11. Gdy rozmaitość M klasy C l jest parazwarta, wtedy w każde jej pokry-cie (Oi)i∈I zbiorami otwartymi można wpisać różniczkowalny rozkład jedności, to znaczyrodzinę (fj)j∈J funkcji gładkich fj ∈ C l(M) spełniającą następujące warunki:

1. Dla każdego j ∈ J zachodzi 0 ¬ fj(x) ¬ 1.

2. Rodzina jest lokalnie skończona, to znaczy każdy punkt x ∈ M ma otoczenie, naktórym tylko skończona liczba funkcji fj jest różna od zera.

3. Suma wszystkich funkcji fj (dobrze określona na mocy poprzedniego punktu) jestrówna jedności: ∑

j∈Jfj(x) ≡ 1 .

11Przestrzeń parazwarta to taka, że w każde jej pokrycie można wpisać pokrycie lokalnie skończone.Parazwarte są wszystkie rozmaitości zwarte oraz niezwarte rozmaitości skończonego wymiaru, które możnapokryć skończoną liczbą zbiorów zwartych, czyli – ujmując rzecz praktycznie – wszystkie przestrzeniespotykane w zastosowaniach inżynierskich i fizycznych.

108

Page 115: Rozn. Geom_ - Jerzy Kijowski

4. Nośnik każdej funkcji fj jest zawarty w którymś ze zbiorów pokrycia (Oi)i∈I . Nośni-kiem funkcji fj nazywamy zbiór supp fj ⊂ M będący domknięciem zbioru na którymjest ona różna od zera:

supp fj = x ∈M |fj(x) > 0 .

A zatem dla każdego j ∈ J istnieje i ∈ I takie, że supp fj ⊂ Oi.

Ten prosty fakt z topologii (wspartej analizą matematyczną) niezwykle ułatwia życie geo-metry, który musi rozważać rozmaite struktury — na przykład pola kowektorowe α — niemieszczące się w jednej mapie. Jeśli bowiem wziąć pokrycie rozmaitości M dziedzinamimap i wpisany weń rozkład jedności, to odpowiada mu rozkład pola α:

α =∑

j∈Jαj , gdzie αj := α · fj . (307)

Zatem wszelkie manipulacje polem α (na przykład całkowanie) można sprowadzić do ma-nipulacji polami αj , z których każda ma tę zaletę, że „ nie wystaje” poza dziedzinę jednejmapy Oi i wszystkie rachunki na tym polu można prowadzić w jednej, ustalonej mapie.Jeśli więc całkowanie pola pierwszym sposobem: przez wprowadzanie punktów podziału,można porównać do krojenia tortu pionowym cięciem noża (zob. Rysunek 15), to całkowa-nie przy użyciu rozkładu jedności można porównać do krojenia skośnego i to w taki sposób,by grubość otrzymanych kawałków zmieniała się od punktu do punktu w sposób gładki(zob. Rysunek 16). Sposób ten nie ma wielkiego znaczenia praktycznego. Czytelnik zain-teresowany zastosowaniami może o nim zapomnieć. Żaden inżynier nie będzie wprowadzałdo swoich rachunków rozkładu jedności, którego funkcje są bardzo skomplikowane anali-tycznie. Jednak posługiwanie się rozkładem jedności w dowodach wielu twierdzeń znacznieupraszcza ich strukturę logiczną. Będziemy go zatem stosować w przyszłości z nadzieją, żenasz wywód zyska na przejrzystości.

Rysunek 15: Podział tortu pionowymi cięciami noża.

Rysunek 16: Podział tortu z użyciem „rozkładu jedności”.

109

Page 116: Rozn. Geom_ - Jerzy Kijowski

4.7 Uwagi o „całkach niezorientowanych”

Zdefiniowana w Rozdziale 4.4 całka z pola kowektorowego zależy od orientacji krzywej D,po której całkujemy. Koronnym przykładem takiej całki jest właśnie „koszt procesu” i całąnaszą heurystykę zbudowaliśmy na tym przykładzie. W zastosowaniach pojawiają jednakważne całki, które w sposób oczywisty nie zależą od żadnej orientacji: na przykład długośćkrzywej, pole powierzchni, objętość czy też średnia wartość funkcji po ustalonym zbiorze.Również takimi całkami będziemy się zajmowali w dalszym ciągu wykładu. Tymczasemzauważmy jedynie, że „katastrofy” ze zmianą znaku we wzorze (299) dałoby się uniknąć,gdyby kowektor, zamiast reagować „jednorodnie” na skalowanie wektora liczbą rzeczywistąa ∈ R:

α(av) = a · α(v) ,zareagował „dodatnio jednorodnie”, to znaczy gdyby prawdziwy był wzór:

α(av) = |a| · α(v) . (308)

Wtedy przy zmianie orientacji we wzorze (299) zachodziłoby: φ′ = ∂t∂s¬ 0 i pojawiłby się

dodatkowy minus, dzięki czemu całka nie zależałaby od orientacji.Kowektor, jako funkcjonał liniowy na wektorach, nie spełnia równania (308). Można

jednak rozważać takie obiekty, czyli funkcje dodatnio jednorodne na wektorach. Ich całkipo zwartych rozmaitościach (z brzegiem) nie zależą od wyboru parametryzacji. Na przykładgdy α jest kowektorem, to |α| zdefiniowany następująco:

|α|(v) := |α(v)|

jest takim obiektem. Są też i zupełnie inne, które poznamy dalej. Jednak najprostsze po-jęciowo są funkcje liniowe. To dla nich zachodzi Twierdzenie Stokes’a. Dla nich też możnarozważać parametryzacje niemonotoniczne: podczas całkowania możemy się na chwilę cof-nąć, a potem wrócić do poprzedniego kierunku. Mimo tego zawracania całka nie zmienisię, bowiem w obszarze, który przebiegamy trzykrotnie wkład od „cofania się” będzie ani-hilowany przez wkład od jednego z przebiegów w dobrym kierunku. Dlatego też, a równieżz powodu zastosowań takich jak „funkcja kosztów”, praca i inne, podstawową rolę przyopisie całek jednokrotnych odgrywają pola kowektorowe. Właśnie od nich rozpoczęliśmyanalizę pojęcia całki po rozmaitości.

110

Page 117: Rozn. Geom_ - Jerzy Kijowski

5 Formy różniczkowe

5.1 Multi-kowektory. Wyznacznik jako forma objętości

W tym Rozdziale będziemy zajmować się całkami wielokrotnymi. Na przykład powierzch-niowymi, to znaczy dwuwymiarowymi. Albo i więcej wymiarowymi. Ale rozpocznijmy na-sze roważania od całek dwuwymiarowych. Jest wiele całek tego rodzaju: na przykład polepowierzchni, które nie zależy od orientacji, lub strumień pola magnetycznego przez po-wierzchnię, który zależy od orientacji powierzchni. Ta ostatnia wielkość jest bardzo ważna,bowiem zgodnie z prawem indukcji magnetycznej sformułowanym przez M. Faraday’a, si-ła elektromotoryczna wytworzona w uzwojeniu prądnicy jest proporcjonalna właśnie doprędkości zmian tego strumienia.Jakie wielkości geometryczne nadają się do całkowania? Całkowanie polega na sumowa-

niu infinitezymalnych wersji takiej wielkości po „infinitezymalnych kawałkach” powierzchniD. Gdy wybrać jakąś parametryzację powierzchni dwuwymiarowej:

R2 ∋ (t1, t2)→ F (t1, t2) ∈ D ⊂M ,

to „infinitezymalny kawałek” tej powierzchni można sobie wyobrażać jako równoległobokrozpięty przez wektory styczne do powierzchni:

e1 =∂

∂t1, e2 =

∂t2.

Aby wielkość α = α(e1, e2) mogła opisywać „infinitezymalny strumień” jakiejś wielkościfizycznej przez ten „infinitezymalny kawałek” powierzchni, musi się odpowiednio skalowaćwraz ze zmianą tego kawałka. Inaczej nie będzie nadawała się do całkowania, albowiemwynik będzie zależał od wyboru parametryzacji. W szczególności zależność tego „infinite-zymalnego strumienia” od obu wektorów musi być taka, by była niezmiennicza względemprzekształceń zachowujących pole równoległoboku. Od czasów starożytnych wiemy, że „po-chylanie” równoległoboku, polegające na dodaniu do jednego z wektorów wielokrotnościdrugiego wektora (zob. Rysunek 17), nie zmienia jego pola. A zatem wielkość α musi być

e1

e2 e2 + ae1

Rysunek 17: Pochylanie równoległoboku nie zmienia jego pola.

niezmienniczą względem operacji „pochylania” funkcją par wektorów, czyli musi spełniać

111

Page 118: Rozn. Geom_ - Jerzy Kijowski

następujące warunki:

α(e1, e2) = α(e1 + a · e2, e2) , (309)

α(e1, e2) = α(e1, a · e1 + e2) . (310)

Pochylając równoległobok kolejno to w jedną, to w drugą stronę, otrzymujemy z tychdwóch własności następującą tożsamość:

α(e1, e2) = α(e1+e2, e2) = α(e1+e2, e2−(e1+e2)) = α(e1+e2,−e1) = α(e2,−e1) . (311)

Poza tym wiemy, że gdy jeden z wektorów przeskalujemy o liczbę 0 ¬ a ∈ R, to polerównoległoboku przeskaluje się o tę samą liczbę (zob. Rysunek 17). Zatem wielkość α musi

e1

e2

2e2

Rysunek 18: Skalowanie jednego z boków równoległoboku skutkuje skalowaniem jego pola.

spełniać następującą tożsamość, przynajmniej dla liczb dodatnich:

α(a · e1, e2) = a · α(e1, e2) = α(e1, a · e2) . (312)

Teraz wreszcie musimy się zdecydować co do prawa skalowania dla liczb ujemnych. Jeśli αma dawać całkę zależną od orientacji, to przy zamianie jednego z wektorów na przeciwnywartość α(e1, e2) musi zmieniać znak. Decydujemy zatem, że prawo skalowania (312) będzieobowiązywało dla dowolnej liczby a: dodatniej i ujemnej. Wtedy formuła (311) daje nam:

α(e1, e2) = −α(e2, e1) , (313)

czyli α musi być antysymetryczną funkcją swoich dwóch argumentów, tzn. taką, którazmienia znak przy ich zamianie. Oznacza to, że jej wartość musi znikać gdy oba wektory sąproporcjonalne, czyli równoległobok jest zdegenerowany. Rzeczywiście, gdy mamy np. e2 =ae1, to zachodzi:

α(e1, e2) = aα(e1, e1) = −aα(e1, e1) = 0 ,bowiem jedyna liczba równa swojej przeciwnej to zero.Twierdzenie 1: Funkcja α zależna od dwóch argumentów należących do dwuwymia-

rowej przestrzeni wektorowej TxD, posiadająca powyższe własności, jest funkcją zależnąliniowo od każdego ze swoich argumentów.

112

Page 119: Rozn. Geom_ - Jerzy Kijowski

Dowód: Ponieważ wiemy, że α jest multiplikatywna ze względu na skalowanie, zatemwystarczy wykazać jej addytywność. Jeśli wektoryw oraz u są proporcjonalne, np.w = au,to mamy:

α(v +w,u) = α(v +w − au,u) = α(v,u) = α(v,u) + α(w,u) ,

i to samo gdy v = au. Pozostaje do wykazania przypadek gdy wektory te są niezależne odu. Wtedy jeden z nich jest kombinacją liniową pozostałych, bowiem wszystko to odbywasię w przestrzeni dwuwymiarowej. Niech więc będzie w = au+ bv. Mamy wtedy:

α(v +w,u) = α(v + au+ bv,u) = α(v + bv,u) = (1 + b)α(v,u)= α(v,u) + α(bv,u) = α(v,u) + α(au+ bv,u)= α(v,u) + α(w,u) .

.Doświadczenie powyższe przenosi się na całki więcej niż dwu-wymiarowe. „Infinitezy-

malny kawałek” takiego obszaru całkowania można sobie wyobrażać jako równoległościanrozpięty przez wektory styczne:

ei =∂

∂ti,

gdzie (ti), i = 1, . . . , k; są parametrami w k-wymiarowej objętości D, po której mamycałkować. Aby całka z „infinitezymalnego strumienia”

α (e1, . . . , ek) , (314)

nie zależała od parametryzacji, muszą znów być spełnione oba prawa: prawo „pochyla-nia” dowolnego wektora w kierunku dowolnego innego, analogiczne do (309) i (310), amianowicie:

α (e1, . . . , ei, . . . , ej, . . . , ek) = α (e1, . . . , ei + a · ej , . . . , ej, . . . , ek) , (315)

(pochylony został wektor i-ty w kierunku wektora j-tego), oraz prawo skalowania dowol-nego wektora, analogiczne do (312):

α (e1, . . . , a · ei, . . . , ek) = a · α (e1, . . . , ei, . . . , ek) . (316)

Decydując się by prawo skalowania obowiązywało również dla liczb ujemnych otrzymujemycałkę zależną od orientacji obszaru całkowania D, bowiem zmiana współrzędnej ti na −ti,związana ze zmianą orientacji na przeciwną (wyznacznik Jacobianu takiej transformacjijest równy „−1”, patrz wzór (301)) spowoduje zmianę znaku funkcji podcałkowej (316).Zachowując na swoich miejscach wszystkie wektory z wyjątkiem ei oraz ej , a na tych

dwóch stosując przekształcenia identyczne jak we wzorze (311) otrzymujemy natychmiasttożsamość:

α (e1, . . . , ei, . . . , ej , . . . , ek) = −α (e1, . . . , ej , . . . , ei, . . . , ek) , (317)

113

Page 120: Rozn. Geom_ - Jerzy Kijowski

oznaczającą znów antysymetrię: funkcja α zmienia znak na przeciwny gdy zamienimy miej-scami jej dowolne dwa argumenty. Wreszcie otrzymujemyTwierdzenie 2: Funkcja zależna od k argumentów wektorowych należących do k-

wymiarowej przestrzeni wektorowej: e1, . . . , ek ∈ TxD, mająca powyższe własności jestfunkcją liniową w każdym argumencie.Dowód tego twierdzenia jest zupełnie analogiczny do dowodu poprzedniej, dwuwymia-

rowej wersji tego twierdzenia.Uwaga: Jak widać z Dowodu, liniowość jest konsekwencją jednorodności względem

skalowania (316). Podkreślamy, że jednorodność ta musi obowiązywać dla liczb dodatnicha ­ 0 aby całkowanie miało sens. Natomiast jednorodność dla liczb ujemnych jest naszymwyborem: decydujemy się na całki zależne od orientacji. I tylko w tym przypadku funkcjaα jest (wielo-)liniowa. Zauważmy, że jest to wieloliniowość w ramach jednej podrozmaito-ści D ⊂ M (czy też raczej: w ramach jej przestrzeni stycznej TxD). Natomiast zależnośćta mogłaby się zmieniać w bardzo skomplikowany sposób przy zmianie samej powierzchnicałkowania D. Okazuje się, że warto rozważać całki, w których wieloliniowość całkowa-nego obiektu obowiązuje na całej rozmaitości M (to znaczy na wszystkich przestrzeniachstycznych TxM). W dawnej literaturze takie całki nazywano „całkami drugiego rodzaju”.Okazuje się, że są to pojęciowo najprostsze całki, a niesiona przez nie struktura jest bardzobogata. Okazuje się też, że inne całki (na przykład niezależne od orientacji) wiążą się zdużo bardziej skomplikowanymi (nieliniowymi) obiektami geometrycznymi. Niektóre z nichpoznamy w dalszym ciągu niniejszego wykładu.Dotychczasowe rozważania uzasadniają zatem następującą definicje.Definicja: Funkcję k-liniową, antysymetryczną na przestrzeni TxM nazywamy multi-

kowektorem, lub dokładniej: k-kowektorem, zaczepionym w punkcie x ∈M .Lemat:

1. Jeśli dwa wektory w układzie ei są sobie równe, to α (e1, . . . , ek) = 0.

2. To samo jeśli układ ei jest liniowo zależny.

Dowód: ad 1.: Jeśli ei = ej , to na mocy (317) mamy

α (e1, . . . , ei, . . . , ei, . . . , ek) = −α (e1, . . . , ei, . . . , ei, . . . , ek) = 0 ,

bowiem jedyna liczba równa swej przeciwnej to zero.ad 2.: Jeśli układ jest liniowo zależny, to jeden z wektorów jest kombinacją liniową

pozostałych, na przykład:

e1 =k∑

i=2

viei .

Wtedy

α (e1, . . . , ek) = α(k∑

i=2

viei, e2, . . . , ek

)=k∑

i=2

viα (ei, e2, . . . , ek) = 0 ,

114

Page 121: Rozn. Geom_ - Jerzy Kijowski

bowiem w każdej sekwencji (ei, e2, . . . , ek), i ­ 2; jakieś dwa wektory są sobie równe.

Okazuje się, że wartość multi-kowektora jest bardzo ściśle związana z pojęciem wy-znacznika macierzy (k × k), o czym mówi następujące twierdzenie:Twierdzenie 3: Jeśli vj = vijei (uwaga: konwencja sumacyjna, zatem sumujemy po

i = 1, . . . , k) wtedy zachodzi:

α (v1, . . . ,vk) = det(vij)· α (e1, . . . , ek) . (318)

To proste twierdzenie z algebry liniowej można też przyjąć jako definicję wyznacznikamacierzy. W każdym razie mówi ono, że gdy wybierzemy jakąś jednostkę k-objętości: naprzykład równoległościan rozpięty na bazie wektorów (ek), otrzymamy objętość dowolnegoinnego wielościanu w postaci wyznacznika macierzy współczynników rozkładu rozpinają-cych go wektorów w tej bazie. Widzimy więc, że (zorientowana!) objętość jest po prostuwyznacznikiem.Ćwiczenie: Jako ćwiczenie wykażemy powyższe twierdzenie, bowiem biegłość w po-

dobnych przekształceniach jest istotna z punktu widzenia naszego wykładu. A zatem:

α (v1, . . . ,vk) = α(vi11ei1 , . . . , v

ikkeik

)(319)

= vi11 . . . vikk · α (ei1 , . . . , eik) . (320)

Pamiętamy o konwencji sumacyjnej: jest to zatem k-krotna suma po wszystkich możliwychwartościach wskaźników (i1, i2, . . . , ik). Ale wyrażenie α (ei1 , . . . , eik) znika gdy jakieś dwawektory są sobie równe. A zatem większość składników powyższej sumy znika i pozostająjedynie te, dla których wszystkie wskaźniki (i1, i2, . . . , ik) są różne, to znaczy są permutacjąliczb (1, 2, . . . , k):

il = σ(l) , l = 1, 2, . . . , k .

Zatem zamiast sumować po wszystkich kk układach wskaźników, wystarczy sumować pok! permutacjach:

α (v1, . . . ,vk) =∑

σ∈Skvσ(1)1 . . . v

σ(k)k · α

(eσ(1), . . . , eσ(k)

)

=∑

σ∈Sk(−1)|σ|vσ(1)1 . . . vσ(k)k · α (e1, . . . , ek) .

Oznaczyliśmy tutaj przez |σ| ilość transpozycji z których można złożyć permutację σ.Zatem (−1)|σ| = 1 dla permutacji parzystych oraz (−1)|σ| = −1 dla nieparzystych. Wielkośćta nazywa się parzystością permutacji. Ostatnia równość wynika z faktu, że aby przejść odwielkości α

(eσ(1), . . . , eσ(k)

)do α (e1, . . . , ek) należało wykonać |σ| transpozycji, a każda z

nich powoduje zmianę znaku tego wyrażenia. Ale∑

σ∈Sk(−1)|σ|vσ(1)1 . . . vσ(k)k = det

(vij),

co kończy dowód.

115

Page 122: Rozn. Geom_ - Jerzy Kijowski

Podobnie jak w przypadku jedno-kowektora (czyli po prostu kowektora), wygodniebędzie stosować następujące oznaczenie na wartość k-kowektora na sekwencji wektorów:

α (v1, . . . ,vk) = 〈α ; v1, . . . ,vk〉 . (321)

Wyrażenie to jest liniowe w każdym z argumentów vi:

〈α ; v1, . . . , a · vi + b ·wi, . . . ,vk〉= a · 〈α ; v1, . . . , ·vi, . . . ,vk〉+ b · 〈α ; v1, . . . ,wi, . . . ,vk〉 (322)

oraz całkowicie antysymetryczne. Multi-kowektory — jako funkcje — stanowią przestrzeńwektorową. Oznacza to, że powyższe wyrażenie jest również liniowe w pierwszym argumen-cie:

〈a · α + b · β ; v1, . . . ,vk〉 = a · 〈α ; v1, . . . ,vk〉+ b · 〈β ; v1, . . . ,vk〉 . (323)

Przestrzeń wektorową złożoną ze wszystkich k-kowektorów zaczepionych w punkcie x ∈Moznaczamy następującym symbolem:

k∧T ∗xM .

W szczególności jedno-kowektor to po prostu kowektor, zatem dla ujednolicenia oznaczeńpiszemy:

1∧T ∗xM = T ∗

xM ,

natomiast zero-kowektor, to liczba (zależna od zero wektorów, czyli po prostu od niczegoniezależny skalar):

0∧T ∗xM = R .

Kolekcję wszystkich tych przestrzeni oznaczamy jako

k∧T ∗M :=

x∈M

k∧T ∗xM .

W rozdziale 5.3 poznamy wygodną parametryzację tych przestrzeni i wtedy okaże się, żeta suma jest wiązką włóknistą nad bazą M .Podobnie jak to miało miejsce dla (jedno-)kowektorów w Rozdziale 4.1, k-kowektor

możemy sobie znów wyobrażać jako „czarną skrzynkę”. Teraz jednak ma ona k „slotów”,które wypełnić musimy wektorami, aby skrzynka wyprodukowała z nich wynik liczbowy.Wynik ten zależy liniowo od wkładu w każdym poszczególnym slocie. Poza tym zmieniaznak gdy zamienimy ze sobą wkłady w dowolnych dwóch slotach. Takie — pozornie bardzoabstrakcyjne — obiekty pojawiają się na każdym kroku w fizyce, naukach inżynierskich,ekonomii i innych zastosowaniach matematyki. Często występują one „w przebraniu”, bo-wiem znajomość geometrii różniczkowej nie jest najmocniejszą stroną autorów książek i

116

Page 123: Rozn. Geom_ - Jerzy Kijowski

wykładowców nadających ton w tych dziedzinach. Preferują oni stare, osiemnastowieczneformalizmy, gdzie każdy przypadek traktowany jest osobno, przy pomocy narzędzi stworzo-nych niegdyś na potrzeby tego właśnie przypadku, a istota rzeczy gubi się w technikaliach.Tymczasem zamiast studiować oddzielnie twierdzenia Gaussa a oddzielnie Ostrogradskie-go, uczyć się na pamięć wzorów oddzielnie dla współrzędnych sferycznych a oddzielnie np.dla parabolicznych, oddzielnie na sferze a oddzielnie na hiperboloidzie, warto rozpoznaćistotę rzeczy. A ta sprowadza się do wskazówki: ilekroć pojawiają się całki wielokrotne,tylekroć mamy do czynienia z multi-kowektorami, a raczej ich polami, to znaczy formamiróżniczkowymi, choćby były przebrane za coś innego. Zdjęcie z nich tego przebrania napewno uprości strukturę teorii i ułatwi rachunki!

5.2 Formy różniczkowe. Całkowanie form po podrozmaitościach

Forma różniczkowa to pole multi-kowektorów. Ściślej: k-forma różniczkowa to pole k-kowektorów. W szczególności jedno-forma to po prostu znane nam już pole kowektoro-we. A zero-forma to pole skalarne, czyli funkcja. Jak wynika z dyskusji przeprowadzonejw Rozdziale 5.1, k-forma nadaje się do całkowania po k-wymiarowych podrozmaitościach

D ⊂ M . Jeśli bowiem(k)α jest k-formą zaś

Rk ⊃ V ∋ (ti)→ κ(ti) ∈ D ⊂ M ,

jest parametryzacją podrozmaitości D, to „strumień infinitezymalny”⟨(k)α ;

∂t1, . . . ,

∂tk

⟩(324)

dobrze się skaluje przy przejściu do innych współrzędnych. Rzeczywiście, gdy (τ j) jestinnym układem współrzędnych, pochodzącym z innej mapy, wtedy mamy:

⟨(k)α ;

∂t1, . . . ,

∂tk

⟩=

⟨(k)α ;

∂τ i1

∂t1∂

∂τ i1, . . . ,

∂τ ik

∂tk∂

∂τ ik

= det

(∂τ j

∂ti

)⟨(k)α ;

∂τ 1, . . . ,

∂τk

⟩. (325)

Widać więc, że na mocy twierdzenia o zamianie zmiennych w całce wielokrotnej, całka daten sam wynik gdy wykonamy ją w dwóch różnych parametryzacjach, pod warunkiem, żeobie mapy są zgodne pod względem orientacji, to znaczy gdy zachodzi: det

(∂τj

∂ti

)> 0:

∫ ⟨(k)α ;

∂t1, . . . ,

∂tk

⟩dkt =

∫det

(∂τ j

∂ti

)⟨(k)α ;

∂τ 1, . . . ,

∂τk

⟩dkt

=∫ ⟨

(k)α ;

∂τ 1, . . . ,

∂τk

⟩dkτ . (326)

Jako dziedziny całkowania będziemy rozważali zwarte rozmaitości z brzegiem. Rozwa-żania z Rozdziału 4.4 dotyczące przypadku jednowymiarowego przenoszą się tutaj niemal

117

Page 124: Rozn. Geom_ - Jerzy Kijowski

całkowicie z tym, że zamiast wzoru (302) musimy dopuścić więcej nierówności. Przyjmuje-my więc następujące określenie.Definicja: Podzbiór D ⊂ M rozmaitości różniczkowalnej M wymiaru n nazywamy

podrozmaitością różniczkowalną z brzegiem, wymiaru k, klasy C l, jeśli każdy punkt x ∈ Dposiada otoczenie O ⊂M otwarte w M , a w nim układ funkcji (Gi, Hj), i = 1, . . . , r taki,że D ∩ O jest miejscem geometrycznym rozwiązań układu regularnego

G1(x) = 0 ,...

Gr(x) = 0 ,H1(x) ¬ 0 ,...Hs(x) ¬ 0 ,

(327)

przy czym:

1. wymiar k oznacza, że k + r = n = dimM ,

2. „regularność” oznacza, że w każdym punkcie x ∈ D różniczki wszystkich funkcji Gioraz tych spośród Hj, które zerują się w x, są liniowo niezależne.

Ścianą Sj takiej powierzchni regularnej nazywamy powierzchnię regularną wymiaru (k −1) określoną takim układem warunków, który powstał z układu definiującego D poprzezzamianę jednej z nierówności ograniczających Hj ¬ 0 na równość definiującą Hj = 0.Możemy też powiedzieć, że ściana Sj to zbiór wysycający nierówność Hj ¬ 0.Brzegiem ∂D powierzchni regularnej D nazywamy sumę jej wszystkich ścian.Podobnie jak w przypadku k = 1 do definicji całki po takiej rozmaitości musimy mieć

wyróżnioną orientację, to znaczy atlas na D, którego mapy są zgodne w sensie nierówności(301) z Rozdziału 4.3.Definicja: Jeśli D ⊂ M jest zwartą, zorientowaną podrozmaitością z brzegiem, wy-

miaru k, zaś(k)α jest formą różniczkową to całką z tej formy po D nazywamy wielkość

otrzymaną w następujący sposób:

1. Jeśli istnieją globalne układy współrzędnych na D, to wybieramy taki, który jestzgodny z orientacją D i kładziemy:

D

(k)α :=

D

⟨(k)α ;

∂t1, . . . ,

∂tk

⟩dkt , (328)

przy czym D ⊂ Rk jest obszarem który w tej parametryzacji odpowiada naszejrozmaitości D.

118

Page 125: Rozn. Geom_ - Jerzy Kijowski

2. Jeśli globalne układy współrzędnych nie istnieją na D, to albo dzielimy D „na ka-wałki”, z których każdy mieści się już w dziedzinie jakiejś mapy a następnie dodaje-my sumę wyników całkowania po poszczególnych kawałkach, albo stosujemy rozkładjedności 1 =

∑j∈J fj wpisany w pokrycie rozmaitości D dziedzinami map i wtedy

kładziemy ∫

D

(k)α :=

j∈J

D

(k)α ·fj , (329)

podczas gdy każda z form różniczkowych(k)α ·fj „mieści się” już w dziedzinie jakiejś

mapy (por. dyskusja w Rozdziale 4.6), zatem całka z niej może być obliczona zgodniez formułą (328).

Z całej tej dyskusji wynikaTwierdzenie: Powyższa definicja jest poprawna, to znaczy nie zależy od występujących

w niej elementów dowolnych: 1) rozkładu jedności oraz 2) wyboru parametryzacji na D.

5.3 Iloczyn zewnętrzny. Współrzędniowy opis multikowektorówi form różniczkowych

Gdy mamy dwa multi-kowektory: k-kowektor(k)α oraz l-kowektor

(l)

β to łatwo możemy z nichutworzyć (k + l)-kowektor następującym wzorem:

⟨(k)α ∧

(l)

β ;v1, . . . ,vk,vk+1, . . . ,vk+l

⟩:=

=1k!l!

σ∈Sk+l(−1)|σ|

⟨(k)α ;vσ1 , . . . ,vσk

⟩⟨(l)β ;vσk+1 , . . . ,vσk+l

⟩. (330)

We wzorze tym σ ∈ Sk+l oznacza dowolną permutację (k+ l) elementów, zaś |σ| jest liczbątranspozycji realizujących daną permutację.Idea tej definicji jest prosta: spośród (k + l) wektorów (v1, . . . ,vk,vk+1, . . . ,vk+l) wy-

bieramy pierwsze k wektory i „rzucamy na pożarcie” formie(k)α zaś pozostałe „rzucamy

na pożarcie” formie(l)

β , po czym oba wyniki mnożymy przez siebie. Otrzymany rezul-tat jest oczywiście wieloliniowy. Niestety, nie jest on całkowicie antysymetryczny. Dlategoteż musimy go „antysymetryzować”, to znaczy dodać do siebie rezultaty odpowiadają-ce wszystkim możliwym permutacjom pierwotnej sekwencji wektorów, opatrzone znakiem„+1” dla permutacji parzystych i „−1” dla nieparzystych. Znak ten jest realizowany przezczynnik (−1)|σ|, występujący w powyższej formule. Ale pośród (n + m)! składników tejsumy, odpowiadających wszystkim permutacjom (k + l)-elementów, jest bardzo wiele po-wtarzających się. Weźmy bowiem jakikolwiek składnik, a następnie składnik powstały zeń

poprzez oddzielną permutację wektorów (vσ1 , . . . ,vσk) włożonych do „slotów” formy(k)α ,

119

Page 126: Rozn. Geom_ - Jerzy Kijowski

oraz oddzielną permutację pozostałych wektorów (vσk+1 , . . . ,vσk+l), włożonych do „slo-

tów” formy(l)

β . Łatwo widać, że składniki te są identyczne. Wynika to z faktu, że pierwszyi drugi czynnik w iloczynie mogą co najwyżej zmienić znak wskutek permutacji wekto-rów włożonych w „sloty” wejściowe tej samej formy. Jednak ewentualna zmiana znaku jestkompensowana zmianą znaku współczynnika liczbowego (−1)|σ|. Łatwo również widać, żeliczba identycznych składników otrzymanych w ten sposób jest równa liczbie permutacjik elementów, pomnożonej przez liczbę (niezależnych) permutacji l elementów. A zatemwszystkie składniki powyższej sumy „chodzą stadami” identycznych składników, a liczeb-ność każdego takiego „stada” wynosi właśnie „k!l!”. Aby element każdego stada uwzględnićtylko jeden raz, podzieliliśmy wynik przez tę liczebność.Dla porządku zauważmy, że gdy któraś z liczb k lub l jest równa zeru, to odpowiadający

jej „multikowektor” jest liczbą i mnożenie zewnętrzne sprowadza się do zwykłego przez tęliczbę mnożenia. Oznacza to, że dla a ∈ R zachodzi tożsamość:

a ∧ (k)α= a · (k)α . (331)

Otrzymany w wyniku operacji (330) kowektor:(k)α ∧

(l)

β , nazywamy iloczynem zewnętrz-nym obu multi-kowektorów. Definicja (330) implikuje natychmiast jego następujące wła-sności, których prosty, kombinatoryczny dowód pozostawiamy Czytelnikowi jako ćwiczenie.Lemat. Mnożenie zewnętrzne jest dwuliniowe i łączne. Poza tym przestawienie kolejnościmnożenia powoduje ewentualną zmianę znaku według formuły:

(k)α ∧

(l)

β= (−1)k·l(l)

β ∧ (k)α . (332)

Przykład: Jeśli (xk) jest układem współrzędnych w M to dxi ∧ dxj jest dwu-formą,a jej wartość w każdym punkcie rozmaitości M jest 2-kowektorem. Jej wartość na parzewektorów v = vp ∂

∂xporaz u = uq ∂

∂xqwynosi, zgodnie z definicją (330):

⟨dxi ∧ dxj ; v,u

⟩=⟨dxi ; v

⟩ ⟨dxj ; u

⟩−⟨dxi ; u

⟩ ⟨dxj ; v

⟩= viuj − vjui . (333)

Widać, że zachodzi dxi∧dxj = −dxj∧dxi. Natomiast w przypadku trójformy dxi∧dxj∧dxkdefinicja ta daje:

⟨dxi ∧ dxj ∧ dxk ; v,u,w

⟩=

⟨dxi ; v

⟩ ⟨dxj ; u

⟩ ⟨dxk ; w

+⟨dxk ; v

⟩ ⟨dxi ; u

⟩ ⟨dxj ; w

+⟨dxj ; v

⟩ ⟨dxk ; u

⟩ ⟨dxi ; w

−⟨dxk ; v

⟩ ⟨dxj ; u

⟩ ⟨dxi ; w

−⟨dxj ; v

⟩ ⟨dxi ; u

⟩ ⟨dxk ; w

−⟨dxi ; v

⟩ ⟨dxk ; u

⟩ ⟨dxj ; w

⟩.

120

Page 127: Rozn. Geom_ - Jerzy Kijowski

Sześć permutacji trzech elementów zgrupowaliśmy tutaj w dwie trójki: trzy przestawieniacykliczne, które w S3 są parzyste, oraz trzy pozostałe, nieparzyste. Warto zapamiętać tęstrukturę grupy permutacji S3, bo ilekroć pracujemy w rozmaitości trójwymiarowej, mamyz nią do czynienia. Warto również zauważyć, że permutacje cykliczne są parzyste jedyniew przypadku nieparzystej liczby elementów (jak np. właśnie trzy), natomiast w przypadkuich parzystej liczby są nieparzyste.Łatwo widać, że stosując indukcję matematyczną ze względu na rząd k, otrzymamy

uniwersalny wzór na iloczyn zewnętrzny k kowektorów dxi.Lemat: Zachodzi następująca tożsamość:

⟨dxi1 ∧ · · · ∧ dxik ;v1, . . . ,vk

⟩=

σ∈Sk(−1)|σ|

⟨dxiσ1 ;v1

⟩· · ·

⟨dxiσk ;vk

=∑

σ∈Sk(−1)|σ|viσ11 · · · v

iσkk . (334)

Wniosek: Iloczyn zewnętrzny dxi1 ∧ · · · ∧ dxik zmienia znak przy zamianie dowolnychdwóch swoich czynników, czyli jest całkowicie antysymetryczny.Okazuje się, że powyższe k-krotne iloczyny zewnętrzne różniczek współrzędnych stano-

wią bazę w przestrzeni multi-kowektorów. Niech bowiem(k)α będzie dowolnym k-kowektorem

zaczepionym w punkcie x ∈M . Pokażemy, że jest on kombinacją liniową takich iloczynów.W tym celu wybierzemy pewien układ współrzędnych (xk) w otoczeniu tego punktu ioznaczmy: ⟨

(k)α ;

∂xi1, . . . ,

∂xik

⟩=: αi1,...,ik . (335)

Na mocy antysymetrii (317) multikowektora, tablica tych liczb jest całkowicie antysyme-tryczna. W szczególności każdy element odpowiadający takiej samej wartości dwóch róż-nych wskaźników jest równy zeru. Poza tym wielkość ta zmienia znak na przeciwny przyprzestawieniu dowolnych dwóch wskaźników is oraz iq, 1 ¬ i, s ¬ k. Zatem dla permutacjiσ ∈ Sk mamy:

αi1,...,ik = (−1)|σ|αiσ1 ,...,iσk . (336)

Wykorzystamy te własności do obliczenia wartości tego k-kowektora na dowolnej sekwencjiwektorów (v1, . . . ,vk), których współrzędne oznaczamy przez viss :

vs = viss∂

∂xis=⟨dxis,vs

⟩ ∂

∂xis,

(sumowanie po wszystkich wartościach wskaźnika is = 1, . . . , n = dimM). Na mocy linio-wości otrzymamy:

⟨(k)α ; v1, . . . ,vk

⟩=

⟨(k)α ; vi11

∂xi1, . . . , vikk

∂xik

⟩= vi11 · · · vikk · αi1,...,ik . (337)

121

Page 128: Rozn. Geom_ - Jerzy Kijowski

Korzystając z wzoru (336) możemy zastąpić współczynnik αi1,...,ik liczbą (−1)|σ|αiσ1 ,...,iσkdla dowolnej permutacji σ ∈ Sk. Sumując te (identyczne!) wyrazy po wszystkich k! permu-tacjach otrzymamy zatem:

k!⟨(k)α ; v1, . . . ,vk

⟩=

i1,...,ik

σ∈Sk(−1)|σ|vi11 · · · vikk · αiσ1 ,...,iσk . (338)

Jeśli teraz oznaczyć σp = q, to p = πq, gdzie π jest permutacją odwrotną do σ. Obie majątę samą parzystość. Poza tym sumowanie po wszystkich σ to to samo co sumowanie powszystkich π. Stosując tę uwagę, a następnie wzór (334), otrzymujemy:

k!⟨(k)α ; v1, . . . ,vk

⟩=

i1,...,ik

π∈Sk(−1)|π|viπ11 · · · v

iπkk · αi1,...,ik

=⟨dxi1 ∧ · · · ∧ dxik ;v1, . . . ,vk

⟩· αi1,...,ik

=⟨αi1,...,ik · dxi1 ∧ · · · ∧ dxik ;v1, . . . ,vk

⟩,

(teraz już znak sumowania po i1, . . . , ik jest niepotrzebny, bowiem działa zwykła kon-wencja sumacyjna!). Ponieważ tożsamość ta zachodzi dla wszystkich układów wektorów(v1, . . . ,vk), możemy przez nie „uprościć”, otrzymując:

(k)α=1k!αi1,...,ik · dxi1 ∧ · · · ∧ dxik . (339)

Wybierając inny układ współrzędnych (ya) w tej samej przestrzeni otrzymujemy

(k)α=1k!αa1,...,ak · dya1 ∧ · · · ∧ dyak . (340)

Aby wyrazić współczynniki αa1,...,ak przez stare współczynniki αi1,...,ik, wystarczy we wzorze(339) wstawić

dxi1 =∂xi1

∂ya1dya1 ,

i podobnie dla następnych wskaźników i oraz a. Mamy więc

(k)α =

1k!αi1,...,ik ·

(∂xi1

∂ya1dya1

)∧ · · · ∧

(∂xik

∂yakdyak

)

=1k!αi1,...,ik ·

∂xi1

∂ya1· · · ∂x

ik

∂yakdya1 ∧ · · · ∧ dyak . (341)

Porównując ten ostatni wzór z (340) otrzymujemy składowe naszej formy w nowym układziewspółrzędnych:

αa1,...,ak = αi1,...,ik ·∂xi1

∂ya1· · · ∂x

ik

∂yak, (342)

co stanowi prawo transformacyjne dla składowych formy różniczkowej przy transformacjiwspółrzędnych.

122

Page 129: Rozn. Geom_ - Jerzy Kijowski

Dowolna forma różniczkowa przedstawia się zatem jako kombinacje liniowa iloczynówzewnętrznych różniczek współrzędnych. Nie znaczy to jednak, że wszystkie k-kowektory

dxi1 ∧ · · · ∧ dxik stanowią bazę przestrzenik∧T ∗xM . Zauważmy bowiem, że nie są one nie-

zależne: przestawienie wskaźników powoduje jedynie zmianę znaku. Zatem w powyższejsumie wszystkie wyrazy, które biorą się z jednego wyrazu przez permutację wskaźników(i1, . . . , ik) są sobie równe, bowiem zarówno pierwszy jak i drugi czynnik są antysyme-tryczne, więc co najwyżej zmieniają znak, ale oba jednocześnie, dzięki czemu ich iloczynsię nie zmienia. Aby uniknąć wielokrotnego sumowania tego samego członu, wybierzemy wkażdej takiej grupie jednego reprezentanta, na przykład odpowiadającego uporządkowanejsekwencji wskaźników: i1 < i2 < · · · < ik. Ponieważ identycznych składników jest w każ-dej grupie tyle ile permutacji, to znaczy k!, otrzymamy następującą formułę, równoważnąformule (339):

(k)α=

i1<i2<···<ikαi1,...,ik · dxi1 ∧ · · · ∧ dxik . (343)

Elementy dxi1 ∧ · · · ∧ dxik odpowiadające sekwencjom wskaźników spełniających waru-nek i1 < i2 < · · · < ik są już liniowo niezależne, zatem stanowią bazę w przestrzeni

k-kowektorówk∧T ∗xM . Jest ich tyle, ile różnych podzbiorów k elementowych zbioru o

n = dimM elementach, to znaczy tyle, ile wynosi symbol Newtona(nk

). Taki jest zatem

wymiar tej przestrzeni:

dimk∧T ∗xM =

n!k!(n− k)! =

(n

k

). (344)

Składowe k-kowektora: αi1,...,ik , gdzie i1 < i2 < · · · < ik; wraz ze współrzędnymi (xk)punktu zaczepienia, pełnią rolę współrzędnych w wiązce wszystkich k-kowektorów na M ,

czyli wk∧T ∗M . Warto zwrócić uwagę na szczególne przypadki:

• Dla k = 0 mamy(n0

)= 1, ponieważ 0-kowektory to po prostu skalary:

0∧T ∗xM = R ,

stanowiące przestrzeń jednowymiarową.

• Dla k = 1 mamy(n1

)= n, co odpowiada temu, iż jedno-kowektory to kowektory:

1∧T ∗xM = T ∗

xM ,

stanowiące przestrzeń n-wymiarową.

• Dla k = n mamy(nn

)= 1. Odpowiada to faktowi, że w przestrzeni n-wymiarowej

wszystkie n-kowektory mają postać:

α = a · dx1 ∧ · · · ∧ dxn ,

123

Page 130: Rozn. Geom_ - Jerzy Kijowski

gdzie a = α1,...,n. A zatem wszystkie one są proporcjonalne do wybranego n-kowektoradx1∧· · ·∧dxn, który może być traktowany jako (jedno-elementowa) baza tej przestrze-ni. Jest jednak zasadnicza różnica między jednowymiarową przestrzenią n-kowektorówa jednowymiarową przestrzenią 0-kowektorów: w tej ostatniej jest jeden wyróżnionyelement, mianowicie liczba 1, która może być traktowana jako baza „kanoniczna”. Wpierwszej zaś takiego wyróżnionego elementu nie ma. Zauważmy bowiem, że prawotransformacyjne przy przejściu od układu (xi) do układu (ya) wygląda następująco:

dy1 ∧ · · · ∧ dyn = ∂y1

∂xi1dxi1 ∧ · · · ∧ ∂yn

∂xindxin

=∑

σ∈Sn

∂y1

∂xσ(1)dxσ(1) ∧ · · · ∧ ∂yn

∂xσ(n)dxσ(n)

=

σ∈Sn(−1)|σ| ∂y

1

∂xσ(1)· · · ∂y

n

∂xσ(n)

dx1 ∧ · · · ∧ dxn

= det

(∂ya

∂xi

)· dx1 ∧ · · · ∧ dxn . (345)

Wynika stąd, że żadna z „baz” wyznaczonych przez konkretny układ współrzędnych

nie jest „lepsza” od drugiej. Elementy przestrzenin∧T ∗xM czyli n-kowektory, bę-

dziemy też nazywali „gęstościami skalarnymi”. Mimo, że są one wszystkie do siebieproporcjonalne, to nie ma wśród nich żadnej wyróżnionej skali objętości! Chyba, żerozmaitość jest wyposażona w jakąś dodatkową strukturę12, która wyróżnia pewnąskalę . . . .

5.4 Przykład: całkowanie sił wywołanych ciśnieniem. Zewnętrz-na a wewnętrzna orientacja powierzchni

Zajmiemy się teraz opisem bardzo prostego zjawiska fizycznego, w którym formy różniczko-we pojawiają się w bardzo naturalny sposób, prowadząc do znacznego uproszczenia opisu idostarczając w ten sposób podstawowej intuicji dotyczącej tych fundamentalnych strukturgeometrycznych. Nieuzasadniony lęk przed używaniem form różniczkowych prowadzi wła-śnie do patologicznej komplikacji formalizmu, w którym możliwość doprowadzenia do końcajakiegokolwiek rachunku zależy od zapamiętania wielkiej liczby szczegółowych wzorów.Tym zjawiskiem jest ciśnienie oraz — w wersji całkowej — siła parcia na skończony

kawałek krzywej powierzchni.Niech D ⊂ M będzie powierzchnią dwuwymiarową w trójwymiarowej przestrzeni eu-

klidesowej M , w której wybrano współrzędne kartezjańskie (x, y, z). Rozważamy sytuację,gdy po jednej stronie tej powierzchni panuje ciśnienie p — niekoniecznie stałe, być mo-że zależne od punktu: p = p(x), x ∈ D. Ciśnienie mówi nam jaka „infinitezymalna siłaparcia” działa na każdy „infinitezymalny kawałek” powierzchni, rozpięty na wektorach

12Takie struktury pojawią się w dalszym ciągu naszego wykładu.

124

Page 131: Rozn. Geom_ - Jerzy Kijowski

(e1, e2) ∈ TxD. Jeśli przez n(e1, e2) ∈ T ∗xD oznaczymy siłę jednostkową, odpowiadającą

jakiemuś „jednostkowemu ciśnieniu” p = 1, to prawdziwa „infinitezymalna siła parcia” wtym punkcie jest równa jej iloczynowi przez p:

F(e1, e2) = p · n(e1, e2) . (346)

Postarajmy się znaleźć wyrażenie na tę „siłę jednostkową”. Ze szkoły wiemy, że maona być proporcjonalna do pola powierzchni σ(e1, e2) naszego infinitezymalnego kawałka,rozpiętego na wektorach (e1, e2). Natomiast jej kierunek ma być „ortonormalny” w sto-sunku do powierzchni. Ale co to znaczy kierunek „ortonormalny”? Pamiętamy, że siła toinfinitezymalna praca. Siła ortogonalna względem powierzchni to taka, która nie wykonujeżadnej pracy na wektorach stycznych do powierzchni. Gdyby bowiem było inaczej, to takąpracę można byłoby zatrudnić do skonstruowania perpetum mobile! A zatem n(e1, e2) musiznikać na dowolnym wektorze stycznym do tej powierzchni, czyli na dowolnej kombinacjiliniowej wektorów (e1, e2):

〈n(e1, e2) ; a · e1 + b · e2〉 = 0 .

Bardzo łatwo znaleźć przykład kowektora spełniającego ten warunek:

〈n(e1, e2) ;v〉 := 〈dx ∧ dy ∧ dz ; e1, e2,v〉 . (347)

Rzeczywiście, prawa strona zeruje się, gdy v = a · e1 + b · e2. Jest ona też dwuliniową,antysymetryczną funkcją wektorów (e1, e2), czyli — zgodnie z dyskusją przeprowadzoną wRozdziale 5.1, proporcjonalną do pola powierzchni infinitezymalnego kawałka rozpiętego natych wektorach. Każde inne wyrażenie spełniające ten warunek będzie do niej proporcjonal-ne. Aby znaleźć odpowiedni czynnik normalizacyjny zauważmy, że gdy nasz infinitezymalnykawałek powierzchni ma pole jednostkowe, zaś wektor v jest doń prostopadły i ma długośćjednostkową, to prawa strona jest równa jedności jako objętość jednostkowego sześcianurozpiętego na wektorach (e1, e2,v). Wynika to z faktu, że gdy (x, y, z) są współrzędnymikartezjańskimi w przestrzeni euklidesowej M , to forma „dx ∧ dy ∧ dz” mierzy objętość13.Ale wtedy i lewa strona formuły (347) powinna być równa jedności, jako jednostkowa pracana jednostkowym wektorze. Wynika stąd, że formuła (347) jest poprawna i nie wymagażadnego czynnika normalizacyjnego. Otrzymujemy stąd wzór na infinitezymalną siłę parciawywołaną ciśnieniem p:

〈F(e1, e2) ;v〉 := p · 〈dx ∧ dy ∧ dz ; e1, e2,v〉 . (348)

W powyższej dyskusji świadomie pomijaliśmy pewien aspekt, który teraz należy uwzględ-nić. Są bowiem dwa wektory normalne do powierzchni, wzajemnie przeciwne. Wybór jed-nego z nich, to jak gdyby wybór jednej strony powierzchni: tej, z której wychodzi wektor

13Jest to właśnie przykład dodatkowej struktury, o której wspomnieliśmy w zakończeniu poprzedniegorozdziału. Wynika ona ze struktury metrycznej przestrzeni Euklidesowej. Podkreślamy, że w niniejszymwywodzie, z całej, bogatej struktury metrycznej wykorzystujemy jedynie informację o formie objętości.Szczegółowo omówimy te wszystkie sprawy w Rozdziale 6 niniejszego wykładu.

125

Page 132: Rozn. Geom_ - Jerzy Kijowski

normalny. Odpowiada on wybraniu orientacji nie przestrzeni stycznej do D, lecz prze-strzeni dopełniającej. W przypadku gdy zachodzi: dimD = dimM − 1, jest to przestrzeńjednowymiarowa. Taki wybór nazywa się „orientacją zewnętrzną” powierzchni.Dla odróżnienia od niej prawdziwa orientacja, ta o której była mowa w Rozdziale 4.3,

bywa nazywana orientacją wewnętrzną. Jeśli cała przestrzeń jest zorientowana, to wybra-nej orientacji zewnętrznej jednoznacznie odpowiada pewna orientacja wewnętrzna i viceversa. Jeśli bowiem współrzędne (x, y, z) są zgodne z orientacją całej przestrzeni, to układ(e1, e2) wektorów stycznych do D będziemy uważali za zgodny z orientacją D wtedy i tylkowtedy, gdy układ (e1, e2,v) jest zgodny z orientacją triady ( ∂∂x ,

∂∂y, ∂∂z), to znaczy wtedy,

gdy spełniona jest nierówność:

〈dx ∧ dy ∧ dz ; e1, e2,v〉 ­ 0 . (349)

W tej definicji zmiana orientacji zewnętrznej na przeciwną spowoduje zmianę odpowiada-jącej jej orientacji wewnętrznej na przeciwną. Jednak zmiana orientacji całej przestrzeniodwraca relację między tymi dwiema, a priori różnymi strukturami jakimi są orientacjezewnętrzna i wewnętrzna. W przyszłości omówimy tę sprawę głębiej. Natomiast w zasto-sowaniach bardzo często najwygodniejsza strategia polega na założeniu, iż cała przestrzeńM nosi już jakąś orientację, wiążącą na stałe obie struktury. W przestrzeni trójwymiarowejwybór orientacji to np. przyjęcie konwencji „śruby prawoskrętnej”: obrót osi e1 w kierunkue2 powoduje posuw śruby prawoskrętnej14 w kierunku e3. Przyjmijmy więc tę konwencjęprawoskrętną. Oznacza to, że rozmaitość D ma orientację taką, jaką implikuje zwrot wek-tora normalnego w kierunku działania siły ciśnienia, to znaczy na zewnątrz obszaru, wktórym panuje ciśnienie.Nasze rozumowanie prowadzące do wzoru (347) było oparte na założeniu, że zachodzi

nierówność (349), to znaczy, że rozmaitość D niesie tę właśnie orientację.Formuła (348) implikuje natychmiast wzory na poszczególne składowe siły parcia F.

Zgodnie ze wzorem (278) na składowe kowektora mamy:

Fx(e1, e2) =⟨F(e1, e2) ;

∂x

⟩:= p ·

⟨dx ∧ dy ∧ dz ; e1, e2,

∂x

= 〈p · dy ∧ dz ; e1, e2〉 ,

czyli, po „uproszczeniu” przez te wektory:

Fx = p · dy ∧ dz . (350)

Widać, że pozostałe składowe otrzymuje się przez cykliczną permutację współrzędnych:

Fy = p · dz ∧ dx ; Fz = p · dx ∧ dy . (351)

Aby otrzymać analogiczne wzory w dowolnych współrzędnych krzywoliniowych wystarczywyrazić w tych współrzędnych jedyną strukturę metryczną, jaka występuje we wzorze14Odwrotna konwencja: śruby lewoskrętnej, byłaby równie dobra (w każdym razie fizyka czy biologiachyba nie wyróżnia żadnej spośród nich, choć istnieją poważne hipotezy, że może jednak wyróżnia . . . ).

126

Page 133: Rozn. Geom_ - Jerzy Kijowski

(348), a mianowicie formę objętości

ω = dx ∧ dy ∧ dz . (352)

Powyższe wzory zapisuje się w skróconej wersji przy pomocy całkowicie antysymetrycz-nego symbolu Levi-Civity ǫijk, i, j, k = 1, 2, 3, spełniającego warunek normalizacji:

ǫ123 = 1 . (353)

Jeśli teraz oznaczyć x = x1, y = x2, z = x3, to forma objętości przyjmuje postać:

ω =13!ǫijk dxi ∧ dxj ∧ dxk (354)

(konwencja sumacyjna!) i wtedy wzory na poszczególne składowe siły wyglądają następu-jąco:

Fi =12p ǫijk dxj ∧ dxk . (355)

Przykład: Jeśli w cylindrze silnika spalinowego panuje w pewnej chwili ciśnienie p,to siłę działającą na powierzchnię tłoka obliczymy całkując siłę infinitezymalną po tejpowierzchni (zob. Rysunek 19). W tym celu wybierzemy współrzędne kartezjańskie w taki

Rysunek 19: Wypadkową sił działających na tłok obliczymy przez całkowanie.

sposób, by powierzchnie z = const. były prostopadłe do osi cylindra. Wtedy powierzchniacylindra D może być opisana jako wykres funkcji dwóch zmiennych z = f(x, y), przy czym(x, y) przebiegają płaską powierzchnię wylotu cylindra którą oznaczymy przez D. ZatemD jest obrazem powierzchni D przy odwzorowaniu:

R2 ⊃ D ∋ (ξ, η)→ φ(ξ, η) = (x, y, z) = (ξ, η, f(ξ, η)) ∈ D ⊂M ,

lub, inaczej:

x = ξ

y = η

z = f(ξ, η) .

127

Page 134: Rozn. Geom_ - Jerzy Kijowski

A zatem przestrzeń styczna do tej powierzchni jest rozpinana na następujących dwóchwektorach:

∂ξ= 1 · ∂

∂x+∂f

∂ξ

∂z∂

∂η= 1 · ∂

∂y+∂f

∂η

∂z.

Składowa siły parcia w kierunku osi cylindra jest zatem równa iloczynowi ciśnienia przezpole przekroju cylindra |D|, mamy bowiem:

Pz = p ·∫

D

⟨dx ∧ dy ; ∂

∂ξ,∂

∂η

⟩dξdη = p ·

Ddξdη = p · |D| . (356)

Ten pozornie banalny wynik wcale nie byłby łatwy do uzyskania metodami tradycyjnejgeometrii metrycznej, bowiem zsumowanie wektorów o bardzo różnych kierunkach (zawszeprostopadłych do dowolnie zakrzywionej powierzchni D), w dodatku mnożonych przezskomplikowaną formę pola powierzchni na D, jest a priori zadaniem bardzo złożonym. Idopiero użycie form różniczkowych sprowadza całą rzecz do banalnej całki (356). Pozostałeskładowe siły parcia wynoszą:

Px = p ·∫

D

⟨dy ∧ dz ; ∂

∂ξ,∂

∂η

⟩dξdη = −p ·

D

∂f

∂ξdξdη ,

Py = p ·∫

D

⟨dz ∧ dx ; ∂

∂ξ,∂

∂η

⟩dξdη = −p ·

D

∂f

∂ηdξdη .

Widać, że w obu wypadkach można wykonać explicite całkowanie po jednej ze zmiennych(po ξ w pierwszej całce i po η w drugiej), w wyniku czego otrzymamy różnicę wartościfunkcji f w punktach na brzegu obszaru całkowania. Jeśli teraz tłok spełnia warunek, żejego wysokość na brzegu jest stała, to znaczy iż funkcja f jest stała na ∂D, to te wartościbrzegowe uproszczą się i obie całki dadzą w rezultacie wartość zerową. Gdyby natomiasttłok miał „globalne nachylenie”, to i tak obie składowe siły parcia zależałaby jedynie odwartości funkcji f na brzegu (czyli przy ściance cylindra), natomiast dowolne wyginaniepowierzchni tłoka w środku cylindra nie miałoby na nie żadnego wpływu. Zjawisko to wiążesię z twierdzniem Stokes’a, patrz Rozdział 5.7.

5.5 Różniczka zewnętrzna

Niniejszy rozdział zawiera definicję najważniejszej struktury, jaka pojawia się w geome-trii różniczkowej, a która nosi nazwę różniczki zewnętrznej. Jest to operator różniczkowypierwszego rzędu, działający na formy różniczkowe. Wszystkie naturalne operatory róż-niczkowe, na jakich opiera się matematyka stosowana, jak; gradient, rotacja, dywergencja,Laplasjan, operator falowy i inne, są zbudowane z tej podstawowej „cegiełki” jaką jest róż-niczka zewnętrzna. Operatory te były sukcesywnie odkrywane w różnych działach fizyki

128

Page 135: Rozn. Geom_ - Jerzy Kijowski

i techniki podczas całego XIX-go wieku. Znaleziono też wiele związków między nimi, jaknp. to, że „rotacja gradientu” oraz „dywergencja rotacji” zerują się tożsamościowo. I do-piero dzięki twórcom nowoczesnej geometrii różniczkowej (z których najważniejszy wkładwłożył tutaj Elie Cartan) zauważono, że są to bardzo szczególne przypadki pewnej dużoogólniejszej struktury, którą właśnie będziemy studiować w niniejszym Rozdziale. I wte-dy różne szczegółowe twierdzenia, egzystujące dotąd oddzielnie w różnych, oddalonych odsiebie dziedzinach nauki, jak prawo Greena, twierdzenie Gaussa-Ostrogradskiego i wieleinnych, okazują się być szczególnymi przypadkami tego, co w niniejszym wykładzie będzienosiło nazwę „twierdzenia Stokes’a”, które sformułujemy w Rozdziale 5.7.Można podać wiele różnych definicji różniczki zewnętrznej. W naszym wykładzie wy-

braliśmy definicję aksjomatyczną poprzez podanie podstawowych własności, bowiem w tensposób najbliżej nam do konkretnych wzorów rachunkowych pozwalających na wyliczeniewartości różniczki w dowolnym układzie współrzędnych. Poza tym, takie wzory są najprost-sze. Mam nadzieję, że czytelnik raz ujrzawszy wzór (360), zapamięta go sobie na zawsze.W dalszym ciągu poznamy też inne, równoważne definicje tej struktury. W pewnych za-stosowaniach mogą być bardziej przydatne.Definicja. Różniczka zewnętrzna dα formy różniczkowej α jest wynikiem działania linio-wego operatora różniczkowego „d” o następujących własnościach:

1. Operator ten podnosi rząd formy o 1. Oznacza to, że wynik „d(k)α ” działania operatora

„d” na k-formę(k)α jest (k + 1)-formą.

2. Zachodzi uogólniony wzór Leibnitza:

d

((k)α ∧

(l)

β

)=(d(k)α)∧(l)

β +(−1)k (k)α ∧(d(l)

β

). (357)

3. Wynik „df” działania operatora „d” na zero-formę, czyli funkcję f , jest równy do-tychczas poznanej różniczce tej funkcji, którą oznaczaliśmy do tej pory tym samymsymbolem.

4. Różniczka różniczki jest zawsze równa zeru:

d2 = 0 . (358)

Warto tutaj podkreślić, że ostatnia własność manifestuje się „w przyrodzie” właśniejako znikanie rotacji z gradientu, czy dywergencji z rotacji.Na razie nie wiemy wcale, czy operator d, spełniający powyższe żądania w ogóle istnieje.

Zauważmy jednak, że gdy (xi) jest dowolnym układem współrzędnych w rozmaitości M , wktórej uprawiamy naszą geometrię, to zgodnie z formułą (339) oraz (331), dowolna k-formaw tej przestrzeni może być zapisana w postaci:

α =1k!αi1,...,ik · dxi1 ∧ · · · ∧ dxik =

1k!αi1,...,ik ∧ dxi1 ∧ · · · ∧ dxik , (359)

129

Page 136: Rozn. Geom_ - Jerzy Kijowski

gdzie współczynniki rozkładu αi1,...,ik są oczywiście funkcjami (czyli 0-formami), bowiemzależą od punktu x, w którym tego rozkładu używamy. Jeśli teraz zastosować do tej formyaksjomat 2 (uogólniony wzór Leibnitza) to widzimy, że różniczka tej formy będzie sumąskładników, w których operator „d” działa na poszczególne czynniki formy (359). Ale zgod-nie z aksjomatem 4, jego działanie na czynniki postaci dxis daje w wyniku zero, bowiemddxis = 0. Wobec tego jedyny niezerowy składnik tej sumy powstaje przez działanie ope-ratora d na funkcję αi1,...,ik . Z powyższej dyskusji wynika, że powinno być

dα =1k!dαi1,...,ik ∧ dxi1 ∧ · · · ∧ dxik . (360)

Wzór ten jest bardzo łatwy do zapamiętania: w każdym z iloczynów, których sumąjest forma (359) musimy zróżniczkować wszystkie czynniki, zgodnie ze wzorem Leibnitza.Ale różniczkowanie różniczek daje zero. Zatem jedyne co pozostaje do zróżniczkowania towspółczynniki αi1,...,ik .Wzór ten ciągle jednak ma status „pobożnego życzenia”. Wcale zeń nie wynika, że

operacja spełniająca nasze aksjomaty rzeczywiście istnieje. Mogłoby się bowiem zdarzyć,że wzór ten niczego nie definiuje. Byłoby tak, gdyby wynik zależał od wyboru układuwspółrzędnych (xi), tak jak to miało miejsce w Rozdziale 3.3, gdy próbowaliśmy na współ-rzędnych zdefiniować operator „∇XY ”. Na szczęście tutaj jest inaczej, o czym mówi na-stępującyLemat. Operacja dana powyższym wzorem jest dobrze określona: nie zależy od wyboruukładu współrzędnych i spełnia nasze cztery aksjomaty.Dowód. Weźmy inny układ współrzędnych (ya) w tej samej przestrzeni. Otrzymujemy

α =1k!αa1,...,ak · dya1 ∧ · · · ∧ dyak , (361)

gdzie, zgodnie z prawem transformacyjnym (342) mamy:

αa1,...,ak = αi1,...,ik ·∂xi1

∂ya1· · · ∂x

ik

∂yak. (362)

Zastosujemy teraz operację „d” do formy α w nowym układzie współrzędnych. Uzyska-ny w ten sposób wynik oznaczymy przez dα. Teza będzie wykazana, jeśli udowodnimy, żewynik ten będzie równy (360). Ale

dα =1k!dαa1,...,ak ∧ dya1 ∧ · · · ∧ dyak

=1k!d

(αi1,...,ik

∂xi1

∂ya1· · · ∂x

ik

∂yak

)∧ dya1 ∧ · · · ∧ dyak

=1k!

(∂xi1

∂ya1· · · ∂x

ik

∂yak

)dαi1,...,ik ∧ dya1 ∧ · · · ∧ dyak (363)

+ αi1,...,ikd

(∂xi1

∂ya1· · · ∂x

ik

∂yak

)∧ dya1 ∧ · · · ∧ dyak . (364)

130

Page 137: Rozn. Geom_ - Jerzy Kijowski

Pokażemy, że wyrażenie w ostatniej linii jest tożsamościowo równe zeru. Jest tak, ponieważróżniczka wyrażenia w dużym nawiasie zawiera drugie pochodne współrzędnych (xi):

d∂xis

∂yas=

∂2xis

∂ybyasdyb . (365)

Drugie pochodne są symetryczne względem zamiany b na as. Tymczasem w wyrażeniu (364)są one sumowane z iloczynami zewnętrznymi postaci dyb ∧ dyas, które są antysymetrycznewzględem takiej zamiany. Występują tu zatem sumy postaci

fabdya ∧ dyb ,

gdzie współczynniki są symetryczne: fab = fba. Taka suma musi być równa zeru, bowiemprzy zamianie a z b zachodzą jednocześnie dwa procesy: 1) suma zmienia znak na przeciwny,bowiem wyrażenie symetryczne nie zmieniło się, zaś antysymetryczne zmieniło znak naprzeciwny, ale również 2) nic się nie zmieniło, bowiem zmieniliśmy jedynie nazwę wskaźnikaa na b i odwrotnie. Takie „przechrzczenie” wskaźników nie może zmienić wyniku, bowiemi tak musimy sumować po ich wszystkich wartościach. Można było na przykład zmienićnazwę „a” na „c” zaś „b” na „d” i wartość sumy nie może zmienić się w wyniku takiejzmiany nazewnictwa. Potem znów można zmienić nazwy z „c” na „b” oraz z „d” na „a” iznów nic nie mogło się zmienić. Zatem interpretacja „czynna” zamiany wskaźników (jakoich przestawianie) daje zamianę znaku na przeciwny, zaś interpretacja „bierna” tej samejoperacji (jako ich przemianowanie) nie zmienia znaku wyrażenia. Wobec tego

fabdya ∧ dyb = −fabdya ∧ dyb = 0 . (366)

Skoro zatem wyrażenie (364) jest równe zeru, to mamy ostatecznie:

dα =1k!

(∂xi1

∂ya1· · · ∂x

ik

∂yak

)dαi1,...,ik ∧ dya1 ∧ . . . yak

=1k!dαi1,...,ik ∧ dxi1 ∧ · · · ∧ dxik = dα . (367)

A zatem nasz wzór na różniczkę zewnętrzną – mimo, że pozornie zależny od wyboru układuwspółrzędnych – naprawdę od tego wyboru nie zależy. Może zatem służyć nawet jakodefinicja operatora d. Spełnianie aksjomatów 1. — 4. wynika natychmiast z tego wzoru.

Ponieważ we wzorze (359) oba czynniki: dαi1,...,ik oraz dxi1∧· · ·∧dxik są antysymetrycz-

ne, zatem niezerowy wkład dają tylko człony, dla których (i1, . . . , ik) są różne. Ale w takimrazie permutacja tych wskaźników powoduje (ewentualną) zmianę znaku obydwu czynni-ków, zatem ich iloczyn nie zmienia się pod wpływem permutacji. Mamy więc równoważnywzór na różniczkę zewnętrzną:

dα =∑

i1<···<ikdαi1,...,ik ∧ dxi1 ∧ · · · ∧ dxik . (368)

131

Page 138: Rozn. Geom_ - Jerzy Kijowski

Przy pomocy tego wzoru możemy też wyprowadzić – niezależne od jakiegokolwek ukła-du współrzędnych – wyrażenie pozwalające obliczyć wartość (m+1)-formy dα(m) na ukła-dzie (m+ 1) pól wektorowych (X(0), X(1), . . . , X(m)):Twierdzenie. Zachodzi wzór:⟨dα(m);X(0), X(1), . . . , X(m)

⟩=

=m∑

i=0

(−1)iX(i)(⟨α(m);X(0), X(1), . . . , X(i−1), X(i+1), . . . , X(m)

⟩) +

0¬i<j¬m(−1)i+j·

·⟨α(m); [X(i), X(j)], X(0), X(1), . . . , X(i−1), X(i+1), . . . , X(j−1), X(j+1), . . . , X(m)

⟩.

Dowód tego twierdzenia polega na wyliczeniu wartości wszystkich trzech wyrażeń wdowolnym układzie współrzędnych. Najłatwiej rozpocząć od pierwszego wyrazu po pra-wej stronie równości, który umiemy zapisać przy pomocy współrzędnych formy i współ-rzędnych naszych wektorów. Różniczkowanie tego wyrażenia względem pól X(i) daje dwarodzaje członów: gdy różniczkowanie „uderza” na współczynniki αi1,...,im, otrzymujemywłaśnie współczynniki formy dα(m); gdy natomiast różniczkowanie „uderza” na składowepól X(j), otrzymujemy niechciane człony, które jednak upraszczają się dokładnie z wyraże-niem zawierającym komutator [X(i), X(j)] tych pól. Sprawdzenie, że istotnie tak się dziejepozostawimy Czytelnikowi jako proste ćwiczenie.Powyższe wyrażenie można byłoby również przyjąć jako definicję operatora d. Łatwo

wykazać, że wynikają z niej wszystkie własności, które poznaliśmy do tej pory.Ćwiczenie. 1. W przestrzeni trójwymiarowej, przy współrzędnych (x, y, z) rozważymyformy różniczkowe:

α(2) = sin(x2z)dx ∧ dy + 2xydy ∧ dz − dz ∧ dx ,α(1) = sinh(y2z)dx + xyzdy − ezxdz .

Obliczmy ich różniczki zewnętrzne.

dα(2) = [2xz cos(x2z)dx + x2 cos(x2z)dz] ∧ dx ∧ dy + [2ydx+ 2xdy] ∧ dy ∧ dz == x2 cos(x2z)dz ∧ dx ∧ dy + 2ydx ∧ dy ∧ dz == (x2 cos(x2z) + 2y)dx ∧ dy ∧ dz ,

dα(1) = 2yz cosh(y2z)dy ∧ dx+ y2 cosh(y2z)dz ∧ dx+ yzdx ∧ dy++ xydz ∧ dy − zezxdx ∧ dz == (yz − 2yz cosh(y2z))dx ∧ dy + (y2 cosh(y2z) + zezx)dz ∧ dx+ yzdx ∧ dy .

Obliczmy teraz ddα(1):

ddα(1) = (y − 2y cosh(y2z)− 2y3z sinh(y2z))dx ∧ dy ∧ dz++ (2y cosh(y2z) + 2y3z sinh(y2z))dx ∧ dy ∧ dz + ydx ∧ dy ∧ dz = 0 .

Ćwiczenie. 2. W przestrzeni czterowymiarowej, o współrzędnych (x, y, z, t), rozważamyjedno-formę:

α(1) = log(y2 + x2)dt+ xzdy .

132

Page 139: Rozn. Geom_ - Jerzy Kijowski

Znajdźmy dα(1) i ddα(1):

dα(1) =

(2y

x2 + y2dy +

2xx2 + y2

dx

)∧dt+ (zdx+ xdz) ∧ dy =

=2y

x2 + y2dy ∧ dt+ 2x

x2 + y2dx ∧ dt+ zdx ∧ dy + xdz ∧ dy ,

ddα(1) = −2x2y(x2 + y2)2

dx ∧ dy ∧ dt− 2x2y(x2 + y2)2

dy ∧ dx ∧ dt+

+ dz ∧ dx ∧ dy + dx ∧ dz ∧ dy = 0 .

Ćwiczenie. 3. Zapiszemy formę z ćwiczenia 1 we współrzędnych sferycznych:

x = r sin(θ) cos(ϕ)

y = r sin(θ) sin(ϕ)

z = r cos(θ)

dx = sin(θ) cos(ϕ)dr + r cos(θ) cos(ϕ)dθ − r sin(θ) sin(ϕ)dϕdy = sin(θ) sin(ϕ)dr + r cos(θ) sin(ϕ)dθ + r sin(θ) cos(ϕ)dϕ

dz = cos(θ)dr − r sin(θ)dθ

dy ∧ dz = r sin(ϕ)dθ ∧ dr + r sin(θ) cos(θ) cos(ϕ)dϕ ∧ dr − r2 sin(θ) cos(ϕ)dϕ ∧ dθdz ∧ dx = r cos(ϕ)dr ∧ dθ − r sin(θ) cos(θ) sin(ϕ)dr ∧ dϕ+ r2 sin2(θ) sin(ϕ)dθ ∧ dϕdx ∧ dy = r sin2(θ)dr ∧ dϕ+ r2 sin(θ) cos(θ)dθ ∧ dϕ

α(2) = sin(r2 sin2(θ) cos2(ϕ)r cos(θ))[r sin2(θ)dr ∧ dϕ+ r2 sin(θ) cos(θ)dθ ∧ dϕ]+ 2r2 sin2(θ) cos(ϕ) sin(ϕ)(r sin(ϕ)dθ ∧ dr + r sin(θ) cos(θ) cos(ϕ)dϕ ∧ dr− r2 sin(θ) cos(ϕ)dϕ ∧ dθ) + r sin(ϕ)dr ∧ dθ + r sin(θ) cos(θ) cos(ϕ)dr ∧ dϕ− r2 sin(θ) cos(ϕ)dθ ∧ dϕ .

5.6 Transport i pochodna Liego pola kowektorowego oraz formyróżniczkowej

Każdy diffeomorfizmF :M → N

pozwalający transportować do przodu obiekty kontrawariantne (wektory), pozwala teżtransportować do tyłu obiekty kowariantne, jak kowektory i zbudowane z nich multi-kowektory oraz ich pola, czyli formy różniczkowe. Zasada jest taka sama jak w Rozdziale4.2, konkretnie we wzorze (287), którego multi-kowektorowa wersja przyjmuje oczywistąpostać: ⟨

F ∗(k)α ;v1, . . . ,vk

⟩:=⟨(k)α ;F∗v1, . . . , F∗vk

⟩. (369)

133

Page 140: Rozn. Geom_ - Jerzy Kijowski

Gdy (ya) stanowi układ współrzędnych naM zaś (xk) odpowiedni układ współrzędnych naN , a odwzorowanie F jest realizowane przez funkcje xi = F i(ya), wtedy transport formyróżniczkowej (359) wyraża się we współrzędnych następującym wzorem:

F ∗( 1k!αi1,...,ik · dxi1 ∧ · · · ∧ dxik

)=1k!αa1,...,ak · dya1 ∧ · · · ∧ dyak , (370)

gdzie nowe współrzędne αa1,...,ak wyrażają się przez stare tym samym wzorem (362)

αa1,...,ak = αi1,...,ik ·∂xi1

∂ya1· · · ∂x

ik

∂yak, (371)

ale interpretowanym „czynnie”. Tam, sama forma nie ulegała zmianie, ale zmienialiśmyjej opis, bowiem przechodziliśmy do nowego układu współrzędnych (interpretacja „bierna”wzoru (362)). Tutaj natomiast naprawdę transformujemy formę, czyli przyjmujemy inter-pretację „czynną” tego samego wzoru. Zgodność tych obu interpretacji podkreślaliśmy jużzarówno w przypadku wektorów (Rozdział 2.12, wzór (111)) jak i kowektorów (Rozdział4.2, wzór (291)). Zgodność ta jest uniwersalną własnością używanego tutaj formalizmu:zamiana współrzędnych to nic innego niż odwzorowanie tożsamościowe.

id :M →M ,

jednak opisywane w dwu różnych układach współrzędnych: układzie (ya) w M po lewejstronie powyższej strzałki (tzn. w dziedzinie odwzorowania id), oraz (xi) po prawej stronie(czyli w obrazie tegoż odwzorowania).Zgodnie z definicją iloczynu zewnętrznego (330), jest on w sposób oczywisty przemienny

z operacją transportu:Twierdzenie 1:

F ∗((k)α ∧

(l)

β

)=(F ∗(k)α)∧(F ∗(l)

β

). (372)

Zauważmy, że operator różniczkowania zewnętrznego (368) jest zbudowany wyłącznie zoperacji mnożenia zewnętrznego oraz operacji różniczki, ale stosowanej wyłącznie do funkcjiskalarnej αi1,...,ik . Jak wykazaliśmy w rozdziale 4.2 (patrz wzór (293)) różniczkowanie funkcjijest również przemienne z operacją transportu. Wynika stąd, że jest z nią przemienneróżniczkowanie zewnętrzne w ogólnym przypadku k-formy różniczkowej:Twierdzenie 2:

d(F ∗(k)α)= F ∗

(d(k)α). (373)

Własność ta jest, być może, najważniejszą własnością różniczki zewnętrznej. W wielutekstach powyższy fakt podsumowuje się stwierdzeniem: „różniczkowanie zewnętrzne jestoperacją naturalną”. Zwróćmy uwagę, iż dowód Lematu w Rozdziale 5.5 (czyli w gruncierzeczy dowód wzoru (367), mówiącego iż zachodzi równość dα = dα) może być traktowa-ny jako bezpośredni, rachunkowy dowód równości (373). W tym celu znów należy przyjąćinterpretację „czynną” tego wzoru: ya = F a(xi), podczas gdy w tamtym dowodzie nie było

134

Page 141: Rozn. Geom_ - Jerzy Kijowski

żadnego odwzorowania, jedynie zmiana opisu tego samego obiektu spowodowana zmianąprzyjętego układu współrzędnych. Jednak rachunki, będące bezpośrednim dowodem po-wyższego twierdzenia są te same w obu przypadkach!Zgodnie z dyskusją przeprowadzoną w Rozdziale 3.7, infinitezymalną wersją transportu

obiektu geometrycznego jest jego pochodna Liego względem pola wektorowego X. Pochod-na ta jest związana z transportem obiektu przy pomocy lokalnych diffeomorfizmów GXt ,generowanych przez to pole. W przypadku obiektów kowariantnych, jakimi są formy róż-niczkowe, pochodną Liego definiujemy jak we wzorze (200), to znaczy:Definicja: Pochodną Liego formy różniczkowej α nazywamy formę tego samego rzędu

daną wzorem:

£Xα := limǫ→0

(GXǫ

)∗α− αǫ

=ddt

[(GXt

)∗α]∣∣∣∣∣t=0

. (374)

Okazuje się, że pochodna ta wyraża się w prosty sposób przez różniczkę zewnętrznąformy oraz przez pewną naturalną operację algebraiczną, którą wygodnie będzie właśnieteraz zdefiniować:Definicja: Iloczynem wewnętrznym k-formy różniczkowej α z polem wektorowym X

nazywamy (k − 1)-formę oznaczaną15 jako X α i powstałą przez wysycenie (zapełnienie)pierwszego „slotu” formy α polem X:

⟨X α ; X(1), . . . , X(k−1)

⟩=⟨α ; X,X(1), . . . , X(k−1)

⟩. (375)

Zachodzi podstawowej wagi wzór na pochodną Liego formy różniczkowej:Twierdzenie 3:

£Xα = d(X α) +X (dα) . (376)

Dowód: Użyjemy tego samego wybiegu, który tak nam uprościł rozumowanie prowa-dzące do dowodu wzoru na pochodną Liego pola kowektorowego (patrz Rozdział 3.7, dowódwzoru (207)), mianowicie wyprostujemy pole X, to znaczy użyjemy układu współrzędnych,w którym X = ∂

∂x1. W tym celu rozważymy wpierw przypadek, gdy pole X nie znika w oto-

czeniu badanego punktu. Pozostałe przypadki podsumujemy następnie tak, jak zrobiliśmyto w tamtym rozumowaniu.Po „wyprostowaniu” pola mamy zatem:

£ ∂

∂x1

(αi1,...,ik · dxi1 ∧ · · · ∧ dxik

)=∂αi1,...,ik∂x1

· dxi1 ∧ · · · ∧ dxik , (377)

zgodnie propagowanym wcześniej sloganem mówiącym, że „pochodna Liego to zwykła,cząstkowa pochodna, liczona w układzie, w którym pole jest wyprostowane”. I rzeczywiście,transport wzdłuż pola ∂

∂x1nie zmienia współrzędnych xi dla i ­ 2. Współrzędna x1 zmienia

się, ale jedynie o stałą, zatem wszystkie cegiełki „dxi” różniczkowanej formy nie zmieniająsię podczas transportu i jedynym jej elementem, który ulega zmianie jest funkcja skalarna

15Ze względów graficznych wygodniejsze jest to stare i mało już używane oznaczenie. Dlatego też, wbrewobowiązującej „modzie”, nakazującej używania symbolu i(X)α, iloczyn wewnętrzny będziemy oznaczalijako X α.

135

Page 142: Rozn. Geom_ - Jerzy Kijowski

αi1,...,ik , która jest po prostu przesuwana wzdłuż linii zmiennej x1. Pochodna (374) po

parametrze przesunięcia da zatem jej pochodną cząstkową, tę właśnie, która pojawia siępo prawej stronie powyższego wzoru. A zatem: w tym układzie współrzędnych pochodnaLiego sprowadza się do zwykłej pochodnej cząstkowej ∂

∂x1.

Pokażemy teraz, że również prawa strona wzoru (376) sprowadza się do tej pochodnejcząstkowej. W tym celu zauważmy, że wśród składników formy po lewej stronie formuły(377) można wyróżnić dwa typy: te które nie zawierają czynnika „dx1” i te, które gozawierają. Wykażemy (376) oddzielnie dla tych dwóch typów. A zatem:

1. Jeśliα = a · dxi1 ∧ · · · ∧ dxik ,

gdzie wszystkie is ­ 2 dla s = 1, . . . , k, to mamy ∂∂x1

α = 0. Natomiast

dα =∂a

∂x1· dx1 ∧ dxi1 ∧ · · · ∧ dxik + ∂a

∂xi0· dxi0 ∧ dxi1 ∧ · · · ∧ dxik ,

gdzie znów i0 ­ 2. Wobec tego otrzymujemy:

d

(∂

∂x1α

)+

∂x1(dα) =

∂x1(dα) =

∂a

∂x1· dxi1 ∧ · · · ∧ dxik = £ ∂

∂x1α .

2. Jeśli natomiast α zawiera czynnik „dx1”, to znaczy gdy

α = a · dx1 ∧ dxi2 ∧ · · · ∧ dxik ,

gdzie wszystkie is ­ 2 dla s = 2, . . . , k, to mamy:∂

∂x1α = a · dxi2 ∧ · · · ∧ dxik

oraz

d

(∂

∂x1α

)=

∂a

∂x1· dx1 ∧ dxi2 ∧ · · · ∧ dxik + ∂a

∂xi0· dxi0 ∧ dxi2 ∧ · · · ∧ dxik ,

gdzie znów i0 ­ 2. Natomiast

dα =∂a

∂xi0· dxi0 ∧ dx1 ∧ dxi2 ∧ · · · ∧ dxik

= − ∂a

∂xi0· dx1 ∧ dxi0 ∧ dxi2 ∧ · · · ∧ dxik .

Wobec tego∂

∂x1(dα) = − ∂a

∂xi0· dxi0 ∧ dxi2 ∧ · · · ∧ dxik .

Ostatecznie więc również dla form tego typu otrzymujemy:

d

(∂

∂x1α

)+

∂x1(dα) =

∂a

∂x1· dx1 ∧ dxi2 ∧ · · · ∧ dxik = £ ∂

∂x1α .

136

Page 143: Rozn. Geom_ - Jerzy Kijowski

Wykazaliśmy zatem równość (376) w szczególnym układzie współrzędnych, w którym poleX jest „wyprostowane”. Ale dwie formy równe w jednym układzie współrzędnych są sobierówne w każdym innym układzie, a zatem są sobie równe jako obiekty geometryczne.A zatem równość (376) została wykazana we wszystkich punktach, w których pole X

nie znika. Jeśli natomiast X(x) = 0 to, podobnie jak to miało miejsce w Rozdziale 3.7,możliwe są dwa przypadki:

1. Jeśli X znika tożsamościowo w otoczeniu punktu x, to zarówno pochodna Lie’go ze-ruje się w tym punkcie bowiem GXt = id w otoczeniu tego punktu, jak i oba wyrażeniapo prawej stronie równości (376) znikają. A zatem teza Twierdzenia jest prawdziwa.

2. Jeśli X znika w x, ale nie znika w żadnym jego otoczeniu, to istnieje ciąg punktówxl zbieżny do naszego punktu x i taki, że X(xl) 6= 0, a zatem takich, w którychobowiązuje równość (376). Ponieważ oba pola są ciągłe, równość ta przenosi się teżdo naszego punktu x.

Przykład: W trójwymiarowej przestrzeni euklidesowej, parametryzowanej współrzęd-nymi kartezjańskimi (x, y, z), obliczmy pochodną Liego pola dx względem generatora ob-rotów wokół osi „z”, to znaczy pola Z = x ∂

∂y− y ∂

∂x(patrz wzór (181)). Korzystając bez-

pośrednio z definicji (374) oraz z wyliczonej poprzednio wzorem (294) wartości transportutej formy: (

GZt)∗(dx) = dx · cos t− dy · sin t ,

otrzymujemy natychmiast

£Z(dx) =ddt

[(GZt)∗dx]∣∣∣∣∣t=0

=ddt(dx · cos t− dy · sin t)

∣∣∣∣∣t=0

= −dy . (378)

Używając z kolei Twierdzenia 3 (wzór (5.7)) otrzymujemy ten sam wynik:

£z(dx) = d(Z (dx)) + Z (ddx) = d

(x∂

∂y− y ∂

∂x

)dx

= −dy .

5.7 Twierdzenie Stokesa

Nadeszła pora, by sformułować i udowodnić najważniejsze twierdzenie geometrii różniczko-wej (według opinii wielu wybitnych matematyków jest to najważniejsze twierdzenie mate-matyki), mianowicie Twierdzenie Stokes’a. Jak się wkrótce przekonamy, jego najogólniejszawersja, zawiera klasyczne twierdzenia Gaussa, Greena-Ostrogradskiego i wiele innych, jakobardzo szczególne przypadki. Twierdzenie to zapisuje się identycznie jak znana już namwersja jednowymiarowa, zapisana w formule (305):

Ddf =

∂Df .

137

Page 144: Rozn. Geom_ - Jerzy Kijowski

Jedyna różnica polega na tym, że obowiązuje ona nie tylko dla funkcji „f” (czyli „zero-

formy”), ale dla dowolnej k-formy różniczkowej „kα”, gdzie k ­ 0. Różniczka „d kα” takiej

formy jest (k+1)-formą, którą wolno całkować nie po „byle czym”, a jedynie po rozmaitości(k + 1)-wymiarowej D(k+1). Brzeg ∂D(k+1) tej rozmaitości jest k-wymiarowy: taki akurat,

jakiego potrzeba, by całkować po nim samą formę „kα”. Mamy zatem:

Twierdzenie Stokesa. Dla dowolnej zorientowanej, zwartej rozmaitości z brzegiemD(k+1) wymiaru (k + 1) oraz dowolnej k-formy różniczkowej

kα, zachodzi następująca rów-

ność: ∫

D(k+1)

dkα=

∂D(k+1)

kα , (379)

gdzie ∂D(k+1) jest brzegiem rozmaitości D(k+1), czyli kolekcją wszystkich jej zorientowanychścian. Orientacja tych ścian jest jednoznacznie określona przez orientację samej rozmaitościwedług poniższej reguły.

Definicja. Jeśli D(k+1) jest rozmaitością zorientowaną zaś Sj — jej ścianą powstałą powysyceniu nierówności Hj ¬ 0 w definicji (327), to orientacją ściany Sj odziedziczoną poD(k+1) nazywamy atlas składający się z parametryzacji (t1, . . . , tk) mających następującąwłasność: parametryzacja (Hj, t1, . . . , tk) jest zgodna z orientacją samej D(k+1).

W duchu rozważań z Rozdziału 5.4 można powiedzieć, że orientacja ściany wiąże się zkierunkiem wzrostu funkcji Hj, to znaczy na zewnątrz rozmaitości D(k+1), skoro punkty tejrozmaitości w pobliżu ściany Sj spełniają warunek Hj ¬ 0.

Uwaga 1: Przejście od całek jednokrotnych do całek wielokrotnych wygląda bardzopoważnie. Można odnieść wrażenie, że obecne Twierdzenie Stokesa jest radykalnym uogól-nieniem „prościutkiego”, jednowymiarowego twierdzenia z Rozdziału 4.4. Tak jest rzeczy-wiście, ale tylko w warstwie „ideologicznej”, bowiem w warstwie technicznej uogólnienieto jest niezwykle proste. Jak zobaczymy w dowodzie, z całej (k + 1)-wymiarowej całki polewej stronie wzoru (379) liczy się tylko całka jednowymiarowa w kierunku transwersalnymdo brzegu, a cała reszta jest zwykłym „ozdobnikiem”. W rezultacie tej obserwacji całydowód znów sprowadza się do podstawowego twierdzenia rachunku różniczkowego i całko-wego: całka z różniczki funkcji jest równa przyrostowi funkcji na odcinku całkowania. Ajednak można naprawdę wpaść w zachwyt wobec faktu, że inteligentne zastosowanie pro-stych „ozdobników” pozwala podnieść tę „banalną”, jednowymiarową obserwację do ranginiezwykle uniwersalnego twierdzenia, znajdującego zastosowanie niemal we wszystkich ga-łęziach matematyki i jej zastosowań. Sytuacja ta jest doskonałą ilustracją prowokacyjnejtezy, iż geometria różniczkowa to: 1) umiejętne posługiwanie się krzywoliniowymi układamiwspółrzędnych a następnie 2) inteligentny system zbierania danych, który zachowuje tylkowyniki niezależne od wyboru układu współrzędnych.

138

Page 145: Rozn. Geom_ - Jerzy Kijowski

Uwaga 2: Zanim przejdziemy do dowodu Twierdzenia Stokes’a zauważmy, że w defi-

nicji (328) całkujemy w gruncie rzeczy nie samą formę(k)α , ale jej cofnięcie „id∗

((k)α)” do

podrozmaitości D:

D

(k)α :=

D

⟨(k)α ;

∂t1, . . . ,

∂tk

⟩dkt =

Did∗

((k)α), (380)

gdzieid : D →M

jest odwzorowaniem tożsamościowym, które każdemu punktowi x ∈ D przyporządkowujeten sam punkt, ale już traktowany jako punkt w M . W tym przypadku transport „id∗”formy polega na wyliczaniu jej wartości wyłącznie na wektorach stycznych do D, a przecieżtylko takie pojawiają się w tym wzorze.

W ten sposób formękα po prawej stronie równości (379) można zastąpić jej cofnięciem

id∗((k)α)do podrozmaitości16 D(k+1). Podobny wybieg można zastosować po lewej stro-

nie tejże równości i całkować cofnięcie różniczki zewnętrznej formy(k)α . Ale, jak wiemy z

rozważań Rozdziału 5.6 (patrz wzór (373)), zachodzi tożsamość:

id∗(d(k)α)= d

(id∗

((k)α))

.

Wobec tego wystarczy ograniczyć się do dowodu twierdzenia Stokes’a dla formy id∗((k)α).

Stąd wynika już prawdziwość jego tezy w ogólnym przypadku. Oznacza to, że w dowodziemożemy zapomnieć o dużej rozmaitości M i rozważać jedynie (k + 1)-wymiarową rozma-itość D(k+1), a na niej dowolną k-formę różniczkową. Innymi słowy: wystarczy udowodnićTwierdzenie dla formy α rzędu o jeden mniejszego niż wymiar samej podrozmaitości D,po której będziemy całkować dα.

Dowód Twierdzenia Stokes’a w przypadku uproszczonym. Aby nie ugrzęznąć wszczegółach technicznych, a zrozumieć istotę rzeczy, przyjmijmy upraszczające założenie,iż na (k + 1)-wymiarowej rozmaitości z brzegiem D(k+1) można wybrać globalny układwspółrzędnych (t0, t1, . . . , tk) w taki sposób, że cała definicja rozmaitości z brzegiem (327)sprowadza się do nierówności ograniczających ich zakres:

u0 ¬ t0 ¬ w0 ,

u1 ¬ t1 ¬ w1 ,...

uk ¬ tk ¬ wk .

(381)

16Można byłoby cofnąć ją nawet do mniejszego zbioru, mianowicie brzegu ∂D(k+1) ⊂ D(k+1), ale docelów naszego dowodu takie cofnięcie nie byłoby przydatne.

139

Page 146: Rozn. Geom_ - Jerzy Kijowski

Wobec tego brzeg ∂D(k+1) składa się z 2(k + 1) ścian:

S+i = ti = wi , S−i = ti = ui .

Załóżmy ponadto, że układ ten jest zgodny z orientacją rozmaitości (gdyby tak nie było,to wystarczy zamienić numery dwóch współrzędnych i już spełnimy warunek zgodności).Po ustaleniu wartości i-tej współrzędnej, pozostałe współrzędne

(t0, . . .∧i

. . . , tk)

stanowią dobry układ współrzędnych na obu ścianach S+i oraz S−i . Nie są to jednak układy

zgodne z orientacją odziedziczoną po orientacji D(k+1). Rzeczywiście, zgodnie z Definicjąpod wzorem (379), dla S+i kryterium zgodności orientacji jest to, czy układ

(ti, t0, . . .∧i

. . . , tk) (382)

jest zgodny z orientacją samego D(k+1). Natomiast dla S−i to samo kryterium wyglądanastępująco:

(−ti, t0, . . .∧i

. . . , tk) (383)

ma być zgodne z orientacją D(k+1), bowiem to nie ti a właśnie −ti rośnie na zewnątrz. Obate kryteria na ogół nie są spełnione: w przypadku S+i trzeba przeprowadzić t

i z początkuna swoje (wakujące) miejsce, czyli dokonać k przestawień, aby uzyskać pierwotny układwspółrzędnych, zgodny z orientacją. Oznacza to, że jeśli całkujemy formę różniczkową poS+i przy pomocy układu współrzędnych (382), to wynik należy pomnożyć przez (−1)i. Wprzypadku S+i , wyniki całkowania przy pomocy układu (383) wymagają korekty o czynnik(−1)i+1, bowiem „poprawianie” tego układu musimy rozpocząć od zamiany znaku pierwszejwspółrzędnej.Dowolną k-formę różniczkową w tej przestrzeni można zapisać w postaci:

(k)α=

k∑

i=0

(−1)iai · dt0 ∧ · · ·∧i

· · · ∧ dtk =k∑

i=0

ai · ∂∂ti

(dt0 ∧ · · · ∧ dtk

), (384)

gdzie symbolem „∧i”, podpisanym pod iloczynem wewnętrznym wielu różniczek, oznaczy-

liśmy brak różniczki dti, tzn. czynnika o numerze „i”. Współczynnik (−1)i pochodzi stąd,że iloczyn wewnętrzny po prawej stronie równości polega na wysyceniu pierwszego slotu. Azatem czynnik dti należało najpierw przesunąć ze swojego miejsca na początek, aby tamzostał zanihilowany przez wektor ∂

∂ti. Ponieważ zamieniając jego pozycję z którymkolwiek z

poprzednich k czynników musimy zmienić znak całego wyrażenia, więc ostatecznie zyskujeono współczynnik (−1)i. Obliczmy różniczkę tej formy:

d(k)α=

k∑

i=0

(−1)i∂ai

∂ti· dti ∧ dt0 ∧ · · ·

∧i

· · · ∧ dtk =(k∑

i=0

∂ai

∂ti

)dt0 ∧ · · · ∧ dtk .

140

Page 147: Rozn. Geom_ - Jerzy Kijowski

Po takim przygotowaniu obliczymy wreszcie lewą stronę równości (379):

D(k+1)

dkα =

k∑

i=0

∫ w0

u0dt0 · · ·

∫ wk

ukdtk

∂ai

∂ti=k∑

i=0

∫ w0

u0dt0 · · ·

∧i

· · ·∫ wk

ukdtk

[ai]ti=witi=ui

=k∑

i=0

∫ w0

u0dt0 · · ·

∧i

· · ·∫ wk

ukdtkai(t0, . . . , wi, . . . , tk)

−k∑

i=0

∫ w0

u0dt0 · · ·

∧i

· · ·∫ wk

ukdtkai(t0, . . . , ui, . . . , tk) ,

bowiem całkowanie pochodnej ∂ai

∂tiwzględem zmiennej ti daje w wyniku przyrost samej

funkcji ai na odcinku całkowania. Ale∫ w0

u0dt0 · · ·

∧i

· · ·∫ wk

ukdtkai

=∫ w0

u0dt0 · · ·

∧i

· · ·∫ wk

ukdtk

⟨ai · dt0 ∧ · · ·

∧i

· · · ∧ dtk ; ∂

∂t0, · · ·

∧i

· · · , ∂∂tk

= (−1)k∫ w0

u0dt0 · · ·

∧i

· · ·∫ wk

ukdtk

⟨kα ;

∂t0, · · ·

∧i

· · · , ∂∂tk

⟩.

Zatem po ustaleniu wartości ti = wi powyższa całka jest równa po prostu całce po ścianieS+i . Natomiast dla ściany S

−i nasza dyskusja dotycząca orientacji wykazuje, że po ustaleniu

wartości ti = ui powyższa całka jest równa minus całce po tej ścianie. Zatem całka z

różniczki dkα po rozmaitości D(k+1) jest sumą całek z samej formy

kα po wszystkich ścianach

brzegu:∫

D(k+1)

dkα=

k∑

i=0

S+i

kα +

k∑

i=0

S−i

kα=

∂D(k+1)

kα .

Jak widać z powyższego dowodu, istotą rzeczy jest całkowanie jednowymiarowe, a resztato inteligentny bookkeeping.

Dowód Twierdzenia Stokes’a w przypadku ogólnym. Przeprowadzimy dowódmetodą „dzielenia tortu”. W Rozdziale 4.6 omówiliśmy dwa sposoby takiego podziału:pierwszy, to pionowe cięcie nożem zaś drugi, to podział gładki, przy pomocy rozkładujedności. Pierwszy sposób polega na podzieleniu całej rozmaitości D(k+1) na małe kawałki,z których każdy mieści się już w dziedzinie jakiejś mapy, a więc twierdzenie Stokesa jest jużspełnione. Następnie zauważamy, że każda k-wymiarowa ściana wewnętrzna występuje dwarazy: jako fragment brzegu dwóch sąsiednich kawałków (k+1)-wymiarowych. Ale za każdymrazem niesie inną orientację, bowiem kierunek „na zewnątrz” jednego z tych kawałków jestkierunkiem „do wewnątrz” dla sąsiada (zob. Rysunek 20). Wynika stąd, że w sumie całekbrzegowych wkłady od ścian wewnętrznych kasują się i pozostaje jedynie suma całek pościanach zewnętrznych, czyli właśnie po brzegu samego D(k+1). Drugi sposób polega na

141

Page 148: Rozn. Geom_ - Jerzy Kijowski

D

D1 D2

Rysunek 20: Całki po ścianie wewnętrzej kasują się z powodu przeciwnej orientacji.

tym, by w otoczeniu każdego punktu x ∈ D(k+1) wybrać lokalny układ współrzędnych wktórym funkcje Hi, pojawiające się w nierównościach definiujących (327), są równe samymwspółrzędnym ti. Lokalnie takie dobre współrzędne istnieją. Z pokrycia rozmaitości D(k+1)dziedzinami takich dobrych układów można wybrać podpokrycie skończone a następniewpisać weń gładki rozkład jedności

N∑

j=1

fj(x) ≡ 1 .

I wtedy rozkładamy naszą formę różniczkową na sumę:

kα=

N∑

j=1

kαj ,

której każdy składnikkαj:= fj ·

ma nośnik zawarty w dziedzinie układu współrzędnych spełniającego upraszczające założe-nia naszego poprzedniego Dowodu. Wobec tego Twierdzenie zachodzi oddzielnie dla każdej

z form różniczkowychkαj. Sumując wyniki dla wszystkich

kαj otrzymujemy Twierdzenie dla

ich sumy równejkα.

5.8 Przykłady i ćwiczenia dotyczące Twierdzenia Stokesa

Przykład: Jeśli mamy orientację daną w R3 prawoskrętnym układem współrzędnych kar-tezjańskich (x, y, z) i przechodzimy do układu współrzędnych sferycznych (r, θ, ϕ) to w celuupewnienia się, czy nowa mapa niesie tę samą orientację musimy sprawdzić znak Jacobianuprzejścia:

det

∣∣∣∣∣∣∣∣

∂x∂r

∂x∂θ

∂x∂ϕ

∂y∂r

∂y∂θ

∂y∂ϕ

∂z∂r

∂zθθ

∂z∂ϕ

∣∣∣∣∣∣∣∣= r2 sin θ > 0 , (385)

zatem orientacja (r, θ, ϕ) jest zgodna z orientacją (x, y, z).

142

Page 149: Rozn. Geom_ - Jerzy Kijowski

Ćwiczenie. 4. Sprawdzimy na przykładzie czy działa wzór Stokesa w przestrzeni cztero-wymiarowej, opisanej współrzędnymi (t, x, y, z). Weźmy dwuformę i trójwymiarową pod-rozmaitość, które są dane wzorami:

α(2) = (x2 + y2 + z2)dx ∧ dy − xydy ∧ dz + cosh(xy2z)dt ∧ dx

Ω =

t = 0

0 ¬ z ¬ 1y ­ 0x2 + y2 ¬ 1

Wybieramy na Ω orientację lewoskretną (x, z, y).

dα(2) = 2zdz ∧ dx ∧ dy − ydx ∧ dy ∧ dz + 2xyz sinh(xy2z)dy ∧ dt ∧ dx++ xy2 sinh(xy2z)dz ∧ dt ∧ dx == (2z − y)dz ∧ dx ∧ dy + 2xyz sinh(xy2z)dy ∧ dt ∧ dx+ xy2 sinh(xy2z)dz ∧ dt ∧ dx

Ponieważ współrzędna t jest stała na Ω, to dt znika na tej podrozmaitości. Zatem całka zdα(2) po Ω wygląda następująco:

Ω(3)dα(2) =

∫∫∫ ⟨dα(2);

∂x,∂

∂z,∂

∂y

⟩dxdydz =

=∫∫∫(2z − y)

⟨dz ∧ dx ∧ dy; ∂

∂x,∂

∂z,∂

∂y

⟩dxdydz =

=∫∫∫(y − 2z)dxdydz =

∫ 1

0dz∫ 1

−1dx∫ √1−x2

0(y − 2z)dy = 2

3− π

2

Całka brzegowa ∫

∂Ω(3)

α(2)

składa się z sumy całek po czterech ścianach:

z = 1 (S1)

z = 0 (S2)x2 + y2 = 1 (S3)

y = 0 (S4)

∂Ω(3) = S1 + S2 + S3 + S4

Całka z α(2) liczona po ścianach S1 i S2 zawiera jedynie jej pierwszy człon, tzn. (x2 + y2+z2)dx ∧ dy. Ale ściany te mają przeciwne orientacje, zatem wkład od x2 + y2 uprości się.Pozostaje wkład od z2, która to funkcja przyjmuje wartość z2 = 1 na górnej ścianie orazz2 = 0 na dolnej. Wobec tego otrzymujemy:

S1+S2α = −

∫ 1

−1dx∫ √1−x2

0dy = −π

2. (386)

143

Page 150: Rozn. Geom_ - Jerzy Kijowski

Całkę po S3 liczymy w zmiennych biegunowych:

x = ρ cosϕ

y = ρ sinϕ∂

∂ϕ=∂x

∂ϕ

∂x+∂y

∂ϕ

∂y

S3

α =∫dz∫dϕ

⟨α;

∂z,∂

∂ϕ

⟩=

=∫dz∫dϕ

⟨α;

∂z, x

∂y− y ∂

∂x

⟩=

=∫ 1

0dz∫ π

0x2ydϕ =

23∫

S4= 0 ,

czyli∫∂Ω(3)

α(2) = 23 − π2Ćwiczenie. 5. W przestrzeni trójwymiarowej obliczyć całkę z dwuformy α(2) = xdy ∧dz + ydx ∧ dz po powierzchni bryły, której ściany są opisane równaniami:

S1 : x2 + y2 + z2 = 1

S2 : z = 0

S2

α =∫ ∫ ⟨

α;∂

∂y,∂

∂x

⟩dxdy = 0

S1α =

∫ ∫ ⟨α;

∂θ,∂

∂ϕ

⟩dθdϕ .

Ponieważ zachodzi

∂θ=∂x

∂θ

∂x+∂y

∂θ

∂y+∂z

∂θ

∂z

= z cos(ϕ)∂

∂x+ z sin(ϕ)

∂y−√x2 + y2

∂z∂

∂ϕ=∂x

∂ϕ

∂x+∂y

∂ϕ

∂y+∂z

∂ϕ

∂z= x

∂y− y ∂

∂x,

otrzymujemy:⟨α; z cos(ϕ)

∂x+ z sin(ϕ)

∂y−√x2 + y2

∂z, x

∂y− y ∂

∂x

=√x2 + y2

⟨dy ∧ dz; ∂

∂z,∂

∂y

⟩=(x2 − y2

)√x2 + y2 .

144

Page 151: Rozn. Geom_ - Jerzy Kijowski

S1α =

∫ ∫ ⟨α;

∂θ,∂

∂ϕ

⟩=∫ π2

0dθ∫ 2π

0

(x2 − y2

)√x2 + y2dϕ

=∫ π2

0dθ∫ 2π

0r3 sin3(θ)

(cos2(ϕ)− sin2(ϕ)

)dϕ = 0 .

Ćwiczenie. 6. Wyrazić we współrzędnych sferycznych formę różniczkową:

α(2) = xdy ∧ dz + ydz ∧ dx+ zdx ∧ dy

x = r sin(θ) cos(ϕ)

y = r sin(θ) sin(ϕ)

z = r cos(θ)

dy ∧ dz = r sin(ϕ)dθ ∧ dr + r sin(θ) cos(θ) cos(ϕ)dϕ ∧ dr − r2 sin(θ) cos(ϕ)dϕ ∧ dθdz ∧ dx = r cos(ϕ)dr ∧ dθ − r sin(θ) cos(θ) sin(ϕ)dr ∧ dϕ+ r2 sin2(θ) sin(ϕ)dθ ∧ dϕdx ∧ dy = r sin2(θ)dr ∧ dϕ+ r2 sin(θ) cos(θ)dθ ∧ dϕ

α(2) = r3 sin(θ)dθ ∧ dϕ

Ćwiczenie. 7. Sprawdźmy wzór Stokesa dla formy α(1) = xdy oraz powierzchni dwuwy-miarowej D = (x, y, z)| x2 + y2 + z2 = 1, 0 ¬ z ¬ 1. Weźmy parametryzację

x = τ1y = τ2z =

√1− τ 21 − τ 22 (τ1, τ2) ∈ K(0, 1)

Mamy:

∂τ1=

∂x

∂τ1

∂x+∂y

∂τ1

∂y+∂z

∂τ1

∂z=

∂x− 2τ1

2√1− τ 21 − τ 22

∂z

∂τ2=

∂x

∂τ2

∂x+∂y

∂τ2

∂y+∂z

∂τ2

∂z=

∂y− 2τ2

2√1− τ 21 − τ 22

∂z.

A zatem∫

Ddα(1) =

K(0,1)

⟨dα;

∂τ1,∂

∂τ2

⟩dτ1dτ2 =

=∫ 1

−1dτ1

∫ √1−τ21−√1−τ21dτ2

⟨dx ∧ dy; ∂

∂τ1,∂

∂τ2

⟩=

=∫ 1

−1dτ1

∫ √1−τ21−√1−τ21dτ2 1 = π .

145

Page 152: Rozn. Geom_ - Jerzy Kijowski

Teraz scałkujmy po brzegu ∂D. Przyjmujemy podobną parametryzację:

x = τ1y = τ2z = 0τ 21 + τ

2 = 1

Otrzymujemy dwa odcinki łuku

1)

x = τ

y =√1− τ 2

z = 0

2)

x = τy = −

√1− τ 2

z = 0

W pierwszym przypadku τ przebiega odcinek od −1 do +1 a w drugim – odwrotnie. Zatemostatecznie:

∂Dα(1) =

∂Dxdy =

∫ −1

1τ−τdτ√1− τ 2

+∫ 1

−1τ

τdτ√1− τ 2

= 2∫ 1

−1

τ 2dτ√1− τ 2

= π

Ćwiczenie. 8. Weźmy dwa wektory v, w. Okazuje się, że wartość formy dx ∧ dy na tychwektorach jest równa składowej z ich iloczynu wektorowego. Rzeczywiście, oznaczając:

v = vx∂

∂x+ vy

∂y+ vz

∂z

w = wx∂

∂x+ wy

∂y+ wz

∂z

otrzymujemy :⟨dx ∧ dy; vx ∂

∂x+ vy

∂y+ vz

∂z,∂

∂x

⟩wx+

+

⟨dx ∧ dy; vx ∂

∂x+ vy

∂y+ vz

∂z,∂

∂y

⟩wy+

+

⟨dx ∧ dy; vx ∂

∂x+ vy

∂y+ vz

∂z,∂

∂z

⟩wz =

=

⟨dx ∧ dy; ∂

∂y,∂

∂x

⟩wxvy +

⟨dx ∧ dy; ∂

∂x,∂

∂y

⟩wyvx

=vxwy − wxvy .Biorąc cykliczną permutację zmiennych (x, y, z) możemy wyrazić składową x iloczynu wek-torowego przez działanie formy dy ∧ dz oraz składową y iloczynu wektorowego przez dzia-łanie formy dz ∧ dx na wektory v, w.

146

Page 153: Rozn. Geom_ - Jerzy Kijowski

5.9 Przykład zastosowania Twierdzenia Stokes’a: prawo Archi-medesa

Na obiekt zanurzony w cieczy działa siła wyporu będąca wypadkową sił parcia wywołanegociśnieniem hydrostatycznym. Jak wiemy z rozważań Rozdziału 5.4, siła ta jest równa (patrzwzór (348))

〈F(e1, e2) ;v〉 := p · 〈dx ∧ dy ∧ dz ; e1, e2,v〉 ,natomiast ciśnienie hydrostatyczne na głębokości h = −z wynosi

p = D · h = −D · z ,

gdzie D jest gęstością cieczy (współrzędną „z” liczymy od powierzchni cieczy w górę).Zatem kolejne współrzędne infinitezymalnej siły parcia wynoszą (por. (350)–(351)):

Fx = −Dzdy ∧ dz ,Fy = −Dzdz ∧ dx ,Fz = −Dzdx ∧ dy .

Aby znaleźć wypadkową tych sił, czyli siłę wyporu należy scałkować te wyrażenia po ca-łej powierzchni Sp zanurzenia ciała, zorientowanej do góry (por. rozważania Rozdziału5.4 dotyczące orientacji). Jeśli przez V oznaczyć całą objętość zanurzonej części rozwa-żanego obiektu, ograniczoną od góry powierzchnią S0, będącą jego przecięciem poziomąpowierzchnią z = 0 zorientowaną „w górę”, to zachodzi:

∂V = S0 − Sp . (387)

Znak minus pochodzi stąd, że jako element brzegu powierzchnia Sp ma orientację „dodołu”, a więc odwrotną do wybranej. Mamy zatem:

Px =∫

SpFx =

S0

Fx −∫

∂VFx = −

∂VFx ,

ponieważ na S0 mamy z = 0, a więc również F = 0. Ostatecznie więc

Px = D∫

∂Vzdy ∧ dz = D

Vd (zdy ∧ dz) = 0 , (388)

bowiem d (zdy ∧ dz) = dz ∧ dy ∧ dz = 0. Podobnie

Py = D∫

∂Vzdz ∧ dx = D

Vd (zdz ∧ dx) = 0 , (389)

natomiast

Pz = D∫

∂Vzdx ∧ dy = D

Vd (zdx ∧ dy) = D

Vdz ∧ dx ∧ dy = D · |V | , (390)

gdzie |V | jest objętością zanurzonej części ciała, czyli objętością cieczy wypartej przez tociało. Zatem D · |V | jest ciężarem wypartej cieczy, jak to przewidział Archimedes. Pozatrywialnymi przypadkami powierzchni, dla których całkowanie da się wykonać explicite,wynik ogólny byłby niemożliwy do otrzymania bez Twierdzenia Stokesa.

147

Page 154: Rozn. Geom_ - Jerzy Kijowski

5.10 Lemat Poincare

Definicja: Formę różniczkową α nazywamy zamkniętą jeśli jej różniczka zewnętrzna zni-ka: dα = 0. Formę różniczkową α nazywamy zupełną jeśli jest ona różniczką zewnętrznąpewnej formy β, tzn. gdy zachodzi α = dβ. Taką formę β nazywamy formą pierwotną lubpotencjałem dla formy α.Z tożsamości dd = 0 wynika, ze każda forma zupełna jest zamknięta. Zatem jedynie

formy zamknięte mają szanse na bycie zupełnymi. Innymi słowy: warunek dα = 0 jestwarunkiem koniecznym rozwiązalności równania różniczkowego α = dβ na formę β. Za-chodzi pytanie czy jest to również warunek dostateczny, tzn. czy każda forma zamkniętajest zupełna? Poniższe przykłady pokazują że tak nie jest.Ćwiczenie. 9. W przestrzeni M = R2 − 0 („dziurawa” płaszczyzna) przyjrzyjmy sięnastępującej jedno-formie różniczkowej, czyli polu kowektorowemu:

α(1) :=xdy − ydxx2 + y2

=x

x2 + y2dy − y

x2 + y2dx . (391)

Jest to forma zamknięta, bowiem mamy:

dα(1) =

(1

(x2 + y2)− 2x2

(x2 + y2)2

)dx ∧ dy +

(1

(x2 + y2)− 2y2

(x2 + y2)2

)dx ∧ dy (392)

=

(2

(x2 + y2)− 2(x

2 + y2)(x2 + y2)2

)dx ∧ dy = 0 . (393)

Naśladując rozważania Rozdziału 4.5, spróbujmy znaleźć potencjał tej formy, tzn. funk-cję U , której byłaby ona różniczką. Wybierzmy dowolny punkt a, ale różny od (0, 0), bo-wiem w tym punkcie forma nie jest dobrze określona. Spróbujmy zdefiniować potencjałU(x) wzorem:

U(x) =∫x

a

α(1) . (394)

Gdyby taka funkcja istniała, to na mocy rozważań z Rozdziału 4.5, byłaby właśnie poten-cjałem formy α(1). A istnieje ona wtedy, gdy powyższa całka nie zależy od drogi γ łącząceja z x. Gdyby wziąć dwie takie drogi: γ1 i γ2, to, „na chłopski rozum”, ich różnica powinnabyć brzegiem pewnej powierzchni ∂O = γ2 + (−γ1). A zatem możemy napisać:

γ2α(1) −

γ1α(1) =

∂Oα(1) =

Odα(1) = 0 . (395)

Powyższe rozumowanie zawiera jednak poważny błąd: jeśli punkt (0, 0) należałby do ob-szaru O (tzn. byłoby (0, 0) ∈ O), to forma α(1) oraz – oczywiście – jej różniczka dα(1)nie byłyby dobrze określone, a zatem wzór nie mógłby być zastosowany. Zatem powyższarówność zachodzi jedynie wtedy, gdy obszar nie zawiera zera, to znaczy wtedy, gdy zacho-dzi O ⊂ M . Widzimy zatem, że potencjał U może być skonstruowany jedynie lokalnie, wotoczeniu punktu odniesienia a, a próba jego globalnego rozszerzenia musi prowadzić dojakiejś sprzeczności. Do jakiej? Przekonamy się o tym w bezpośrednim rachunku.

148

Page 155: Rozn. Geom_ - Jerzy Kijowski

Wybierzmy np. a = (1, 0). Do celów rachunku oznaczmy x = (x0, y0), rezerwując sobiesymbol (x, y) na oznaczenie współrzędnych bierzącego punktu na krzywej γ, po którejbędziemy całkowali.Wybierzmy najpierw całkowanie po odcinkach prostych: poziomo od (1, 0) do (x0, 0) i

potem pionowo od (x0, 0) do (x0, y0). Otrzymujemy:

U(x) =∫ x010 · dx+

∫ y00

x0dyx20 + y2

=1x0

∫ y00

dy1 + ( y

x0)2=∫ y0x0

0

dt1 + t2

= arctgy0x0

(396)

Widzimy tutaj na czym polega paradoks „wyłącznie lokalnego” istnienia potencjału: funk-cja arctg y0

x0(równa fazie liczby zespolonej „x0+iy0”) jest dobrze określona w pobliżu punktu

(1, 0), jednak nie daje się przedłużyć do jednoznacznie określonej, ciągłej funkcji na całejprzestrzeni R2 − (0, 0).Aby przekonać się o (lokalnej!) niezależności całkowania od wyboru drogi, obliczmy

całkę (394) po innej drodze. Oznaczmy r0 :=√x20 + y20. Niech γ składa się z poziomego

odcinka od (1, 0) do (r0, 0)a następnie z wycinka okręgu o promieniu r0, łączącego punkt(r0, 0) z punktem (x0, y0). Zamieniamy także współrzędne kartezjańskie na współrzędnebiegunowe.

x = r cos(ϕ) y = r sin(ϕ) (397)

dy = sin(ϕ)dr + r cos(ϕ)dϕ (398)

dx = cos(ϕ)dr − r sin(ϕ)dϕ (399)

Po podstawieniu otrzymujemy ten sam wynik co we wzorze (396):

U(x) =∫ √x2+y21

0dr +∫ arctg y0

x0

0dϕ = arctg

y0x0

. (400)

W celach wyłącznie „treningowych” wykonajmy teraz całkowanie po prostej łączącej a zx, tzn. po prostej danej równaniem

y =y0

x0 − 1(x− 1) , (401)

którą parametryzujemy zmienną τ :x = 1 + τ(x0 − 1) , τ ∈ (0, 1)y = τy0

(402)

U(x) =∫ 1

0

(1 + τ(x0 − 1))y0 − τy0(x0 − 1)τ 2y20 + 1 + τ 2(x0 − 1)2 + 2τ(x0 − 1)

dτ (403)

=∫ 1

0

y0τ 2(y20 + (x0 − 1)2) + 2τ(x0 − 1) + 1

dτ . (404)

149

Page 156: Rozn. Geom_ - Jerzy Kijowski

Oznaczmy teraz ρ2 = (y0)2 + (x0 − 1)2. Otrzymujemy:

U(x) =∫ 1

0

y0

ρ2(τ + x0−1ρ2)2 − (x0−1)2

ρ2+ 1dτ =

y0ρ2

∫ 1

0

(τ + x0−1ρ2)2 + y

20

ρ4

(405)

=ρ2

y0

∫ 1

0

dτρ4

y20(τ + x0−1

ρ2)2 + 1

(406)

Podstawmy t = ρ2

y0τ + x0−1

y0i konsekwentnie dt = dτ ρ

2

y0. Otrzymujemy ostatecznie:

U(x) =∫ ρ2

y0+x0−1

y0

x0−1y0

dtt2 + 1

= arctgρ2 + x0 − 1

y0− arctgx0 − 1

y0

= arctg(x0)2 + (y0)2 − x0

y0+ arctg

1− x0y0

= arctgp + arctgq .

I tym razem – stosując trygonometryczne wzory na tangens sumy kątów – możemy poka-zać, że wynik całkowania jest identyczny jak w poprzednich obliczeniach. Mianowicie, jeślioznaczyć

a = arctgp ; b = arctgq ,

czyli

tg a = p =(x0)2 + (y0)2 − x0

y0; tg b = q =

1− x0y0

,

to, jak łatwo obliczyć,

tg(a+ b) =p+ q1− pq =

y0x0

.

Wobec tego znów otrzymujemy ten sam wynik:

U(x) = a+ b = arctgy0x0

.

Gdyby natomiast wybrać drogę całkowania, która okrąży N razy punkt (0, 0), to powyższywynik zmieni się tak, jak zmieni się faza liczby zespolonej z = x0+ iy0 na takiej trajektorii,to znaczy wzrośnie o 2πN . Liczba N może też być ujemna, co oznacza, że „dziurę wprzestrzeni M”, jaką stanowi zakazany punkt (0, 0), okrążamy w kierunku ujemnym.

Ćwiczenie. 10. W przestrzeni M = R3 − 0 („dziurawa przestrzeń trójwymiarowa)weźmy formę różniczkową:

ω(2) :=xdy ∧ dz + ydz ∧ dx+ zdx ∧ dy

(x2 + y2 + z2)32

. (407)

Łatwo sprawdzić, że jest to forma zamknięta: dω(2) = 0. Na mocy ćwiczenia 6-tego wRozdziale 5.8 łatwo ją przeliczyć do współrzędnych sferycznych. Otrzymujemy natychmiast

ω(2) = sin(θ) dθ ∧ dϕ . (408)

150

Page 157: Rozn. Geom_ - Jerzy Kijowski

A zatem na powierzchni sfery jednostkowej forma ta redukuje się do formy dwuwymiarowejobjętości. Czy istnieje „potencjał wektorowy” dla formy ω(2), tzn. taka ω(1), że zachodzidω(1) = ω(2)? Decydujące okazuje się tutaj następujące rozumowanie. Łatwo widać, że całkaz tej formy po dowolnej sferze S2 danej równaniem r = const. daje liczbę 4π. Tymczasemdla dowolnej jedno-formy ω(1) zachodzi:

S2dω(1) =

∂S2ω(1) = 0

bowiem brzeg sfery ∂S2 znika. Widać więc, że zachodzi

4π =∫

S2ω(2) 6=

S2dω(1) = 0 (409)

zatem ω(2) nie może być zupełna. Widzimy, że nie istnieje globalny potencjał dla formyobjętości. Istnieją jednak potencjały lokalne, jak widać z jawnego wzoru (408) w zmiennychsferycznych (θ, ϕ), na przykład:

ω(1) = − cos(θ)dϕ , (410)

(nie jest określona globalnie, bo ma osobliwości na biegunach) lub

ω(1) = −ϕ sin(θ)dθ (411)

(znów nieokreślona globalnie, bowiem ϕ nie jest jednoznacznie określone na całym S2).

Okazuje się, że sytuacja jak w powyższych przykładach jest typowa. Mówi o tym na-stępujące twierdzenie, zwane ze względów historycznych Lematem Poincare:

Twierdzenie. Każda forma zamknięta jest lokalnie zupełna.

Natomiast globalne istnienie form pierwotnych jest związane z własnościami topologicz-nym przestrzeni. Jak widzieliśmy w powyższych dwu przykładach, istnienie form różnicz-kowych zamkniętych lecz nie będących zupełnymi wiąże się z istnieniem podrozmaitościo znikającym brzegu, które nie są brzegiem żadnej innej podrozmaitości. I tak istnieniebadanej przez nas formy α(1) wiąże się z faktem, że wszystko działo się w „dziurawej”płaszczyźnie M = R2 − 0. Krzywa zamknięta, otaczająca zero ma znikający brzeg (jest„cyklem”) ale nie jest brzegiem żadnej zwartej podrozmaitości O ⊂ M . Podobnie istnieniedwu-formy zamkniętej a niezupełnej (407) w „dziurawej” przestrzeni M = R3−0 wiążesię z faktem, że każda powierzchnia zamknięta, lecz okrążająca to usunięte z przestrzenizero ma znikający brzeg (jest „cyklem”) ale nie jest brzegiem żadnej zwartej podrozmaito-ści O ⊂ M . Ciekawe, że w tej ostatniej przestrzeni jedno-formy zamknięte są zupełne, bokażdy jednowymiarowy cykl jest brzegiem.Mocniejsza wersja lematu Poincare mówi, że w przestrzeniach, w których nie ma takich

patologii, tzn. w których każdy cykl jest brzegiem (inaczej: każda podrozmaitość o znika-jącym brzegu jest brzegiem innej podrozmaitości) każda forma zamknięta jest zupełna.

151

Page 158: Rozn. Geom_ - Jerzy Kijowski

Formalne podobieństwo obu tych zjawisk wiąże się z tym, że tożsamości dd = 0 (róż-niczka różniczki znika) odpowiada tożsamość ∂∂ = 0 (brzeg brzegu znika!).Po takiej analizie jesteśmy wreszcie gotowi do przeprowadzenia dowodu.

Dowód Lematu Poincare. Niech będzie dana (k + 1)-forma zamknięta d(k+1)α = 0

na n-wymiarowej rozmaitości M , gdzie k = 0, . . . , n. Pokażemy, że lokalnie, w otoczeniu

dowolnego punktu x ∈M , można znaleźć k-formę pierwotną(k)

β spełniającą równanie:

d(k)

β=(k+1)α . (412)

Oczywiście forma(k)

β nie jest wyznaczona jednoznacznie przez to równanie: można do niejdodać dowolną różniczkę zewnętrzną jakiejkolwiek (k−1)-formy i nie zmieni to lewej stronypowyższej równości, bowiem dd = 0.Podamy prostą metodę „odcałkowania” równania (412), to znaczy znalezienia jednego

z możliwych rozwiązań. Wybierzmy mianowicie układ współrzędnych (yj) w pewnym oto-czeniu O punktu x i wyróżnijmy jedną ze współrzędnych, przyjąwszy dla niej specjalneoznaczenie: yn = t. Zatem nasz układ współrzędnych będziemy oznaczali jako (yi, t), gdziei = 1, 2, . . . , n−1. Odpowiednio skalując i przesuwając wartość naszych współrzędnych, bezstraty ogólności możemy przyjąć, że nasz punkt x odpowiada następującym wartościomwspółrzędnych: t = 1 oraz yi = 0. Zgodnie ze wzorem (339), badana forma różniczkowaprzybiera postać:

(k+1)α = ai1,...,ik+1 · dyi1 ∧ · · · ∧ dyik+1 + bi1,...,ik · dt ∧ dyi1 ∧ · · · ∧ dyik

=(k+1)

u (t) + dt ∧(k)

w (t) ,

gdzie dla ustalonej wartości zmiennej „t” zarówno (k + 1)-forma(k+1)u (t), jak i k-forma

(k)w (t), są formami różniczkowymi na (n−1)-wymiarowej przestrzeni t = const., parame-tryzowanej zmiennymi (yi), gdzie i = 1, . . . , n− 1. Oznacza to, że współczynniki ai1,...,ik+1oraz bi1,...,ik , prócz zależności od zmiennych y

i, zależą dodatkowo od parametru t.Dokonamy teraz zamiany zmiennych na każdej powierzchni t = const., kładąc:

yi = t · xi . (413)

Wyrażając formę(k+1)α w nowym układzie współrzędnych możemy znów zgrupować oddziel-

nie wyrazy nie zawierające czynnika dt i oddzielnie wyrazy taki czynnik zawierające:

(k+1)α = ai1,...,ik+1 · dxi1 ∧ · · · ∧ dxik+1 + bi1,...,ik · dt ∧ dxi1 ∧ · · · ∧ dxik

=(k+1)u (t) + dt ∧ (k)w (t) . (414)

Co zyskaliśmy w porównaniu z prawie identycznym wyrażeniem w zmiennych yi? Otóż z

152

Page 159: Rozn. Geom_ - Jerzy Kijowski

faktu iż dyi = tdxi+ xidt wynika iż forma(k+1)u (t) zeruje się gdy zbliżamy się do punktu17

t = 0:limt→0

(k+1)u (t) = 0 .

Różniczkowanie zewnętrzne formy (414) składa się oddzielnie z różniczkowania zewnętrz-nego względem zmiennych (xi) i oddzielnie z różniczkowania po parametrze t:

d(k+1)α = d

(k+1)u + dt ∧

(∂

∂t

(k+1)u

)− dt ∧

(d(k)w)= 0 .

Znak „minus” w ostatnim członie wynika z faktu, iż różniczkując współczynniki formy(k)w względem współrzędnych xi, powinniśmy ustawić następnie ich różniczki na początku,przed czynnikiem dt. Aby jednak wyciągnąć dt na początek potrzebna była zmiana znaku.Ostatnia równość implikuje oddzielnie równość członów zawierających dt i oddzielnie niezawierających tego czynnika. A zatem mamy:

d(k+1)u = 0

d(k)w =

∂t

(k+1)u . (415)

Biorąc to wszystko pod uwagę pokażemy, iż następująca k-forma różniczkowa:

(k)

β (t) :=∫ t

0

(k)w (τ)dτ , (416)

jest rozwiązaniem równania (412). I rzeczywiście, na mocy (415) mamy:

d(k)

β (t) = dt ∧ (k)w (t) +∫ t

0d(k)w (τ)dτ

= dt ∧ (k)w (t) +∫ t

0

∂τ

(k+1)u (τ)dτ

= dt ∧ (k)w (t) + (k+1)u (t) =(k+1)α ,

gdzie przedostatnia równość zachodzi dzięki znikaniu formy(k+1)u (t) w t = 0.

Nieznaczna modyfikacja naszego dowodu pozwala wykazać globalną wersję twierdze-nia Poincare, jeśli założyć „ściągalność” całej przestrzeni do punktu przy pomocy ciągłejhomotopii. Założenia tego nie spełnia żadna z dwóch „dziurawych” rozmaitości, rozważa-nych powyżej, bowiem takie „ściągnięcie” do punktu wymagałoby rozerwania rozmaitości,a więc nie mogłoby być ciągłe.

17W niniejszym, uproszczonym rozumowaniu nie możemy położyć bezpośrednio t = 0, bo wtedy xi

przestają być współrzędnymi: zamiana zmiennych (413) staje się osobliwa. Można jednak traktować wzór

(414) w sposób czynny, jako obraz odwrotny formy(k+1)α przy odwzorowaniu Rn → M danym wzorem

(413). Wtedy punkt t = 0 przestaje być „niebezpieczny” i możemy nawet przechodzić przezeń na drugąstronę, do wartości ujemnych zmiennej t.

153

Page 160: Rozn. Geom_ - Jerzy Kijowski

5.11 Postać dualna formy różniczkowej

Niniejszy Paragraf, uzupełniający Rozdział o formach różniczkowych, nie zawiera już żad-nych nowych faktów matematycznych a jedynie wprowadza pewien sposób zapisu, nie-zwykle użyteczny w zastosowaniach. Zapis ten jest powszechnie używany w książkach iartykułach pisanych przez (dobrze wykształconych!) inżynierów i fizyków, bowiem bardzoupraszcza prowadzenie obliczeń.Jak zauważyliśmy w kilku ćwiczeniach z poprzednich Paragrafów, gdy rząd formy róż-

niczkowej k jest wysoki (np. większy niż połowa wymiaru n całej przestrzeni m, w którejto się wszystko dzieje), wtedy zamiast wyszczególniać „które różniczki zostały zawarte” wiloczynie zewnętrznym

dxi1 ∧ · · · ∧ dxik ,prościej jest wyróżnić te, które nie zostały zawarte. Szczególnie łatwo jest to zauważyć wprzypadku, gdy k = n − 1. Wtedy bowiem w powyższym iloczynie brakuje tylko jednejróżniczki współrzędnych, i to właśnie jej numerem „j” możemy oznaczyć to wyrażenie,zgodnie z definicją (375):

(−1)j−1 · dx1 ∧ · · ·∧j

· · · ∧ dxn = ∂

∂xj

(dx1 ∧ · · · ∧ dxn

).

Tej identyczności używaliśmy już w dowodzie Twierdzenia Stokes’a (patrz np. wzór (384)).Przypominamy, że indeks j podpisany pod środkowym wyrażeniem oznacza, że właśnieczynnika dxj brakuje w całym tym iloczynie. No, a gdyby było k = n−2, to trzeba byłobywyróżniać dwa „nieobecne” czynniki. To i tak łatwiejsze, niż wypisywanie n−2 „obecnych”czynników. Każda taka (n− 2)-forma jest sumą składników postaci

dx1 ∧ · · ·∧i

· · ·∧j

· · · ∧ dxn ,

gdzie, dla ustalenia oznaczeń, zakładamy iż i < j. Zauważmy jednak, że mamy wobec tego:

dx1 ∧ · · ·∧i

· · ·∧j

· · · ∧ dxn = (−1)i−1 ∂∂xi

dx1 ∧ · · ·

∧j

· · · ∧ dxn

= (−1)i−1 ∂∂xi

((−1)j−1 ∂

∂xj

(dx1 ∧ · · · ∧ dxn

))

= (−1)i+j ∂∂xi

(∂

∂xj

(dx1 ∧ · · · ∧ dxn

)).

Warto wprowadzić następujące rozszerzenie iloczynu wewnętrznego (375) k-formy α zparą wektorów:

⟨α ; X, Y,X(1), . . . , X(k−2)

⟩=

⟨Y (X α) ; X(1), . . . , X(k−2)

=:⟨(X ∧ Y ) α ; X(1), . . . , X(k−2)

⟩, (417)

154

Page 161: Rozn. Geom_ - Jerzy Kijowski

czyli, równoważnie:

(X ∧ Y ) α := Y (X α) = −X (Y α) . (418)

Wtedy

dx1 ∧ · · ·∧i

· · ·∧j

· · · ∧ dxn = (−1)i+j−1(∂

∂xi∧ ∂

∂xj

) (dx1 ∧ · · · ∧ dxn

).

Można też zdefiniować uogólnienie wzoru (418) na przypadek l wektorów:(X(1)∧ · · · ∧X

(l)

)α := X

(l)· · ·

(X(1)

α

), (419)

co odpowiada następującemu działaniu tak określonej formy:⟨(

X(1)∧ · · · ∧X

(l)

)α ; Y

(1), . . . , Y

(k−l)

⟩:=

⟨α ; X

(1), . . . , X

(l), Y(1), . . . , Y

(k−l)

⟩. (420)

To bardzo proste: iloczyn wewnętrzny k-formy α z l ¬ k wektorami (X(1), . . . , X(l)) jest(k−l)-formą powstałą z α przez zapełnienie jej pierwszych l slotów właśnie tymi wektorami.Na każdy iloczyn k różniczek dxi można patrzeć jak na bazową n-formę (dx1 ∧ · · · ∧ dxn),

z której wyrwano l = (n− k) czynników. Oznacza to, że każda k-forma różniczkowa możebyć zapisana w postaci:

(k)α =

1l!Aj1,...,jl ·

(∂

∂xj1∧ · · · ∧ ∂

∂xjl

) (dx1 ∧ · · · ∧ dxn

)(421)

=∑

j1<···<jlAj1,...,jl ·

(∂

∂xj1∧ · · · ∧ ∂

∂xjl

) (dx1 ∧ · · · ∧ dxn

),

gdzie żądamy, by tablica współczynników (Aj1,...,jl) była całkowicie antysymetryczna. Beztego żądania tablica ta nie byłaby jednoznacznie wyznaczona przez formę, bowiem ewentu-alna część „choć trochę symetryczna” nie dałaby żadnego wkładu w sumowaniu z całkowicieantysymetrycznym obiektem

(∂∂xj1∧ · · · ∧ ∂

∂xjl

). Czynnik normalizacyjny 1

l!został wprowa-

dzony po to, by z całej gromady l! identycznych składników tej sumy, odpowiadającychwszystkim permutacjom wskaźników (j1, . . . , jl), uwzględnić tylko jeden z nich.Reprezentacja (421) formy różniczkowej jest dualna względem pierwotnej reprezentacji

(339), która, jak pamiętamy, wyglądała następująco:

(k)α=1k!αi1,...,ik · dxi1 ∧ · · · ∧ dxik =

i1<···<ikαi1,...,ik · dxi1 ∧ · · · ∧ dxik .

Znając jedną, musimy umieć znaleźć drugą i odwrotnie. Mówi o tym następujące

155

Page 162: Rozn. Geom_ - Jerzy Kijowski

Twierdzenie 1: Związki między współczynnikami prostej i dualnej reprezentacji formyróżniczkowej wyglądają następująco:

Aj1,...,jl =1k!ej1,...,jl,i1,...,ikαi1,...,ik

∗= ej1,...,jl,i1,...,ikαi1,...,ik (422)

αi1,...,ik =1l!Aj1,...,jlǫj1,...,jl,i1,...,ik

∗= Aj1,...,jlǫj1,...,jl,i1,...,ik , (423)

gdzie ǫj1,...,jn oraz ei1,...,in są całkowicie antysymetrycznymi symbolami Levi-Civitty, tzn.

przyjmują wartości 1, 0 i −1, przy czym18:

ǫ1,...,n = 1 = e1,...,n .

Oznacza to, że gdy zestaw wskaźników (j1, . . . , jn) jest permutacją liczb (1, . . . , n) to ǫj1,...,jnoraz ej1,...,jn przyjmują wartość równą parzystości tej permutacji:

ǫσ1,...,σn = (−1)|σ| = eσ1,...,σn , (424)

a w przeciwnym razie przyjmuje wartość równą zeruRówność z gwiazdką: „ ∗=”, oznacza, że po prawej stronie nie obowiązuje konwencja

sumacyjna, lecz jest to jeden składnik, odpowiadający wyborowi jakiegokolwiek zestawuwskaźników (i1, . . . ik), komplementarnego względem wybranego po lewej stronie zestawu(j1, . . . jl). Możliwość zastąpienia sumy tylko jednym wyrazem wynika stąd, że sumowaniewe wzorach (422) oraz (423) obejmuje identyczne składniki w liczbie odpowiednio 1

l!lub

1k!. Jeśli bowiem ustaliliśmy wskaźniki (j1, . . . jl), to (i1, . . . ik) jest zbiorem wszystkich po-zostałych wskaźników i vice versa. Gdy zmieniamy ich kolejność, to zarówno ej1,...,jl,i1,...,ik

jak i αi1,...,ik mogą zmieniać znak na przeciwny, ale oba jednocześnie. A zatem składnikisumy odpowiadające różnym permutacjom tego samego zbioru wskaźników są identycz-ne. Zamiast zatem je sumować a potem dzielić przez ich liczbę można wziąć po prostuktórykolwiek z nich.Lemat: Zachodzi równość:(

∂xj1∧ · · · ∧ ∂

∂xjl

) (dx1 ∧ · · · ∧ dxn

)=1k!ǫj1,...,jl,i1,...,ikdx

i1 ∧ · · · ∧ dxik (425)

=∑

i1<···<ikǫj1,...,jl,i1,...,ikdx

i1 ∧ · · · ∧ dxik ,

Dowód Lematu: Lewa strona nie zawiera czynników (dxj1 , . . . , dxjl), usuniętych zformy bazowej (dx1 ∧ · · · ∧ dxn), ale i prawa strona ich nie zawiera, bowiem ǫ zeruje się

18W geometrii riemannowskiej symbol ej1,...,jn oznacza się zazwyczaj przez ǫj1,...,jn . Jednak w geometrii„pseudoriemannowskiej”, takiej jak geometria czasoprzestrzeni w teorii Einsteina, taka konwencja bardzokomplikuje notację. Dlatego warto rozróżniać oba te obiekty, kładąc:

ǫj1,...,jn = sgn (det g) ej1,...,jn ,

gdzie g oznacza tensor metryczny, którego wyznacznik może być ujemny. Wrócimy do tej sprawy w na-stępnym Rozdziale.

156

Page 163: Rozn. Geom_ - Jerzy Kijowski

gdy którykolwiek is jest równy któremukolwiek jr. A zatem obie strony zawierają te sameczynniki i obie są całkowicie antysymetryczne we wskaźnikach (j1, . . . , jl). Wobec tegosą proporcjonalne. Wystarczy zatem sprawdzić, że obie strony dają ten sam wynik nasekwencji wektorów

(∂∂xi1

, . . . ∂∂xik

), odpowiadającej na przykład rosnącym wskaźnikom:

i1 < · · · < ik. Ale prawa strona składa się z jedynego tylko składnika, którego wartość natej sekwencji wektorów jest równa współczynnikowi ǫj1,...,jl,i1,...,ik , bowiem

⟨dxi1 ∧ · · · ∧ dxik ; ∂

∂xi1, . . .

∂xik

⟩= 1 .

Natomiast lewa strona daje ten sam wynik na mocy następujących równości:⟨(

∂xj1∧ · · · ∧ ∂

∂xjl

) (dx1 ∧ · · · ∧ dxn

);

∂xi1, . . .

∂xik

=

⟨dx1 ∧ · · · ∧ dxn ; ∂

∂xj1, . . . ,

∂xjl,∂

∂xi1, . . .

∂xik

= ǫj1,...,jl,i1,...,ik ·⟨dx1 ∧ · · · ∧ dxn ; ∂

∂x1, . . . ,

∂xn

⟩= ǫj1,...,jl,i1,...,ik .

(Współczynnik ǫj1,...,jl,i1,...,ik w ostatniej linijce pojawił się, ponieważ uporządkowaliśmysekwencję wektorów

∂xj1, . . . ,

∂xjl,∂

∂xi1, . . .

∂xik

przy pomocy permutacji, której parzystość opisuje właśnie ten współczynnik.)

Dowód Twierdzenia 1:Wstawiając Lemat (425) do (421) otrzymujemy natychmiastwzór (423). W wersji „z gwiazdką” mówi on, że pewna liczba αi1,...,ik jest równa pewnejliczbie Aj1,...,jlǫj1,...,jl,i1,...,ik , pomnożonej przez +1 lub −1, bo taką wartość może przyjmowaćw tym wypadku współczynnik ǫj1,...,jl,i1,...,ik . Dzielenie przez ten współczynnik daje ten samwynik co mnożenie, skąd natychmiast wynika wzór (422) — również w wersji „z gwiazdką”.

Zapis formy różniczkowej w postaci dualnej jest traktowany „po macoszemu” w czystomatematycznych podręcznikach, bowiem nie wnosi nic nowego do geometrii. Nie jest tożadna nowa struktura matematyczna, a jedynie pewna nowa „buchalteria” pozwalająca nasegregowanie danych w sposób, który niekiedy może być bardzo przydatny. Ale matematycyzajmujący się zastosowaniami, a także fizycy i inżynierowie, dawno już odkryli, że tensposób zapisu bardzo niekiedy upraszcza rachunki. Tak jest np. w elektrodynamice, gdziepierwszą parę równań Maxwella zapisuje się w notacji zwykłej, natomiast druga para tychrównań (tzn. prawo Gaussa oraz ulepszone przez Maxwella prawo Ampera) znacznie lepiejwygląda w notacji dualnej. Przekonamy się o tym w następnych rozdziałach niniejszegowykładu. Natomiast teraz pokażemy, że w notacji dualnej różniczka zewnętrzna wyraża sięw postaci operatora „dywergencji”.

157

Page 164: Rozn. Geom_ - Jerzy Kijowski

Twierdzenie 2: Jeśli(k)α jest k-formą różniczkową daną wzorem (421), to zachodzi:

d(k)α =

1(l − 1)!∂jA

j1,...,jl−1,j ·(

∂xj1∧ · · · ∧ ∂

∂xjl−1

) (dx1 ∧ · · · ∧ dxn

)(426)

=∑

j1<···<jl−1∂jA

j1,...,jl−1,j ·(

∂xj1∧ · · · ∧ ∂

∂xjl−1

) (dx1 ∧ · · · ∧ dxn

).

Dowód: Oznaczmy

d(k)α =

1(k + 1)!

βj,i1,...,ik · dxj ∧ xi1 ∧ · · · ∧ dxik (427)

=1

(l − 1)!Bj1,...,jl−1 ·

(∂

∂xj1∧ · · · ∧ ∂

∂xjl−1

) (dx1 ∧ · · · ∧ dxn

).

Ale, na mocy wzoru na różniczkę zewnętrzną (360) mamy również

d(k)α=1k!∂αi1,...,ik∂xj

dxj ∧ dxi1 ∧ · · · ∧ dxik . (428)

Oczywiście wkład dają tylko te wyrazy, dla których j /∈ i1, . . . , ik, natomiast sumowaniez iloczynem zewnętrznym różniczek powoduje, że na wynik tej sumy ma wpływ jedyniecałkowicie antysymetryczna część tych pochodnych. Porównując to z (427) widzimy, że

βj,i1,...,ik = (k + 1) · Asym∂αi1,...,ik∂xj

,

gdzie przez „Asym” oznaczyliśmy właśnie tę część całkowicie antysymetryczną względemwszystkich k + 1 wskaźników. Stosując wzór (422) dla (k + 1)-formy otrzymamy

Bj1,...,jl−1 =1

k + 1!ej1,...,jl−1,j,i1,...,ikβj,i1,...,ik

=1k!ej1,...,jl−1,j,i1,...,ik · Asym

∂αi1,...,ik∂xj

=1k!ej1,...,jl−1,j,i1,...,ik

∂αi1,...,ik∂xj

=∂

∂xjAj1,...,jl−1,j . (429)

Możliwość opuszczenia operatora antysymetryzacji „Asym” wynika z faktu, że całkowi-cie antysymetryczne współczynniki ej1,...,jl−1,j,i1,...,ik i tak dokonują tej antysymetryzacji,natomiast ostatnia równość wynika oczywiście z (422).

Warto zapamiętać tę ostatnią równość w postaci następującej reguły, bardzo częstopomocnej w prowadzeniu skomplikowanych rachunków: w notacji dualnej różniczka ze-wnętrzna wyraża się jako dywergencja w ostatnim wskaźniku.

158

Page 165: Rozn. Geom_ - Jerzy Kijowski

Dla porównania z odpowiednim wzorem w notacji prostej przypomnijmy, że formuła(360) implikuje:

dα =1k!dαi1,...,ik ∧ dxi1 ∧ · · · ∧ dxik

=1k!∂αi1,...,ik∂xi0

dxi0 ∧ dxi1 ∧ · · · ∧ dxik

=1k!∂i0αi1,...,ik dx

i0 ∧ dxi1 ∧ · · · ∧ dxik

=1k!∂[i0αi1,...,ik] dx

i0 ∧ dxi1 ∧ · · · ∧ dxik . (430)

Nawiasami kwadratowymi oznaczyliśmy – jak to się robi zazwyczaj – antysymetryzację(k + 1)-wymiarowej tablicy ∂i0αi1,...,ik , to znaczy:

∂[i0αi1,...,ik] =1

(k + 1)!

σ∈Sn+1(−1)|σ|∂iσ(0)αiσ(1),...,iσ(k)

=1

k + 1

n∑

r=0

(−1)r∂irαi0,...∧r...,ik .

Jak zwykle symbol „ ∧r” oznacza, że r-ty element ciągu został pominięty. Ostatnia równość

wynika z faktu, że αi1,...,ik jest już i tak antysymetryczna, zatem permutowanie jej wskaź-ników nic nie wnosi. Tych permutacji jest właśnie k!, zatem ten czynnik się upraszcza.Pozostaje zatem suma (k+1) składników powstałych przez postawienie jednego ze wskaź-ników ir (gdzie r = 0, 1, . . . , n) na początku, przy znaku pochodnej cząstkowej, podzielonaprzez (k + 1).Porównując wzór (430) z reprezentacją samej (k + 1)-formy dα = β, mianowicie:

β =1

(k + 1)!βi0,...,ik ∧ dxi0 ∧ · · · ∧ dxik ,

otrzymujemy:

βi0,...,ik = (k + 1) · ∂[i0αi1,...,ik] =n∑

r=0

(−1)r∂irαi0,...∧r...,ik

= ∂i0αi1,...,ik − ∂i1αi0,i2,...,ik + ∂i2αi1,i3,...,ik − ∂i3αi1,i2,i4,...,ik + · · · . (431)

I tak właśnie obliczamy składowe różniczki zewnętrznej w reprezentacji prostej: aby ob-liczyć składową βi0,...,ik formy β = dα, wybieramy jeden wskaźnik – na przykład i0 – iprzeznaczamy go na różniczkowanie składowej αi1,...,ik formy α, a następnie sumujemy (zodpowiednim znakiem!) wszystkie takie elementy odpowiadające wszystkim takim wybo-rom.Przykład 1. Różniczka zewnętrzna dα = β = 1

2βijdxi ∧ dxj jedno-formy α = αidxi

ma składowe:βij = ∂iαj − ∂jαi . (432)

159

Page 166: Rozn. Geom_ - Jerzy Kijowski

Wynika stąd, następujący warunek na znikanie tej różniczki:

dα = 0⇐⇒ ∂iαj = ∂jαi . (433)

Przykład 2. Podobny rachunek przeprowadzony dla dwu-formy α = 12αijdxi ∧ dxj

oraz jej różniczki zewnętrznej dα = β = 16βijkdxi ∧ dxj ∧ dxk daje nam:

βijk = ∂iαjk − ∂jαik + ∂kαij= ∂iαjk + ∂jαki + ∂kαij . (434)

Ta ostatnia wersja jest łatwiejsza jeśli się pamięta, że wśród sześciu permutacji trzechelementów parzyste są trzy przestawienia cykliczne.

5.12 Geometryczny opis pola elektromagnetycznego

Klasyczna elektrodynamika to teoria dwóch dwu-form różniczkowych w czterowymiarowejrozmaitości M jaką stanowi czasoprzestrzeń – arena wszystkich zdarzeń fizycznych. Formyte oznaczane są w literaturze literami f oraz F . Jeśli wybrać w tej rozmaitości tak zwanyinercjalny układ współrzędnych19 (xµ), µ = 0, 1, 2, 3; gdzie x0 = t jest zmienną czasowązaś (xi), i = 1, 2, 3; są zmiennymi przestrzennymi, to mamy:

f =12fijdxi ∧ dxj = f0jdt ∧ dxj + f12dx1 ∧ dx2 + f23dx2 ∧ dx3 + f31dx3 ∧ dx1 .

Jeśli teraz oznaczyć f0j = −Ej , zaś f12 = B3 i cyklicznie, to mamy:

f = −dt ∧E + B , (435)

gdzie jedno-forma E = Ejdxj oraz dwu-forma

B = B1dx2 ∧ dx3 + B2dx3 ∧ dx1 + B3dx1 ∧ dx2

= Bi ∂∂xi

(dx1 ∧ dx2 ∧ dx3

),

są obiektami czysto trój-wymiarowymi, czyli przestrzennymi. Pierwsza z nich nazywa siępolem elektrycznym zaś druga polem indukcji magnetycznej. Zgodnie z długoletnią tra-dycją pole elektryczne zapisujemy zazwyczaj w reprezentacji prostej zaś magnetyczne – wreprezentacji dualnej, bo taki właśnie zapis jest najlepiej przystosowany do wykonywaniaobliczeń. Odkrywane w XIX-tym wieku prawa rządzące zjawiskami elektromagnetycznymioznaczją m.in., że forma f musi być zamknięta:

0 = df = dt ∧ dE + dt ∧(∂B∂t

)+ dB (436)

= dt ∧(dE +

∂B∂t

)+ dB .

19Pojęcie to zostanie wyjaśnione w dalszym ciągu wykładu.

160

Page 167: Rozn. Geom_ - Jerzy Kijowski

Oznacza to, że obie składowe tej formy muszą się zerować:

dE = −∂B∂t

,

dB = 0 .

Pierwsze z tych równań nosi nazwę prawa indukcji elektromagnetycznej Faradaya, zaś dru-gie: prawa Gaussa dla magnetyzmu. Razem stanowią one tzw. „pierwszą parę równań Ma-xwella”. W języku składowych tych pól prawo Faradaya oznacza spełnienie następującychtrzech równań różniczkowych pierwszego rzędu:

∂x1E2 −

∂x2E1 = −

∂B3∂t

,

i cyklicznie (1→ 2→ 3→ 1), a także jednego, czysto przestrzennego równania:

∂xiBi = 0 .

Równania te wyglądają tak samo w dowolnym krzywoliniowym układzie współrzędnych.Pamiętać jednak należy, że podział formy f na część elektryczną E i część magnetycz-ną B, dany równaniem (435) zależy od wyboru układu współrzędnych. Gdy „mieszamy”współrzędne przestrzenne ze współrzędną czasową, to pole elektryczne „miesza się” z ma-gnetycznym zgodnie z regułami transformacyjnymi (342) dla współrzędnych fij dwu-formy.Jak powiedzieliśmy na początku tego Paragrafu, do opisu pola elektromagnetycznego

konieczna jest jeszcze druga forma różniczkowa

F = dt ∧H +D , (437)

gdzie H = Hidxi jest jedno-formą nazywaną polem magnetycznym zaś

D = D1dx2 ∧ dx3 +D2dx3 ∧ dx1 +D3dx1 ∧ dx2

= Di ∂∂xi

(dx1 ∧ dx2 ∧ dx3

),

jest dwu-formą nazywaną polem indukcji elektrycznej. Natomiast ruch ładunków w czaso-przesrzeni opisuje trójforma J nazywana „cztero-prądem”:

J = J µ ∂

∂xµ

(dx0 ∧ dx1 ∧ dx2 ∧ dx3

)

= J 0dx1 ∧ dx2 ∧ dx3 − dt ∧(J 1dx2 ∧ dx3 + J 2dx3 ∧ dx1 + J 3dx1 ∧ dx2

)

= ρdx1 ∧ dx2 ∧ dx3 − dt ∧ (j dx1 ∧ dx2 ∧ dx3) . (438)

Jej składowa czasowa ρ := J 0 opisuje gęstość ładunku elektrycznego, zaś składowe prze-strzenne (J i) składają się na dwu-formę opisującą gęstość prądu elektrycznego, która może

161

Page 168: Rozn. Geom_ - Jerzy Kijowski

być parametryzowana przy pomocy wektora pola wektorowego j. Okazuje się, że w przy-rodzie zachodzi zawsze równość

dF = J . (439)

Równoważnie, na mocy (437):

J = dF = dt ∧(−dH + ∂D

∂t

)+ dD . (440)

Porównując z (438) otrzymujemy tzw. „drugą parę równań Maxwella”:

−j = −dH + ∂D∂t

,

dD = ρ .

W języku składowych oznacza to spełnienie następujących trzech równań różniczkowychpierwszego rzędu, składających się na tzw. prawo Ampera (poprawione przez Maxwella):

∂x1H2 −

∂x2H1 =

∂D3∂t+ j3 ,

oraz cyklicznie (1→ 2→ 3→ 1), a także tzw. prawa Gaussa dla pola indukcji elektrycznej:∂

∂xiDi = ρ .

Jak widać, do opisu pól E i H wygodnie jest stosować zapis prosty, zaś pola indukcji B iD zapisują się lepiej w reprezentacji dualnej.Druga para równań Maxwella (439) implikuje tożsamość:

dJ = ddF = 0 ,co w języku współrzędnych odpowiada równaniu:

ρ+ ∂1j1 + ∂2j2 + ∂3j3 = 0 . (441)

Równanie to pojawia się w bardzo wielu działach fizyki i nosi nazwę „równania ciągłości”.Jak pokażemy w rozdziale 6.12, wyraża ono prawo zachowania ładunku elektrycznego.Rozpoznanie w ośmiu równaniach Maxwella dwóch równań geometrycznych: df = 0

oraz dF = J , wyglądających identycznie w dowolnym, krzywoliniowym układzie współ-rzędnych, niezmiernie uprościło strukturę pojęciową teorii. To ogromne osiągnięcie byłomożliwe dzięki odkryciu przez Alberta Einsteina teorii względności, według której podziałelektromagnetyzmu na elektryczność i magnetyzm jest względny i zależy od układu od-niesienia, czyli parametryzacji czasoprzestrzeni. Jednak te dwa równania to nie jest całaelektrodynamika. Okazuje się, że pola f i F nie są niezależne, bowiem jedno z nich wy-znacza już drugie. Związek między nimi, zwany „równaniem konstytutywnym”, zależy odwłasności fizycznych ośrodka w którym zachodzą opisywane zjawiska elektromagnetyczne.W szczególności jeśli ośrodkiem tym jest próżnia fizyczna, to związek ten sprowadza siędo tzw. dualizmu Hodge’a (zwanego też żargonowo „gwiazdką Hodge’a” i zapisywanego wpostaci równania „F = ∗f”), który poznamy w następnym Rozdziale.

162

Page 169: Rozn. Geom_ - Jerzy Kijowski

6 Geometria Riemanna

Gdyby trzymać się pierwotnego znaczenia słowa geometria, czyli „mierzenie Ziemi”, to do-piero teraz rozpocznie się „właściwy”wykład. W poprzednich rozdziałach nie omawialiśmybowiem żadnych struktur pozwalających na mierzenie – ani na Ziemi, ani w żadnej innejrozmaitości różniczkowalnej. Strukturę umożliwiającą takie pomiary nazywamy zazwyczajtensorem metrycznym czy po prostu metryką, lub też strukturą Riemanna. Dopiero w ni-niejszym rozdziale podamy jej definicję i zbadamy rozliczne jej implikacje. Podobnie jakczyni to wielu innych autorów nowoczesnych wykładów z geometrii różniczkowej, omówili-śmy wpierw struktury bardziej podstawowe, niezależne od metryki. Taka kolejność pozwalana dużo głębsze zrozumienie wszystkich tych struktur i związków między nimi, a także pro-wadzi do zasadniczego uproszczenia struktury logicznej całej teorii. Można powiedzieć, żetradycyjne symbole szkolnej geometrii: cyrkiel i ekierka, pojawią się dopiero w niniejszymRozdziale.

6.1 Struktura euklidesowa w przestrzeni afinicznej

Okazuje się, że całą klasyczną geometrię można sprowadzić do pewnej struktury algebraicz-nej, która nazywa się „strukturą euklidesową”. Polega ona na spostrzeżeniu, iż przestrzeńafiniczna (A, V,+), w której Euklides uprawiał geometrię, jest jeszcze wyposażona w do-datkowe „działanie”, mianowicie iloczyn skalarny wektorów z przestrzeni wektorowej V .Działanie to jest po prostu formą dwu-liniową:

V × V ∋ (v,w)→ (v|w) ∈ R , (442)

o następujących własnościach: 1) symetria:

(v|w) = (w|v) ,

oraz 2) ścisła dodatniość:

(v|v) ­ 0 ,

(v|v) = 0 ⇐⇒ v = 0 .

Występująca powyżej liczba (v|v), czyli iloczyn skalarny wektora z samym sobą, jest za-wsze nieujemna, zaś równa zeru tylko w przypadku, gdy sam wektor jest równy zeru.Liczbę tę nazywamy kwadratem długości wektora v, zgodnie z następującym, powszechnieużywanym oznaczeniem:

‖v‖ :=√(v|v) .

Z powyższej definicji wynika, że jedynym wektorem o długości zerowej jest wektor zerowy:wszystkie inne mają długość ściśle dodatnią.Przestrzeń z taką strukturą będziemy nazywali n-wymiarową przestrzenią euklidesową

i oznaczali symbolem En. W XIX wieku matematycy odkryli, że twierdzenia geometriieuklidesowej dają się prosto wyrazić w języku tej struktury. I tak np. okazuje się, że umiejąc

163

Page 170: Rozn. Geom_ - Jerzy Kijowski

mierzyć długości wszystkich wektorów potrafimy natychmiast obliczyć iloczyn skalarny ichdowolnej pary, co wynika z następującej, prostej tożsamości, zwanej też niekiedy „wzoremna polaryzację formy kwadratowej”:

(v +w|v +w)− (v−w|v−w) = 4(v|w) .

Jest ona natychmiastową implikacją dwuliniowości oraz symetrii iloczynu skalarnego. Moż-na ją również zapisać jako:

(v|w) = 14

(‖v +w‖2 − ‖v −w‖2

). (443)

Zauważmy, że natępująca funkcja zmiennej rzeczywistej „t” jest nieujemna:

0 ¬ (v + tw|v + tw) = (v|v) + 2t(v|w) + t2(w|w) .

Oznacza to, iż wyróżnik tego trójmianu kwadratowego nie może być dodatni:

∆ = 4(v|w)2 − 4‖v‖2‖w‖2 ¬ 0 .

Nierówność tę zapisuje się najczęściej w równoważnej postaci tzw. nierówności Schwarza:

|(v|w)| ¬ ‖v‖‖w‖ , (444)

lub jeszcze inaczej:

−1 ¬ (v|w)‖v‖‖w‖ ¬ 1 .

Ponieważ środkowy ułamek przyjmuje wartości z odcinka [−1, 1] więc jest zawsze cosinusemjakiegoś kąta z odcinka [0, π]:

cosα(v,w) :=(v|w)‖v‖‖w‖ , to znaczy : α(v,w) := arc cos

(v|w)‖v‖‖w‖ ∈ [0, π] . (445)

który nazywamy kątem zawartym między tymi dwoma wektorami. Definicję tę możnazapisać jeszcze inaczej:

(v|w) = ‖v‖ · ‖w‖ · cosα(v,w) , (446)

co jest „szkolną” definicją iloczynu skalarnego („iloczyn długości obu wektorów razy cosi-nus kąta między nimi”). W tych oznaczeniach wzór (443) na polaryzację formy kwadrato-wej odpowiada tzw. „twierdzeniu cosinusów” (zob. Rysunek 21). I rzeczywiście: rozpisująckwadrat długości sumy jako

(v +w|v +w) = ‖v‖2 + ‖w‖2 + 2(v|w) ,

możemy przepisać (443) w następującej postaci:

‖v−w‖2 = ‖v‖2 + ‖w‖2 − 2‖v‖ · ‖w‖ · cosα(v,w) . (447)

164

Page 171: Rozn. Geom_ - Jerzy Kijowski

w

v

v − w

α(v, w)

Rysunek 21: Twierdzenie cosinusów.

Twierdzenie Pitagorasa odpowiada przypadkowi α(v,w) = π2. Jeśli (e1, . . . , en) jest jaką-

kolwiek bazą przestrzeni V , to cała informacja o strukturze euklidesowej może być zako-dowana w postaci macierzy ich iloczynów skalarnych:

gij := (ei|ej) , (448)

zwanej „tensorem metrycznym”, bowiem gdy u = uiei oraz v = vjej , to mamy:

(u|v) =(uiei

∣∣∣vjej)= uigijvj .

Z definicji struktury euklidesowej wynika, że macierz g jest symetryczna oraz ściśle dodatniookreślona. W szczególności macierz ta jest odwracalna, a jej wyznacznik jest dodatni:det g > 0. Wynika stąd, że istnieją bazy „ortonormalne”, to znaczy takie, dla których tensormetryczny staje się macierzą jednostkową: gij = δij. Prostoliniowe układy współrzędnychna En oparte na bazie ortonormalnej nazywają się układami kartezjańskimi.Struktura przestrzeni En pozwala definiować również k-wymiarową objętość brył dla

k ¬ n, której szczególnym, jednowymiarowym przypadkiem jest długość wektora ‖v‖. Jakwiemy z rozdziału 5.1, funkcja

(v1, . . . ,vk)→ α(v1, . . . ,vk) ∈ R

ma własności „objętości zorientowanej” równoległościanu V(v1,...,vk) rozpiętego na tych wek-torach , to znaczy spełnia warunki „pochylania” (315) oraz „skalowania” (316), wtedy itylko wtedy, gdy spełnia warunek (318), tzn. gdy dla układu wektorów vl = vilei mamiejsce tożsamość:

α (v1, . . . ,vk) = det(vij)· α (e1, . . . , ek) . (449)

Gdyby więc w każdej k-wymiarowej podprzestrzeni można było wybrać jakiś „wzorzec” k-objętości w postaci szczególnego równoległościanu V(e1,...,ek), to objętość dowolnego innegorównoległościanu V(v1,...,vk) byłaby dana powyższym wzorem. Otóż istnieje taki wzorzec,mianowicie „kostka jednostkowa”, wyznaczona przez układ ortonormalny, tzn. taki, dlaktórego zachodzi

(ei|ej) = δij .Jest tu jednak pewne „ale”! Zauważmy, że zachodzi następujące prawo transformacyjne:

(vl|vm) =(vilei

∣∣∣vjmej)= vil (ei|ej) vjm . (450)

165

Page 172: Rozn. Geom_ - Jerzy Kijowski

Jeśli teraz oba układy wektorów są ortonormalne, to mamy:

δlm = vil δij vjm ,

zatem biorąc wyznacznik z obu stron tej równości otrzymujemy: 1 =det

(vij)2

, co

oznacza, że może być również det(vij)= −1 (np. gdy v1 = − e1 a pozostałe wektory obu

baz są identyczne). Zatem dwa „wzorce” objętości dawałyby sprzeczne wartości. Widać,że nie ma szans na wzorzec „zorientowanej” (to znaczy wrażliwej na orientację) objęto-ści. Natomiast kostka jednostkowa jest doskonałym wzorcem objętości „niezorientowanej”:kładąc |α (e1, . . . , ek) | = 1, a następnie wyliczając wartość bezwzględną po obu stronachwzoru (449), otrzymujemy wzór na k-objętość równoległościanu V(v1,...,vk):

‖V(v1,...,vk)‖ :=∣∣∣det

(vij)∣∣∣ , (451)

gdzie(vij)są współczynnikami rozkładu tych wektorów względem jakiegokolwiek układu

ortonormalnego:vl = vilei . (452)

Równoważnie, na mocy formuły (450), można zapisać tę definicję w następujący sposób:

‖V(v1,...,vk)‖ :=√det (vi|vj) . (453)

6.2 Uwagi na temat geometrii pseudo-euklidesowej

Albert Einstein odkrył, że „czasoprzestrzeń” w której żyjemy nosi na sobie strukturę„pseudo-euklidesową”, która jest pewnym uogólnieniem powyższej struktury polegającymna rezygnacji z założenia iż iloczyn skalarny jest dodatni. W takiej przestrzeni „kwadratdługości” wektora, to znaczy jego iloczyn skalarny z samym sobą: (u|u), bywa dodatni, alebywa też ujemny. Stanowi to podstawę fizycznej klasyfikacji wektorów na „przestrzenne” i„czasowe”. Co więcej: bywają też wektory o zerowej „długości”: (u|u) = 0, zwane „świetl-nymi”. Okazuje się, że promienie świetlne w czasoprzestrzeni to właśnie linie, dla którychwektor styczny jest zerowy.Natomiast utrzymujemy w mocy założenie o nieosobliwości formy iloczynu skalarnego.

Oznacza to, że tensor metryczny jest odwracalny: det g 6= 0. Wszystkie konstrukcje wgeometrii euklidesowej, w których korzystamy z odwracalności tensora metrycznego, mogąbyć zatem powtórzone w geometrii pseudo-euklidesowej. Natomiast tam, gdzie w geometriieuklidesowej występuje pierwiastek:

√det g, tam musimy go zastąpić wyrażeniem

√| det g|.

Z twierdzenia o „bezwładności formy kwadratowej” wynika, że każdą formę kwadratowąmożna doprowadzić do postaci diagonalnej, gdzie na diagonali mogą pojawić się jedynki,minus jedynki lub zera. Nieosobliwość iloczynu skalarnego wyklucza zera, jednak minusjedynki są dozwolone. W szczególnej teorii względności preferuje się sygnaturę (−,+,+,+)(lub (+,−,−,−, ), zależnie od konwencji, ale w niniejszy tekście wybieramy tę pierwszą).Baza, w której tensor metryczny sprowadzony został do takiej postaci nazywa się znów

166

Page 173: Rozn. Geom_ - Jerzy Kijowski

„ortonormalną”. Oznacza to, że istnieje baza (e0, e1, e2, e3) taka, że macierz ich iloczynówskalarnych

(eµ|eν) = ηµν , µ, ν = 0, 1, 2, 3;

wygląda następująco:

ηµν =

−1 0 0 00 1 0 00 0 1 00 0 0 1

. (454)

Prostoliniowy układ współrzędnych oparty na takiej bazie, czyli odpowiednik układu kar-tezjańskiego w geometrii euklidesowej, nazywa się w szczególnej teorii względności „czaso-przestrzennym układem inercjalnym”. Współrzędna x0, odpowiadająca ujemnej wartościiloczynu skalarnego: (e0|e0) = −1, ma w tym układzie odniesienia interpretację czasu, pod-czas gdy pozostałe współrzędne (x1, x2, x3) interpretujemy jako współrzędne przestrzenne.Właśnie takim układem posługiwaliśmy się w paragrafie 5.12 do opisu pola elektromagne-tycznego.W dalszym ciągu będziemy starali się formułować rozmaite konstrukcje geometryczne w

wersji uniwersalnej, poprawnej nie tylko w przypadku geometrii euklidesowej, ale równieżw ogólnym przypadku pseudo-euklidesowym.

6.3 Struktura Riemanna i tensor metryczny na rozmaitości

Rozmaitość Riemanna to przestrzeń, w której umiemy mierzyć długość wektorów stycz-nych. Nie musi ona być przestrzenią euklidesową, to znaczy nie musi dopuszczać istnieniakartezjańskich układów współrzędnych. Dlatego też struktura iloczynu skalarnego musi byćokreślona niezależnie w każdym jej punkcie.Definicja. Rozmaitość M nosi na sobie strukturę Riemanna (metryczną) oznaczaną „g”,gdy w każdym jej punkcie x ∈ M przestrzeń styczna TxM jest przestrzenią euklidesową,to znaczy jest na niej określony iloczyn skalarny (·|·)g, i to w taki sposób, że gdy X i Y sągładkimi polami wektorowymi, to ich iloczyn skalarny, tzn. funkcja

M ∋ x −→ (X(x)|Y (x))g = (Y (x)|X(x))g ∈ R (455)

jest gładka.Jeśli (xi) jest lokalną mapą (układem współrzędnych) w M to iloczyn skalarny defi-

niuje w każdym punkcie macierz symetryczną, dodatnio określoną, złożoną z iloczynówskalarnych wektorów bazy:

gij(x) :=

(∂

∂xi(x)

∣∣∣∣∣∂

∂xj(x)

)

g

. (456)

Pole macierzy gij nazywa się tensorem metrycznym. Jest w nim zakodowana pełna infor-macja o strukturze Riemanna, bowiem mamy

(v|w) =(vi

∂xi

∣∣∣∣∣wj ∂

∂xj

)

g

= vigijwj . (457)

167

Page 174: Rozn. Geom_ - Jerzy Kijowski

Wyrazy tej macierzy są oczywiście odpowiednio gładkimi funkcjami na M . Przy zamianieukładu współrzędnych na (ya) macierz współrzędnych tensora metrycznego transformujesię tak jak we wzorze (450), to znaczy w sposób wynikający z praw transformacji wektorówbazy:

gab =

(∂

∂ya

∣∣∣∣∣∂

∂yb

)

g

=

(∂xi

∂ya∂

∂xi

∣∣∣∣∣∂xj

∂yb∂

∂xj

)

g

=∂xi

∂yagij

∂xj

∂yb. (458)

To prawo transformacyjne zawiera macierz przejścia J =(∂xi

∂ya

), tę samą co prawo trans-

formacyjne dla współrzędnych kowektora („stare współrzędne różniczkowane względemnowych”). Mówimy, że gij jest tensorem kowariantnym. Prawo to można sformułować wjęzyku iloczynu trzech macierzy:

g = J · g · JT (459)

Najprostszym przykładem przestrzeni Riemanna jest afiniczna przestrzeń euklideso-wa opisana w poprzednim paragrafie. W takiej przestrzeni można wybrać jakąś bazę(e1, . . . , en) przestrzeni V , a następnie prostoliniowy układ współrzędnych:

Rn ∋ (xi)→ x0 + xiei ∈ A .

W takiej parametryzacji mamy ∂∂xi= ei, zatem macierz

gij = (ei|ej)

jest, jak widać, stała: jej współrzędne nie zależą od punktu. W szczególności: jeśli wy-braliśmy bazę ortonormalą, to odpowiadające jej współrzędne nazywamy współrzędnymikartezjańskimi. Macierz gij jest w tych współrzędnych macierzą jednostkową: gij = δij .Jednak nawet płaską przestrzeń euklidesową możemy opisywać w dowolnym układzie

krzywoliniowym, w którym macierz gij może być bardzo skomplikowana, a zależność jejelementów macierzowych od punktu x tak uwikłana, że na pierwszy rzut oka nie da się wniej rozpoznać zwykłej, płaskiej przestrzeni euklidesowej. Jeśli ktoś da nam taką macierz,której elementy macierzowe są funkcjami na przestrzeni M , to rozstrzygnięcie tego, czymamy do czynienia z przestrzenią płaską, a zatem czy przy pomocy mądrego wyboruukładu współrzędnych możemy sprowadzić tę macierz do delty Kroneckera, jest poważnymproblemem. W następnym Rozdziale będziemy się uczyli jak go rozwiązywać. Wspomnimyjednakże, iż należy w takim przypadku obliczyć tzw. „tensor krzywizny”. Nasza przestrzeńjest płaska wtedy i tylko wtedy, gdy ten tensor znika tożsamościowo. Jeśli nie znika onw jakimś punkcie x ∈ M , to żadnym trickiem nie uda się nam sprowadzić macierzy gijdo delty w całym otoczeniu punktu x. Natomiast w izolowanym punkcie zawsze możnasprowadzić gij(x) do delty Kroneckera, to znaczy wybrać współrzędne w taki sposób, by(∂∂xi

)była w tym punkcie bazą ortonormalną.

Przykład 1. Trójwymiarową przestrzeń euklidesową E3 parametryzujemy przy pomo-cy współrzędych sferycznych (r, θ, ϕ), związanych ze współrzędnymi kartezjańskimi (x, y, z)dobrze nam znaną transformacją (31). Obliczymy tensor metryczny w tych współrzędnych,czyli macierz iloczynów skalarnych wektorów ∂

∂r, ∂∂θ, ∂∂ϕ.

168

Page 175: Rozn. Geom_ - Jerzy Kijowski

Mamy:

∂r=∂x

∂r

∂x+∂y

∂r

∂y+∂z

∂r

∂z=1r

(x∂

∂x+ y

∂y+ z

∂z

)

∂θ=∂x

∂θ

∂x+∂y

∂θ

∂y+∂z

∂θ

∂z= r cos θ

(cosϕ

∂x+ sinϕ

∂y

)− r sin θ ∂

∂z

∂ϕ=∂x

∂ϕ

∂x+∂y

∂ϕ

∂y+∂z

∂ϕ

∂z= r sin θ

(− sinϕ ∂

∂x+ cosϕ

∂y

).

Wobec tego:

grr =

(∂

∂r

∣∣∣∣∣∂

∂r

)=1r2

(x∂

∂x+ y

∂y+ z

∂z

∣∣∣∣∣x∂

∂x+ y

∂y+ z

∂z

)

=x2 + y2 + z2

r2= 1 .

Podobnie pokazujemy, że wektory bazy są wzajemnie ortogonalne, czyli:(∂

∂r

∣∣∣∣∣∂

∂ϕ

)= grϕ = gϕr = 0 ,

(∂

∂ϕ

∣∣∣∣∣∂

∂θ

)= gϕθ = gθϕ = 0 ,

(∂

∂r

∣∣∣∣∣∂

∂θ

)= grθ = gθr = 0 .

Ponadto otrzymujemy:(∂

∂θ

∣∣∣∣∣∂

∂θ

)= gθθ = r2 ,

(∂

∂ϕ

∣∣∣∣∣∂

∂ϕ

)= gϕϕ = r2 sin2 θ .

Macierz gij ma więc w tych współrzędnych następującą postać:

gij =

1 0 00 r2 00 0 r2 sin2 θ

. (460)

Przykład 2. Dowolna rozmaitość zanurzona w przestrzeni euklidesowej M ⊂ E, jestrozmaitością Riemanna. Rzeczywiście, wektory styczne do M możemy przecież traktowaćjako wektory w E, a zatem ich iloczyn skalarny jest automatycznie określony.Jako przykład szczegółowy rozważymy sferę S2(R) o ustalonym promieniu R w trójwy-

miarowej przestrzeni euklidesowej. Taka sfera jest dwuwymiarową przestrzenią Riemanna.

169

Page 176: Rozn. Geom_ - Jerzy Kijowski

Znajdziemy jej tensor metyczny we współrzędnych geograficznych (θ, ϕ). Współrzędne teparametryzują sferę zgodnie ze wzorami:

x = R sin θ cosϕ

y = R sin θ sinϕ

z = R cos θ .

Mamy zatem

∂θ=∂x

∂θ

∂x+∂y

∂θ

∂y+∂z

∂θ

∂z= R cos θ

(cosϕ

∂x+ sinϕ

∂y

)−R sin θ ∂

∂z

oraz

∂ϕ=∂x

∂ϕ

∂x+∂y

∂ϕ

∂y+∂z

∂ϕ

∂z= R sin θ

(− sinϕ ∂

∂x+ cosϕ

∂y

).

Pamiętając, że wektory ∂∂x, ∂∂yi ∂∂zstanowią układ ortonormalny znajdujemy prosto ilo-

czyny skalarne powyższych wektorów, a zatem elementy macierzowe szukanego tensorametrycznego:

gθθ =

(∂

∂θ

∣∣∣∣∣∂

∂θ

)= R2 ,

gθϕ = gϕθ =

(∂

∂θ

∣∣∣∂

∂ϕ

)= 0 ,

gϕϕ =

(∂

∂ϕ

∣∣∣∣∣∂

ϕθ

)= R2 sin2 θ .

Tak więc macierz współrzędnych tensora metrycznego na sferze o promieniu R wygląda wtej parametryzacji następująco:

gij = R2[1 00 sin2 θ

]. (461)

Przykład 3. Jako następny przykład rozmaitości Riemanna weźmy powierzchnię Ozanurzoną w E3, daną we współrzędnych kartezjańskich jednym równaniem:

O = (x, y, z) ∈ R3| z = f(x, y) . (462)

Przykład ten zawiera w sobie pół-sferę, gdy jako f weźmiemy f =√R2 − x2 − y2. Weźmy

parametryzację punktów tej powierzchni współrzędnymi (x, y) ich rzutów na płaszczyznęz = 0. Kładziemy zatem:

x = τ 1 ,

y = τ 2 ,

z = f(τ 1, τ 2) .

170

Page 177: Rozn. Geom_ - Jerzy Kijowski

Mamy zatem:

∂τ 1=

∂x

∂τ 1∂

∂x+

∂y

∂τ 1∂

∂y+

∂z

∂τ 1∂

∂z=

∂x+ fx

∂z,

∂τ 2=

∂x

∂τ 2∂

∂x+

∂y

∂τ 2∂

∂y+

∂z

∂τ 2∂

∂z=

∂y+ fy

∂z,

gdzie oznaczyliśmy:

fx :=∂f

∂x,

fy :=∂f

∂y.

Możemy teraz obliczyć współrzędne tensora metrycznego:

g11 =

(∂

∂τ 1

∣∣∣∣∣∂

∂τ 1

)=

(∂

∂x+ fx

∂z

∣∣∣∣∣∂

∂x+ fx

∂z

)= 1 + (fx)2 ,

g22 =

(∂

∂τ 2

∣∣∣∣∣∂

∂τ 2

)=

(∂

∂y+ fy

∂z

∣∣∣∣∣∂

∂y+ fy

∂z

)= 1 + (fy)2 ,

g12 = g21 =

(∂

∂τ 1

∣∣∣∣∣∂

∂τ 2

)=

(∂

∂x+ fx

∂z

∣∣∣∣∣∂

∂y+ fy

∂z

)= fxfy .

Otrzymaliśmy zatem:

gij =

[1 + (fx)2 fxfyfxfy 1 + (fy)2

]. (463)

Przykład 4. Powyższy przykład sugeruje rozważenie następującego, krzywoliniowegoukładu współrzędnych na R3:

x = τ 1 ,

y = τ 2 ,

z = f(τ 1, τ 2) + τ 3 ,

gdzie f jest gładką funkcją dwóch zmiennych. Odpowiednio otrzymujemy wzory wyrażającestarą bazę kowektorów w języku nowej bazy:

dx = dτ 1 ,

dy = dτ 2 ,

dz = fxdτ 1 + fydτ 2 + dτ 3 ,

171

Page 178: Rozn. Geom_ - Jerzy Kijowski

oraz dualne wzory wyrażające nową bazę wektorów w języku starej bazy:

∂τ 1=

∂x

∂τ 1∂

∂x+

∂y

∂τ 1∂

∂y+

∂z

∂τ 1∂

∂z=

∂x+ fx

∂z,

∂τ 2=

∂x

∂τ 2∂

∂x+

∂y

∂τ 2∂

∂y+

∂z

∂τ 2∂

∂z=

∂y+ fy

∂z,

∂τ 3=

∂x

∂τ 3∂

∂x+

∂y

∂τ 3∂

∂y+

∂z

∂τ 3∂

∂z=

∂z.

Licząc iloczyny skalarne tych wektorów otrzymujemy następującą macierz tensora me-trycznego w zwykłej, płaskiej przestrzeni euklidesowej:

gij =

1 + (fx)2 fxfy fxfxfy 1 + (fy)2 fyfx fy 1

. (464)

Jeśli funkcja f jest bardzo skomplikowana, to „rodzona matka nie rozpozna” w tym obiek-cie zwykłej macierzy jednostkowej δij , tyle tylko, że przepisanej w innym układzie współ-rzędnych. Trudno zaiste byłoby odgadnąć, że ta przestrzeń jest płaska i że istnieje w niejglobalny układ kartezjański, sprowadzający tę macierz do delty Kroneckera δij .

6.4 Obraz odwrotny („pull back”) tensora metrycznego

Podobnie jak to miało miejsce w przypadku poprzednio poznanych obiektów geometrycz-nych (wektory, ko-wektory, formy różniczkowe), prawo transformacyjne (458) dla tensorametrycznego można interpretować czynnie, jako współrzędniowy opis operacji polegającejna braniu obrazu odwrotnego. Jeśli mianowicie

F :M → N

jest odwzorowaniem z rozmaitości M w rozmaitość N to obrazem odwrotnym tensora me-trycznego g na N nazywamy formę kwadratową (czyli symetryczną!) na wektorach stycz-nych do M , daną wzorem:

(v|w)F ∗g := (F∗v|F∗w)g . (465)

Jeśli teraz (xi) są współrzędnymi w N zaś (ya) – współrzędnymi w M to, jak wiemy,zachodzi

F∗

(∂

∂ya

)=∂xi

∂ya∂

∂xi.

Wobec tego macierz formy kwadratowej F ∗ jest rzeczywiście dana wzorem (458):

gab =

(∂

∂ya

∣∣∣∣∣∂

∂yb

)

F ∗g

=

(∂xi

∂ya∂

∂xi

∣∣∣∣∣∂xj

∂yb∂

∂xj

)

g

=∂xi

∂yagij

∂xj

∂yb. (466)

Interpretację bierną tego wzoru, czyli prawo transformacyjne (458) dla składowych metryki,otrzymuje się biorąc N = M i odwzorowanie tożsamościowe miedzy nimi: F = id : M →M , ale stosując różne układy współrzędnych na dziedzinie i na obrazie tego odwzorowania.

172

Page 179: Rozn. Geom_ - Jerzy Kijowski

Jeśli odwzorowanie F∗ ma trywialne jądro (np. jeśli F jest dyfeomorfizmem), to obrazodwrotny metryki: F ∗g, jest również dodatnio określony, zatem jest metryką. W ogólnymprzypadku mogą istnieć w M wektory, na których F∗ zeruje się, zatem ich „kwadrat dłu-gości” w sensie F ∗ jest równy zeru. W takiej sytuacji forma kwadratowa F ∗ nie jest jużmetryką Riemanna.

6.5 Izomorfizm miedzy przestrzenią styczną a ko-styczną gene-rowany przez strukturę Riemanna

Wśród licznych konsekwencji istnienia struktury Riemanna, które będziemy stopniowoomawiali w tym Rozdziale, najprostszą jest możliwość reprezentowania ko-wektorów przezwektory (i odwrotnie). W niektórych zastosowaniach opis ko-wektora w sposób typowydla wektora może nawet ujawnić jakieś ciekawe aspekty opisywanego zjawiska. Jednak na-łogowe korzystanie z takiego wybiegu prowadzi do zamazania istoty rzeczy. Zjawisko tojest bardzo rozpowszechnione i powoduje komplikowanie nawet prostych problemów. Niedajmy się wciągnąć w ten nałóg!Istnieje jednak możliwość takiego utożsamienia przestrzeni stycznej z ko-styczną po-

przez następujące odwzorowanie:

TxM ∋ v −→ v = (v|·)x ∈ T ∗xM . (467)

Wzór ten oznacza, że wartość ko-wektora v na dowolnym wektorze w wynosi:⟨v;w

⟩= (v|w)

x.

Obliczmy współrzędne ko-wektora v = vkdxk, gdy dane są współrzędne wektora v = vi ∂

∂xi.

Mamy mianowicie:

vk =

⟨v;

∂xk

⟩=

(v

∣∣∣∣∣∂

∂xk

)

x

=

(vi

∂xi

∣∣∣∣∣∂

∂xk

)

x

= vigik(x) . (468)

A zatem współrzędne vk kowektora v powstają poprzez „opuszczenie” współrzędnych vi

wektora v przy pomocy macierzy gik.Ponieważ iloczyn skalarny jest niezdegenerowany, macierz gik jest odwracalna. Zatem

powyższe odwzorowanie jest izomorfizmem przestrzeni liniowych. Odwzorowanie odwrotnenazywamy „operacją podnoszenia wskaźnika” i oznaczamy muzycznym krzyżykiem:

T ∗xM ∋ α −→ α# ∈ TxM . (469)

Polega ono zatem na zastosowaniu macierzy odwrotnej gkj, to znaczy takiej, która spełnia:

gik gkj = δji . (470)

To przy jej pomocy „podnosimy” współrzędne kowektora(α#)j= αkgkj . (471)

173

Page 180: Rozn. Geom_ - Jerzy Kijowski

W szczególności dla α = v otrzymujemy:

vkgkj = vigikgkj = viδ

ji = v

j , (472)

co oznacza właśnie iż (v)# = v. Podobnie mamy: (α#) = α. Inaczej:

−1 = # , (473)

#−1 = . (474)

Żargonowe nazwy „opuszczanie” i „podnoszenie” wskaźnika są związane z reprezentacjątych odwzorowań na współrzędnych: wektory mają wskaźniki na górze a ko-wektory nadole.Zauważmy, że dxi = δikdx

k, zatem zgodnie z (471) mamy:

(dxi

)#= δikg

kj ∂

∂xj= gij

∂xj. (475)

A priori wektory i kowektory są zupełnie innymi obiektami geometrycznymi. Ich utożsa-mianie jest możliwe jedynie dzięki strukturze Riemanna. W przestrzeni euklidesowej możnastosować współrzędne kartezjańskie, w których to utożsamienie wyraża się bardzo prosto,bowiem macierz gij jest w nich macierzą jednostkową. Na mocy wzoru (468) oznacza to,że v i v mają te same składowe: vk = v

k. Można wtedy zapomnieć o tym, czy wskaźnikileżą na górze czy na dole a nawet zapomnieć czy mamy do czynienia z wektorem czy zko-wektorem. Gdy chcemy jednak używać krzywoliniowych układów współrzędnych, lubgdy przestrzeń nie jest płaska i po prostu nie istnieją w niej układy prostoliniowe (a tymbardziej kartezjańskie), mylenie wektorów z ko-wektorami prowadzi do bolesnych pomyłek.

6.6 Długość kowektora oraz multi-kowektora

Izomorfizm między przestrzenią styczną a ko-styczną pozwala „przeciągnąć” iloczyn skalar-ny do tej ostatniej. Otrzymamy w ten sposób iloczyn skalarny „#∗g” dla ko-wektorów. Abyuniknąć proliferacji oznaczeń, nie będziemy wprowadzali nowego symbolu na tę strukturę,zadowalając się następującą formułą na iloczyn skalarny dwóch ko-wektorów α, β ∈ T ∗

xM :

(α|β) :=(α#∣∣∣β#

)g. (476)

W szczególności wzór (475) implikuje następującą zależność:

(dxi

∣∣∣dxj)=((dxi

)#∣∣∣∣(dxj

)#)

g=

(gik

∂xk

∣∣∣∣∣gjl ∂

∂xl

)= gikgklglj = gij , (477)

co pozwala interpretować odwrotny tensor metryczny gij jako macierz iloczynów skalarnychko-wektorów bazy dxi, analogicznie do pierwotnej definicji (456) samego tensora gij .

174

Page 181: Rozn. Geom_ - Jerzy Kijowski

Ogólne wyrażenie współrzędniowe na iloczyn skalarny ko-wektorów otrzymujemy pod-stawiając α = αidxi, β = βjdxj :

(α|β) =(αi(dxi

)#∣∣∣∣βj(dxj

)#)

g= αigijβj , (478)

analogicznie do (457).Jeśli umiemy liczyć iloczyn skalarny kowektorów, to i wszystkiego, co można z nich

zbudować. Na przykład multi-kowektorów.

Przykład: Jeśli(2)α= t ∧ u, zaś

(2)

β= v ∧w, gdzie t, u, v, w są ko-wektorami, to mogłobysię wydawać, że ich iloczyn skalarny można określić prostym wzorem:

((2)α

∣∣∣∣∣(2)

β

)= (t ∧ u|v ∧ w) = (t|v) · (u|w) .

Taki wzór byłby jednak absurdalny, bowiem nie uwzględniałby faktu, że iloczyn zewnętrznyjest antysymetryczny i – wobec tego – zachodzi tożsamość: t ∧ u = −u ∧ t, oraz: v ∧ w =−w ∧ v. Prawidłowa definicja musimy uwzględniać poprawkę na permutacje ko-wektorówtworzących multi-kowektor:

(t ∧ u|v ∧ w) = (t|v) · (u|w)− (t|w) · (u|v)= (t|v) · (u|w)− (u|v) · (t|w)

= det

[(t|v) (t|w)(u|v) (u|w)

]. (479)

W ten sposób dochodzimy do następującej definicji:Definicja: Jeśli (u(1), . . . , u(k)), oraz (w(1), . . . , w(k)) są zbiorami ko-wektorów zaczepio-

nych w punkcie x ∈M przestrzeni Riemanna, to iloczyn skalarny ich iloczynów zewnętrz-nych definiujemy następująco:

(u(1) ∧ · · · ∧ u(k)

∣∣∣w(1) ∧ · · · ∧ w(k))=

σ∈Sk(−1)|σ|

(u(1)

∣∣∣w(σ1))· · ·

(u(k)

∣∣∣w(σk))

=∑

σ∈Sk(−1)|σ|

(u(σ1)

∣∣∣w(1))· · ·

(u(σk)

∣∣∣w(k))

= det(u(i)

∣∣∣w(j)). (480)

Ściśle rzecz biorąc, powyższy wzór wyznacza iloczyn skalarny jedynie dla bazy przestrze-

nik∧T ∗xM , co z kolei implikuje jednoznacznie postać iloczynu skalarnego dla dowolnych

elementów tej przestrzeni.

Twierdzenie: Jeśli αi1,...,ik stanowią współrzędne k-kowektora(k)α (patrz wzór (339))

zaś βj1,...,jk współrzędne k-kowektora(k)

β , to ich iloczyn skalarny wyraża się wzorem:((k)α

∣∣∣∣∣(k)

β

)=1k!αi1,...,ikg

i1j1 · · · gikjkβj1,...,jk . (481)

175

Page 182: Rozn. Geom_ - Jerzy Kijowski

Dowód: Zgodnie z (480) oraz (477) mamy:(dxi1 ∧ · · · ∧ dxik

∣∣∣dxj1 ∧ · · · ∧ dxjk)=∑

σ∈Sk(−1)|σ|gi1jσ1 · · · gikjσk ,

zatem, oznaczając przez π permutację odwrotną do σ: (tzn. π = σ(−1)) otrzymujemy:((k)α

∣∣∣∣∣(k)

β

)=

1(k!)2

αi1,...,ikβj1,...,jk∑

σ∈Sk(−1)|σ|gi1jσ1 · · · gikjσk

=1(k!)2

π∈Skαi1,...,ikβjπ1 ,...,jπk (−1)

|π|gi1j1 · · · gikjk

=1(k!)2

π∈Skαi1,...,ikβj1,...,jkg

i1j1 · · · gikjk

=1k!αi1,...,ikg

i1j1 · · · gikjkβj1,...,jk .

Skorzystaliśmy tutaj z faktu, że |σ| = |π| oraz z tożsamości

βj1,...,jk = βjπ1 ,...,jπk (−1)|π| ,

wyrażającej antysymetrię składowych multi-ko-wektora.

Przykład: Wszystkie multi-ko-wektory maksymalnego rzędu k = n są proporcjonalnedo elementu bazowego

α = dx1 ∧ · · · ∧ dxn = 1n!ǫi1,...,ikdx

i1 ∧ · · · ∧ dxin .

Obliczymy kwadrat jego długości. Korzystając z (481) oraz (424) otrzymujemy:

(α|α) = 1n!

ǫi1,...,ingi1j1 · · · ginjnǫj1,...,jn

=1n!

σ∈Sn

π∈Sn(−1)|σ|(−1)|π|gσ1π1 · · · gσnπn .

Uporządkujemy czynniki w tym iloczynie w rosnącym porządku pierwszego wskaźnika σr =m. Podstawiając r = σ−1(m) i oznaczając ρ = π σ−1 mamy:

(α|α) = 1n!

σ∈Sn

ρ∈Sn(−1)|ρ|g1ρ1 · · · gnρn

=∑

ρ∈Sn(−1)|ρ|g1ρ1 · · · gnρn = det

(gij)=1det g

, (482)

gdzie skróconym symbolem det g = det (gij) oznaczamy wyznacznik tensora metrycznegog. Skorzystaliśmy z faktu, że parzystość permutacji ρ jest sumą parzystości σ oraz π. Widaćwięc, że element √

|det g| · dx1 ∧ · · · ∧ dxn =√|det g| · α (483)

176

Page 183: Rozn. Geom_ - Jerzy Kijowski

jest w geometrii Riemanna unormowany do jedności. Znak wartości bezwzględnej podpierwiastkiem wprowadziliśmy „na wszelki wypadek”, po to, by formuła ta miała sensrównież w przypadku pseudo-euklidesowym. Wzór (482) pokazuje jednak, że w ogólnymprzypadku iloczyn skalarny tego elementu przez siebie jest równy znakowi wyznacznika ztensora metrycznego, czyli liczbie sgn(det g) = ±1.

6.7 Przykład: jak obliczyć Laplasjan funkcji w zmiennych krzy-woliniowych

W niniejszym paragrafie odstąpimy na chwilę od filozofii naszego wykładu i opiszemy pew-ną ważną strukturę na rozmaitości Riemanna w języku czysto współrzędniowym. W dal-szym ciągu naszego wykładu ta sama struktura, zwana operatorem Laplace’a-Beltramiego,otrzyma poprawny opis geometryczny, niezależny od układu współrzędnych. Jednak opiswspółrzędniowy jest tak ważny w zastosowaniach, a rachunek wykazujący jego niezależ-ność od wyboru układu współrzędnych tak „modelowy”, że warto omówić te sprawy napoczątku wykładu. Zresztą odkrycie operatora Laplace’a-Beltramiego na pewno nie byłobymożliwe bez dostrzeżenia niezmienniczości formuł, które przedstawimy poniżej.Rozpocznijmy od n-wymiarowej przestrzeni euklidesowej En. W wielu teoriach fizycz-

nych pojawia się operator różniczkowy drugiego rzędu zwany operatorem Laplace’a lub„Laplasjanem”, który we współrzędnych kartezjańskich definiuje się następująco:

∆f :=n∑

i=1

∂2f

∂(xi)2=n∑

i=1

∂2i f . (484)

Jak to wkrótce zobaczymy, wzór ten wygląda identycznie w dowolnym innym kartezjań-skim układzie współrzędnych. A jak wyrazić ten operator w dowolnym układzie współrzęd-nych?Okazuje się, że prawdziwa jest następująca formuła20:

∆f :=1√| det g|

∂i

(√| det g| gij∂jf

). (485)

Obowiązuje tu konwencja sumacyjna. Znaczy to, iż prawa strona jest podwójną sumą poi oraz po j. Nie ma problemów z braniem pierwiastka, bowiem tensor metryczny jestmacierzą ściśle dodatnio określoną, zatem jej wyznacznik jest dodatni.Zanim wykażemy ten wzór zauważmy, że w układzie kartezjańskim mamy gij = δij .

Zatem również macierz odwrotna do g jest macierzą jednostkową: gij = δij, zaś wyznacznikjest równy jedności i jest funkcją stałą:

√det g ≡ 1. Widać więc, że w tych współrzędnych

wzór (485) redukuje się do (484).Twierdzenie: Powyższy operator wygląda identycznie w dowolnym układzie współ-

rzędnych.20Podajemy wersję prawdziwą również w geometrii pseudoeuklidesowej. W przypadku euklidesowymsymbol wartości bezwzględnej jest zbędny.

177

Page 184: Rozn. Geom_ - Jerzy Kijowski

Dowód: Niech będą dane dowolne dwa układy współrzędnych: (xi) oraz (ya). W każ-dym z nich określmy operator różniczkowy wzorem (485) i oznaczmy:

∆f :=1√| det g|

∂xi

(√| det g| gij ∂

∂xjf

), (486)

∆f :=1√| det g|

∂ya

(√| det g| gab ∂

∂ybf

), (487)

gdzie przez „g” oznaczyliśmy tensor metryczny (456) we współrzędnych (xi) zaś przez „g”– jego odpowiednik (458) we współrzędnych (ya). Celem naszego dowodu jest wykazanierówności ∆f = ∆f .Pamiętając o oznaczeniu: J =

(∂xi

∂ya

), prawo transformacyjne (459) dla metryki (tzn. g =

J · g · JT ) implikuje następujący wzór:

det g = det g · (det J)2 ;√| det g| =

√| det g| · | detJ | . (488)

Natomiast macierz odwrotną do g też można obliczyć jako odwrotną do iloczynu trzechmacierzy (459):

g−1 = (JT )−1 · g−1 · J−1 ,czyli na współrzędnych:

gab =∂ya

∂xigij∂yb

∂xj. (489)

Wstawimy teraz (488) oraz (489) do definicji (487) operatora ∆. Otrzymamy w ten sposób:

∆f =1√

| det g| · | detJ |∂

∂ya

(√| det g| · | det J | ∂y

a

∂xigij∂yb

∂xj∂

∂ybf

)

=1√

| det g| · | detJ |∂

∂ya

(√| det g| · | det J | ∂y

a

∂xigij

∂xjf

)

=1√

| det g| · | detJ |∂

∂ya

(| det J | ∂y

a

∂xi·√| det g| gij ∂

∂xjf

)

=1

| det J | gij ∂f

∂xj∂

∂ya

(| det J | ∂y

a

∂xi

)+

1√| det g|

∂ya

∂xi∂

∂ya

(√| det g| gij ∂

∂xjf

).

I znów skorzystamy z tożsamości ∂ya

∂xi∂∂ya= ∂∂xi, dzięki której drugi składnik powyższej sumy

jest równy definicji (486) operatora ∆. Mamy zatem:

∆f = ∆f +1det J

gij∂f

∂xj∂

∂ya

((det J)

∂ya

∂xi

). (490)

Pozbyliśmy się znaku wartości bezwzględnej, bo albo zachodzi det J > 0, albo też | det J | =− det J > 0 i wtedy dwa znaki „minus” kasują się. Okazuje się, że zatrważający dodatekpo prawej stronie nie jest groźny, bowiem znika na mocy następującej tożsamości:

178

Page 185: Rozn. Geom_ - Jerzy Kijowski

Lemat:∂

∂ya

((det J)

∂ya

∂xi

)≡ 0 . (491)

Ostatecznie więc otrzymujemy żądaną równość obu operatorów:

∆f = ∆f . (492)

Dowód Lematu: Rozważmy (n − 1)-formę różniczkową α w M , która w zmiennych(xi) wyraża się wzorem:

α =∂

∂xi

(dx1 ∧ · · · ∧ dxn

)= (−1)i−1 · dx1 ∧ · · ·

∧i

· · · ∧ dxn .

Forma ta jest w oczywisty sposób zamknięta:

dα = 0 . (493)

We współrzędnych (ya) ta sama forma wyraża się wzorem:

α = (det J)∂ya

∂xi∂

∂ya

(dy1 ∧ · · · ∧ dyn

).

(Przypominamy, że J =(∂xj

∂yc

).) Równość (493) zapisana w tych współrzędnych daje nam

żądaną tożsamość (zob. (429)):

0 = dα =∂

∂ya

((det J)

∂ya

∂xi

)(dy1 ∧ · · · ∧ dyn

). (494)

Wzór (485) daje bardzo wygodną metodę wyliczania wartości zwykłego, płaskiego (toznaczy danego wzorem (484)) Laplasjanu w zmiennych krzywoliniowych. Jeszcze ważniejszajest jego rola jako definicji tzw. operatora Laplace’a-Beltramiego w dowolnej przestrzeniRiemanna, w której nie istnieją współrzędne kartezjańskie, zaś naiwny wzór (484) nie masensu, bowiem daje różną wartość w różnych układach współrzędnych. Zgodnie z filozofiąnaszego wykładu, podamy w dalszym ciągu geometryczną definicję tego operatora bezodwoływania się do współrzędnych.Ćwiczenie 1: W trójwymiarowej przestrzeni Euklidesowej znajdziemy postać opera-

tora Laplace’a (484) wyrażonego w zmiennych sferycznych. Wiemy już (por. wzór (460)),że tensor metryczny przyjmuje w tych zmiennych postać

gij =

1 0 00 r2 00 0 r2 sin2 θ

=

[1 00 r2 · γAB

], (495)

179

Page 186: Rozn. Geom_ - Jerzy Kijowski

gdzie macierz

γAB =

[1 00 sin2 θ

], (496)

jak to wynika z (461), opisuje tensor metryczny na sferze jednostkowej S2 = r = 1.Wobec tego zachodzi: √

det g = r2√det γ = r2 sin θ ,

oraz

gij =

[1 00 1r2· γAB

], (497)

gdzie macierz

γAB =

[1 00 1sin2 θ

], (498)

jest odwrotnym tensorem metrycznym na S2. Stosując teraz wzór (486) w zmiennych sfe-rycznych otrzymujemy:

∆f =1

r2√det γ

∂r

(r2√det γ grr

∂rf

)+

1r2√det γ

∂A

(r2√det γ

1r2γAB∂Bf

)

=1r2

∂r

(r2∂

∂rf

)+1r2

(2)

∆ f ,

gdzie przez(2)

∆ oznaczyliśmy dwuwymiarowy operator Laplace’a na sferze S2, generowanyprzez metrykę (496):

(2)

∆ f =1√det γ

∂A

(√det γ γAB∂Bf

)

=1sin θ

∂θ (sin θ ∂θf) + ∂ϕ

(sin θ

1sin2 θ

∂ϕf)

=(∂2θ +

1sin2 θ

∂2ϕ + ctg θ ∂θ)f . (499)

Ostatecznie więc otrzymujemy rozkład trójwymiarowego Laplasjanu w E3 na część radialnąpostaci 1

r2∂r (r2∂rf) = ∂2rf+

2r∂rf , oraz na część kątową, równą Laplasjanowi w zmiennych

kątowych, podzielonemu przez r2:

∆ = ∂2r +2r∂r +

1r2(2)

∆ . (500)

Powyższy wzór można wyprowadzić bezpośrednim rachunkiem, przeliczając we wzorze„∆ = ∂2x + ∂

2y + ∂

2z” pochodne po zmiennych kartezjańskich na pochodne po zmiennych

sferycznych. Zachęcamy czytelnika podjęcia takiej próby. Ten trudny rachunek pokazujeniezbicie jak ogromnym osiągnięciem było znalezienie uniwersalnej formuły (485).

180

Page 187: Rozn. Geom_ - Jerzy Kijowski

Ćwiczenie 2: Teza naszego Lematu, tzn. tożsamość (491), została wykazana przypomocy rozumowania geometrycznego, odwołującego się do pojęcia różniczki zewnętrznej.Można to jednak uczynić również bezpośrednim rachunkiem. Przedstawimy ten rachunek,bowiem jest on modelowy i stanowi znakomite ćwiczenie o uniwersalnym znaczeniu.Przypominamy, że J =

(∂xj

∂yc

). Mamy zatem:

∂ya

((det J)

∂ya

∂xi

)= (det J)

∂ya

(∂ya

∂xi

)+∂ya

∂xi∂

∂ya(det J) . (501)

Aby obliczyć pierwszą z tych pochodnych, zróżniczkujemy stronami następującą tożsamość:

δac =∂ya

∂xj∂xj

∂yc.

Ponieważ elementy macierzowe δab macierzy jednostkowej są funkcjami stałymi, ich pochod-ne znikają tożsamościowo:

0 =∂

∂ya

(∂ya

∂xj∂xj

∂yc

)=∂xj

∂yc∂

∂ya

(∂ya

∂xj

)+∂ya

∂xj

(∂2xj

∂ya∂yc

)

Mnożąc teraz obie strony przez macierz ∂yc

∂xii korzystając z faktu, że

∂yc

∂xi∂xj

∂yc= δji ,

otrzymujemy:

0 =∂

∂ya

(∂ya

∂xi

)+∂ya

∂xj

(∂2xj

∂ya∂yc

)∂yc

∂xi,

czyli:∂

∂ya

(∂ya

∂xi

)= −∂y

a

∂xj

(∂2xj

∂ya∂yc

)∂yc

∂xi. (502)

Aby teraz obliczyć składnik ∂∂ya(det J) w (501) zauważmy, że pochodna wyznacznika po

dowolnym elemencie macierzowym jest równa dopełnieniu algebraicznemu tego elementumacierzowego, a to dopełnienie jest równe elementowi macierzowemu macierzy odwrotnejpomnożonemu przez sam wyznacznik:

∂(det J)

∂(∂xj

∂yc

) = (det J)∂yc

∂xj. (503)

Otrzymujemy zatem:

∂ya(det J) =

∂(det J)

∂(∂xj

∂yc

)(

∂2xj

∂ya∂yc

)= (det J)

∂yc

∂xj

(∂2xj

∂ya∂yc

). (504)

Wstawiając teraz to wyrażenie oraz wyrażenie (502) do (501) obserwujemy znikanie prawejstrony, a więc tezę (491) naszego Lematu.

181

Page 188: Rozn. Geom_ - Jerzy Kijowski

6.8 Całki „pierwszego rodzaju”: długość krzywej, pole powierzch-ni itd.

Jeśli γ jest krzywą sparametryzowaną w przestrzeni Riemanna:

R ⊃ [a, b] ∋ t→ γ(t) ∈M , (505)

to jej długość definiuje się wzorem:

|γ| :=∫ b

a‖γ(t)‖dt . (506)

Podobnie jak w przypadku całki z pola ko-wektorowego (295), tak i tutaj można wykazać,że wielkość ta nie zmienia się, gdy zmienimy parametryzację krzywej. Więcej: możemynawet zmienić orientację, a całka ta nie ulegnie zmianie, podczas gdy „koszt procesu”(295) w takiej sytuacji zmieniał znak na przeciwny. I rzeczywiście, jeśli

[c, d] ∋ τ → ϕ(τ) ∈ [a, b] , oraz ϕ′ 6= 0 ,

to podstawiając t = ϕ(τ) otrzymujemy:

|γ| =∫ b

a

∥∥∥∥∥∥

√dγdt

∥∥∥∥∥∥dt =

∫ b

a

∥∥∥∥∥∥

√dγdτ

∥∥∥∥∥∥· |ϕ′|dt .

Są możliwe dwa przypadki: 1) Jeśli ϕ zachowuje orientację krzywej, tzn. ϕ′ > 0, to ϕ(c) = aoraz ϕ(d) = b i wtedy twierdzenie o zamianie zmiennych daje nam:

∫ b

a

∥∥∥∥∥∥

√dγdτ

∥∥∥∥∥∥· |ϕ′| · dt =

∫ b

a

∥∥∥∥∥∥

√dγdτ

∥∥∥∥∥∥· ϕ′ · dt =

∫ d

c

∥∥∥∥∥∥

√dγdτ

∥∥∥∥∥∥dτ ,

podobnie jak to miało miejsce dla form różniczkowych (zob. formuła (298)). Możliwy jestjednak inny przypadek: 2) Jeśli ϕ zmienia orientację krzywej, tzn. ϕ′ < 0, to ϕ(c) = b orazϕ(d) = a i wtedy mamy:

∫ b

a

∥∥∥∥∥∥

√dγdτ

∥∥∥∥∥∥· |ϕ′| · dt = −

∫ b

a

∥∥∥∥∥∥

√dγdτ

∥∥∥∥∥∥· ϕ′ · dt = −

∫ c

d

∥∥∥∥∥∥

√dγdτ

∥∥∥∥∥∥dτ =

∫ d

c

∥∥∥∥∥∥

√dγdτ

∥∥∥∥∥∥dτ .

Zatem i teraz całka (506) nie zmieni się, gdy zmienimy parametryzację krzywej, odwrot-nie niż miało to miejsce we wzorze (299). Podobnie jak w paragrafie 4.3, możemy zatemokreślić pojęcie długości krzywej niesparametryzowanej, ale tym razem nie zależy ono odorientacji takiej krzywej! Krzywa niesparametryzowana D ⊂ M , to po prostu jednowymia-rowa podrozmaitość różniczkowalna, a zmienna t to „układ współrzędnych” w D. Definicję(506) można zapisać w następujący sposób

|γ| :=∫ b

a

√√√√(∂

∂t

∣∣∣∣∣∂

∂t

)

g

dt . (507)

182

Page 189: Rozn. Geom_ - Jerzy Kijowski

Niezależność od parametryzacji wynika z faktu, że w każdym punkcie x ∈ D krzywejfunkcja

TxD ∋ v→ ‖v‖ =√(v|v)g ∈ R (508)

jest dodatnio-jednorodna, to znaczy że dla dowolnej liczby a ∈ R spełnia tożsamość:

‖av‖ = |a| · ‖v‖ . (509)

Podobnie można określić k-wymiarową (niezorientowaną!) objętość dowolnej k-wymiarowej,zwartej podrozmaitości z brzegiem D ⊂ M . W tym celu musimy wybrać parametryzacjęD przy pomocy współrzędnych (ti), i = 1, . . . , k, które przebiegają jakiś zbiór O ⊂ Rk. Wkażdym punkcie rozmaitości wektory ∂

∂tirozpinają k-równoległościan, którego k-objętość

liczymy według euklidesowego wzoru (453). No i w końcu musimy „zsumować” te objętości,czyli wziąć całkę:

|D| =∫

O

√√√√det(∂

∂ti

∣∣∣∣∣∂

∂tj

)

g

dkt . (510)

Gdy nie ma globalnego układu współrzędnych na D, to postępujemy podobnie jak w roz-dziale 5.2: albo dzielimy D na mniejsze części albo „dzielimy tort” przy pomocy rozkładujedności, tak jak w formule (329).Niezależność tej całki od wyboru parametryzacji wynika znów z dodatniej jednorodności

funkcji podcałkowej. Jeśli mianowicie (τa) są nowymi współrzędnymi, to mamy:(∂

∂ti

∣∣∣∣∣∂

∂tj

)

g

=

(∂τa

∂ti∂

∂τa

∣∣∣∣∣∂τ b

∂tj∂

∂τ b

)

g

=∂τa

∂ti

(∂

∂τa

∣∣∣∣∣∂

∂τ b

)

g

∂τ b

∂tj,

zatem √√√√det(∂

∂ti

∣∣∣∣∣∂

∂tj

)

g

= | detJ |√√√√det

(∂

∂τa

∣∣∣∣∣∂

∂τ b

)

g

,

gdzie J =(∂τa

∂ti

). Wstawiając ten wynik do definicji (510) i stosując twierdzenie o zamianie

zmiennych w całce wielokrotnej otrzymujemy taką samą całkę w zmiennych (τa).Zauważmy, że zgodnie z definicją (465), macierz iloczynów skalarnych pod pierwiastkiem

jest po prostu tensorem metrycznym na D zdefiniowanym jako obraz odwrotny metryki gprzy odwzorowaniu tożsamościowym id : D →M , tzn.

g|D := id∗g . (511)

Zatem definicja (510) k-objętości może być zapisana jako:

|D| =∫

O

√det(g|D) dkt . (512)

W klasycznej literaturze takie całki, niewrażliwe na orientację, nazywane były całkamipierwszego rodzaju.

183

Page 190: Rozn. Geom_ - Jerzy Kijowski

Przykład: Dwuwymiarową wersję k-objętości nazywamy „polem powierzchni”. Ob-liczmy pole powierzchni sfery o promieniu R w trójwymiarowej przestrzeni euklidesowej:S2(R) ∈ E3. Tensor metryczny w parametryzacji zmiennymi sferycznymi (θ, ϕ) został ob-liczony wzorem (461). Jego wyznacznik wynosi R4 sin2 θ. Zatem na mocy definicji (510)mamy:

|S2(R)| =∫ 2π

0dϕ

∫ π

0dθ ·R2 sin θ = 4πR2 . (513)

6.9 Forma objętości

Rozważanie poprzedniego rozdziału można podsumować obserwacją, iż na każdej k-podroz-maitości D w przestrzeni Riemanna mamy jednoznacznie określoną pewną miarę dodatnią.W parametryzacji zmiennymi (ti), i = 1, . . . , k; miara ta wyraża się wzorem:

dµ =√det(g|D) dkt , (514)

ale jej wartość nie zależy od wyboru tej parametryzacji. W szczególności dla k = n = dimMotrzymujemy miarę w całej przestrzeni M :

dµ =√det g dnx , (515)

gdzie (xi), i = 1, . . . , n jest dowolnym układem współrzędnych na całym M .Jeśli dodatkowo M jest zorientowaną rozmaitością Riemanna wymiaru n, to istnieje

na niej również kanoniczna forma różniczkowa maksymalnego stopnia, to znaczy n-formaróżniczkowa ω, zwana formą objętości. Jest ona dana „niemal identycznym” wzorem, alejedynie w układach współrzędnych zgodnych z orientacją:

ω =√det g dx1 ∧ dx2 ∧ · · · ∧ dxn . (516)

Różnica między (515) a (516) polega na tym, że „dnx” jest miarą dodatnią, niewrażliwąna orientację, podczas gdy „dx1 ∧ dx2 ∧ · · · ∧ dxn” jest formą różniczkową, wrażliwą naorientację. Gdy przejdziemy do innego układu współrzędnych (ya), miara transformuje sięzgodnie z twierdzeniem o zamianie zmiennych w całce wielokrotnej:

dny =

∣∣∣∣∣det(∂y

∂x

)∣∣∣∣∣ dnx ,

podczas gdy forma różniczkowa transformuje się odmiennie:

dy1 ∧ dy2 ∧ · · · ∧ dyn = det(∂y

∂x

)dx1 ∧ dx2 ∧ · · · ∧ dxn .

184

Page 191: Rozn. Geom_ - Jerzy Kijowski

Zgodnie zatem z formułą (488) na transformację wyznacznika z tensora metrycznego otrzy-mujemy:

ω =√det(gab) dy1 ∧ dy2 ∧ · · · ∧ dyn = (517)

=

∣∣∣∣∣det∂x

∂y

∣∣∣∣∣

(det

∂y

∂x

)√det(gij) dx1 ∧ dx2 ∧ · · · ∧ dxn (518)

=

∣∣∣∣∣det∂x

∂y

∣∣∣∣∣

(det

∂y

∂x

)ω , (519)

gdzie symbolem gab oznaczyliśmy składowe tensora metrycznego w układzie (ya). Oba teczynniki upraszczają się:

ω = ω ,

jeżeli Jacobian zamiany zmiennych jest dodatni, to znaczy gdy oba układy współrzędnychbyły zgodne z orientacją rozmaitości M . Wnioskujemy zatem, że nasza definicja formyobjętości rzeczywiście nie zależy od wyboru układu współrzędnych pod warunkiem, że wewzorze (516) będziemy brali jedynie układy zgodne z orientacją. A zatem na zorientowanejrozmaitości Riemanna mamy dobrze określoną formę objętości. Interesujące, że na mocyrozważań paragrafu (6.6) (zob. formuła (483)) forma ta jest unormowana: ‖ω‖ = 1.W geometrii pseudoriemannowskiej – takiej jak geometria czasoprzestrzeni w teorii

względności Einsteina, gdzie tensor metryczny gij, choć niezdegenerowany, jednak nie musibyć dodatnio określony: det g 6= 0, forma objętości jest dana uniwersalnym wzorem

ω =√| det g| dx1 ∧ dx2 ∧ · · · ∧ dxn . (520)

6.10 Dualizm („gwiazdka”) Hodge’a

Istnienie formy objętości pozwala zdefiniować izomorfizm między k-formami a l-formami,gdzie k+l = n = dimM . Izomorfizm ten nazywa się „dualizmem” (żargonowo: „gwiazdką”)Hodge’a:

k∧T ∗xM ∋ α→ ∗α ∈

l∧T ∗xM . (521)

Na mocy wzoru (344), przestrzenie obu typów multi-kowektorów mają ten sam wymiar:

dimk∧T ∗xM =

(n

k

)= dim

n−k∧T ∗xM ,

jednak bez „pomocy” struktury metrycznej nie potrafimy wyróżnić żadnego kanonicznegoizomorfizmu między nimi.Przykład 1: Dla k = 0 mamy oczywiste utożsamienie liczb i n-kowektorów:

R ∋ a→ (∗a) = a · ω ∈n∧T ∗xM. (522)

185

Page 192: Rozn. Geom_ - Jerzy Kijowski

Przykład 2: Każdy wektor TxM ∋ v jednoznacznie wyznacza pewien (n−1)-kowektorwzorem:

TxM ∋ v→ ϕ(v) := v ω ∈n−1∧

T ∗xM. (523)

Z kolei każdy wektor można utożsamiać z jakimś kowektorem. Złożenie tych dwóch utożsa-mień daje właśnie izomorfizm ∗α := ϕ(α♯) między 1-kowektorami a (n− 1)-kowektorami.Podamy teraz ogólną definicję, ważną dla dowolnego k-kowektora α ∈

k∧T ∗xM . W tym

celu zauważmy, że iloczyn skalarny (480) (lub (481) w wersji „wskaźnikowej”) pozwalaidentyfikować funkcje liniowe na przestrzeni k-kowektorów z samymi k-kowektorami, czyliutożsamiać samą przestrzeń z przestrzenią doń sprzężoną, według standardowej formuły,którą stosowaliśmy np. w (467):

k∧T ∗xM ∋ α→ (α|·) ∈

(k∧T ∗xM

)∗.

Zauważmy, że z drugiej strony „domnażanie zewnętrzne” dowolnego k-kowektora β ∈l∧

T ∗xM przez l-kowektor γ produkuje n-kowektor, zatem obiekt proporcjonalny do formyobjętości:

k∧T ∗xM ∋ β → β ∧ γ = fγ(β) · ω ∈

n∧T ∗xM . (524)

Współczynnik proporcjonalności, który oznaczyliśmy symbolem fγ, zależy liniowo od β,

czyli jest elementem przestrzeni sprzężonej dok∧T ∗xM . Łatwo widać, że odwzorowanie

l∧T ∗xM ∋ γ → fγ ∈

(k∧T ∗xM

)∗

jest izomorfizmem przestrzeni wektorowych, bowiem jego jądro jest trywialne, a wymiaryobu przestrzeni identyczne. Składając odpowiednio oba te izomorfizmy uzyskamy pewien

izomorfizm przestrzenik∧T ∗xM z

l∧T ∗xM , który oznaczamy symbolem „∗”. A konkretnie:

Definicja: Jeśli α jest k-kowektorem, to symbolem ∗α oznaczamy jedyny l = (n− k)-kowektor spełniający równość

β ∧ ∗α = (α|β) · ω , (525)

dla dowolnego k-kowektora β.

Twierdzenie 1: Jeśli

α =1k!αi1,...,ik · dxi1 ∧ · · · ∧ dxik ,

to ∗α ma w zapisie dualnym (zob. (421)) składowe (∗A)j1,...,jk:

∗α = 1k!(∗A)j1,...,jk ·

(∂

∂xj1∧ · · · ∧ ∂

∂xjk

) (dx1 ∧ · · · ∧ dxn

),

186

Page 193: Rozn. Geom_ - Jerzy Kijowski

gdzie (dx1 ∧ · · · ∧ dxn) jest n-formą zgodną z orientacją rozmaitości M . Składowe te sądane wzorem:

(∗A)j1,...,jk =√| det g| αi1,...,ikgi1j1 · · · gikjk . (526)

Uwaga : Wzór ten może być stosowany jako definicja dualności Hodge’a w sformu-łowaniu współrzędnościowym. Łatwo go zapamiętać: składowe dualne formy ∗α powstająze składowych prostych formy α przez: 1) standardowe „podniesienie” wskaźników tablicyα przy pomocy tensora metrycznego, oraz: 2) pomnożenie jej elementów przez

√| det g|.

Zobaczymy w dalszym ciągu tego wykładu, że ta ostatnia operacja jest związana z faktem,iż składowe formy w zapisie prostym stanowią tzw. tensor, podczas gdy składowe w zapi-sie dualnym nie są tensorem, lecz tzw. gęstością tensorową. Jak się wkrótce przekonamy,wprowadzenie ogólnego pojęcia „tensora”, czy „gęstości tensorowej” niewiele tu wyjaśnia(choć w wielu podręcznikach traktuje się je jako centralne pojęcie geometrii). Natomiastwzór (526) wraz ze wzorami (422) oraz (423), pozwalającymi na przejście od reprezentacjiprostej do dualnej, stanowią pełny opis współrzędnościowy dualizmu Hodge’a.

Dowód Twierdzenia 1: Zauważmy, że iloczyn zewnętrzny

(dxi1 ∧ · · · ∧ dxik

)∧((

∂xj1∧ · · · ∧ ∂

∂xjk

) (dx1 ∧ · · · ∧ dxn

))

jest równy zeru gdy zbiory wskaźników i1, . . . , ik oraz j1, . . . , jk nie są tożsame, bowiemaby któryś z czynników dxis mógł „wskoczyć” na swoje miejsce, wpierw odpowiedni czynnik∂∂xjrmusi mu to miejsce „zwolnić”. Możemy zatem ograniczyć się do takich iloczynów, w

których te zbiory są tożsame, to znaczy w których r = σ(s) dla pewnej permutacji σ ∈ Sk.W takim przypadku iloczyn jest równy:

(dxi1 ∧ · · · ∧ dxik

)∧((

∂xσ(i1)∧ · · · ∧ ∂

∂xσ(ik)

) (dx1 ∧ · · · ∧ dxn

))

= (−1)|σ|(dx1 ∧ · · · ∧ dxn

).

Wobec tego dla dowolnej k-formy β danej wzorem

β =1k!βi1,...,ik · dxi1 ∧ · · · ∧ dxik

możemy skorzystać z antysymetrii tablicy (∗A)i1,...,ik, dzięki czemu otrzymujemy:

β ∧ ∗α = 1k!1k!

i1,...,ik

σ∈Skβi1,...,ik(∗A)σ(i1),...,σ(ik)(−1)|σ|

(dx1 ∧ · · · ∧ dxn

)

=1k!1k!

i1,...,ik

σ∈Skβi1,...,ik(∗A)i1,...,ik

(dx1 ∧ · · · ∧ dxn

)

=1k!βi1,...,ik(∗A)i1,...,ik

(dx1 ∧ · · · ∧ dxn

)=

1

k!√| det g|

βj1,...,jl(∗A)j1,...,jl · ω .

187

Page 194: Rozn. Geom_ - Jerzy Kijowski

Znak sumowania po ir w ostatniej linijce mogliśmy już pominąć, bo działa tu zwykła kon-wencja sumacyjna. Natomiast w ostatniej równości skorzystaliśmy z uniwersalnej formuły(520). Tymczasem iloczyn skalarny k-kowektorów jest dany formułą (481):

(α|β) = 1k!αi1,...,ikg

i1j1 · · · gikjkβj1,...,jk . (527)

Ponieważ równość (525) ma zachodzić dla każdej tablicy βj1,...,jl, więc otrzymujemy stądtezę (526).

Twierdzenie 2: W reprezentacji prostej składowe formy ∗α są dane wzorem:

(∗α)m1,...,ml =1k!sgn det g√| det g|

αi1,...,ikei1,...,ik,j1,...,jlgj1m1 · · · gjlml . (528)

Aby udowodnić to Twierdzenie wykażemy wpierw następujący fakt.Lemat:

ǫi1,...,in gi1j1 · · · ginjn = 1

det g· ej1,...,jn . (529)

Dowód Lematu: Zauważmy, że wyrażenie po lewej stronie równości jest całkowicieantysymetryczne we wskaźnikach j1, . . . , jn. Rzeczywiście: jeśli zamienić miejscami dwa znich, np. jr z js, to możemy również „przechrzcić” ir na is i odwrotnie. Wtedy jedynymefektem tej zmiany będzie zamiana miejsca wskaźników w ǫi1,...,in, co skutkuje zmianąznaku. Wobec tego wyrażenie to jest różne od zera jedynie wtedy gdy ciąg (j1, . . . , jn) jestpermutacją ciągu (1, . . . , n) i zachodzi

ǫi1,...,in gi1σ1 · · · ginσn = (−1)|σ|ǫi1,...,in gi11 · · · ginn = (−1)|σ| det

(g−1

).

Stosując formułę (424) otrzymujemy stąd wzór (529) czyli tezę Lematu.

Dowód Twierdzenia 2: Kojarząc tezę (526) ze wzorem (423), pozwalającym wrócićz reprezentacji dualnej do prostej, otrzymamy następujący wzór na gwiazdkę Hodge’a wreprezentacji prostej:

(∗α)m1,...,ml =(√| det g| αi1,...,ikgi1j1 · · · gikjk

) 1k!ǫj1,...,jk,m1,...,ml

=1k!

√| det g| αi1,...,ik

(gi1j1 · · · gikjkǫj1,...,jk,n1,...,nl · gn1s1 · · · gnlsl

)gs1m1 · · · gslml

W ostatniej linijce dopisaliśmy po prostu l macierzy jednostkowych w postaci gn1s1gs1m1 =δn1m1 i tak dalej. Po zastosowaniu Lematu wyrażenie w nawiasie zastępujemy przez prawąstronę wzoru (529), skąd natychmiast wynika teza.

Twierdzenie 3: Zachodzi tożsamość: ∗ (∗α) = sgn (det g) (−1)k·l · α dla każdego k-kowektora α, gdzie l = (dimM)− k. Innymi słowy kwadrat gwiazdki Hodge’a jest propor-cjonalny do odwzorowania tożsamościowego:

∗∗ = sgn (det g) (−1)k·l · id . (530)

188

Page 195: Rozn. Geom_ - Jerzy Kijowski

Dowód: Oznaczmy

∗ (∗α) = 1l!Bj1,...,jl ·

(∂

∂xj1∧ · · · ∧ ∂

∂xjl

) (dx1 ∧ · · · ∧ dxn

),

Kombinując tezy: Twierdzenia 2, czyli (528), oraz Twierdzenia 1, czyli (526), widzimy,iż opuszczone w Twierdzeniu 2 wskaźniki tablicy ei1,...,in wracają teraz do swojej górnejpozycji. Otrzymujemy zatem następującą postać na składowe dualne formy ∗ ∗ α:

Bj1,...,jl =1k!sgn(det g) · αi1,...,ikei1,...,ik,j1,...,jl

= sgn (det g) · 1k!(−1)k·lej1,...,jl,i1,...,ikαi1,...,ik . (531)

Porównując ten wynik z formułą (422) na składowe Aj1,...,jl widzimy, że są one równe skła-dowym Bj1,...,jl z dokładnością do czynnika sgn (det g) · (−1)k·l, a zatem zachodzi formuła(530), czyli teza Twierdzenia 3.

Uwaga : Jeśli wymiar n przestrzeni M jest nieparzysty, to (−1)k·l = +1 dla dowolnegok, bo albo k jest parzyste albo l = n−k jest parzyste. A zatem np. w geometrii trójwymia-rowej czynnik ten można zawsze pomijać. Natomiast gdy wymiar n jest parzysty, wtedy ki l mają tę samą parzystość. Zatem czynnik ten zmienia znak „w szachownicę”: jest równy„+1” dla k parzystych oraz „−1” dla k nieparzystych.Ćwiczenie 1: Dla k = 0 oraz „zero-kowektora” a, b ∈ R =

0∧T ∗xM mamy:

b ∧ (∗a) = b · (∗a) = b · a · ω,

zatem∗a = a · ω ,

jak we wzorze (522).Ćwiczenie 2: Dla k = n = dimM oraz n-kowektora α = a · ω, mamy:

∗α = ∗ ∗ a = sgn (det g) · a .

Zachęcamy czytelnika do uzyskania tego samego wyniku ze wzoru (526).Ćwiczenie 3: Ponieważ dxj = δjndx

n, zatem formuła (526) implikuje, iż w układziewspółrzędnych zgodnym z orientacją mamy:

∗dxj = 11!

√det g · δjngni

∂xidx1 ∧ · · · ∧ dxn = gji ∂

∂xiω . (532)

Jeśli E = Eidxi jest jedno-formą różniczkową, to

∗E = E = E j ∂∂xj

dx1 ∧ · · · ∧ dxn ,

gdzie, zgodnie z wyprowadzoną poprzednio uniwersalną formułą (526), E j = √det g gjiEi.Zastosowałem tutaj często używane (szczególnie przez fizyków teoretycznych zajmujących

189

Page 196: Rozn. Geom_ - Jerzy Kijowski

się elektrodynamiką) oznaczenie, polegające na zastosowaniu tej samej litery alfabetu(jedno-forma E oraz odpowiadająca jej (n − 1)-forma E) dla obiektów powiązanych zesobą operatorem Hodge’a.Jeśli teraz E = X, to znaczy Xj = gjiEi, to powyższy wzór można przepisać jeszcze

inaczej:X ω = ∗E = ∗X . (533)

Ćwiczenie 4:W płaskiej przestrzeni euklidesowej powyższe wzory znacznie się uprasz-czają jeśli używamy współrzędnych kartezjańskich, tzn. takich, w których tensor metrycznyjest macierzą jednostkową: gij = δij. Formuła (532) daje wtedy (zob. Rozdział 5.11):

∗dxj = (−1)j−1 · dx1 ∧ · · ·∧j

· · · ∧ dxn . (534)

W szczególności dla wymiaru n = 3 mamy wzory cykliczne: ∗dx1 = dx2∧dx3, ∗dx2 = dx3∧dx1, oraz ∗dx3 = dx1 ∧ dx2. Mamy również tożsamość ∗∗ = id, co daje: ∗dx2 ∧ dx3 = dx1itd.Łatwo sprawdzić, że dla dowolnego ciągu i1 < i2 < · · · < ik, gdzie k ¬ n = dimM

zachodzi:

∗(dxi1 ∧ · · · ∧ dxik

)=1l!ǫi1,...ik,j1,...,jl · dxj1 ∧ · · · ∧ dxjl

= (−1)S · dx1 ∧ · · ·∧i1

· · ·∧i2

· · ·∧ik

· · · ∧ dxn , (535)

gdzie

S =k∑

j=1

ij −k(k − 1)2

,

bo tyle właśnie trzeba było inwersji, aby czynniki dxis „wyłuskać” z formy dx1 ∧ · · · ∧ dxni ustawić je na początku.Ćwiczenie 5:Wprzestrzeni pseudo-euklidesowej o wymiarze 4 i o tensorze metrycznym

ηµν danym wzorem (454), mamy det η = −1. Forma objętości wynosi:

ω = dx0 ∧ dx1 ∧ dx2 ∧ dx3 .

Przestrzeń 2-kowektorów jest 6-wymiarowa. Bazę stanowią trzy elementy dx0 ∧ dxk oraztrzy elementy czysto przestrzenne dxk ∧ dxl, gdzie k, l = 1, 2, 3. Zgodnie z (480), elementyte są wzajemnie ortogonalne. Natomiast ich kwadraty skalarne są równe:

(dx0 ∧ dxk

∣∣∣dx0 ∧ dxk)= −1 ,

(dxk ∧ dxl

∣∣∣dxk ∧ dxl)= +1 .

Definicja (525) daje zatem dla β = (dx0 ∧ dx1):(dx0 ∧ dx1

)∧ ∗

(dx0 ∧ dx1

)= − dx0 ∧ dx1 ∧ dx2 ∧ dx3 ,

190

Page 197: Rozn. Geom_ - Jerzy Kijowski

a zero dla wszystkich innych β z tej bazy. Wobec tego ∗ (dx0 ∧ dx1) = −dx2 ∧ dx3. Wpodobny sposób otrzymujemy pełen opis dualizmu Hodge’a:

∗(dx0 ∧ dx1

)= −dx2 ∧ dx3 ,

∗(dx0 ∧ dx2

)= −dx3 ∧ dx1 ,

∗(dx0 ∧ dx3

)= −dx1 ∧ dx2 ,

∗(dx1 ∧ dx2

)= dx0 ∧ dx3 ,

∗(dx2 ∧ dx3

)= dx0 ∧ dx1 ,

∗(dx3 ∧ dx1

)= dx0 ∧ dx2 .

Wzory te można zapisać w następujący sposób: ∗(dx0 ∧ dxk

)= −1

2ǫklmdxl ∧ dxm, oraz

∗(dxk ∧ dxl

)= ǫklmdx0 ∧ dxm, gdzie obowiązuje jedynie „przestrzenna” konwencja suma-

cyjna. Widać, że zachodzi: ∗∗ = −1.Jeśli zatem pole elektromagnetyczne (patrz wzór (435)) wynosi f = −dt ∧ E + B, to

∗f = E + dt ∧ B , (536)

gdzie zastosowaliśmy notację z Ćwiczenia 3: dwu-forma E jest równa trójwymiarowej„gwiazdce” (na powierzchni t = const.) z jedno-formy E zaś jedno-forma B jest równatrójwymiarowej „gwiazdce” z dwu-formy B.Pole elektromagnetyczne w próżni ma tę własność, że H = B oraz E = D. Porównując

z (437) widzimy, że zachodzi:

D + dt ∧H = F = ∗f . (537)

W aktywnych ośrodkach ciągłych relacje między tymi dwoma zestawami pól mogą byćbardzo różne. Stosunkowo proste uogólnienie polega na dopuszczeniu różnej od jednościstałej „przenikalności elektrycznej”:

D = ε · E

oraz „przenikalności magnetycznej”

B = µ ·H .

Obecnie wytwarza się materiały o zadziwiających własnościach, dla których te związkimogą być dużo bardziej złożone, w szczególności nawet nieliniowe. Przykładem mogą byćtzw. metamateriały stosowane do budowy obiektów niewidzialnych dla radaru. W wieluprzypadkach związki między f oraz F można opisać matematycznie w ten sposób, że zacho-dzi wzór (537), jednak względem zmodyfikowanej gwiazdki, danej przez „zmodyfikowanągeometrię” hµν . Wewnątrz materiału geometria ta może znacznie różnić się od geometriiczasoprzestrznej, opisanej „prawdziwym” tensorem metrycznym gµν .

191

Page 198: Rozn. Geom_ - Jerzy Kijowski

6.11 Gradient, dywergencja, Laplasjan

Gradient funkcji, to pole wektorowe odpowiadające jej różniczce:

gradf := (df)♯ , (538)

to znaczy:grad := ♯ d , (539)

a na współrzędnych:

gradf :=∂f

∂xigij

∂xj. (540)

Jeśli fc ⊂ M jest „poziomicą” funkcji f , tzn. zbiorem rozwiązań równania f(x) = c,to jak wiemy z Rozdziału 2.8 (wzór (66)), wektor v jest styczny do fc jeśli tylko różniczkafunkcji f zeruje się na nim, lub — równoważnie — gdy zachodzi:

〈df,v〉 =((df)♯

∣∣∣v)= (gradf |v) = 0 . (541)

Wniosek: Gradient jest prostopadły do poziomicy funkcji.Jeśli zatem wektory styczne do poziomicy wyznaczają kierunki, w których funkcja wcale

nie rośnie (ani nie maleje), to jej gradient wyznacza kierunek największego wzrostu. Wynikastąd, że „−gradf” jest kierunkiem najszybszego spadku wartości funkcji. Warto o tympamiętać zarówno podczas wspinaczki górskiej jak i w trakcie operacji giełdowych.

Dywergencja pola wektorowego X odpowiada różniczce zewnętrznej (n−1)-formy X ω.Ściślej: jest to funkcja, odpowiadająca tej różniczce, która jest n-formą:

∗divX = d(X ω) , (542)

lub, inaczej:(divX) · ω = d(X ω) (543)

Uwaga: W rozmaitości Riemanna mamy ∗∗ = id na funkcjach, zatem definicję powyż-szą można zapisać jako: divX = ∗d(X ω). Uwzględniając (533) można ten wzór przepisaćjako:

divX = ∗d ∗X . (544)

W przypadku rozmaitości pseuro-riemannowskiej, gdy det g < 0, we wzorze tym trzebajeszcze zmienić znak na przeciwny, patrz (530).Jak wiemy (zob. (429)), różniczka zewnętrzna w zapisie dualnym to zwykła, rachunkowa

„dywergencja”. Jeśli zatem X = Xj ∂∂xj, to otrzymujemy:

(divX) · ω =d

(√| det g|Xj ∂

∂xjdx1 ∧ · · · ∧ dxn

)

=

∂xj

(√| det g|Xj

)dx1 ∧ · · · ∧ dxn ,

192

Page 199: Rozn. Geom_ - Jerzy Kijowski

czyli

divX =1√| det g|

∂xj

(√| det g|Xj

). (545)

Laplasjan, to złożenie powyższych dwóch operacji:

∆f := div gradf = ∗d ∗ df . (546)

Wzory współrzędniowe (540) oraz (545) implikują formułę (485), której niezależność od wy-boru układu współrzędnych wykazaliśmy już w Rozdziale (6.7) bezpośrednim rachunkiem.Wobec powyższej definicji, która od początku jest niezależna od współrzędnych, tamtendowód jest już zbędny.Warto wspomnieć, że operator δ := ∗d∗ sam zasługuje na uwagę. Definicję (546) można

zapisać jako „∆ = δd”. Zauważmy, że dla dowolnej funkcji f zachodzi dδf ≡ 0, bowiem∗f jest już formą różniczkową maksymalnego rzędu w M , zatem jej różniczka jest tożsa-mościowo równa zeru. Można więc pozornie skomplikować ten zapis w następujący sposób:

∆ := (δd + dδ) . (547)

Jak się okazuje, taka komplikacja jest opłacalna, bowiem zdefiniowany w ten sposób opera-tor jest „właściwym” laplasjanem nie tylko dla funkcji (czyli zero-form, dla których drugiczłon i tak niczego nie wnosi) lecz także dla form różniczkowych dowolnego rzędu, z tym, żetrzeba wtedy uzupełnić definicję operatora „δ” działającego na dowolne formy różniczkoweo znak:

δ := (−1)n·k ∗ d ∗ , (548)

gdzie n · k jest odpowiednim czynnikiem kombinatorycznym, równym iloczynowi wymiaruprzestrzeni n oraz stopnia formy różniczkowej k.Ćwiczenie: W trójwymiarowej przestrzeni euklidesowej rozważmy 1-formę, która we

współrzędnych kartezjańskich ma postać:

α = f · dx1 .

Oznaczmy ∂jf = fj . Wtedy dα = −f2dx1 ∧ dx2 + f3dx3 ∧ dx1, oraz

∗dα = −f2dx3 + f3dx2 .

Zatem

d ∗ dα = −f12 dx1 ∧ dx3 − f22 dx2 ∧ dx3 + f13 dx1 ∧ dx2 + f33 dx3 ∧ dx2 ,

oraz, na mocy Ćwiczenia 3 z poprzedniego paragrafu, mamy

∗d ∗ dα = f12 dx2 − f22 dx1 + f13 dx3 − f33 dx1 .

193

Page 200: Rozn. Geom_ - Jerzy Kijowski

Tymczasem ∗α = f · dx2 ∧ dx3, oraz d ∗ α = f1 · dx1 ∧ dx2 ∧ dx3. Wobec tego ∗d ∗ α = f1oraz

d ∗ d ∗ α = f11dx1 + f21dx2 + f31dx3 .W końcu otrzymujemy:

(− ∗ d ∗ d + d ∗ d∗)α = (f11 + f22 + f33)dx1 = ∆α ,gdzie znaki „−” oraz „+” w pierwszym nawiasie są równe właśnie owym czynnikom kom-binatorycznym.Przykład: Równania Maxwella: (436) oraz (439), wraz z „równaniem konstytutyw-

nym” (537) implikują, iż w próżni zachodzi df = 0 = dF = d(∗f). Wobec tego:(∗d ∗ d + d ∗ d∗)f = 0 .

W przestrzeni pseudo-euklidesowej, parametryzowanej współrzędnymi „pseudo-kartezjań-skimi” (t, x, y, z), o tensorze metrycznym η danym wzorem (454), operator Laplace’a-Beltramiego jest po prostu operatorem falowym:

:=1√| det η|

∂i

(√| det η| ηij∂j

)= − ∂2

∂t2+

∂2

∂x2+

∂2

∂y2+

∂2

∂z2. (549)

Równanie f = 0 oznacza istnienie fal elektromagnetycznych.

6.12 Interpretacja fizyczna całek z form różniczkowych

Rozmaitość zerowymiarowa to punkt lub zbiór punktów. Wybór orientacji takiej roz-maitości polega na wyposażeniu każdego punktu w znak „+” lub „−”. Całka z 0-formy(czyli funkcji) f po takiej zorientowanej rozmaitości to suma wartości f w tych punktach,opatrzonych tymi znakami.

Rozmaitość jednowymiarowa γ to krzywa. Jej orientacja to „zwrot”, czyli informacjaw którą stronę „mamy się poruszać”. Brzeg ∂γ każdego spójnego kawałka krzywej to dwapunkty: koniec krzywej wzięty ze znakiem „plus”, oraz jej początek, wzięty ze znakiem„minus”. Jeśli krzywa jest zamknięta (początek i koniec są takie same), to punkty te„znoszą się” z powodu różnej orientacji i w rezultacie jej brzeg jest równy zeru. Pokażemy,że całka z jedno-formy α po γ jest równa pracy pola wektorowego α# po tej krzywej. Wtym celu bowiem wybierzemy dowolny parametr τ na krzywej zgodny z orientacją. Namocy definicji (467) oraz (473) mamy:

γα =

γ

⟨α,

∂τ

⟩dτ =

γ

(α#∣∣∣∂

∂τ

)dτ . (550)

a to jest właśnie praca pola na krzywej. Aby się o tym przekonać podzielimy wektor styczny∂∂τprzez jego długość. W ten sposób otrzymamy unormowany wektor styczny do krzywej:

t :=

∣∣∣∣∣

∣∣∣∣∣∂

∂τ

∣∣∣∣∣

∣∣∣∣∣

−1∂

∂τ. (551)

194

Page 201: Rozn. Geom_ - Jerzy Kijowski

Ale przecież długość tego wektora jest równa pierwiastkowi z (jednowymiarowego!) wy-znacznika macierzy tensora metrycznego na γ:

∣∣∣∣∣

∣∣∣∣∣∂

∂τ

∣∣∣∣∣

∣∣∣∣∣=

√√√√(∂

∂τ

∣∣∣∂

∂τ

). (552)

Oznacza to, że

ds :=

∣∣∣∣∣

∣∣∣∣∣∂

∂τ

∣∣∣∣∣

∣∣∣∣∣ dτ (553)

jest miarą 1-objętości na γ, czyli po prostu miarą długości. Mamy zatem∫

γα =

γ

(α#∣∣∣t)ds . (554)

Funkcja podcałkowa jest równa rzutowi pola α# na kierunek przesunięcia, zaś ds jestwłaśnie miarą owego „przesunięcia”. Oznaczając α# =: X możemy zapisać pracę pola Xjako całkę z odpowiadającej mu jedno-formy X:

γ(X|t)ds =

γX . (555)

Twierdzenie Stokes’a dla 0-form można przepisać w klasycznej postaci, wykorzystującpowyższą identyczność. Jeśli mianowicie γ ma początek w punkcie x a koniec w punkcie y,to możemy zamienić całkę z df na pracę z odpowiadającego jej pola wektorowego „gradf =(df)♯” i otrzymać równość:

γ(gradf |t)ds =

∂γf = f(y)− f(x) . (556)

W taki właśnie sposób stosuje się to Twierdzenie w mechanice: praca sił potencjalnych(czyli równych gradientowi jakiejś funkcji, zwanej potencjałem) w jakimś procesie nie zależyod samego procesu, lecz jest równa przyrostowi potencjału między jego końcami.

Hiper-powierzchnia D ⊂ M , czyli rozmaitość (n − 1)-wymiarowa w n-wymiarowej rie-mannowskiej rozmaitości zorientowanejM uzyska orientację, jeśli tylko z dwóch możliwychwektorów ortonormalnych do niej (prostopadłych i unormowanych do jedności) wybierze-my jeden konkretny. Oznaczmy ten wektor symbolem n. Pokażemy, że całka z (n−1)-formyróżniczkowej α = X ω po D jest równa strumieniowi pola wektorowego X przez tę po-wierzchnię, to znaczy całce: ∫

DX ω =

D(X|n) dσ , (557)

gdzie przez dσ oznaczyliśmy niezorientowaną miarę (m− 1)-objętości na D daną wzorem(514).

195

Page 202: Rozn. Geom_ - Jerzy Kijowski

Aby wykazać powyższą tożsamość parametryzujemy powierzchnię D przy pomocy (m−1) parametrów, które oznaczamy (τ 2, . . . , τm). Wiemy, że można dobrać również dodat-kowy parametr τ 1, stały na D, tak by otrzymać (zgodną z orientacją) mapę w całymm-wymiarowym otoczeniu powierzchni D. Z całego wyrażenia

X ω =√det g

n∑

i=1

(−1)i−1X i · dτ 1 ∧ · · ·

∧i

· · · ∧ dτn ,

do całki po powierzchni D = τ 1 = const. wejdzie jedynie człon nie zawierający dτ 1, toznaczy wyrażenie √

det g X1 dτ 2 ∧ · · · ∧ dτm . (558)

Oznaczmy przez g tensor metryczny na D. Jest to (m − 1)-wymiarowa macierz, którejelementy są równe elementom macierzy gij dla i oraz j przebiegających wartości od 2 dom. Z elementarnej algebry mamy wzór na element macierzowy macierzy odwrotnej:

g11 =det gdet g

.

Oznacza to, że wyrażenie podcałkowe (558) możemy przepisać do następującej postaci:

X1√g11

√det g dτ 2 ∧ · · · ∧ dτm = X1√

g11dσ . (559)

Pokażemy, że ułamek poprzedzający formę powierzchni dσ na D jest rzeczywiście równyrzutowi pola X na wektor normalny, skierowany w stronę wzrostu zmiennej τ 1. I rzeczy-wiście:

X1 =⟨dτ 1, X

⟩= ((dτ 1)#|X) .

Oczywiście wektor (dτ 1)# = grad(τ 1) jest ortogonalny do powierzchni D bowiem, jak wie-my, gradient jest prostopadły do poziomicy. Tymczasem

√g11 jest długością tego wektora,

bowiemg11 = (dτ 1|dτ 1) = ((dτ 1)#|(dτ 1)#) .

Ostatecznie więc otrzymujemy pod całką iloczyn skalarny wektora X z unormowanymwektorem stycznym, a jego zwrot jest skierowany w stronę, w którą parametr τ 1 rośnie:

(dτ 1)#√g11=(dτ 1)#∣∣∣∣∣∣(dτ 1)#

∣∣∣∣∣∣= n .

Zatem rzeczywiście, funkcja podcałkowa (559) jest rzutem pola X na kierunek normalnydo powierzchni, króry następnie należy całkować po D względem miary dσ generowanej naD przez metrykę.

Podrozmaitość maksymalnego wymiaru w V ⊂M to po prostu „kawałek” tej rozma-itości. Całka z funkcji skalarnej f względem miary objętości dV =

√det gdnx jest równa

całce z m-formy ∗f = f · ω: ∫

VfdV =

V∗f , (560)

196

Page 203: Rozn. Geom_ - Jerzy Kijowski

jeśli orientacja V jest zgodna z orientacją M . A jeśli jest przeciwna to, jak wiemy, trzebatu jeszcze dopisać znak „minus”.

Twierdzenie Stokes’a dla (n − 1)-form możemy zatem przepisać w klasycznej postaci,bowiem wykorzystując definicję (542) dywergencji pola, otrzymamy równość strumieniapola wektorowego przez brzeg obszaru D = ∂V oraz całki z dywergencji tego pola posamym obszarze: ∫

∂V(X|n) dσ =

VdivXdV. (561)

W tym zapisie Twierdzenie Stokes’a nazywa się Twierdzeniem Gaussa, które formułuje sięnastępująco: strumień pola wektorowego przez brzeg obszaru jest równy całce z dywergencjitego pola po całym obszarze.

Przykład 1: W elektrostatyce (a także elektrodynamice) od dawna było wiadomo, żestrumień pola indukcji elektrycznej D przez brzeg obszaru jest równy całkowitemu ładun-kowi elektrycznemu zawartemu w tym obszarze, czyli całce z gęstości ładunku ρ. Wynikastąd, że musi zachodzić prawo Gaussa: divD = ρ, które jest jednym z równań Maxwella.Podobne prawo zachodzi dla pola indukcji magnetycznej z tym, że żaden ładunek magne-tyczny nigdy nam się dotychczas nie objawił, więc przypuszczamy, że jest tożsamościoworówny zeru. Wynika stąd „prawo Gaussa dla pola magnetycznego”: divB = 0.

Przykład 2: Jednym z najważniejszych równań fizyki matematycznej, pojawiającymsię w bardzo wielu zastosowaniach, jest tak zwane równanie ciągłości:

ρ+ divj = 0 , (562)

gdzie ρ jest gęstością jakiejś substancji (np. właśnie ładunku elektrycznego, patrz (441),lub jakiejś cieczy) zaś pole wektorowe j jest gęstością prądu tejże substancji. Jeśli terazzdefiniować ilość substancji zawartej w obszarze V wzorem

QV :=∫

Vρ dV ,

to, na mocy równania ciągłości, jej pochodna czasowa ma następującą własność:

ddt

QV =∫

Vρ dV = −

Vdivj dV = −

∂V(j|n) dσ .

Strumień prądu j przez brzeg nazywa się „wypływem” substancji z V . Po zmianie znakumożna ją nazwać „wpływem”. Równanie ciągłości oznacza zatem, że substancja opisywanaobiektami (ρ, j) nie powstaje ani nie ginie: jeśli jej ilość w jakimś obszarze uległa zmianieto jedynie na skutek wpływu (czy wypływu) tej substancji z zewnątrz. W elektrodynami-ce równanie ciągłości nazywa się prawem zachowania ładunku. Jest to jedno z najlepiejpotwierdzonych praw przyrody.Lemat: Dywergencja pola wektorowego mierzy pochodną Liego formy objętości wzglę-

dem tego pola, a konkretnie:£Xω = (divX) · ω . (563)

197

Page 204: Rozn. Geom_ - Jerzy Kijowski

Dowód: Forma objętości ma maksymalny rząd, więc jej różniczka znika tożsamościowo:dω = 0. Zatem na mocy Twierdzenia (376) mamy: £Xω = d(X ω) = (divX) · ω

Przykład 3: Dla danego obszaru V wM dywergencja pola X mierzy względną zmianęobjętości obszaru podczas jego transportu wzdłuż tego pola. Warunek divX > 0 oznacza,że obszar rozszerza się podczas tego transportu, a warunek przeciwny — że się kurczy. Abyto wykazać oznaczmy symbolem Vt obszar przetransportowany polem X:

Vt := GXt (V ) ,

i obliczmy jego (zorientowaną!) objętość:

|Vt| =∫

GXt (V )ω =

V

(GXt

)∗ω .

Szybkość zmian tej objętości jest zatem równa na mocy wzoru (563) całce z dywergencjipola X:

ddt|Vt| =

V

ddt

(GXt

)∗ω =

V£Xω =

V(divX) · ω .

Gdy divX > 0 to obszar rozszerza się, a gdy divX < 0 – kurczy się.

6.13 Analiza wektorowa w przestrzeni trójwymiarowej. Iloczynwektorowy i rotacja

Wymiar przestrzeni równy trzy jest wyjątkowy, bowiem umożliwia wprowadzenie typowychdlań struktur, które nie istnieją w innym wymiarze. Są to: 1) iloczyn wektorowy oraz 2)rotacja pola wektorowego.

Iloczyn wektorowy jest wygodną reprezentacją iloczynu zewnętrznego. Jeśli α oraz β sąkowektorami, to ich iloczyn wektorowy „α× β” jest następującym kowektorem:

α× β := ∗ (α ∧ β) . (564)

Iloczyn wektorowy jest oczywiście antysymetryczny: α×β = −β×α, oraz prostopadły doobu czynników α i β:

(α|∗ (α ∧ β)) · ω = α ∧ ∗ ∗ (α ∧ β) = α ∧ α ∧ β = 0 .

Używając identyfikacji wektorów z kowektorami, można natychmiast zdefiniować iloczynwektorowy dla wektorów:

(u× v) := ∗(u ∧ v

), (565)

lub, równoważnie:

u× v :=(∗(u ∧ v

))♯. (566)

Lemat: Dla dowolnych trzech wektorów u,v,w zachodzi:

(u× v|w) = ω(u,v,w) . (567)

198

Page 205: Rozn. Geom_ - Jerzy Kijowski

Jest to tak zwany iloczyn mieszany, równy objętości (zorientowanej!) równoległościanurozpiętego przez te trzy wektory.Dowód:

(u× v|w) · ω =((u× v)

∣∣∣w)· ω =

(∗(u ∧ v

)∣∣∣w)· ω

= u ∧ v ∧w .

Wzór ten dowodzi, że lewa strona wzoru (567) jest całkowicie antysymetryczna względemtrzech wektorów, zatem jest proporcjonalna do lewej strony. Podstawiając po obu stro-nach wektory będące elementami bazy ortonormalnej, zgodnej z orientacją M widzimy, żewspółczynnik proporcjonalności jest równy 1.Opis współrzędniowy: Jeśli u = ui∂i, v = vj∂j , to

u ∧ v = uigikvjgjldxk ∧ dxl .

Na mocy Twierdzenia (528) mamy:

∗(u ∧ v

)=

1√det g

· uivjgikvjgjleklmgmndxn =√det g · uivjǫijmdxn ,

gdzie skorzystaliśmy z tożsamości (529) (w wersji z „dolnymi wskaźnikami”). Aby otrzymaćstąd wektor u× v należy jeszcze podnieść wskaźnik:

u× v =√det g · uivjǫijmgmk

∂xk. (568)

Można też zapisać ten wzór w postaci formuły na współrzędne wektora u× v:

(u× v)k =√det g · uivjǫijmgmk . (569)

Rotacja pola wektorowego wykorzystuje wyjątkowy wymiar równy trzy, bowiem je-dynie wtedy jedno-formy oraz (n − 1) = 2-formy dzieli tylko jeden stopień, który możnaprzekroczyć stosując różniczkę zewnętrzną. Ta obserwacja pozwala wprowadzić „operatorrotacji” następującym wzorem:

rotX =(∗dX

)♯. (570)

Tutaj X jest polem wektorowym naM , oraz dimM = 3. Operator ten jest zatem złożeniemczterech operacji:

rot = ♯ ∗ d , (571)

działających na X. Trzy spośród nich: ♯, ∗ oraz są czysto algebraiczne i nie zawierająróżniczkowania, zaś d jest operatorem różniczkowym pierwszego rzędu. Zatem i „rot” jestoperatorem różniczkowym pierwszego rzędu. (W książkach angielskojęzycznych zamiast„rot” pisze się „curl”). Ponieważ X jest jedno-formą, więc jej różniczka — dwu-formą.Aby zatem gwiazdka Hodge’a wyprodukowała z niej znów pole ko-wektorowe musiało byćwłaśnie n = 3.

199

Page 206: Rozn. Geom_ - Jerzy Kijowski

Stosując powyższe oznaczenie możemy zapisać Twierdzenie Stokes’a dla jedno-form wtradycyjnej, dziewiętnastowiecznej postaci. Jeśli bowiem S ⊂ M jest zorientowaną pod-rozmaitością dwuwymiarową, ∂S – jej brzegiem, zaś α = X — dowolną jedno-formąróżniczkową, to, dzięki formule (555), możemy to twierdzenie zapisać następująco:

Sdα =

SdX =

∂SX =

∂S(X|t)ds .

Z drugiej strony, działając na obie strony definicji (570) operatorem „” a następnie „∗”otrzymamy na mocy (533):

∗dα = (rotX) ⇐⇒ dα = ∗ ∗ dα = ∗(rotX) = (rotX) ω .

Skorzystaliśmy tutaj z faktu, że w trójwymiarowym przypadku euklidesowym mamy: ∗∗ =id (w przeciwnym razie trzeba byłoby postawić jeszcze znak „minus”, jak to wynika z(530)). Możemy teraz skorzystać z oznaczenia (557) dla (n−1)-wymiarowej całki z (n−1)-formy dα: ∫

Sdα =

S(rotX|n) dσ .

Ostatecznie więc zapis Twierdzenia Stokes’a wygląda w tych oznaczeniach następująco:∫

S(rotX|n) dσ =

∂S(X|t)ds . (572)

Twierdzenie Stokes’a w powyższej wersji pozwala sformułować poglądową interpretacjęhydrodynamiczną wektora rotacji. Otóż wyobraźmy sobie, że pole wektorowe X opisujepole prędkości wody w rzece. Aby zmierzyć rotację tego pola należy wyposażyć się w wia-traczek, który poglądowo można sobie wyobrażać jako długi pręt stanowiący oś wiatraczka,wokół którego obraca się kółko najeżone małymi, prostopadłymi doń łopatkami (zob. Ry-sunek 22). Obwód koła to nasza krzywa zamknięta ∂S. Ewentualny obrót wiatraczka jestnapędzany składową pola prostopadłą do łopatek, czyli styczną do krzywej ∂S. Zatemprawa strona równania (572) reprezentuje całkowitą składową pola X napędzającą obrót.Jest ona równa lewej stronie równania, czyli rzutowi rotacji pola na oś wiatraczka n. Azatem wiatraczek będzie się obracał tym szybciej, im bardziej jego oś ustawimy równolegledo wektora rotX. Można więc powiedzieć, że kierunek wektora rotacji leży na takiej osi,która maksymalizuje prędkość obrotu wiatraczka. Jego zwrot zależy od wyboru orienta-cji przestrzeni (np. dla orientacji prawoskrętnej dodatni obrót to obrót „w prawo”). No adługość wektora rotX jest proporcjonalna do prędkości obrotów wiatraczka. Współczynnikproporcjonalności zależy oczywiście od własności fizycznych całego układu, między innymio lepkości cieczy, co musimy uwzględnić przy wycechowaniu naszego aparatu. Jeśli umie-my to zrobić, to skonstruowaliśmy urządzenie do pomiaru wektora rotacji pola prędkościcieczy.

Sformułowanie Twierdzenia Stokes’a w szczególnym przypadku n = 3 oraz k = 1pozwoliło Maxwellowi odczytać jedno z równań rządzących dynamiką pola elektromagne-tycznego. Punktem wyjścia było odkryte wcześniej przez Faraday’a prawo indukcji ma-gnetycznej. Głosiło ono, iż siła elektromotoryczna w zamkniętym obwodzie elektrycznym

200

Page 207: Rozn. Geom_ - Jerzy Kijowski

Rysunek 22: Wirnik urządzenia do pomiaru rotacji pola prędkości cieczy.

∂S wywołana indukcją jest proporcjonalna do prędkości zmian strumienia magnetyczne-go obejmowanego przez ten przewodnik. Otóż siła elektromotoryczna to właśnie „praca”wykonywana na jednostkowym ładunku w trakcie przeniesienia go wzdłuż całego przewod-nika, a zatem prawa strona powyższego równania, gdy jako X bierzemy pole elektryczneE. Natomiast strumień z pola magnetycznego B przez powierzchnię S to całka

∫S (B|n) dσ,

a zatem szybkość jego zmian to∫S

(B∣∣∣n)dσ. Porównując prawo Faraday’a z tożsamością

(572), zachodzącą dla dowolnej powierzchni S i uwzględniając odpowiednie współczynnikiproporcjonalności (które w przyjętej tutaj konwencji są równe jedności) stwierdzamy, żezachodzi jedno z równań Maxwella:

−B = rotE .

W przestrzeni trójwymiarowej wszystkie trzy przypadki różniczkowania zewnętrznego mo-żemy zatem opisać w języku klasycznej analizy wektorowej. I tak: różniczkowanie 0-formopisuje gradient, dla 1-form jest to rotacja zaś dla 2-form — dywergencja. Identycznośćdd = 0 wraz ze wzorami (539), (571) oraz (544), implikuje następujące tożsamości:

rot grad = (♯ ∗ d ) (♯ d) = (♯ ∗) (dd) = 0 , (573)

div rot = (∗ d ∗ ) (♯ ∗ d ) = sgn(det g) ∗ (dd) = 0 . (574)

Lemat Poincare tłumaczy się zatem na następujące wnioski:1) Pole bezwirowe (tzn. takie, którego rotacja znika) jest lokalnie gradientem funkcji

tzn. ma lokalny potencjał skalarny.2) Pole bezźródłowe (tzn. takie, którego dywergencja znika) jest lokalnie rotacją pola

wektorowego, tzn. ma lokalny potencjał wektorowy.W trywialnych topologicznie przestrzeniach istnienie tych potencjałów jest również za-

pewnione globalnie.Prawo (574) znalazło niezwykle ważne zastosowanie w „odszyfrowaniu” przez Maxwella

praw rządzących dynamiką pola elektromagnetycznego. Rozważał on mianowicie prawo

201

Page 208: Rozn. Geom_ - Jerzy Kijowski

Ampere’a, mówiące iż wokół przewodnika z prądem powstaje wirowe pole magnetyczne.W takim sformułowaniu prawo to zapisuje się jako:

rotE = j .

Biorąc dywergencję z obu stron otrzymujemy:

div rotE = 0 = div j .

Gdyby miała to być uniwersalna prawda, to zachowanie ładunku elektrycznego byłoby „zamocne”, bowiem nie dopuszczałoby nawet jego przepływu z miejsca na miejsce. Spodzie-wając się raczej równania ciągłości (562) i pamiętając o prawie Gaussa: divD = ρ, Maxwellpoprawił prawo Ampere’a, zapisując je w następującej postaci:

rotE = j + D .

Biorąc dywergencję z obu stron i uwzględniając prawo Gaussa otrzymujemy teraz ocze-kiwane równanie ciągłości 0 = div j + ρ. Dodanie członu D po prawej stronie równaniaAmpere’a, mimo zupełnego braku jakichkolwiek przesłanek doświadczalnych (człon tenjest zbyt mały, by mógł być zaobserwowany w ówczesnych pracowniach) miał ogromneznaczenie teoretyczne, bowiem tak uzupełnione prawa Maxwella implikowały spełnienierównania falowego f = 0 (zob. (549)), a więc istnienie fal elektromagnetycznych. Faltych poszukiwano eksperymentalnie przez blisko 40 lat po napisaniu tych równań. A więckiedy odkryto te fale: czy wtedy, gdy Maxwell napisał swoje równania, czy wtedy gdy Herz,Marconi lub Popow zaobserwowali je doświadczalnie?

Analiza wektorowa w krzywoliniowych układach współrzędnych może być upra-wiana według wzorów uzyskanych powyżej. I tak, wyrażenie współrzędniowe na rotacjęwynika z następującej sekwencji operacji:

X = X i∂

∂τ i,

po opuszczeniu wskaźników:

X = (X igij)dτ j

po zróżniczkowaniu:

dX =∂

∂τk(X igij)dτk ∧ dτ j =

12[∂k(X igij)− ∂j(X igik)]dτk ∧ dτ j

Ostatecznie więc, zgodnie z (528), otrzymujemy:

(rotX)l =121√det g

ǫlkj [∂k(X igij)− ∂j(X igik)]

=1√det g

ǫlkj ∂k(X igij) .

202

Page 209: Rozn. Geom_ - Jerzy Kijowski

Gradient we współrzędnych sferycznych.

(gradf)i = gij∂jf (575)

(gradf)r = ∂rf (576)

(gradf)θ =1r2∂θf (577)

(gradf)ϕ =1

r2 sin2 θ∂ϕf (578)

gradf = (∂rf)∂

∂r+1r2

[(∂θf)

∂θ+1sin2 θ

(∂ϕf)∂

∂ϕ

](579)

Rotacja we współrzędnych sferycznych.Uniwersalna formuła:

(rotX)l =1√det g

ǫlkj ∂k(X igij)

implikuje we współrzędnych sfrycznych:

(rotX)r =1

r2 sin θǫrkj∂k(X igij) =

1r2 sin θ

(∂θ(X igiϕ)− ∂ϕ(X igiθ)

)

=1

r2 sin θ

(∂θ(Xϕr2 sin2 θ)− ∂ϕ(Xθr2)

)

=1sin θ

(∂θ(Xϕ sin2 θ)− ∂ϕ(Xθ)

),

(rotX)θ =1

r2 sin θ∂ϕX

r − sin θr2

∂r(Xϕr2) ,

(rotX)ϕ =1

r2 sin θ

(∂r(X igiθ)− ∂θ(X igir)

)

=1

r2 sin θ

(∂r(Xθr2)− ∂θ(Xr)

).

6.14 Pochodna Liego metryki. Pola Killinga

Aby obliczyć pochodną Liego tensora metrycznego, stosujemy uniwersalną formułę „kowa-riantną” (200).Niech F k(x, t) będzie rozwiązaniem układu dynamicznego

xk = Xk (580)

z warunkiem początkowym F k((xi), 0) = xk. Oznacza to, że obrazem GXt (x) punktu x owspółrzędnych (xi) jest punkt o współrzędnych (F k(x, t)). Równanie (580) implikuje, żezachodzi:

ddtF k(x, t)

∣∣∣∣∣t=0

= Xk(x) .

203

Page 210: Rozn. Geom_ - Jerzy Kijowski

Jeśli zatem tensor metryczny g ma w tym układzie współrzędnych składowe gij(x) to,zgodnie z równaniem (466) mamy:

((GXt

)∗g)ij(x, t) =

∂F k(x, t)∂xi

gkl(F (x, t))∂F l(x, t)∂xj

,

a w konsekwencji:

ddt

[((GXt

)∗g)ij(x, t)

]∣∣∣∣∣t=0

=∂Xk

∂xigkj(x) +Xm

∂xmgij(x) + gil(x)

∂X l

∂xj.

Wynik ten możemy w skrócie zapisać w następujący sposób:

(£Xg)ij = (∂iXk)gkj + (∂jXk)gki +Xk∂kgij . (581)

Spełnia on kryterium sensowności polegające na obserwacji, że „pochodna Liego względempola stałego, to zwykła pochodna w kierunku tego pola”. Rzeczywiście: jeśli w jakimśukładzie współrzędnych pochodne składowych pola (∂iXk)gkj znikają (pole „ jest stałe”)to po prawej stronie zostaje jedynie człon „Xk∂kg”.Ćwiczenie 1: Powyższa uwaga może posłużyć za inną metodę dowodu formuły (581).

Niech bowiem pole X = Xa ∂∂yama składowe Xa, które w układzie współrzędnych (ya) są

funkcjami stałymi. Wiemy, że w tym układzie współrzędnych zachodzi;

(£X g)ab = Xc∂cgab ,

gdzie przez gab oznaczyliśmy (może nieco zbyt ostrożnie!) składowe tensora metrycznego gw tym szczególnym układzie. Niech teraz (xi) będzie dowolnym układem współrzędnych.Składowe tego obiektu transformują się jak składowe formy kwadratowej, czyli tak jakskładowe metryki. Zatem w nowym układzie współrzędnych mamy:

(£Xg)ij =∂ya

∂xi(£X g)ab

∂yb

∂xj=∂ya

∂xi(Xc∂cgab)

∂yb

∂xj

= Xc∂c

(∂ya

∂xigab

∂yb

∂xj

)− gabXc∂c

(∂ya

∂xi∂yb

∂xj

)

= Xk∂kgij − Xcgab∂c(∂ya

∂xi∂yb

∂xj

), (582)

gdzie skorzystaliśmy z faktu, iż Xc∂c = Xk∂k, bowiem Xk = Xc ∂xk

∂yc, oraz z prawa trans-

formacyjnego (458) dla składowych metryki.Tymczasem symetria drugich pochodnych ∂a∂c = ∂c∂a implikuje tożsamość:

gkj∂i∂xk

∂yc= gkj

∂ya

∂xi∂a∂xk

∂yc= gkj

∂ya

∂xi∂c∂xk

∂ya= gkl

∂xl

∂yb∂yb

∂xj∂ya

∂xi∂c∂xk

∂ya

= −gkl∂xl

∂yb∂yb

∂xj∂xk

∂ya∂c∂ya

∂xi= −gab

∂yb

∂xj∂c∂ya

∂xi.

204

Page 211: Rozn. Geom_ - Jerzy Kijowski

Przejście od pierwszej do drugiej linijki wynika z „całkowania przez części”, bowiem ∂xk

∂ya∂ya

∂xi=

δki jest macierzą jednostkową i jej pochodne znikają. Zatem:

gkj∂i∂xk

∂yc+ gki∂j

∂xk

∂yc= −gkl

∂xl

∂yb∂xk

∂ya∂c

(∂ya

∂xi∂yb

∂xj

)= −gab∂c

(∂ya

∂xi∂yb

∂xj

)

Podstawiając ten wynik do (582) i uwzględniając fakt, iż funkcje Xc są stałe, więc możnaje wnosić pod znak różniczkowania, otrzymujemy, zgodnie z (581):

(£Xg)ij = Xk∂kgij + Xc(gkj∂i

∂xk

∂yc+ gki∂j

∂xk

∂yc

)

= Xk∂kgij + gkj∂iXk + gki∂jXk .

Ćwiczenie 2: Pouczające będzie uzyskanie tego samego wyniku jeszcze innym rozu-mowaniem. Dla dowolnych trzech pól wektorowych X, Y, Z na M zachodzi:

£Xg(Y, Z) = (£Xg)(Y, Z) + g(£XY, Z) + g(Y,£XZ) .

Jest to prawo Leibniza dla różniczkowania (względem polaX) „iloczynu” trzech pól: g, Y, Z.W języku współrzędnościowym tożsamość ta wygląda następująco:

£Xg(Y, Z) = (£Xg)ijY iZj + gij(Xk∂kY i − Y k∂kX i)Zj + gijY i(Xk∂kZj − Zk∂kXj)= (£Xg)ijY iZj + gij(ZjXk∂kY i + Y iXk∂kZj)

−gkj(Y i∂iXk)Zj − gikY i(Zj∂jXk) . (583)

Uwzględniliśmy tu wyrażenie (146) na współrzędne komutatora [X, Y ] = £XY . Ale

g(Y, Z) = gijY iZj ,

jest funkcją (polem skalarnym), zatem jej pochodna Liego jest równa zwykłej pochodnej:

£Xg(Y, Z) = Xk∂k(gijY iZj) = (Xk∂kgij)Y iZj + gij(Y iXk∂kZj + ZjXk∂kY i) . (584)

Odejmując stronami (584) od (583) otrzymujemy tożsamość:((£Xg)ij − gkj∂iXk − gik∂jXk −Xk∂kgij

)Y iZj = 0 ,

która musi zachodzić dla dowolnych pól Y, Z. Wynika stąd, że wyrażenie w nawiasie znikatożsamościowo, co dowodzi prawdziwości formuły (581).Definicja: Równanie

£Xg = 0 , (585)

nazywa się równaniem Killinga. Pole wektorowe spełniające ten warunek nazywa się polemsymetrii metryki g lub inaczej polem Killinga.

205

Page 212: Rozn. Geom_ - Jerzy Kijowski

Twierdzenie: Grupa transformacji GXt indukowana przez pole Killinga X zachowujemetrykę: (

GXt)∗g = g . (586)

Dowód: Oznaczmy g(t) :=(GXt

)∗g. Oczywiście g(0) = g. Ale

ddt

g(t) = limǫ→0

(GXt+ǫ

)∗g −

(GXt

)∗g

ǫ= limǫ→0

(GXt

)∗ (GXǫ)∗g −

(GXt

)∗g

ǫ

=(GXt

)∗limǫ→0

(GXǫ

)∗g − gǫ

=

(GXt

)∗(£Xg) = 0 .

Stąd teza.

Ćwiczenie 3: Warto sprawdzić bezpośrednim rachunkiem oczywisty skądinąd fakt, żepola wektorowe X, Y , Z, zdefiniowane w (187) jako generatory grupy obrotów, są stycznedo sfery S2(R) i spełniają na niej równanie Killinga (585) dla metryki (461).Ćwiczenie 4: Formułę (581) można przepisać w następujący sposób:

(£Xg)ij = (∂iXk)gkj + (∂jXk)gki +Xk∂kgij= ∂i(Xkgkj)−Xk∂igkj + ∂j(Xkgki)−Xk∂jgki +Xk∂kgij= ∂iXj + ∂jXi −Xk (∂igjk + ∂jgik − ∂kgij) . (587)

Z pewnych powodów, które staną się jasne w następnym Rozdziale, to ta właśnie wersjalewej strony równania Killinga (585) jest najlepiej znana w literaturze.

6.15 Tensory

Rozważania niniejszego rozdziału nie zawierają żadnej nowej treści matematycznej, sta-nowią jedynie poręczny „słownik”, umożliwiający lekturę podręczników i prac pisanychw języku tzw. analizy tensorowej. Cała sprawa jest dość prosta. Zilustrujemy ją kilkomaprzykładami, które dają dobre wyjaśnienie, bez wchodzenia zbyt głęboko w całą złożoną„zoologię” rozmaitych obiektów, które można sobie w tym kontekście wymyślać.Obiekty geometryczne, które badaliśmy dotychczas: wektory, kowektory, formy róż-

niczkowe, czy tensory metryczne, mają pewną cechę wspólną: mogą być traktowane jakofunkcje wieloliniowe na (wielu egzemplarzach) przestrzeni stycznej TxM lub ko-stycznejT ∗xM . I tak: multi-kowektor, a konkretnie k-kowektor, to funkcja k-liniowa na wektorach,spełniająca dodatkowo warunek antysymetrii (317). Z kolei tensor metryczny, to funkcjadwu-liniowa na wektorach, spełniająca dodatkowo warunek symetrii (455). Sam kowektorto po prostu funkcja liniowa na wektorach. No a wektor może być identyfikowany jakofunkcja liniowa na kowektorach. Okazuje się, że można ten punkt widzenia rozszerzyć irozważać ogólne obiekty tego typu, zwane tensorami.Definicja: Tensorem k-kontrawariantnym oraz l-kowariantnym zaczepionym w punk-

cie x ∈ M , nazywamy funkcję wieloliniową, a konkretnie (k + l)-liniową, określoną na

206

Page 213: Rozn. Geom_ - Jerzy Kijowski

k egzemplarzach przestrzeni ko-stycznej T ∗xM oraz l egzemplarzach przestrzeni stycznej

TxM :

(T ∗xM)k × (TxM)l ∋ (α1, . . . , αk,v1, . . . ,vl)→ T (α1, . . . , αk,v1, . . . ,vl) ∈ R . (588)

Liczba (skalar) jest tensorem 0-kontrawariantnym i 0-kowariantnym.Przypominając nasz obrazek „czarnej skrzynki” możemy powiedzieć, że tensor T jest

właśnie taką czarną skrzynką o (k + l) „slotach”, z których pierwsze k przyjmują kowek-tory, a pozostałe przyjmują wektory. Efektem działania skrzynki jest przetworzenie całegotego wkładu („inputu”) w liczbę. I najważniejsze: wynik ten zależy liniowo od każdego zwkładów.Używając tej terminologii możemy powiedzieć, że l-kowektor to tensor l-kowariantny,

który w dodatku jest całkowicie symetryczny. Tensor metryczny, to tensor dwu-kowariantny,który w dodatku jest symetryczny. Wektor to tensor 1-kontrawariantny zaś kowektor totensor 1-kowariantny. Aby uprościć terminologię wprowadzono również określenie: tensoro walencji (k, l).Z liniowości wynika, że wystarczy znać wartość tensora na elementach jakiejś bazy w

T ∗xM oraz TxM , a będziemy znać jego wartość na wszystkich elementach tych przestrzeni.Wynika stąd, że gdy (xi) jest układem współrzędnych w M , to cała informacja o tensorzejest zawarta w jego składowych, zdefiniowanych podobnie jak w (277) dla wektora, w(278) dla kowektora, w (335) dla multi-kowektora oraz w (456) dla tensora metrycznego,to znaczy:

T i1,...,ikj1,...,jl := T

(dxi1 , . . . , dxik ,

∂xj1, . . . ,

∂xjl

). (589)

Tensor o walencji (k, l), ma zatem składowe o k górnych oraz l dolnych wskaźnikach.Z definicji tej wynikają natychmiast „wzory transformacyjne” dla składowych tensora,

odpowiadające zmianie układu współrzędnych. Dla składowych wektora był to wzór (90),dla kowektora – wzór (285), dla formy różniczkowej – wzór (342), zaś dla tensora metrycz-nego – wzór (458). Dla ogólnego tensora prawo transformacyjne wynika z transformacjiwektorów bazy:

∂ya=∂xi

∂ya∂

∂xi, dya =

∂ya

∂xidxi , (590)

co implikuje następujący wzór:

T ...,ar,... ...,bs,... = T...,in,...

...,jm,... ·∂yar

∂xin· ∂x

jm

∂ybs· · · (591)

A zatem każdy górny (kontrawariantny) wskaźnik transformuje się jak wskaźnik wektora,a każdy dolny (kowariantny) wskaźnik transformuje się jak wskaźnik kowektora.W starych podręcznikach geometrii różniczkowej pojęcie tensora było obiektem central-

nym opisu struktury rozmaitości różniczkowalnych, zaś powyższy wzór transformacyjny był„sercem” całej teorii. W naszym wykładzie ogólne pojęcie tensora nie odgrywa takiej roli:w różnych zagadnieniach pojawiają się tensory o szczególnych własnościach czy symetriach.

207

Page 214: Rozn. Geom_ - Jerzy Kijowski

A przede wszystkim: ważne obiekty geometryczne, jak powiązanie czy „dżet” (miot) od-wzorowania nie są wcale wektorami. Warto jednak znać to pojęcie by umieć czytać pracepisane przez autorów posługujących się nim.Przykład 1: Tensor 1-kontrawariantny i 1-kowariantny może być uważany za operator

liniowy w przestrzeni stycznej. Rzeczywiście, po zapełnieniu drugiego „slotu” wektorem,wielkość T (·,v) jest funkcją liniową na kowektorach, czyli wektorem. Mamy zatem

TxM ∋ v→ T (·,v) ∈ TxM .

Widać, że gdy v = vj ∂∂xjto wektor w = T (·,v) ma współrzędne:

wi = T ijvj .

Zbiór tensorów odpowiedniego typu jest oczywiście przestrzenią wektorową: tensorymożna dodawać i mnożyć przez liczby. Można rozważać tensory o odpowiedniej symetrii .Można też rozkładać bardziej ogólne tensory na części o odpowiedniej symetrii. Przykłademmoże być rozkład ogólnego tensora o walencji 2 na część symetryczną i antysymetryczną:

Tij = T(ij) + T[ij] ,

gdzie część symetryczna jest dana wzorem

T(ij) :=12(Tij + Tji) ,

zaś antysymetryczna jako:

T[ij] =12(Tij − Tji) .

W przypadku tensora T o wyższej walencji częścią całkowicie symetryczną oznacza sięśrednią po wszystkich przestawieniach wskaźników:

symTi1,...,ik = T(i1,...,ik) =∑

σ∈SkT(σ(1),...,σ(k)) , (592)

zaś częścią całkowicie antysymetryczną — średnią po przestawieniach wskaźników z uwzględ-nieniem znaku permutacji:

asymTi1,...,ik = T[i1,...,ik] =∑

σ∈Sk(−1)|σ|T(σ(1),...,σ(k)) . (593)

Ważna jest również następująca operacja na tensorach, zwana „zwężeniem”, „kontr-akcją”, czy też po prostu „śladem”. Zilustujemy ją na przywołanym powyżej przykładzietensora 1-kontrawariantnego i 1-kowariantnegoDefinicja: Śladem tensora T jest liczba

trT = T ii . (594)

208

Page 215: Rozn. Geom_ - Jerzy Kijowski

Lemat: Powyższa definicja jest poprawna, tzn. nie zależy od wyboru układu współ-rzędnych.Dowód: Jeśli (ya) jest innym układem współrzędnych, to

T aa = Tij

∂ya

∂xi∂xj

∂ya= T ijδ

ji = T

ii .

Możemy zawsze „zwęzić” jakiś górny wskaźnik z jakimś dolnym dla dowolnego tensoraT . Musimy w tym celu określić który z górnych wskaźników zostanie zwężony z którym zdolnych wskaźników. Po takim zwężeniu otrzymujemy z tensora o walencji (k, l) tensor owalencji (k − 1, l − 1). Symbolicznie możemy napisać:

T ...,... ...,... = T...,i,...

...,i,... .

Trzeba powiedzieć, że operację powyższą wyjątkowo trudno zapisać w języku abstrakcyj-nym, natomiast jej zapis współrzędniowy jest bardzo prosty. Fakt ten bardzo ciąży np. naOgólnej Teorii Względności, gdzie zapis abstrakcyjny tensora Ricci’ego czy tensora Einste-ina, uzyskanych z tensora Riemanna poprzez odpowiednią kontrakcję, niezwykle komplikujewykład, podczas gdy rachunki współrzędniowe są stosunkowo proste.Ważną operacją jest iloczyn tensorowy T ⊗ S dwu tensorów: T oraz S. Polega on na

traktowaniu układu dwóch „czarnych skrzynek” jako jednej, zbiorczej, według następującejreguły:

(T ⊗ S)(α1, . . . , αk, β1, . . . , βm,v1, . . . ,vl,u1, . . . ,un)= T (α1, . . . , αk,v1, . . . ,vl) · S(β1, . . . , βm,u1, . . . ,un) . (595)

Widzimy, że iloczyn zewnętrzny multi-kowektorów, zdefiniowany w rozdziale 5.3 formułą(330) jest po prostu iloczynem tensorowym, poddanym następnie antysymetryzacji:

T ∧ S = asym(T ⊗ S) . (596)

Powyższa definicja iloczynu zewnętrznego nie musi być ograniczana do tensorów kowa-riantnych: można ją stosować również dla tensorów kontrawariantnych. Antycypowaliśmyją, używając iloczynu zewnętrznego wektorów, np. we wzorach (419) czy (421). Za każdymrazem podawaliśmy tam definicję konkretnej struktury. Wszystkie one były szczególnymiprzypadkami ogólnej definicji (596).Zwężać wskaźniki można nie tylko jednemu tensorowi, ale dwu różnym, a nawet kilku

tensorom, budując z nich najpierw iloczyn tensorowy. Zawsze muszą to być dwa różnewskaźniki: jeden kontra- i jeden kowariantny. Gdy rozmaitość jest wyposażona w strukturęmetryczną, możemy również „opuszczać” i „podnosić” wskaźniki tensorów. Czyniliśmytak w przypadku wektorów i kowektorów, ustanawiając w ten sposób izomorfizm międzyprzestrzeniami tensorowymi różnego a priori typu. Cała ta algebra jest stosunkowo prostai w każdym konkretnym przypadku, pojawiającym się w zastosowaniach, dość oczywista.

209

Page 216: Rozn. Geom_ - Jerzy Kijowski

Dla porządku warto jeszcze wspomnieć o tzw. „gęstościach tensorowych”. Są niminp. symbole Levi Civity ǫj1,...,jn czy e

j1,...,jn używane w rozdziale 5.11 do zapisu form różnicz-kowych w reprezentacji dualnej, a także same składowe Aj1,...,jl formy w takiej reprezentacji.Gęstość tensorowa to „czarna skrzynka”, która oprócz slotów wyszczególnionych w defini-cji (588) tensora, ma dodatkowy slot przeznaczony na włożenie tam „elementu objętości”,to znaczy wybranego równoległościanu rozpiętego na bazie przestrzeni stycznej TxM . Alewszystkie możliwe elementy objętości są proporcjonalne do elementu

v(xi) =

(∂

∂x1∧ · · · ∧ ∂

∂xn

).

Zatem w wybranym układzie współrzędnych (xi) współrzędne gęstości tensorowej T defi-niuje się jako:

T i1,...,ikj1,...,jl := T(dxi1 , . . . , dxik ,

∂xj1, . . . ,

∂xjl; v(xi)

). (597)

Po przejściu do innego układu współrzędnych (ya) element objętości mnoży się przez Ja-cobian transformacji współrzędnych:

(∂

∂y1∧ · · · ∧ ∂

∂yn

)= det

(∂x

∂y

)·(∂

∂x1∧ · · · ∧ ∂

∂xn

)(598)

Wynika stąd, że prawo transformacyjne składowych gęstości tensorowej różni się od (591)w ten sposób, że należy jeszcze uwzględnić mnożenie przez Jacobian transformacji współ-rzędnych:

T ...,ar ,......,bs,... = T...,in,...

...,jm,... ·∂yar

∂xin· ∂x

jm

∂ybs· · ·det

(∂x

∂y

). (599)

Wyróżnia się jeszcze gęstości „parzyste”, które nie reagują na orientację elementu obję-tości, to znaczy, że w powyższej formule transformacyjnej zamiast Jacobianu występujejego moduł:

∣∣∣det(∂x∂y

)∣∣∣. Nie warto omawiać tutaj całej tej „zwierzętarni”, bo w każdymkonkretnym przypadku sprawa jest prosta. Oto kilka przykładów:Przykład 2:Współczynnik „ρ” w formie różniczkowej maksymalnego rzędu (n-formie)

α = ρ · dx1 ∧ · · · ∧ dxn

nie jest zwykłym skalarem lecz „gęstością skalarną”, bowiem przy przejściu do układuwspółrzędnych (ya) mnoży się właśnie przez Jacobian

(∂x∂y

).

Przykład 3: Jeśli K jest tensorem 2-kowariantnym to√| detKij | jest parzystą gęsto-

ścią skalarną, bowiem:

detKab = det

(∂xi

∂yaKij

∂xj

∂yb

)= (detKij) · det

(∂x

∂y

)2,

210

Page 217: Rozn. Geom_ - Jerzy Kijowski

skąd natychmiast wynika teza:√| detKab| =

√| detKij | ·

∣∣∣∣∣det(∂x

∂y

)∣∣∣∣∣ .

W szczególności z tensora metrycznego g można utworzyć gęstość skalarną√| det g|, poja-

wiającą się jako współczynnik w formie objętości (520).Przykład 4: Współczynniki Aj1,...,jk dowolnej l-formy różniczkowej w reprezentacji

dualnej (przy czym k+ l = dimM) są składowymi całkowicie antysymetrycznej, kontrawa-riantnej gęstości tensorowej. Twierdzenie 1 z rozdziału 6.10 (tzn. formuła (526)) oznacza, iżgwiazdka Hodge’a polega na podniesieniu wskaźników formy, co skutkuje przekształceniemtensora kowariantnego na kontrawariantny, oraz na pomnożeniu przez gęstość skalarną√| det g|, co skutkuje przekształceniem tensora w gęstość tensorową.Przykład 5: Symbol ej1,...,jn, używany w rozdziale 5.11 do zapisu form różniczkowych

w reprezentacji dualnej zachowuje się jak kontrawariantna gęstość tensorowa, bowiem wiel-kość

ej1,...,jn · ∂ya1

∂xj1· · · ∂y

an

∂xjn

jest całkowicie antysymetryczna we wskaźnikach (a1, . . . , an), zatem musi być proporcjo-nalna do ea1,...,an. Współczynnik proporcjonalności otrzymujemy z następującej obserwacji:

ej1,...,jn · ∂y1

∂xj1· · · ∂y

n

∂xjn= det

(∂y

∂x

)= det

(∂y

∂x

)· e1,...,n .

Wynika stąd, że po przejściu do nowego układu współrzędnych (ya) mamy:

ej1,...,jn · ∂ya1

∂xj1· · · ∂y

an

∂xjn· det

(∂x

∂y

)= ea1,...,an ,

a zatem spełnione jest prawo transformacyjne (599) dla składowych gęstości tensorowej.Powyższa obserwacja implikuje, że

1√det g

· ej1,...,jn

jest tensorem kontrawariantnym.Przykład 6: Podobnie można pokazać, że „

√det g · ǫj1,...,jn” jest tensorem kowariant-

nym, ale tylko dla transformacji zachowujących orientację. Oznacza to że sam „epsilon”jest „gęstością tensorową o wadze równej −1”, to znaczy, że w jej prawie transformacyjnymzamiast czynnika „det

(∂y∂x

)”, jak w (599), występuje tenże Jacobian w potędze równej −1.

Przykład 7: Podsumujmy dwa ostatnie przykłady. 1) Mnożąc gęstość „o wadze −1”,jaką jest ǫj1,...,jn, przez

√det g otrzymujemy tensor kowariantny. 2) Podnosząc jego wskaź-

niki otrzymujemy tensor kontrawariantny. 3) Mnożąc go znów przez√det g otrzymujemy

gęstość tensorową, tego samego typu co ej1,...,jn. Łatwo widać, że zachodzi:(√det g

)2· ǫj1,...,jn · gj1i1 · · · gjni

n

= sgn(det g) · ei1,...,in . (600)

211

Page 218: Rozn. Geom_ - Jerzy Kijowski

A zatem w przestrzeni Riemanna, gdy det g > 0, jeden z tych obiektów jest po prostu innąreprezentacją drugiego. Można więc było oznaczać je tą samą literą. Przyjęliśmy jednakinną, bowiem w przestrzeni pseudo-riemannowskiej, gdy det g < 0, obiekty te różnią sięznakiem.

6.16 Przykład: funkcje sferyczne

Bardzo ważnym zastosowaniem algebry tensorowej jest konstrukcja tzw. funkcji sferycz-nych, które odgrywają ogromną rolę w licznych zastosowaniach fizycznych i inżynierskich.Funkcje te definiuje się jako funkcje własne dwuwymiarowego laplasjanu (499) na sferzeS2. W trójwymiarowej, wektorowej przestrzeni Euklidesowej V , parametryzowanej współ-rzędnymi kartezjańskimi (xi) (tzn. takimi, że tensor metryczny jest macierzą jednostkową:gij = δij), rozważamy tensory kowariantne, całkowicie symetryczne, których ślad znika.Tensor taki jest reprezentowany tablicą współczynników Qi1,...,iℓ która jest całkowicie sy-metryczna:

Qi1,...,ir,...,is,...iℓ = Qi1,...,is,...,ir,...iℓ (601)

oraz bezśladowa:Qi i,i3,...,...iℓ = 0 . (602)

Zażądaliśmy tu znikania śladu otrzymanego przez zwężenie pierwszych dwóch wskaźników,ale symetria tensora (601) implikuje równoważność tego warunku z warunkiem znikaniawszystkich innych możliwych śladów.Rozważamy teraz funkcję na V daną jako jednorodny wielomian stopnia ℓ współrzęd-

nych (xi), którego współczynniki są równe składowym Qi1,...,iℓ naszego tensora:

FQ(x) := Qi1,...,iℓ · xi1 · · ·xiℓ .

Bezśladowość (602) tensora Q implikuje znikanie laplasjanu (484) (tzn. śladu macierzydrugich pochodnych) tej funkcji: ∆FQ = 0, bowiem zachodzi:

∂iFQ(x) = k ·Qi,i2,...,iℓ · xi2 · · ·xiℓ ,∂j∂iFQ(x) = k(k − 1) ·Qi,j,i3,...,iℓ · xi3 · · ·xiℓ ,∆FQ(x) = k(k − 1) ·Qi i,i3,...,...iℓ · x

i3 · · ·xiℓ = 0 .

Z drugiej jednak strony możemy ten laplasjan obliczyć w zmiennych sferycznych, zgodniez formułą (500). W tym celu oznaczmy

xi

r= ni .

Wektor o tych współrzędnych jest elementem sfery jednostkowej S2:

n =xr= (ni) ∈ S2 ⊂ V .

212

Page 219: Rozn. Geom_ - Jerzy Kijowski

Przepiszemy teraz funkcję FQ w następujący sposób:

FQ(x) = rℓ · YQ(n) ,

gdzie obcięcie funkcji FQ do S2:

YQ(n) := FQ(n) , (603)

nazywa się funkcją sferyczną generowaną przez tensor Q. Stosując wzór (500) otrzymamy:

∆FQ(x) =(∂2r +

2r∂r +

1r2(2)

)rℓ · YQ(n) =

(ℓ(ℓ− 1) + 2ℓ+

(2)

)rℓ−2 · YQ(n)

= rℓ−2(ℓ(ℓ+ 1)YQ(n)+

(2)

∆ YQ(n))= 0 .

Wynika stąd, że YQ jest funkcją własną laplasjanu na sferze z wartością własną „−ℓ(ℓ+1)”:

(2)

∆ YQ = −ℓ(ℓ + 1)YQ . (604)

W mechanice kwantowej parametr ℓ nazywa się często „całkowitym momentem pędu funk-cji falowej YQ”. Okazuje się, że wszystkie funkcje własne laplasjanu na sferze są tego ro-dzaju. Są one bardzo dogodną bazą w przestrzeni wszystkich funkcji na sferze. Np. jeślirozważać przestrzeń funkcji całkowalnych z kwadratem: L2(S2), to rzeczywiście stanowiąone bazę w sensie przestrzeni Hilberta. Cała ta przestrzeń rozkłada się wtedy na skończeniewymiarowe podprzestrzenie Hℓ numerowane właśnie wartością własną laplasjanu. Wymiartakiej podprzestrzeni jest równy liczbie wszystkich (liniowo niezależnych) symetrycznychbezśladowych tensorów o walencji ℓ. Dla ℓ = 0 jest to przestrzeń jednowymiarowa funkcjistałych: dimH0 = 1. Dla ℓ = 1 takie tensory to po prostu kowektory, więc dimH1 = 3.Dla ℓ = 2 są to macierze symetryczne 3 × 3 (przestrzeń 6-wymiarowa!) spełniające jedenwarunek znikania śladu. Zatem dimH2 = 5.Lemat: Wymiar przestrzeni Hℓ dany jest wzorem: dimHℓ = 2ℓ+ 1.Dowód: Jako bazę w przestrzeni tensorów symetrycznych można wybrać takie, dla któ-

rych wybieramy pewien konkretny zestaw wskaźników i1, . . . , iℓ i kładziemy Qi1,...,iℓ = 1, adla każdego zestawu j1, . . . , jℓ, który nie jest permutacją powyższego kładziemy Qj1,...,jℓ = 0.Oznacza to, że jako bazę w przestrzeni FQ wybieramy jednomiany stanowiące po prostuiloczyn: xr · ys · zt, gdzie r + s + t = ℓ. Takie funkcje można numerować liczbą powtó-rzeń każdej z trzech możliwych wartości wskaźników is w sekwencji Qi1,...,iℓ , czyli potęgami(r, s, t). Niech na x i y przypada wspólnie rząd r + s = k wielomianu. Wtedy z występujew potędze t = ℓ− k. Zachodzi oczywiście 0 ¬ k ¬ ℓ. Dla ustalonej wartości k mamy k + 1różnych możliwości, mianowicie: 1) r = 0 i s = k, 2) r = 1 i s = (k − 1), 3) r = 2 is = (k − 2), i tak dalej. Suma tych wszystkich możliwości jest równa:

Sym(ℓ) =ℓ∑

k=0

(k + 1) = 1 + 2 + 3 + · · ·+ (ℓ+ 1) = (ℓ+ 1)(ℓ+ 2)2

.

213

Page 220: Rozn. Geom_ - Jerzy Kijowski

A zatem przestrzeń wszystkich ℓ-tensorów całkowicie symetrycznych jest wymiaru Sym(ℓ).Na obiekty te nakładamy teraz warunki znikania śladu (602). Warunków tych jest tyle,ile niezależnych tensorów symetrycznych o walencji (ℓ − 2), bowiem są one numerowanewskaźnikami i3, . . . , iℓ. Przestrzeń tensorów spełniających te warunki ma więc następu-jący wymiar:

dimHℓ = Sym(ℓ)− Sym(ℓ− 2) =(ℓ+ 1)(ℓ+ 2)

2− (ℓ− 1)ℓ

2= 2ℓ+ 1 .

Zauważmy, że generatory grupy obrotów, czyli pola wektorowe X, Y, Z dane wzorami(187), są operatorami w przestrzeni Hℓ. Aby się o tym przekonać zauważmy, że F ∈ Hℓzachodzi wtedy i tylko wtedy, gdy: 1) F jest funkcją harmoniczną, tzn. ∆F = 0, oraz 2) Fjest wielomianem stopnia l zmiennych kartezjańskich. Ale obrót funkcji harmonicznej dajeznów funkcję harmoniczną (mówimy, że „równanie Laplace’a jest niezmiennicze względemobrotów”). Zatem pola X, Y, Z, jako „infinitezymalne obroty”, w działaniu na funkcję har-moniczną wyprodukują znów funkcję harmoniczną. Poza tym pola te nie zmieniają stopniawielomianu, bowiem każdemu różniczkowaniu (zmniejszenie stopnia o jeden) towarzyszymnożenie przez inną zmienną (zwiększenie stopnia o jeden).Aby znaleźć wygodną bazę przestrzeni Hℓ wygodnie jest rozważać funkcje zespolne

(czyli pary funkcji rzeczywistych) i uporządkować je pod względem zachowania względemobrotów wokół wybranej osi, na przykład osi „z”. Modelem jest tutaj wielomian (zespolony)postaci F = (x2 + y2 + z2)kzn(x + iy)m. Jeśli wyrazić go w zmiennych sferycznych, tox + iy = r · sin θ · eiϕ, zatem (x + iy)m zawiera czynnik eimϕ. Funkcja zawierająca takiczynnik jest funkcją własną operatora Z o wartości własnej „im” bowiem, jak wiemy,Z = ∂

∂ϕ, zatem Zeimϕ = imeimϕ.

Dopuszczając również wielomiany postaci r2kzn(x−iy)|m| = rk+n+m cosn θ sinm θe−i|m|ϕ,dopuszczamy ujemne wartości własne m = −|m|.Aby takie wielomiany miały szanse należeć do Hℓ, ich stopień musi być równy ℓ, stąd

mamy ograniczenie:−ℓ < m < ℓ . (605)

Jak się zaraz okaże, dla każdego m przestrzeń takich funkcji jest jednowymiarowa. Oznacz-my ją przez Hℓ,m. Mamy więc:

Hℓ = Hℓ,−ℓ ⊗Hℓ,−ℓ+1 ⊗ · · · ⊗Hℓ,0 ⊗ · · · ⊗Hℓ,ℓ−1 ⊗Hℓ,ℓ . (606)

Wydawać by się mogło, że rozważania powyższe, choć teoretycznie bardzo ciekawe, nieprzybliżyły nas do znalezienia konkretnego wyrażenia na funkcje sferyczne. Tymczasem,pamiętając postać generatorów: X = (y∂z − z∂y) oraz Y = (z∂x − x∂z), otrzymujemy:

X (zn(x+ iy)m) = nyzn−1(x+ iy)m − imzn+1(x+ iy)m−1 ,Y (zn(x+ iy)m) = mzn+1(x+ iy)m−1 − nxzn−1(x+ iy)m ,

X(zn(x− iy)|m|

)= nyzn−1(x− iy)|m| + imzn+1(x− iy)|m|−1 ,

Y(zn(x− iy)|m|

)= mzn+1(x− iy)|m|−1 − nxzn−1(x+ iy)|m| .

214

Page 221: Rozn. Geom_ - Jerzy Kijowski

Wobec tego zachodzi:

(X + iY ) (zn(x+ iy)m) = −inzn−1(x+ iy)m+1 , (607)

(X + iY )(zn(x− iy)|m|

)= 2imzn+1(x− iy)|m|−1 − inzn−1(x+ iy)(x− iy)(x− iy)|m|−1

= i(2mzn+1 − nzn−1(x2 + y2)

)(x− iy)|m|−1 . (608)

Oznacza to, że operator (X + iY ) w działaniu na funkcję, która zależy od zmiennej ϕ takjak eimϕ produkuje funkcję, która zależy od zmiennej ϕ tak jak ei(m+1)ϕ, i to zarówno wtedygdy m ­ 0, jak i wtedy gdy m = −|m| ¬ 0. Pokazaliśmy zatem, że zachodzi:

(X + iY )Hℓ,m ⊂ Hℓ,m+1 .

Zupełnie podobnie pokazujemy, że zachodzi:

(X − iY )Hℓ,m ⊂ Hℓ,m−1 .

Można zatem mieć nadzieję, że wystarczy znać jedną z tych przestrzeni, na przykład Hℓ,0,a wszystkie pozostałe otrzymamy poruszając się po „drabince” (606) w górę lub w dółprzy pomocy operatorów (X + iY ) lub (X − iY ). Wspinaczka ta nie może jednak trwaćbez końca, bowiem drabina jest skończona na mocy (605). Jest tak rzeczywiście na mocynastępującego Lematu:Lemat: Zachodzi: (X + iY )Hℓ,ℓ = 0, natomiast dla m 6= ℓ operator (X + iY ) ma

trywialne jądro na Hℓ,m, zatem jest izomorfizmem tej przestrzeni z przestrzenią Hℓ,m+1.Poza tym zachodzi: (X − iY )Hℓ,−ℓ = 0, natomiast dla m 6= −ℓ operator (X − iY ) matrywialne jądro na Hℓ,m, zatem jest izomorfizmem tej przestrzeni z przestrzenią Hℓ,m−1.Dowód: Prostym przeliczeniem wykazujemy następującą tożsamość:

X2 + Y 2 + Z2 = (x2 + y2 + z2)∆− ∂

∂rr2∂

∂r. (609)

Jeśli zatem F ∈ Hℓ, to ∆F = 0, a zatem

(X2 + Y 2 + Z2)F = − ∂

∂rr2∂

∂rF = −ℓ(ℓ + 1)F ,

bowiem, jak wiemy, F jest jednorodna stopnia ℓ w zmiennej r. Rozważmy operatory

(X − iY )(X + iY ) = X2 + i[X, Y ] + Y 2 = (X2 + Y 2 + Z2)− iZ − Z2 ,(X + iY )(X − iY ) = X2 − i[X, Y ] + Y 2 = (X2 + Y 2 + Z2) + iZ − Z2 .

Pierwszy z tych operatorów opisuje wspięcie się o jeden stopień po drabince (606), a następ-nie opuszczenie się do pozycji wyjściowej. Drugi — najpierw krok w dół a potem powrótw górę. Jeśli zatem F ∈ Hℓ,m, to mamy: ZF = imF , Z2F = −m2F , a więc:

(X − iY )(X + iY )F = (−ℓ(ℓ + 1) +m(m+ 1))F , (610)

(X + iY )(X − iY )F = (−ℓ(ℓ + 1) +m(m− 1))F . (611)

215

Page 222: Rozn. Geom_ - Jerzy Kijowski

Wynika stąd, że (X − iY )(X + iY ) zeruje się dla m = ℓ zaś w pozostałych przypadkachjest proporcjonalne do tożsamości ze współczynnikiem różnym od zera, zatem ma trywialnejądro. Natomiast (X + iY )(X − iY ) zeruje się dla m = −ℓ zaś w pozostałych przypadkachjest proporcjonalne do tożsamości ze współczynnikiem różnym od zera, zatem ma trywialnejądro. I stąd już wynika teza.

Wybór funkcji w każdej z przestrzeni Hℓ,m jest jednoznaczny z dokładnością do po-mnożenia przez stałą. Można go ujednoznacznić nakładając na przykład taki warunek:1) funkcja ma być rzeczywista po usunięciu czynnika eimϕ oraz: 2) całka z kwadratu jejmodułu po sferze S2 ma być równa 1. Jedyną funkcję spełniającą te warunki normalizacjioznacza się zazwyczaj symbolem Yℓ,m ∈ Hℓ,m. Mamy dokładnie 2ℓ + 1 takich funkcji i toje właśnie warto wybrać jako bazę przestrzeni Hℓ.Aby zbadać co dzieje się z funkcjami Yℓ,m ∈ Hℓ,m podczas działania operacji „drabin-

kowych” (X + iY ) oraz (X − iY ) zauważmy, że w całce po sferze z iloczynu dwu funkcji,operatory X oraz Y można „przerzucać” ze zmianą znaku, według następującej reguły:

S(1)F · (XG)dσ = −

S(1)(XF ) ·Gdσ ,

S(1)F · (Y G)dσ = −

S(1)(Y F ) ·Gdσ .

Oczywisty dowód tej własności polega na wyliczeniu całki w takim układzie współrzędnychna sferze, w którym badane pole jest równe pochodnej: ∂

∂ϕ. W takim układzie współrzęd-

nych każda z tych tożsamości jest po prostu wzorem na całkowanie przez części. W języ-ku operatorów na przestrzeni L2(S2) (funkcji „różniczkowalnych z kwadratem” na sferze)oznacza to, że operatory X i Y są anty-symetryczne. Zatem, na mocy (610), zachodzi:

S(1)|(X + iY )Yℓ,m|2dσ =

S(1)((X + iY )Yℓ,m) ((X + iY )Yℓ,m) dσ

=∫

S(1)

((X − iY )Yℓ,m

)((X + iY )Yℓ,m) dσ

= −∫

S(1)Yℓ,m ((X − iY )(X + iY )Yℓ,m) dσ

= (ℓ(ℓ+ 1)−m(m+ 1))∫

S(1)|Yℓ,m|2dσ .

Widać stąd, że dla m < ℓ operator

A+ :=1√

ℓ(ℓ+ 1)−m(m+ 1)(X + iY )

zachowuje unormowanie. Ponieważ na mocy (607)–(608), zachowuje on również warunekfazy, zatem pokazaliśmy dla m < ℓ tożsamość:

A+Yℓ,m = Yℓ,m+1 . (612)

216

Page 223: Rozn. Geom_ - Jerzy Kijowski

Podobnie, wykorzystując (611), pokazujemy, ze dla m > −ℓ zachodzi:

A−Yℓ,m = Yℓ,m−1 , (613)

gdzie operator A− został zdefiniowany jako:

A− :=1√

ℓ(ℓ+ 1)−m(m− 1)(X − iY ) .

Wystarczy zatem znaleźć choć jedną funkcję sferyczną Yℓ,m dla każdego ℓ, aby odtworzyćpozostałe. Najwygodniej jest znaleźć Yℓ,0. Musi to być wielomian stopnia ℓ, niezmienniczywzględem obrotów wokół osi „z”, a zatem zależny jedynie od zmiennej z oraz kombinacjir2 = (x2+y2+ z2). Widać, że gdy ℓ = 2k jest liczbą parzystą, to mogą tu wystąpić jedynieparzyste potęgi zmiennej z, a gdy ℓ = 2k+1 to jedynie nieparzyste. Szukamy zatem funkcji:

F (x, y, z) = r2kk∑

n=0

a2n

(z

r

)2n= r2k

k∑

n=0

a2nξ2n = r2k · P2k(ξ) ,

dla ℓ = 2k oraz

F (x, y, z) = r2kzk∑

n=0

a2n+1

(z

r

)2n= r2k+1

k∑

n=0

a2n+1ξ2n+1 = r2k+1 · P2k+1(ξ) ,

dla ℓ = 2k+1, spełniających równanie ∆F = 0, przy czym oznaczyliśmy ξ := zr. Na mocy

(609) równanie to jest równoważne warunkowi:

(X2 + Y 2 + Z2)F = − ∂

∂rr2∂

∂rF = −ℓ(ℓ + 1)F . (614)

Zauważmy, że funkcja r jest niezmiennicza względem wszelkich obrotów, zatem w stosunkudo operatorów X, Y, Z, zachowuje się jak stała. Różniczkowaniu podlegają zatem jedyniepotęgi zmiennej „z”. Ale:

(X2)zn = (y∂z − z∂y)(y∂z − z∂y)zn = n(y∂z − z∂y)yzn−1 = n((y2(n− 1)zn−2 − zn

),

(Y 2)zn = (z∂x − x∂z)(z∂x − x∂z)zn = −n(z∂x − x∂z)xzn−1 = −n(zn − x2(n− 1)zn−2

),

(Z2)zn = 0 .

Wobec tego otrzymujemy:

(X2 + Y 2 + Z2)ξn =1rn(X2 + Y 2 + Z2)zn =

1rn

n(n− 1)(x2 + y2)zn−2 − 2nzn

=1rn

n(n− 1)(r2 − z2)zn−2 − 2nzn

=

((1− ξ2) d

2

dξ2− 2ξ ddξ

)(ξn) .

Widać zatem, że szukamy rozwiązania w postaci F = rℓ ·Pℓ(ξ), gdzie Pℓ jest wielomianemstopnia ℓ i że na mocy (614) wielomiany te muszą spełniać równanie różniczkowe zwyczajne:

((1− ξ2) d

2

dξ2− 2ξ ddξ+ ℓ(ℓ+ 1)

)Pℓ(ξ) = 0 . (615)

217

Page 224: Rozn. Geom_ - Jerzy Kijowski

Przyrównując do zera współczynniki przy potęgach zmiennej ξ otrzymujemy równanie re-kurencyjne na współczynniki wielomianu Pℓ, które ma jednoznaczne rozwiązanie jeśli tylkoustalić współczynnik przy najniższej potędze. Zwyczajowo jako rozwiązanie bierze się tzw.wielomiany Legendre’a dane wzorem

Pℓ =12ℓ · ℓ!

dℓ

dξℓ(ξ2 − 1)ℓ ,

które należy jeszcze unormować. Każde inne rozwiązanie jest doń proporcjonalne. Teoriafunkcji sferycznych jest bardzo bogata i można ją znaleźć w licznych podręcznikach. Jejaspekty związane z teorią funkcji analitycznych a także z teorią równań różniczkowychzostały tutaj całkowicie pominięte. Celem rozważań niniejszego Rozdziału było bowiemuwypuklenie struktury geometrycznej, zapisanej całkowicie we własnościach algebry pólX, Y, Z, to znaczy generatorów grupy obrotów.

218

Page 225: Rozn. Geom_ - Jerzy Kijowski

7 Teoria powiązania („koneksji”)

7.1 Pole grawitacyjne jako pole układów inercjalnych

Jeśli rozdziały poświęcone pojęciu pola wektorowego należą w gruncie rzeczy do teorii rów-nań różniczkowych pierwszego rzędu, to niniejszy rozdział stanowi refleksję nad równaniamidrugiego rzędu. Takich równań dostarcza nam np. mechanika, gdzie ruchem „punktu ma-terialnego o masie m” rządzi druga zasada Newtona, będąca właśnie równaniem drugiegorzędu:

xk =1mF k(x, t) . (616)

Wiemy też, że powyższe równanie obowiązuje jedynie „w układzie inercjalnym”, bo-wiem w układzie „nieinercjanym” przyśpieszenie wcale nie pokrywa się z drugą pochodną,lecz jest jeszcze obciążone różnymi dodatkami (Coriolisa, dośrodkowe itd.), których wy-liczaniem dręczymy studentów pierwszych lat studiów, zanim wreszcie damy im do rękiracjonalne narzędzia pozwalające na prostą analizę występujących tu zjawisk. Konstrukcjitych właśnie narzędzi poświęcony jest niniejszy Rozdział.Zacznijmy od prostego przypadku przestrzeni afinicznej. Tak właśnie wygląda czaso-

przestrzeń w modelu stworzonym przez Galileusza i Newtona. Warto bowiem traktowaćczas i przestrzeń na tym samym poziomie. Jeśli zatem (ya) = (t, x, y, z) stanowi prostoli-niowy układ współrzędnych w takiej czterowymiarowj przestrzeni afinicznej, to trajektorieciał „swobodnych” (tzn. takich, na które nie działa żadna siła) są liniami prostymi, czylipo prostu rozwiązaniami równania różniczkowego

ya = 0 . (617)

(Zwracam uwagę, że w takim sformułowaniu parametr τ , czyli zmienna niezależna w po-wyższym równaniu, nie musi się pokrywać ze współrzędną czasową t.) Jak pisałem weWstępie, geometria różniczkowa to sztuka uprawiania analizy matematycznej w sposóbniezależny od układu współrzędnych. Zobaczmy więc jak wygląda to samo równanie wdowolnym, być może krzywoliniowym, układzie współrzędnych (xk):

ya =∂ya

∂xkxk

ya =∂ya

∂xkxk +

∂2ya

∂xk∂xlxkxl = 0 . (618)

W celu wyliczenia „przyśpieszenia” xm we współrzędnych (xk) pomnożymy obie stronyprzez macierz ∂x

m

∂ya, odwrotną do macierzy ∂y

a

∂xk. Ponieważ zachodzi:

∂xm

∂ya∂ya

∂xk= δmk , (619)

otrzymujemy:

xm +∂xm

∂ya∂2ya

∂xk∂xlxkxl = 0 .

219

Page 226: Rozn. Geom_ - Jerzy Kijowski

Jeśli teraz wprowadzić oznaczenie:

Γmkl :=∂xm

∂ya∂2ya

∂xk∂xl, (620)

to powyższe równanie można przepisać w następującej formie:

xm + Γmklxkxl = 0 . (621)

Uwaga na symetrię: Γmkl = Γmlk ! Wynika ona z symetrii drugich pochodnych.

Gdyby układ (xk) był również prostoliniowy, tzn. gdyby zależność między współrzęd-nymi (ya) a (xk) była liniowa, to macierz pierwszych pochodnych ∂y

a

∂xlbyłaby stała, zatem

drugie pochodne ∂2ya

∂xk∂xlbyłyby tożsamościowo równe zeru i równanie (621) dawałoby znów

xm = 0 . (622)

Natomiast w ogólnym przypadku współczynniki Γmkl mierzą odstępstwo układu (xk) od li-

niowości („inercjalności”) i równanie (622) jest błędne! Prawo bezwładności Galileusza,tzn. pierwszą zasadę dynamiki Newtona, wyraża bowiem równanie nieliniowe (621), którejedynie w układzie inercjalnym sprowadza się do (617). Nieliniowe dodatki Γmklx

kxl zawie-rają właśnie te wszystkie „siły odśrodkowe”, „Coriolisy” i inne fikcyjne przyśpieszenia,związane z nieinercjalnością układu (xk).Do czasów Einsteina panowała zgoda, że „prawdziwe” równania dynamiki należy za-

wsze odnosić do „układu inercjalnego”, utożsamiając to pojęcie z prostoliniowym układemwspółrzędnych w Galileuszowsko-Newtonowskiej (czyli po prostu afinicznej) czasoprze-strzeni. Dopiero Einstein poddał w wątpliwość ten dogmat i przypuścił myśl, że czasoprze-strzeń jest krzywa, to znaczy nie istnieją na niej żadne układy prostoliniowe. Jeśli jednakjego postulat „względności”, to znaczy niezależności praw fizyki od układu współrzęd-nych, jest spełniony, to jaki sens miałoby równanie Newtona (617) opisujące ruch cząstkiswobodnej, skoro zapisane w nieinercjanym układzie w postaci (622) jest ewidentnie nie-równoważne tamtemu, zapisanemu w postaci (621)? Przecież wybierając „dzikie” układywspółrzędnych można dowolnie zmieniać wartość dodatku Γmklx

kxl w równaniu (621)! Wten sposób równanie to przestałoby mieć jakikolwiek sens.Musi więc istnieć w czasoprzestrzeni jakaś struktura geometryczna, która pozwoli zmie-

rzyć „prawdziwe” przyśpieszenie i odróżnić je od fikcyjnego, będącego jedynie wynikiemstosowania niewłaściwej parametryzacji.Teoria względności Einsteina opisuje taką strukturę postulując, że choć nie istnieją

globalne układy inercjalne, to w każdym punkcie czasoprzestrzeni istnieje lokalny układinercjalny, do którego należy odnieść równanie ruchu swobodnego (617).Co to jest „układ inercjalny”? Czy to jest po prostu „układ współrzędnych”? No nie, na-

wet w czasoprzestrzeni Galileusza-Newtona nie było wyróżnionego układu współrzędnych,bowiem wszystkie układy prostoliniowe były równoważne, czyli „równie dobre”. Tutaj teżukład inercjalny w punkcie x ∈M rozmaitości różniczkowalnejM opiszemy jako klasę rów-noważnych układów współrzędnych w otoczeniu tego punktu. W tym celu wprowadzimynastępującą relację równoważności w zbiorze takich układów współrzędnych:

220

Page 227: Rozn. Geom_ - Jerzy Kijowski

Definicja 1: Dwa układy współrzędnych, (xk) oraz (ya) określone w otoczeniu punktux ∈ M nazywamy równoważnymi ze względu na x i zapiszemy: (xk) ∼x (ya), wtedy itylko wtedy, gdy zachodzi ∂

2ya

∂xk∂xl(x) = 0.

Za chwilę pokażemy, że jest to rzeczywiście relacja równoważności. Zatem zbiór wszyst-kich układów współrzędnych wokół punktu x rozpada się na rozłączne klasy układów rów-noważnych.Definicja 2: Układem odniesienia w punkcie x ∈M nazywamy klasę układów równo-

ważnych w powyższym sensie.Pole grawitacyjne należy sobie wyobrażać jako pole lokalnych układów inercjalnych.

Równania Newtona należy odnosić właśnie do układów inercjalnych. Nie wyklucza to jed-nak posługiwania się układami nieinercjalnymi. Poza przypadkiem płaskim inercjalnośćukładu współrzędnych może być jedynie punktowa: gdy jest on inercjalny w punkcie x,to w sąsiednich punktach już zazwyczaj nie. W takich sytuacjach jesteśmy zmuszeni dostosowania nieinercjalnego układu współrzędnych, czyli takiego, w którym równanie ruchuswobodnego przyjmuje postać (621). Natomiast wielkości Γmkl należy odnosić do dowolnegoukładu (ya) z klasy lokalnego układu inercjalnego. Pokażemy, że wzór (620) jest dobrądefinicją tych wielkości, niezależną od wyboru reprezentanta (ya) z klasy równoważności.Jeśli przypadkowo nasz układ (xk) jest inercjalny w punkcie x, czyli równoważny z (ya), toakurat w tym punkcie dodatki Γmklx

kxl znikną, ale w sąsiednich punktach naogół nie znikną.Na tym właśnie polega różnica między płaską a krzywą czasoprzestrzenią. Płaska to taka,że istnieją w niej globalne układy inercjalne. Einsteinowska teoria grawitacji, bez którejnie można sobie wyobrazić misji kosmicznych ani nawet codziennie używanego systemunawigacji satelitarnej GPS, polega właśnie na rezygnacji z założenia o istnieniu globalnychukładów inercjalnych.Jeśli równanie (621) przepisać w postaci „równania Newtona”:

xm = −Γmklxkxl . (623)

to prawa strona opisuje „siły grawitacyjne” działające na cząstkę w układzie współrzędnych(xk). Wielkość ta nie ma jednak żadnego znaczenia geometrycznego, bowiem zależy od wy-boru układu współrzędnych. W szczególności lokalnie, w danym punkcie czasoprzestrzeni,można ją wyeliminować używając inercjalnego układu współrzędnych. Wtedy Γmkl = 0 i ta„siła grawitacyjna” znika. Rewolucja w myśleniu o grawitacji dokonała się właśnie wtedy,gdy Einstein zrozumiał, iż sytuacja taka odpowiada właśnie opisowi zjawisk grawitacyjnychzachodzących w swobodnie spadającej windzie (wersja z 1915 roku) czy też (wersja współ-czesna) w swobodnie orbitującej stacji kosmicznej. Panuje tam stan nieważkości, to znaczyodczuwamy, iż siły grawitacyjne zostały rzeczywiście wyeliminowane. Jednak nie możnana ogół wyeliminować tych sił globalnie. Obserwujemy bowiem, że trajektorie różnych ciałznajdujących się w stacji kosmicznej nie rozbiegają się do nieskończoności, jak wiązka pro-stych w płaskiej przestrzeni afinicznej, lecz okrążają centrum grawitacji, w orbicie któregoznajduje się stacja. A zatem grawitacja, choć lokalnie wyeliminowana, manifestuje się wzakrzywieniu przestrzeni, czego wynikiem jest globalna struktura trajektorii ciał swobodnie„orbitujących”.

221

Page 228: Rozn. Geom_ - Jerzy Kijowski

7.2 Problem ortodromy i geometrie nie-euklidesowe

Podobna struktura geometryczna występuje w nawigacji, gdzie chodzi o znalezienie „naj-prostszej” drogi na powierzchni globu ziemskiego. Jeśli wyobrażać sobie tę powierzchnięjako sferę S2, to linie „proste” na sferze są wielkimi okręgami. Żeglarze nazywają takąlinię na powierzchni globu „ortodromą”. Biorąc ortodromy w charakterze „linii prostych”na sferze, można zbudować aksjomatycznie geometrię nie-euklidesową, zwaną geometriąsferyczną, w której wiele definicji i twierdzeń można bezpośrednio przenieść z geometriiEuklidesa. Jednak zasadnicza różnica między geometrią Euklidesa a sferyczną polega natym, że nie obowiązuje tutaj słynny piąty aksjomat mówiący iż przez punkt nie leżący naprostej przechodzi jedyna prosta do niej równoległa. Na sferze nie ma równoległych: każdedwie proste (wielkie okręgi) przecinają się!Są też modele geometrii, w których ten aksjomat jest gwałcony w inny sposób: np. w

modelu Łobaczewskiego jest bardzo wiele linii równoległych przechodzących przez wybranypunkt, a nie tylko jedna.W takich przestrzeniach informację o własnościach linii „prostych” wygodnie jest ko-

dować przy pomocy pola „lokalnych układów inercjalnych”, jak w przypadku problemugrawitacji. Najwcześniej poznaną „krzywą przestrzenią”, dla której opis oparty na geome-trii euklidesowej przestał wystarczać, była właśnie powierzchnia globu ziemskiego w dobiewielkich odkrywców geograficznych i na jej przykładzie zilustrujemy konstrukcję strukturypowiązania.Otóż żeglując po oceanie najłatwiej jest trzymać się tzw. loksodromy, czyli linii prze-

cinającej siatkę geograficzną złożoną z południków i równoleżników pod stałym kątem. Wtakiej żegludze sternik musi po prostu trzymać ciągle ten sam kurs kompasowy. We współ-rzędnych geograficznych (θ, ϕ) równanie takiej trajektorii ruchu wygląda rzeczywiście tak,jak równanie (622):

θ(t) = 0 , ϕ(t) = 0 , (624)

co gwarantuje liniową zależność obu współrzędnych od parametru.Nazwa loksodroma pochodzi od greckich słów „loksós” – ukośny, oraz „droma” – linia

prosta. Ale, pożal się Boże, cóż to za prosta! W żegludze po morzu Bałtyckim może być na-wet przydatna, ale wystarczy popatrzeć na globus by zauważyć, że żegluga po loksodromiez Plymouth do Nowego Yorku to ogromna strata czasu! A w pobliżu biegunów loksodromacoraz bardziej zbliża się do spirali Archimedesa i poruszanie się po niej przypominałobyraczej taniec Św. Wita niż jakiekolwiek sensowne zmierzanie do celu.Gdyby na globus naciągnąć gumkę umocowaną końcami w dwóch miastach leżących po

różnych stronach oceanu, to wyznaczyłaby ona zupełnie inną trasę, wielkie koło na globu-sie, czyli właśnie „ortodromę”. Czujemy instynktownie, że wskazuje ona najkrótszą drogęmiędzy punktem startu a punktem docelowym. Wyznaczanie ortodromy to najbardziejtypowe zadanie, jakie rozwiązują studenci wydziału nawigacji w szkole morskiej. Trzebasię tu wyzbyć nostalgii za funkcjami liniowymi, bowiem równanie różniczkowe opisująceortodromę względem współrzędnych geograficznych (θ, ϕ) jest dużo bardziej skompliko-wane niż warunek (624) na znikanie „przyśpieszenia”, tzn. drugich pochodnych. Aby jetutaj wyprowadzić zauważmy, że w każdym punkcie globu (θ0, ϕ0) można wybrać takie

222

Page 229: Rozn. Geom_ - Jerzy Kijowski

Rysunek 23: Rzut siatki geograficznej na płaszczyznę styczną do kuli.

lokalne współrzędne (x, y), żeby przynajmniej w tym jednym punkcie równanie ortodromywyglądało tak jak (624):

x(t) = 0 , y(t) = 0 . (625)

W tym celu rozważymy płaszczyznę styczną do globusa w naszym „miejscu postoju”(θ0, ϕ0) – niech będzie to na przykład kartka papieru. Jak to widać na rysunku 23, rzutsiatki geograficznej z globusa na naszą kartkę daje wysoce nie-prostoliniowy układ współ-rzędnych. Gdyby nasze miejsce postoju znajdowało się na lądzie, to siatka ta zupełnie nienadawała by się jako lokalna mapa do celów geodezyjnych, takich jak: wytyczanie siecirównoległych ulic czy obrysów działek w naszej miejscowości.Do tych celów najlepiej posługiwać się siatką współrzędnych kartezjańskich na kartce.

Gdy zrzutujemy je (przy pomocy rzutu prostopadłego) z naszej kartki papieru na globus,otrzymamy właśnie lokalnie najlepsze, „wyprostowane” współrzędne. Wybierzmy na przy-kład oś X w kierunku wschodnim zaś oś Y – prostopadle, w kierunku północnym, przyczym, dla prostoty rachunków, niech obie będą zaczepione właśnie w naszym „miejscu po-stoju” (θ0, ϕ0) (zob. rys. 2.). Odrobina znajomości trygonometrii pozwoli nam stwierdzić,że zależność miedzy współrzędnymi geograficznymi a naszymi „lokalnie prostoliniowymi”współrzędnymi (x, y), skopiowanymi z płaskiej kartki, wyraża się następującymi wzorami:

θ = θ0 − y + Ax2 + człony wyższego rzędu , (626)

ϕ = ϕ0 + x(1 +By) + człony wyższego rzędu . (627)

Pewna doza nonszalancji w zapisie powyższych wzorów pozwala zwrócić uwagę na ichstrukturę, a do tego ani wartość stałych A i B, ani szczegółowa informacja o członach

223

Page 230: Rozn. Geom_ - Jerzy Kijowski

Rysunek 24: Współrzędne geograficzne a lokalne współrzędne „prostoliniowe” na sferze.

rzędu wyższego niż kwadratowy, nie jest potrzebna. Otóż człony rzędu zerowego zostaływprowadzone tylko po to, by odpowiednio „scentrować” nasze współrzędne, tzn. by zeroukładu (x, y) znalazło się właśnie w punkcie (θ0, ϕ0). Wybór ten jest nieistotny z punktuwidzenia naszego celu, jakim jest „wyprostowanie” równania ortodromy do najprostszejpostaci (625). Człony rzędu pierwszego zostały wybrane tak, by osie X i Y były odpo-wiednio skierowane. Znak „minus” przed zmienną y w pierwszym równaniu pochodzi stąd,że matematyk liczy „szerokość geograficzną” θ od bieguna północnego w dół, na południe.Tymczasem nawigator woli liczyć współrzędną y na mapie w górę, na północ. To równieżjest zupełnie nieistotne z punktu widzenia naszego celu: dowolna liniowa transformacjawspółrzędnych (x, y) będzie równie dobra. Także człony wyższego rzędu są nieistotne, bo-wiem w punkcie (x, y) = (0, 0) nie dają one wkładu do równania (625). To co istotne, toczłony kwadratowe, reprezentowane tutaj przez dwie stałe: A i B. Odrobina znajomościtrygonometrii wystarczy, by się przekonać, że ich wartość wynosi:

A =12sin θ0 cos θ0 , B = ctg θ0 . (628)

Gdybyśmy mieli osiąść na stałe w miejscowości (θ0, ϕ0), to już nigdy inna mapa nie byłabynam potrzebna: ta jest najlepsza ze wszystkich możliwych. Jeśli jednak punkt (θ0, ϕ0) znaj-duje się na oceanie a my jesteśmy nawigatorami w podróży, to niestety nasza doskonała(w otoczniu punktu (θ0, ϕ0)) mapa wkrótce się zdezaktualizuje i trzeba byłoby ją szyb-ko wymienić na inną, dostosowaną do innego punktu. No ale nie możemy wozić ze sobątak ogromnej liczby map: po jednej dla każdego małego otoczenia kolejno mijanych punk-tów globu! Przeprośmy się zatem z bardziej globalnymi współrzędnymi geograficznymi iprzeliczmy równanie ortodromy (625) (oznaczonej kolorem czerwonym na rys. 24) do tych

224

Page 231: Rozn. Geom_ - Jerzy Kijowski

współrzędnych. Różniczkując stronami wzory (626) i (627) otrzymujemy:

θ = −y + 2Axx , (629)

θ = −y + 2Axx+ 2Axx , (630)

ϕ = x+Bxy +Bxy , (631)

ϕ = x+ 2Bxy +Bxy +Bxy . (632)

Ale w zmiennych „wyprostowanych” równanie ortodromy to znikanie drugich pochodnych(625). Zatem w naszym punkcie postoju (x, y) = (0, 0) równanie ortodromy wygląda na-stępująco:

θ = 2Axx = 2Aϕ2 ,

ϕ = 2Bxy = −2Bϕθ ,

(uwzględniono związki: θ = −y oraz ϕ = x, wynikające z (629) i (631)). Po wstawieniuwartości stałych (628) otrzymujemy następujące równanie ortodromy:

θ = ϕ2 sin θ cos θ , (633)

ϕ = −2ϕθ ctg θ , (634)

obowiązujące już uniwersalnie, w każdym punkcie (θ, ϕ), tzn. na całym globie. Równania tesą równoważne układowi (623), to znaczy xm = −Γmklxkxl, gdzie współczynniki Γ przyjmująnastępujące wartości:

Γθϕϕ = − sin θ cos θ , Γϕθϕ = Γϕϕθ = ctg θ , (635)

a pozostałe są równe zeru:

Γθϕθ = Γθθϕ = Γ

θθθ = Γ

ϕϕϕ = Γ

ϕθθ = 0 .

Kapitan statku żeglującego po oceanie nie musi zatem wozić całej (nieskończonej) ko-lekcji „dobrych” map, czyli lokalnych układów inercjalnych, w których równanie ortodromyma postać (625), bowiem cała o nich informacja została zakodowana we wzorach (635) ito ona wystarcza do znalezienia ortodromy.

7.3 Matematyczny opis teorii powiązania

Sformalizujemy teraz powyższe opowiadania w postaci twierdzeń matematycznych.Twierdzenie: Relacja „∼x” wprowadzona w paragrafie 7.1 w postaci Definicji 1 jest

relacją równoważności.Dowód: Należy pokazać zwrotność, symetrię oraz przechodniość tej relacji.Zwrotność jest oczywista: jeśli oba układy są identyczne: xa = ya, to macierz pierw-

szych pochodnych jest macierzą jednostkową: ∂ya

∂xk(m) = δak , i wobec tego macierz drugich

pochodnych jest równa zeru: ∂2ya

∂xk∂xl(m) = 0.

225

Page 232: Rozn. Geom_ - Jerzy Kijowski

Aby wykazać symetrię skorzystamy z równania (619):

∂yc

∂xk∂xk

∂ya= δca .

Działając na obie strony operatorem różniczkowym

∂yb=∂xl

∂yb∂

∂xl,

otrzymamy zero. Zachodzi więc:

0 =∂

∂yb

(∂yc

∂xk∂xk

∂ya

)=∂xl

∂yb∂2yc

∂xl∂xk∂xk

∂ya+∂yc

∂xk∂2xk

∂yb∂ya. (636)

Działając na obie strony macierzą ∂xn

∂ycotrzymamy:

0 =∂xn

∂yc∂xl

∂yb∂2yc

∂xl∂xk∂xk

∂ya+ δnk

∂2xk

∂yb∂ya, (637)

skąd otrzymujemy:∂2xn

∂yb∂ya= −∂x

n

∂yc∂xl

∂yb∂2yc

∂xl∂xk∂xk

∂ya. (638)

Jeśli zatem zachodzi ∂2ya

∂xk∂xl(m) = 0, to również ∂

2xn

∂yb∂ya(m), co dowodzi symetrii relacji.

Aby wykazać przechodniość, skorzystamy ze wzoru na pochodną superpozycji: ∂zr

∂xk=

∂zr

∂ya∂ya

∂xk. Wobec tego:

∂2zr

∂xl∂xk=

∂xl

(∂zr

∂ya∂ya

∂xk

)

=

(∂

∂xl∂zr

∂ya

)∂ya

∂xk+∂zr

∂ya∂

∂xl∂ya

∂xk

=

(∂yb

∂xl∂

∂yb∂zr

∂ya

)∂ya

∂xk+∂zr

∂ya∂2ya

∂xk∂xl

=∂yb

∂xl∂2zr

∂yb∂ya∂ya

∂xk+

∂2ya

∂xk∂xl∂zr

∂ya. (639)

Zatem jeśli (xk) ∼m (yr) i (yr) ∼m (za), to oba człony po prawej stronie równania (639)znikają. Zatem, ∂

2za

∂xk∂xl(m) = 0, czyli (xk) ∼m (za). Relacja jest więc przechodnia.

Pamiętamy, że lokalny układ odniesienia to klasa równoważności, na jakie relacja ∼mdzieli zbiór wszystkich lokalnych układów współrzędnych określonych w otoczeniu punktux. Klasę, do której należy układ (ya) oznaczmy przez Υ = [(ya)] a zbiór wszystkich takichklas oznaczmy przez KxM . Gdy (xk) jest dowolnym układem współrzędnych, to klasa tajednoznacznie definiuje tablicę Γmkl wzorem (620), który warto tutaj powtórzyć:

Γmkl :=∂xm

∂ya∂2ya

∂xk∂xl,

226

Page 233: Rozn. Geom_ - Jerzy Kijowski

gdzie (ya) jest dowolnym reprezentantem tej klasy. Wynika to z następującego faktu:Lemat 1: Jeśli (ya) oraz (zr) należą do tej samej klasy Υ ∈ KxM , to znaczy gdy są

sobie równoważne, to zachodzi tożsamość:

∂xm

∂ya∂2ya

∂xk∂xl=∂xm

∂zr∂2zr

∂xk∂xl. (640)

Dowód: Skorzystamy ponownie z formuły (639). Jeśli (ya) oraz (zr) są równoważne,to zachodzi ∂2zr

∂yb∂ya= 0 i formuła ta redukuje się do:

∂2zr

∂xl∂xk=∂zr

∂ya∂2ya

∂xk∂xl.

Mnożąc obie strony przez ∂xm

∂zrotrzymujemy

∂xm

∂zr∂2zr

∂xl∂xk=∂xm

∂zr∂zr

∂ya∂2ya

∂xk∂xl=∂xm

∂ya∂2ya

∂xk∂xl.

Widzimy więc, że tablica współczynników Γmkl zależy od samej klasy Υ, a nie od wyborukonkretnego reprezentanta, którego użyliśmy do jej wyliczenia wzorem (620).Okazuje się, że tablica ta jednoznacznie charakteryzuje tę klasę:Lemat 2: Dla dowolnego wyboru wartości elementów tablicy Γmkl (byle tylko była sy-

metryczna: Γmkl = Γmlk) istnieje jedna i tylko jedna klasa, dla której zachodzi wzór (620).

Dowód: Wystarczy oczywiście znaleźć jakiegokolwiek reprezentanta tej klasy, czyliukład współrzędnych (ya) dla którego zachodzi (620), bowiem na mocy poprzedniego le-matu inne elementy tej klasy dadzą ten sam wynik. Oznaczmy przez xk wartość współ-rzędnych naszego punktu x w układzie współrzędnych (xk) i rozważmy „poprawione” okwadratową poprawkę współrzędne, dane wzorem:

ym := xm +12Γmkl(x

k − xk)(xl − xl) . (641)

Zachodzi:

∂ym

∂xk= δmk + Γ

mkl(x

l − xl) , zatem∂xn

∂ym(x) = δnm ,

∂2ym

∂xk∂xl= Γmkl , zatem

∂xn

∂ym(x)

∂2ym

∂xk∂xl(x) = Γmkl .

Widać więc, że zastaw liczb (Γmkl) dobrze parametryzuje zbiór KxM i może być zasto-sowany jako układ współrzędnych na tym zbiorze. Zatem (xk,Γmkl) stanowi układ współ-rzędnych na zbiorze układów odniesienia we wszystkich punktach rozmaitości M . Zbiórten oznaczymy przez

KM =⋃

x∈MKxM . (642)

227

Page 234: Rozn. Geom_ - Jerzy Kijowski

Z dotychczasowych rozważań wynika, że zbiór ten ma strukturę wiązki włóknistej, którejwłókna mają wymiar równy wymiarowi przestrzeni tablic symetrycznych Γmkl = Γ

mlk. Jeśli

dimM = n to górny wskaźnik może przyjmować n różnych wartości. Natomiast pod wzglę-dem dolnych wskaźników tablicą ta jest macierzą symetryczną (n× n), zawierającą n(n+1)

2

niezależnych informacji. W ten sposób wykazaliśmy, że

dim KxM =n2(n+ 1)2

. (643)

I tak dla n = 2 wymiar ten wynosi 6, dla n = 3 wynosi on 18 , zaś dla n = 4 wynosi aż 40.Wybierając układ współrzędnych (xk) w M ustalamy trywializację wiązki KM , bowiemlokalnie jej elementy są w jedno-jednoznacznej odpowiedniości z elementami iloczynu kar-

tezjańskiego M × Rn2(n+1)2 . Zbadajmy jeszcze jak transformują się współrzędne elementu

Υ ∈ KM przy zmianie współrzędnych w M . Wybierzmy zatem inny układ współrzędnych(zr) w M i oznaczmy przez

Γrst =∂zr

∂ya∂2ya

∂zs∂zt

nowe parametry naszego elementu, gdzie (ya) jest jego dowolnym reprezentantem: Υ =[(ya)]. Zachodzi

∂ya

∂zt=

∂ya

∂xl∂xl

∂zt

∂2ya

∂zs∂zt=

∂zs

(∂ya

∂xl∂xl

∂zt

)

=

(∂xk

∂zs∂

∂xk∂ya

∂xl

)∂xl

∂zt+∂ya

∂xl∂2xl

∂zs∂zt=∂xk

∂zs∂2ya

∂xk∂xl∂xl

∂zt+∂ya

∂xl∂2xl

∂zs∂zt.

Mnożąc obie strony przez macierz ∂zr

∂ya= ∂zr

∂xm∂xm

∂yaotrzymujemy żądany wzór transforma-

cyjny:

Γrst =∂zr

∂xm∂xk

∂zs∂xl

∂ztΓmkl +

∂zr

∂xm∂2xm

∂zs∂zt, (644)

bowiem iloczyn macierzy odwrotnych uprościł się: ∂xm

∂ya∂ya

∂xl= δml .

Widzimy, że obiekty geometryczne będące elementami wiązki KM nie są tensorami, bo-wiem ich współrzędne nie transformują się według tensorowego prawa transformacyjnego,które odpowiadałoby pierwszemu składnikowi po prawej stronie równania (644). Docho-dzi bowiem drugi człon ∂z

r

∂xm∂2xm

∂zs∂zto zupełnie nie-tensorowym charakterze. W szczególności

włókno KxM nie jest przestrzenią wektorową, bowiem prawo transformacyjne (644) —choć liniowe — jest jednak niejednorodne i nie zachowuje ni sumy ni iloczynu. Nie mazatem sensu dodawać ani mnożyć przez liczbę układów odniesienia.Natomiast wykazane prawo transformacyjne zachowuje strukturę afiniczną włókien.

Oznacza to, że tak jak w przestrzeni afinicznej, punkty przestrzeni KxM można „odejmo-wać”, w wyniku czego powstaje jakiś „wektor łączący te punkty”. Jeśli zatem mamy dwa

228

Page 235: Rozn. Geom_ - Jerzy Kijowski

układy odniesienia w punkcie x ∈M , mianowicie(1)

Υ oraz(2)

Υ, to na mocy (644) zachodzi:

(1)

Γrst −(2)

Γrst=∂zr

∂xm∂xk

∂zs∂xl

∂zt

((1)

Γmkl −(2)

Γmkl

). (645)

Spostrzeżenie to oznacza, że ten „wektor łączący oba układy odniesienia”, czyli po prostu

różnica(1)

Υ −(2)

Υ, jest tensorem 1-kontrawariantnym i 2-kowariantnym.Definicja: Powiązaniem („koneksją”) na rozmaitości M nazywamy cięcie wiązki KM ,

M ∋ x→ Υ(x) ∈ KxM ,

czyli wyróznienie w każdym punkcie x ∈ M szczególnego układu odniesienia Υ(x) i to wtaki sposób, by jego współrzędne Γmkl(x) były funkcjami gładkimi. Układy współrzędnychnależące do wybranej klasy nazywamy układami inercjalnymi w punkcie x. Krzywa, któraw każdym swym punkcie spełnia równanie różniczkowe „ya = 0” jeśli tylko (ya) ∈ Υ(x)(zob. (617)), nazywa się ortodromą. Elementy tablicy liczbowej Γmkl(x) nazywa się „współ-czynnikami koneksji”.Wniosek 1: Równanie ortodromy w dowolnym (niekoniecznie inercjalnym) układzie

współrzędnych wygląda następująco:

xm + Γmkl(x)xkxl = 0 . (646)

Widzimy, że współczynniki koneksji Γmkl(x) niosą pełną informację o strukturze powiązaniaΥ(x).Wniosek 2: Układ współrzędnych (xk) jest inercjalny w punkcie x wtedy i tylko wtedy,

gdy współczynniki koneksji znikają w tym punkcie, tzn. gdy Γmkl(x) = 0.

Wektor przyśpieszenia.W przestrzeni (M,Υ) wyposażonej w strukturę powiązania, lewa strona powyższego

równania ma sens geometryczny nie tylko dla ortodromy, ale dla dowolnej krzywej spara-metryzowanej

R ∋ τ → γ(τ) = (xk(τ)) ∈M .

Jest ona mianowicie wektorem, który nazwiemy wektorem przyśpieszenia krzywej γ w punk-cie x:

a(x) :=(xm + Γmkl(x)x

kxl) ∂

∂xm∈ TxM . (647)

Aby się przekonać, że definicja ta nie zależy od wyboru układu współrzędnych wystarczypokazać, że domniemane składowe „(xm + Γmkl(x))” rzeczywiście transformują się jak skła-dowe wektora przy przejściu od jednego do drugiego układu współrzędnych. Gdy jeden ztych układów (oznaczmy go przez (ya)) jest inercjalny, wtedy sprawa jest prosta, bowiemprawo transformacyjne wynika natychmiast z wzoru (618), przepisanego w następującysposób:

ya =∂ya

∂xm

(xm + Γmkl(x)x

kxl). (648)

229

Page 236: Rozn. Geom_ - Jerzy Kijowski

Jeśli natomiast (zr) nie jest układem inercjalnym, to najprościej uzyskać dowód odnoszącsię do jakiegoś układu inercjalnego (ya) i korzystając z tożsamości:

∂ya

∂zq

(zq + Γqst(x)z

szt)= ya =

∂ya

∂xm

(xm + Γmkl(x)x

kxl).

Mnożąc obie strony przez macierz ∂zr

∂yai wykorzystując wzór na pochodną superpozycji:

∂zr

∂ya∂ya

∂xm= ∂zr

∂xm, otrzymujemy żądane prawo transformacyjne:

zr + Γrst(x)zszt =

∂zr

∂xm

(xm + Γmkl(x)x

kxl).

Ćwiczenie: Wyprowadźmy powyższy wzór bezpośrednio z prawa transformacyjnego(644) dla współczynników koneksji.Zwracamy uwagę, iż w obliczeniach z mechaniki składowe wektora przyśpieszenia ozna-

czane są często jako „absolutne” pochodne DDτwektora prędkości vm = xm:

am = xm + Γmkl(x)xkxl =

ddtvm + Γmkl(x)v

kvl =:D

Dτvm . (649)

Wrócimy do tej sprawy w dalszym ciągu naszego wykładu, gdy będziemy mówili o „po-chodnej kowariantnej”.

Przykład 1: Każda przestrzeń afiniczna M nosi na sobie kanoniczną strukturę powią-zania Υflat, w której układami inercjalnymi są wszystkie prostoliniowe układy współrzęd-nych na M . Strukturę taką nazywamy płaską. Istotą tej płaskości jest fakt, iż istnieją wniej globalne układy inercjalne, to znaczy takie układy współrzędnych, które są inercjalnew każdym punkcie swej dziedziny. Jeśli (ya) jest takim układem współrzędnych, to każdyinny układ (xk) o tej własności bierze się z (ya) przez linową transformację:

xk = Akaya +Bk ,

gdzie tablice liczbowe Aka oraz Bk są stałe. Wynika to z faktu, iż równoważność ob układów

implikuje układ równań różniczkowych: ∂2ya

∂xk∂xl= 0. Musi on być spełniony nie tylko w

jednym punkcie, ale w całym jego otoczeniu. Rozwiązaniem tego układu są jedynie funkcjeliniowe.Oczywiście „płaskość” nie musi być od razu globalna, ale może dotyczyć ograniczonego

choć „grubego” obszaru rozmaitości M . W takim przypadku przestrzeń wygląda jak ob-szerna, płaska równina, jednak ograniczona, otoczona górami czyli obszarami, które nie sąjuż płaskie.Przykład 2: W trójwymiarowej przestrzeni euklidesowej wybierzmy prostoliniowe

współrzędne (xk) = (x, y, z). Współczynniki płaskiej koneksji znikają w tym układzie exdefinitione. Linie proste są tu rozwiązaniami układu równań:

x = 0 ,y = 0 ,z = 0 .

(650)

230

Page 237: Rozn. Geom_ - Jerzy Kijowski

Przejdźmy teraz do współrzędnych sferycznych (r, θ, ϕ), zdefiniowanych przy pomocy trans-formacji (2). Różniczkując kolejno wzory (2) możemy drogą prostego przeliczenia prze-kształcić powyższe równania do następującej postaci:

r − rϕ2 sin2 θ − rθ2 = 0 ,ϕ+ 21

rrϕ+ 2ϕθ ctg θ = 0 ,

θ − ϕ2 sin θ cos θ + 21rrθ = 0 .

(651)

Współczynniki koneksji (skądinąd możliwe do wyliczenia z definicji (620)) są równe współ-czynnikom wyrazów kwadratowych względem prędkości w tych równaniach (wypisujemyjedynie te, które nie są tożsamościowo równe zeru):

Γrϕϕ = −r sin2 θ , Γrθθ = −r ,Γϕrϕ =

1r, Γϕϕθ = ctg θ ,

Γθϕϕ = − sin θ cos θ , Γθrθ = 1r .(652)

Przykład 3: Przedmiot zainteresowania żeglarzy: powierzchnia globu ziemskiego, czylisfera S2, jest wyposażona w naturalną strukturę powiązania. Tego właśnie powiązania uży-wają nawigatorzy do obliczania ortodromy. Opisaliśmy je w Paragrafie 7.2 w następującysposób: układ inercjalny w dowolnym punkcie x ∈ S2 to rzut prostopadły na sferę dowolne-go układu prostoliniowego na płaszczyźnie stycznej do sfery w tym punkcie (patrz Rysunek23). Relację między rzutem na sferę tych współrzędnych prostoliniowych a współrzędnymigeograficznymi ilustruje rysunek 24. Wyliczając drugie pochodne jednych względem dru-gich otrzymujemy opis tego powiązania we współrzędnych geograficznych (θ, ϕ), to znaczywartość (635) współczynników koneksji:

Γθϕϕ = − sin θ cos θ , Γϕθϕ = Γϕϕθ = ctg θ ,

przy czym pozostałe znikają. Ortodroma, to linia spełniająca równania (646), to znaczy:

θ = ϕ2 sin θ cos θ ,

ϕ = −2ϕθ ctg θ .

7.4 Ważny przykład przestrzeni z powiązaniem: opis ruchu wukładzie nieinercjalnym

NiechM będzie czterowymiarową czasoprzestrzenią Galileusza, tzn. przestrzenią afiniczną,wyposażoną w strukturę czasu absolutnego, to znaczy funkcję liniową t. Jako przestrzeńafiniczna, nosi ona na sobie trywialną (płaską) strukturę powiązania. Układy inercjalneto liniowe układy współrzędnych. Niech będzie dany liniowy układ współrzędnych (yµ),µ = 0, 1, 2, 3, zgodny ze strukturą czasu, tzn. taki że y0 = t. Współrzędne przestrzenne(yk), k = 1, 2, 3); można traktować jak współrzędne kartezjańskie punktu y w trójwy-miarowej przestrzeni Euklidesowej, wyposażonej w płaską metrykę gkl = δkl. Rozważmy

231

Page 238: Rozn. Geom_ - Jerzy Kijowski

teraz nieinercjalny układ współrzędnych (xµ) = (x0,x), związany z układem inercjalnymnastępującą transformacją:

y0 = x0 = t , (653)

y = r(t) +O(t)x , (654)

gdzie O(t) jest zależną od czasu transformacją obrotu przestrzeni euklidesowe, zaś r(t)opisuje ruch środka tego obrotu. Transformacja odwrotna wygląda następująco:

x0 = y0 = t , (655)

x = O−1(t) (y − r(t)) . (656)

Obliczmy teraz współczynniki tej koneksji w układzie nieinercjalnym. Zauważmy po pierw-sze, że

∂x0

∂yλ= δ0λ ,

zatem:

Γ0µν =∂x0

∂yλ∂2yλ

∂xµ∂xν=∂x0

∂y0∂2y0

∂xµ∂xν= 0 ,

bowiem y0 jest funkcją liniową (patrz (653)), więc jej drugie pochodne znikają. Również

Γmkl =∂xm

∂yn∂2yn

∂xk∂xl= 0 ,

bowiem zgodnie z (654) przestrzenne składowe (yn) zależą liniowo od przestrzennych skła-dowych (xk), zatem drugie pochodne znikają tożsamościowo. Wobec tego jedyne nietry-wialne współczynniki koneksji to Γk00 oraz Γ

k0l. Jeśli zatem rozważamy trajektorię:

R ⊃ ]a, b[ ∋ t→ (xµ(t)) = (t,x(t)) ,

to zerowa składowa przyśpieszenia zeruje się:

a0 = x0 + Γ0µν xµxν .

Natomiast jego składowe przestrzenne:

ak = xk + Γkµν xµxν = xk + Γk00x

0x0 + 2Γk0lx0xl = xk + Γk00 + 2Γ

k0lxl ,

ponieważ x0 = 1. Można to zapisać macierzowo:

a = x + Γ+ 2Uv ,

gdzie wektor Γ ma składowe Γk00, macierz U ma elementy macierzowe Γk0l, zaś wektor

prędkości v ma składowe xl.

232

Page 239: Rozn. Geom_ - Jerzy Kijowski

Zanim przystąpimy do rachunków przypomnijmy proste fakty z trójwymiarowej geo-metrii euklidesowej. Macierz obrotu zachowuje metrykę, czyli:

OijδikOkl = δjl ,

co w notacji macierzowej oznacza, iż transpozycja zamienia macierz O w odwrotną:

OTO = I ⇐⇒ OT = O−1 .

Natomiast fakt, iż cała rodzina obrotów O(t) zachowuje iloczyn skalarny:

(O(t)v|O(t)u) = (v|u)

po zróżniczkowaniu względem czasu implikuje:

0 =(O(t)v

∣∣∣O(t)u)+(O(t)v

∣∣∣O(t)u)=(OT (t)O(t)v

∣∣∣u)+(v∣∣∣OT (t)O(t)u

),

=(O−1(t)O(t)v

∣∣∣u)+(v∣∣∣O−1(t)O(t)u

)=(v∣∣∣(AT + A

)u),

gdzie oznaczyliśmy A := O−1O. Wynika stąd, że AT + A = 0, czyli AT = −A. Zatemmacierz A jest antysymetryczna. Oznaczając

A := O−1O =

0 −Ωz Ωy

Ωz 0 −Ωx−Ωy Ωx 0

, (657)

widzimy, że A(t)x = Ω(t)×x. Wektor Ω(t) nazywa się chwilową prędkością kątową naszegoukładu nieinercjalnego. Teraz już możemy przystąpić do obliczeń. Różniczkując (654) poczasie mamy:

∂y∂x0

= r+ Ox = r+O (Ω× x) ,∂2y∂x0∂x

= O ,

∂2y∂x0∂x0

= r+ O (Ω× x) +O(Ω× x

)= r+O

(Ω× (Ω× x) + Ω× x

),

∂x∂y= O−1 .

Ale y0 jest funkcją liniową, więc jej drugie pochodne znikają. Zatem

Γkµν =∂xk

∂yλ∂2yλ

∂xµ∂xν=∂xk

∂ym∂2ym

∂xµ∂xν.

W notacji macierzowej mamy więc:

(Γk00

)= Γ =

∂x∂y

∂2y∂x0∂x0

= O−1r+Ω× (Ω× x) + Ω× x , (658)

(Γk0lx

l)= Uv =

∂x∂y

∂2y∂x0xv = O−1Ov = Ω× v , (659)

233

Page 240: Rozn. Geom_ - Jerzy Kijowski

a w notacji wskaźnikowej:

Γk00 =(O−1

)klrl +

(AkmA

ml + A

kl

)xl , (660)

Γk0l = Akl . (661)

Ostatecznie otrzymujemy klasyczny wzór:

a = x +O−1r+Ω× (Ω× x) + Ω× x + 2Ω× v . (662)

Składnik O−1r jest przyspieszeniem ruchu środka układu r, przeliczonym do układu poru-szającego się. Właśnie to przyśpieszenie odczuwamy, gdy pociąg, poruszając się po prostej,przyspiesza lub hamuje. Składnik Ω× (Ω× x) nazywa się przyspieszeniem dośrodkowym,które odczuwamy gdy pociąg jedzie po łuku. Składnik Ω×x jest efektem działania przyspie-szenia kątowego, odczuwalnym, gdy w czasie jazdy po łuku pociąg zwalnia lub przyspiesza.Zaś proporcjonalny do prędkości składnik 2Ω × v nazywa się przyspieszeniem Coriolisa.Siedząc w fotelu nie odczuwamy go, bo wtedy v = 0. Zauważymy ten składnik dopierotocząc kulki po podłodze wagonu.

7.5 Krzywizna

Patrząc na skomplikowaną postać współczynników powiązania (652) w zwykłej przestrze-ni euklidesowej lub zapisane przy ich pomocy równania (651), lub też oglądając postaćwspółczynników koneksji (658) – (661), trudno byłoby odgadnąć, że opisują one przestrzeńpłaską a w niej zwykłe linie proste. Wiemy, że cała komplikacja wzięła się z użycia krzywo-liniowego (nieinercjalnego) układu współrzędnych i natychmiast zniknie, jeśli przeliczymywszystko do układu prostoliniowego. Zachodzi pytanie: czy istnieje jakieś kryterium, któ-re pozwoliłoby odróżnić takie „pozorne”, współrzędniowe nieliniowości od prawdziwych,związanych z prawdziwym zakrzywieniem badanej przestrzeni.Takiego kryterium dostarcza pojęcie tensora krzywizny który stanowi prawdziwą

miarę odchylenia badanej struktury powiązania na przestrzeni M od „płaskości”.Gdyby przestrzeń była płaska w jakimś otoczeniu punktu x ∈ M , to istniałby w tym

otoczeniu układ współrzędnych realizujący warunek znikania współczynników powiązaniaΓmkl ≡ 0. Zatem dowodu na „płaskość” przestrzeni dostarczylibyśmy, gdyby udało się nam„wyzerować” współczynniki koneksji w całym otoczeniu punktu x przechodząc do współ-rzędnych prostoliniowych – jeśli takie istnieją. Tymczasem umiemy jedynie wyzerowaćte współczynniki w jednym punkcie przechodząc do lokalnego układu inercjalnego w tympunkcie.Odłóżmy na razie ambitny cel wyzerowania współczynników Γ w całym otoczeniu punk-

tu x, i spróbujmy zbliżać się do tego celu „metodą kolejnych przybliżeń”, poprzez wyzero-wanie prznajmniej ich pochodnych w tym punkcie. Wprowadzimy następujące oznaczenie:

Γmkln := ∂nΓmkl . (663)

234

Page 241: Rozn. Geom_ - Jerzy Kijowski

Jeśli zatem w układzie współrzędnych (xk) zachodzi Γmkl(x) = 0, natomiast Γmkln(x) 6= 0, to

zobaczmy, czy istnieje układ współrzędnych (ya), w którym defekt ten zostałby naprawiony,to znaczy taki, w którym zachodzi Γabc(x) = 0, oraz Γ

abcd(x) = 0.

Warunek znikania współczynników koneksji w punkcie x oznacza, że oba układy współ-rzędnych są inercjalne, czyli są sobie równoważne w tym punkcie. Oznacza to, że wszystkiedrugie pochodne zerują się w tym punkcie: ∂

2xm

∂yb∂yc(x) = 0 oraz ∂2ya

∂xk∂xl(x) = 0. Działając na

prawo transformacyjne (644), czyli:

Γabc =∂ya

∂xm∂xk

∂yb∂xl

∂ycΓmkl +

∂ya

∂xm∂2xm

∂yb∂yc, (664)

operatorem różniczkowym „∂d = ∂xn

∂yd∂n” i uwzględniając fakt, że wszystkie drugie pochodne

zerują się, otrzymujemy w tym punkcie następującą zależność

Γabcd = ∂dΓabc =

∂ya

∂xm∂xk

∂yb∂xl

∂yc∂xn

∂yd∂nΓmkl +

∂ya

∂xm∂3xm

∂yb∂yc∂yd

=∂ya

∂xm

(∂xk

∂yb∂xl

∂yc∂xn

∂ydΓmkln +

∂3xm

∂yb∂yc∂yd

). (665)

Trzecie pochodne starych współrzędnych po nowych są całkowicie do naszej dyspozycji.Zatem wybierając je odpowiednio możemy wyzerować wiele! Ale czy wszystko?Niestety nie, bowiem tablica trzecich pochodnych ∂3xm

∂yb∂yc∂ydjest symetryczna, zaś prze-

widziana do „unicestwienia” tablica Γmkln wcale nie musi być symetryczna. Konkluzja jestzatem następująca: możemy wyzerować jedynie część całkowicie symetryczną tablicy Γmklnzłożonej z pochodnych współczynników koneksji, ale reszta pozostanie!Omówimy nieco dokładniej tę sprawę. Dla dowolnej tablicy Qi1,...,is oznacza się jej część

całkowicie symetryczną w następujący sposób:

Q(i1,...,is) :=1s!

σ∈SsQσ(1),...,σ(s) . (666)

W szczególności dla s = 3 będziemy oznaczać:

Γm(kln) :=16(Γmkln + Γ

mnkl + Γ

mlnk + Γ

mnlk + Γ

mlkn + Γ

mknl) . (667)

Ale∂xk

∂y(b∂xl

∂yc∂xn

∂yd)Γmkln =

∂xk

∂yb∂xl

∂yc∂xn

∂ydΓm(kln) , (668)

ponieważ permutowanie wskaźników (b, c, d) można implementować permutowaniem odpo-wiadających im wskaźników (k, l, n). Wobec tego formuła (665) implikuje:

Γa(bcd) =∂ya

∂xm

(∂xk

∂yb∂xl

∂yc∂xn

∂ydΓm(kln) +

∂3xm

∂yb∂yc∂yd

), (669)

235

Page 242: Rozn. Geom_ - Jerzy Kijowski

bo trzecie pochodne są już symetryczne i ich symetryzacja nic nie zmienia. Odejmując(669) od (665) widzimy, że te trzecie pochodne odejmują się:

Γabcd − Γa(bcd) =∂ya

∂xm∂xk

∂yb∂xl

∂yc∂xn

∂yd

(Γmkln − Γm(kln)

). (670)

Zatem cała dowolność w wyborze układu współrzędnych, przy pomocy której mieliśmynadzieję na wyzerowanie pochodnych Γabcd znikła. Jeśli występuje nie-symetryczna częśćpochodnych współczynników koneksji Γmkln − Γm(kln) to jest ona jest niezniszczalna! Rzeczy-wiście, powyższy wzór wygląda jak prawo transformacyjne (591) dla składowych tensora1-kontrawariantnego oraz 3-kowariantnego. Jeśli obiekt ten nie znika w jakimś (inercjal-nym!) układzie współrzędnych to nie znika w żadnym innym. W takim przypadku nieistnieje w otoczeniu punktu x układ współrzędnych, w którym współczynniki koneksji zni-kałyby nie tylko w punkcie, lecz w całym otoczeniu, zatem przestrzeń nie jest płaska! Miarąodstępstwa od płaskości jest właśnie powyższy obiekt.Definicja 1: Tensorem krzywizny rozmaitości z powiązaniem (M,Υ) nazywamy tensor

1-kontra- oraz 3-kowariantny, którego składowe w dowolnym układzie inercjalnym wyrażająsię wzorem:

Kmkln := Γmkln − Γm(kln) . (671)

Lemat: Składowe tensora krzywizny są: 1) symetryczne w pierwszych dwóch dolnychwskaźnikach:

Kmkln = Kmlkn , (672)

natomiast: 2) ich całkowicie symetryczna część znika tożsamościowo:

Km(kln) = Γm(kln) − Γm(kln) = 0 . (673)

Powyższa tożsamość nosi nazwę tożsamości Bianchi’ego pierwszego rodzaju. Można jąprzepisać w następujący sposób:

0 = Km(kln) =16(Kmkln +K

mnkl +K

mlnk +K

mnlk +K

mlkn +K

mknl)

=13(Kmkln +K

mnkl +K

mlnk) , (674)

bowiem na mocy symetrii (672) wyrazy występujące w sumie sześciu wyrazów są paramirówne.Definicję tensora krzywizny podaną powyżej należy rozumieć w ten sposób, że gdy

(xk) nie jest układem inercjalnym, to najpierw trzeba znaleźć współrzędne Kabcd w jakimśukładzie inercjalnym (ya) a potem należy je przetransformować do pierwotnego układu tak,jak transformują się składowe tensora. Cała procedura nie zależy od wyboru układu (ya)inercjalnego, bowiem formuła (670) oznacza, że między układami inercjalnymi zachodzi itak transformacja tensorowa. Wychodząc z tej definicji znajdziemy teraz uniwersalny wzórna tensor krzywizny, obowiązujący już w dowolnym układzie współrzędnych, niekoniecznieinercjalnym.

236

Page 243: Rozn. Geom_ - Jerzy Kijowski

Twierdzenie 1: Zachodzi uniwersalny wzór wyrażający składowe tensora krzywiznypoprzez współczynniki koneksji oraz ich pochodne:

Kmkln = ∂nΓmkl + Γ

jklΓmnj −

(∂(nΓmkl) + Γ

j(klΓ

mn)j

)(675)

Dowód: Jako pomocniczy układ inercjalny (ya) wybierzmy najprostszy, polegający nadeformacji naszego układu (xk) zgodnie z wzorem (641), to znaczy:

ym := xm +12Γm

kl (xk − xk)(xl − xl) ,

gdzie (xk) oznaczają wartość współrzędnych naszego punktu x zaśΓm

kl oznaczają wartość

współczynników koneksji w tym punkcie:Γm

kl= Γmkl(x). Zachodzi:

∂ym

∂xk= δmk +

Γm

kl (xl − xl) =⇒

∂xn

∂ym(x) = δnm ;

∂ym

∂xn(x) = δmn , (676)

∂2ym

∂xk∂xl=

Γm

kl =⇒∂3ym

∂xk∂xl∂xn= 0 . (677)

Na mocy tożsamości (638) mamy

∂2xn

∂yb∂ya(x) = −

(∂xn

∂yc∂xl

∂yb∂2yc

∂xl∂xk∂xk

∂ya

)(x) =

Γn

ba . (678)

Po takim przygotowaniu wystarczy skorzystać z prawa transformacyjnego (644) dlawspółczynników koneksji:

Γmkl =∂xm

∂ya∂yb

∂xk∂yc

∂xlΓabc +

∂xm

∂ya∂2ya

∂xk∂xl, (679)

gdzie przez Γabc oznaczyliśmy ich wartości w układzie współrzędnych (ya). Podziałamy

teraz na obie strony operatorem różniczkowania ∂∂xn= ∂y

d

∂xn∂∂ydi obliczymy otrzymaną w ten

sposób pochodną w punkcie x. Ale w tym — na pierwszy rzut oka bardzo skomplikowanym— wyrażeniu bardzo wiele członów znika, bowiem zachodzi: 1) Γabcd(x) = 0 bo układ (y

a)jest w tym punkcie inercjalny, oraz: 2) ∂3ym

∂xk∂xl∂xn= 0. Pozostają zatem jedynie dwa człony,

które łatwo się upraszczają na mocy tożsamości (676) – (678):

Γmkln(x) =∂xm

∂ya∂yb

∂xk∂yc

∂xl∂yd

∂xnΓabcd(x) +

(∂yd

∂xn∂2xm

∂yd∂ya∂2ya

∂xk∂xl

)(x)

= Γmkln(x)−Γm

na

Γa

kl .

A zatem w naszym punkcie x zachodzi następująca tożsamość:

Γmkln + ΓjklΓmnj = Γ

mkln =

∂xm

∂ya∂yb

∂xk∂yc

∂xl∂yd

∂xnΓabcd .

237

Page 244: Rozn. Geom_ - Jerzy Kijowski

Nie ma ona znaczenia geometrycznego, bowiem zależy od bardzo szczególnego wyboruukładu współrzędnych (ya). Ale, jak wiemy z rozważań poprzedzających definicję tensorakrzywizny, zależna od tego wyboru jest jedynie część całkowicie symetryczna. Po jej odjęciupozostaje nam nam właśnie uniwersalny wzór na krzywiznę, zgodnie z formułą:

Γm(kln) + Γj(klΓ

mn)j =

∂xm

∂ya∂yb

∂xk∂yc

∂xl∂yd

∂xnΓa(bcd) ;

Γmkln + ΓjklΓmnj −

(Γm(kln) + Γ

j(klΓ

mn)j

)=

∂xm

∂ya∂yb

∂xk∂yc

∂xl∂yd

∂xn

(Γabcd − Γa(bcd)

)

=∂xm

∂ya∂yb

∂xk∂yc

∂xl∂yd

∂xn(Kabcd) (680)

= Kmkln

Ostatnią równość mogliśmy napisać dlatego, iż formuła (680) realizuje właśnie naszą defi-nicję: 1) oblicz tensor krzywizny w dowolnym układzie inercjalnym, a następnie: 2) prze-transformuj jego składowe tensorowo do twojego układu współrzędnych (xk). A zatemuniwersalna formuła na składowe tensora krzywizny wygląda następująco:

Kmkln = Γmkln + Γ

jklΓmnj −

(Γm(kln) + Γ

j(klΓ

mn)j

), (681)

co jest równoważne tezie (675).

Zauważmy, że symetria: Kmkln = Kmlkn, oraz tożsamości Bianchi’ego: Km(kln) = 0, są

automatycznie zagwarantowane przez tę formułę.Nasze dotychczasowe rozważanie możemy podsumować w postaci następującego „wa-

runku koniecznego na płaskość przestrzeni”:Twierdzenie 2: Jeśli przestrzeń (M,Υ) jest płaska na obszarze O ⊂ M , tzn. jeśli

istnieje na tym obszarze układ współrzędnych (xk) który jest wszędzie inercjalny, to tensorkrzywizny znika tożsamościowo na tym obszarze.Dowód: Jeśli układ jest wszędzie inercjalny, to składowe koneksji wyliczone w tym

obszarze znikają tożsamościowo. Znikają zatem również ich pochodne, zatem na mocy(681) zachodzi również Kmkln ≡ 0.

Jak się okaże w paragrafie 7.7, znikanie tensora krzywizny jest również warunkiem do-statecznym na płaskość. Dowód tego faktu będzie polegał po prostu na konstrukcji układuwspółrzędnych, w którym współczynniki koneksji znikają tożsamościowo.

Tensor Riemanna: Przedstawimy teraz inną, równoważną miarę „odstęptwia od płasko-ści”. Sposób ten polega na użyciu antysymetryzacji tensora krzywizny w dwu ostatnichwskaźnikach:Definicja 2: Tensorem Riemanna nazywamy wielkość Rmkln

Rmkln := −2Kmk[ln] = −Kmkln +Kmknl . (682)

Z definicji tej wynika, że jest to tensor antysymetryczny w dwu ostatnich wskaźni-kach:

Rmkln = −Rmknl . (683)

238

Page 245: Rozn. Geom_ - Jerzy Kijowski

Okazuje się, że powyższa operacja nie traci żadnej informacji zawartej w tensorze krzy-wizny K, bowiem można go natychmiast odtworzyć:

−23Rm(kl)n = −2

3· 12(Rmkln +R

mlkn)

= −13(Kmknl −Kmkln +Kmlnk −Kmlkn)

= −13(Kmknl −Kmlkn +Kmnlk) +

13Kmkln

= −13(Kmknl +K

mlkn +K

mnlk) +

23Kmkln +

13Kmkln

= −Km(kln) +Kmkln = Kmkln .

Skorzystaliśmy tutaj z tożsamości Bianchiego (674) oraz z symetrii tensora krzywizny wdwóch pierwszych wskaźnikach. Te dwie zależności:

Rmkln = −2Kmk[ln] ; Kmkln = −23Rm(kl)n , (684)

pokazują, że K i R są dwiema – algebraicznie równoważnymi – reprezentacjami tego same-go obiektu. W szczególności znikanie jednego z nich jest równoważne znikaniu drugiego. Wnaszym wywodzie tensor K jest pierwotny jako miara „obstrukcji przeciw wyprostowaniuwspółrzędnych” nie tylko w jednym punkcie (co zawsze jest możliwe) lecz w całym otocze-niu tego punktu. Tensor Riemanna jest natomiast naturalną miarą tego, jak zmienia sięwektor po równoległym transporcie wzdłuż krzywej zamkniętej. W wywodach opartych nadefinicji powiązania jako transportu równoległego ten obiekt ma oczywiście pierwszeństwo.Wrócimy do tej sprawy w paragrafie 7.11.Skoro obiekty te są równoważne, to i tożsamość Bianchi’ego dla K powinna dać się

łatwo wyrazić w języku tensora R. I rzeczywiście, tożsamość ta oznacza po prostu znikanieczęści całkowicie antysymetrycznej tensora Riemanna zdefiniowanej w sposób analogicznydo symetryzacji (674):

Rm[kln] =16(Rmkln +R

mnkl +R

mlnk −Rmlkn − Rmnlk −Rmknl) (685)

=13(Rmkln +R

mnkl +R

mlnk) . (686)

Różnica polega na tym, że wkłady od poszczególnych permutacji są teraz uwzględnianieze znakiem permutacji. Podobnie jak tam, sześć członów odpowiadających sześciu permu-tacjom łączy się w pary, dzięki czemu wzór na część całkowicie antysymetryczną tensoraantysymetrycznego w dwóch wskaźnikach (686) wygląda podobnie jak wzór (674) na częśćcałkowicie symetryczną tensora symetrycznego w dwóch wskaźnikach. Zachodzi zatem:Twierdzenie 3: Zachodzi następująca tożsamość Bianchi’ego pierwszego rodzaju dla

tensora Riemanna: Rm[kln] = 0.

239

Page 246: Rozn. Geom_ - Jerzy Kijowski

Dowód:

Rm[kln] =13(Rmkln +R

mnkl +R

mlnk)

=13(−Kmkln +Kmknl −Kmnkl +Kmnlk −Kmlnk +Kmlkn)

= −Km(kln) +Km(knl) = 0

Definicja (682) w połączeniu z formułą (681) pozwala znaleźć składowe tensora Rie-manna w dowolnym układzie współrzędnych. Mamy bowiem:

Rmkln = −Kmkln +Kmknl= −Γmkln − ΓjklΓmnj +

(Γm(kln) + Γ

j(klΓ

mn)j

)+ Γmknl + Γ

jknΓmlj −

(Γm(knl) + Γ

j(knΓ

ml)j

)

= Γmknl − Γmkln + ΓjknΓmlj − ΓjklΓmnj ,

co można zapisać w postaci uniwersalnej formuły:

Rmkln = ∂lΓmkn − ∂nΓmkl + ΓmjlΓjkn − ΓmjnΓjkl . (687)

W inercjalnym układzie współrzędnych współczynniki koneksji zerują się i powyższy wzórredukuje się do następującej formuły: Rmkln = ∂lΓ

mkn−∂nΓmkl, równoważnej naszej pierwotnej

definicji (671).

7.6 Normalny układ współrzędnych

Równanie ortodromy (646) jest równaniem zwyczajnym drugiego rzędu, zatem ma jedynerozwiązanie dla ustalonych warunków początkowych: (xm(0)) = x ∈ M oraz (xm(0)) =v ∈ TxM . Rozwiązanie to jest krzywą sparametryzowaną, którą oznaczymy przez γx,v:

R ⊃]a, b[∋ t→ (xm(t)) = γx,v(t) ∈ M .

Rozwiązanie to może nie istnieć globalnie, a jedynie lokalnie, w otoczeniu zera.Pokażemy, że ortodromy wychodzące z tego samego punktu, ale odpowiadające wekto-

rom proporcjonalnym do siebie, różnią się jedynie parametryzacją, natomiast przebiegajątę samą krzywą niesparametryzowaną.Lemat 1: Dla dowolnej liczby c ∈ R zachodzi tożsamość:

γx,cv(t) = γx,v(ct) . (688)

Dowód: W języku współrzędnych mamy: γx,v(ct) = (xm(ct)). Kładąc τ = ct mamyddt= c d

dτ, oraz: d

2

dt2= c2 d

2

dτ2. Zatem

0 =

(d2xm

dτ 2+ Γmkl(x(τ))

dxk

dτdxl

)∣∣∣∣∣τ=ct

= c2(d2

dt2xm(ct) + Γmkl(x(ct))

ddtxk(ct)

ddtxl(ct)

)

240

Page 247: Rozn. Geom_ - Jerzy Kijowski

co dowodzi, że krzywa sparametryzowana t → γx,v(ct) jest ortodromą. Ale jej wektorstyczny jest c-razy dłuższy niż wektor styczny do krzywej γx,cv(t), bowiem:

ddt(γx,v(ct)) = cγx,v(ct) ,

zatem ddtγx,v(0) = cγx,v(0) = cv. Teza wynika zatem z jednoznaczności rozwiązania wa-

runku początkowego dla równania ortodromy.

Korzystając z jednoznaczności ortodromy można konstruować specjalne układy współ-rzędnych w rozmaitości z powiązaniem (M,Υ), zwane układami normalnymi. W tym celuzdefiniujmy odwzorowanie:

TxM ∋ v→ exp(v) := γx,v(1) ∈M . (689)

Na mocy poprzedniego Lematu mamy: γx,tv(1) = γx,v(t), co można zapisać w następującysposób:Lemat 2:

exp(tv) = γx,v(t) . (690)

Wybierzmy dowolną bazę (e1, . . . , en) w przestrzeni stycznej i rozważmy odwzorowanie:

Rn ⊃ O ∋ (ya)→ exp(yaea) ∈M ,

które spełnia warunek exp(0) = x. Jeśli (xk) jest jakimkolwiek układem współrzędnych wotoczeniu naszego punktu x to oznaczając

exp(yaea) =(xk(ya)

),

mamy:∂xk

∂yb(0) =

(∂

∂ybexp(yaea)

)(0) = eb = e kb

gdzie e kb są składowymi wektora eb, tzn. eb = ekb∂∂xk. Ponieważ wektory te są liniowo

niezależne, macierz(∂xk

∂yb(0))jest odwracalna. Zatem (ya) stanowią dobry układ współ-

rzędnych w otoczeniu punktu x. Układy skonstruowane w ten sposób nazywamy układaminormalnymi a odpowiednie współrzędne — współrzędnymi normalnymi wokół x.Lemat 3: Współrzędne normalne wokół x są inercjalne w tym punkcie.Dowód: Rozważmy linię „prostą” w tych współrzędnych, daną równaniem ya(t) = t·va,

tzn.:t→ (ya)(t) = (t · va) = exp(tv) .

Na mocy Lematu 2 krzywa ta jest ortodromą, zatem we współrzędnych (ya) spełnia rów-nanie

0 = ya + Γabc(t · va)ybyc = Γabc(t · va)vbvc . (691)

W szczególności w punkcie t = 0 mamy

Γabc(0)vbvc ≡ 0 ,

241

Page 248: Rozn. Geom_ - Jerzy Kijowski

dla dowolnego wektora v = va ∂∂ya. Używając wzoru na polaryzację formy kwadratowej

(stosowanej już raz w tym wykładzie w postaci wzoru (443)) mamy:

0 = Γabc(0)(ub + vb)(uc + vc)− Γabc(0)(ub − vb)(uc − vc)

=14Γabc(0)u

bvc

dla dowolnych dwu wektorów u = ua ∂∂yai v = va ∂

∂ya. Czyli Γabc(0) = 0.

Zatem współrzędne normalne są układem inercjalnym, „utkanym” z ortodrom. Zaś wzór(691), po pomnożeniu przez t2 i podstawieniu tvd = yd, wygląda następująco:

Γabc(yd)ybyc ≡ 0 . (692)

7.7 Znikanie tensora krzywizny jako warunek dostateczny pła-skości

Twierdzenie: Jeśli tensor krzywizny znika w obszarze określoności O współrzędnych nor-malnych (ya), to zachodzi w tym obszarze równość: Γabc(y

a) ≡ 0, czyli współrzędne te sąinercjalne w każdym punkcie tego obszaru.Widzimy więc, że każdy odcinek dowolnej ortodromy przechodzący przez O spełnia

w tym układzie współrzędnych równanie ya = 0, czyli jest funkcją liniową parametru t.Zatem ortodromy zachowują się w tym obszarze jak linie proste w płaskiej przestrzeni Rn.Mówimy, że O jest podzbiorem płaskiej przestrzeni lub po prostu jest płaski.Dowód: Różniczkując tożsamość (692), spełnianą przez współrzędne normalne otrzy-

mujemy:∂d(Γabc(y

a)ybyc)= ∂dΓabc(y

a)ybyc + 2Γabd(ya)yb ≡ 0 . (693)

Podstawiając znów tva = ya i wracając do oznaczenia ∂dΓabc = Γabcd, mamy:

Γabcd(tva)vbvc +

2tΓabd(tv

a)vb ≡ 0 . (694)

Na mocy wzoru (681), wyrażającego składowe tensora krzywizny w dowolnym układziewspółrzędnych, jego znikanie implikuje tożsamość:

0 = vbvcKabcd(tva) = vbvc

(Γabcd − Γa(bcd) + ΓebcΓade − Γe(bcΓad)e

)(tva) . (695)

Jednak na mocy (674) mamy:

Γabcd − Γa(bcd) =23Γabcd −

13Γacdb −

13Γadbc ,

ΓebcΓade − Γe(bcΓad)e =

23ΓebcΓ

ade −13ΓecdΓ

abe −13ΓedbΓ

ace .

Zatem w punktach naszej ortodromy ya = tva mamy:

0 = 3vbvcKabcd(tva) = vbvc (2Γabcd − Γacdb − Γadbc + 2ΓebcΓade − ΓecdΓabe − ΓedbΓace) (tva) .

242

Page 249: Rozn. Geom_ - Jerzy Kijowski

Uwzględniając teraz znikanie czwartego członu na mocy (691) oraz wstawiając tożsamość(694) otrzymujemy:

0 = −4tvbΓabd(tv

a)− 2vbvcΓacdb(tva)− 2vbvcΓedbΓace(tva) . (696)

Oznaczmy teraz przez A(t) następującą funkcję zmiennej t o wartościach macierzowych:

Aad(t) := vbΓabd(tv

a) .

Widać, że

Aad(t) =ddtAad(t) = v

bvc∂cΓabd(tva) = vbvcΓabdc(tv

a) .

Zatem równanie (696) można przepisać następująco:

Aad(t) +2tAad(t) + A

ae(t)A

ed(t) = 0 ,

lub, w notacji macierzowej:

A+2tA+ A · A = 0 . (697)

Wiemy nawet, że spełniony jest warunek początkowy: A(t) = 0. Chcemy wykazać, żerozwiązanie tego równania znika tożsamościowo: A(t) ≡ 0. Niestety, nie możemy stosowaćtwierdzenia o rozwiązalności zagadnienia Cauchy’ego w równaniach zwyczajnych, bowiemw punkcie t = 0 równanie jest osobliwe i nie są spełnione założenia tego twierdzenia. Tymniemniej zachodzi fakt, który wykażemy później, a mianowicie:Lemat 1: Jedyne rozwiązanie równania (697), które jest różniczkowalne w sposób cią-

gły, znika tożsamościowo.

Na mocy powyższego Lematu mamy vbΓabc(tva) ≡ 0. Można to zapisać w postaci:

ybΓabc(ye) ≡ 0 .

Działając teraz operatorem ∂d otrzymamy:

ybΓabcd(ye) + Γadc(y

e) ≡ 0 ,

lub, po podzieleniu przez t:

vbΓabcd(tve) = −1

tΓadc(tv

e) .

Skorzystamy teraz ponownie ze znikania tensora krzywizny w następującej konfiguracji:

0 = 3vdKabcd(tva) = vd (2Γabcd − Γacdb − Γadbc + 2ΓebcΓade − ΓecdΓabe − ΓedbΓace) (tva)

= vd (2Γabcd − Γacdb − Γadbc) (tva) = 2ddtΓabc(tv

e) +2tΓabc(tv

e)

=2t

ddt(tΓabc(tv

e)) .

243

Page 250: Rozn. Geom_ - Jerzy Kijowski

Wynika stąd, że tΓabc(tve) jest stała na całych promieniach. Ale, ponieważ znika w zerze,

ostatecznie otrzymujemy tezę: Γabc ≡ 0.

Do kompletu brakuje nam zatem jedynie dowodu Lematu. Potrzebne nam będzie przy-gotowanie algebraiczne. Wybierzmy jakąkolwiek normę ‖ · ‖ w przestrzeni macierzy kwa-dratowych Rnn. Przykładów jest wiele: 1) suma modułów elementów macierzowych, 2) ichmaksymalna wartość 3) pierwiastek z sumy ich kwadratów i wiele innych. Ponieważ „kulajednostkowa”, czyli zbiór

K(0, 1) := A ∈ Rnn : ‖A‖ ¬ 1 ,

jest zwarta a mnożenie macierzy jest operacją ciągłą, więc funkcja ‖A2‖ osiąga na tymzbiorze maksimum, które oznaczmy literą L > 0. Zachodzi więc nierówność

∥∥∥∥∥A

‖A‖· A

‖A‖

∥∥∥∥∥¬ L ,

lub, równoważnie,

‖A2‖ ¬ L‖A‖2 ⇐⇒ L‖A2‖ ¬ L‖A‖ · L‖A‖ .

Widać więc, że przeskalowana norma ‖ · ‖ := L‖ · ‖ spełnia nierówność:

‖A · A‖ ¬ ‖A‖2 . (698)

Przeprowadzimy teraz dowód, w którym posłużymy się taką „dobrze przeskalowaną”normą macierzy.Dowód Lematu: Choć wiemy skądinąd, że A(0) = 0, to fakt ten wynika również z

samego równania (697). Jeśli bowiem funkcja A(t) jest różniczkowalna w sposób ciągły wotoczeniu zera, to pierwszy i trzeci wyraz są ciągłe, zatem również drugi wyraz zawierającyA(t)tmusi być ciągły. Stąd musi być A(0) = 0, a jeśli tak, to różniczkowalna w sposób ciągły

funkcja musi w otoczeniu zera spełniać nierówność:

‖A(t)‖ ¬ C|t| . (699)

Zauważmy, że równanie (697) można przepisać w następującej, równoważnej postaci:

1t2ddt

(t2A

)+ A · A = 0 ⇐⇒ d

dt

(t2A

)= −t2A · A , (700)

lub jeszcze inaczej:

t2A(t) = −∫ t

0

τ 2A(τ) · A(τ)

dτ . (701)

Wobec tego, po uwzględnieniu (699), ma miejsce nierówność:

‖t2A(t)‖ ¬ =∫ t

0‖τ 2A(τ) ·A(τ)‖dτ ¬

∫ t

0C2|τ |4dτ = 1

5C2|t|5 ,

244

Page 251: Rozn. Geom_ - Jerzy Kijowski

lub, równoważnie:

‖A(t)‖ ¬ 15C2|t|3 ¬ C2|t|3 .

Ograniczając się np. do odcinka |t| ¬ 1 mamy zatem:

‖A(t)‖ ¬ C2|t|2 . (702)

Stosując rozumowanie indukcyjne pokażemy, że dla dowolnego k ∈ N zachodzi na tymodcinku nierówność

‖A(t)‖ ¬ (C|t|)2k . (703)

I rzeczywiście, stosując (703) jako założenie indukcyjne, otrzymamy na mocy (701):

|t|2‖A‖ = ‖t2A(t)‖ ¬∫ t

0‖τ 2A(τ) · A(τ)‖dτ ¬

∫ t

0(C|τ |)22k |τ |2dτ

=1

22k + 3(C|t|)22k |t|3 ¬ (C|t|)22k |t|2 ,

czyli nierówność (703), w której k zostało zamienione na 2k. Wobec tego przynajmniej naodcinku |t| ¬ ǫ = min1, 1

2C jest spełniona nierówność:

‖A(t)‖ ¬ 122k

, (704)

dla dowolnego k ∈ N, zatem A(t) ≡ 0 na tym odcinku. Jednak, poza tym odcinkiemrównanie (700) jest już regularne i można stosować twierdzenie o jednoznaczności rozwią-zania zagadnienia początkowego. Wynika stąd, że A(t) musi znikać wszędzie, jako jedynerozwiązanie problemu początkowego A(ǫ) = 0 lub A(−ǫ) = 0 dla tego równania.

7.8 Pochodna kowariantna i transport równoległy

Niech

X := Xa∂

∂ya= Xk

∂xk(705)

będzie polem wektorowym określonym w otoczeniu O punktu x ∈ M . Jak stwierdziliśmyjuż w rozdziale 3.3 (por. wzór (154)) pochodne składowych pola nie mają już charakterutensorowego. Mamy bowiem

∂ybXa =

∂xl

∂yb∂

∂xl

(Xk

∂ya

∂xk

)=∂xl

∂yb

(∂

∂xlXk

)∂ya

∂xk+∂xl

∂yb∂2ya

∂xl∂xkXk .

Działając na obie strony macierzami odwrotnymi do macierzy ∂xl

∂yboraz ∂y

a

∂xkotrzymujemy:

∂yb

∂xl

(∂

∂ybXa)∂xk

∂ya=

∂xlXk +

∂xk

∂ya∂2ya

∂xl∂xjXj . (706)

245

Page 252: Rozn. Geom_ - Jerzy Kijowski

Widzimy, że macierz ∂∂ybXa pochodnych cząstkowych składowych pola transformuje się

przy przejściu do nowego układu współrzędnych w sposób niejednorodny i nie ma żadnejinterpretacji tensorowej.Jeśli jednak przestrzeń M jest wyposażona w strukturę powiązania, to możemy uznać,

że „prawdziwe” (czyli tzw. „kowariantne”) pochodne, to te, które liczymy w lokalnymukładzie inercjalnym, a lewą stronę powyższego wzoru traktujemy jako tensorowe prawotransformacji. Przyjmujemy więc, co następuje:Definicja 1: Pochodną kowariantną pola wektorowego X nazywamy tensor 1–kontra- i

1–kowariantny, którego składowe oznaczamy ∇lXk, a które w inercjalnym układzie współ-rzędnych są równe zwykłym pochodnym cząstkowym składowych tego pola.Niech więc współrzędne (ya) będą inercjalne w punkcie x. Wtedy wzór (706) daje nam

natychmiast następującą formułę dla obliczenia składowych ∇lXk w dowolnym, niekoniecz-nie inercjalnym układzie współrzędnych. Wykazaliśmy zatemTwierdzenie: Pochodna kowariantna pola wektorowego wyraża się w dowolnym ukła-

dzie współrzędnych wzorem:∇lXk = ∂lXk + ΓkljXj . (707)

Powyższe pojęcie pochodnej kowariantnej można uogólnić na przypadek dowolnego polatensorowego:Definicja 2: Pochodną kowariantną pola tensorowego T będziemy nazywać tensor

∇T o jednym wskaźniku kowariantnym więcej, którego składowe w inercjalnym układziewspółrzędnych są równe zwykłym pochodnym cząstkowym składowych tego pola:

∇cT a1a2...amb1b2...bn= ∂cT

a1a2...amb1b2...bn

,

natomiast w dowolnym (nieinercjalnym) układzie składowe tego tensora należy wyliczyć,transformując je z układu inercjalnego, podobnie jak to uczyniliśmy dla pola wektorowegostosując formułę (706).Wniosek: Pochodna kowariantna spełnia regułę Leibniza:

∇k (T ⊗ S) = (∇k T )⊗ S + T ⊗ (∇k S) , (708)

bowiem spełnia ją w układzie inercjalnym jako zwykła pochodna.

Przykład 1:Wyprowadzimy wzór na pochodną kowariantną pola kowektorowego (jedno-formy różniczkowej):

α = αidxi = αi∂xi

∂yadya = αadya .

W inercjalnym układzie współrzędnych (ya) pochodna kowariantna jednoformy jestrówna zwykłej pochodnej cząstkowej:

∂αa∂yb=

∂yb

(∂xi

∂yaαi

)=∂xi

∂ya∂αi∂yb+

∂2xi

∂yb∂yaαi .

246

Page 253: Rozn. Geom_ - Jerzy Kijowski

Natomiast składowe tej wielkości w dowolnym, nieinercjalnym układzie współrzędnych (xk)otrzymujemy przez zwykłą transformację tensorową:

∇nαm =∂yb

∂xn∂ya

∂xm∂bαa .

Podstawiamy do tego wyrażenia poprzedni wzór, otrzymując:

∇nαm =∂ya

∂xm∂yb

∂xn∂xi

∂ya∂αi∂yb+∂ya

∂xm∂yb

∂xn∂2xi

∂yb∂yaαi .

Korzystając z tożsamości (638), mianowicie:

∂2xi

∂yb∂ya= −∂x

i

∂yc∂xl

∂yb∂2yc

∂xl∂xk∂xk

∂ya=∂xl

∂ybΓikl

∂xk

∂ya,

otrzymujemy ostateczny wynik:

∇nαm = ∂nαm − Γinmαi . (709)

Składowe dowolnego tensora m–razy kontrawariantnego i n–razy kowariantnego możnawyrazić jako iloczyny składowych m wektorów kontrawariantych i n wektorów kowariant-nych. Na podstawie tego faktu można uogólnić wzory na pochodną kowariantną dla do-wolnego tensora m razy kontrawariantnego i n razy kowariantnego: każdemu wskaźnikowikontrawariantnemu towarzyszy dodatek taki, jak we wzorze (707): „+ΓkljX

j”, zaś każde-mu wskaźnikowi kowariantnemu towarzyszy dodatek taki, jak we wzorze (709): „−Γinmαi”.Można tę regułę zapisać w następujący, symboliczny sposób (por. (591)):

∇mT ...,k,... ...,l,... = ∂mT ...,k,... ...,l,... + T ...,n,... ...,l,...Γknm − T ...,k,... ...,n,...Γnlm + · · · (710)

Przykład 2: Obliczmy współrzędne pochodnej kowariantnej tensora 2-kowariantnego— na przykład tensora metrycznego w dowolnym układzie współrzędnych (xk). Jeśli (ya)jest układem inercjalnym, to mamy:

gkl =∂ya

∂xkgab

∂yb

∂xl,

gdzie gab są składowymi tensora w układzie inercjalnym. Aby znaleźć składowe ∇mgkl nale-ży obliczyć ∂

∂ycgab a następnie przetransformować je do naszego układu w sposób tensorowy.

A zatem:

∇mgkl =∂yc

∂xm∂ya

∂xk∂

∂ycgab

∂yb

∂xl=

∂yc

∂xm∂

∂yc

(∂ya

∂xkgab

∂yb

∂xl

)

− ∂ya

∂xkgab

∂2yb

∂xm∂xl− ∂2ya

∂xm∂xkgab

∂yb

∂xl

= ∂mgkl − gki∂xi

∂yb∂2yb

∂xm∂xl− ∂2ya

∂xm∂xk∂xi

∂yagil

= ∂mgkl − Γimkgil − Γimlgki . (711)

247

Page 254: Rozn. Geom_ - Jerzy Kijowski

Otrzymaliśmy w ten sposób szczególny przykład formuły (710).Przykład 3: Obliczmy pochodną kowariantną gęstości skalarnej

α = ρ · dx1 ∧ · · · ∧ dxn = ρ · J · dy1 ∧ · · · ∧ dyn = ρ · dy1 ∧ · · · ∧ dyn ,gdzie J = det

(∂x∂y

). Jeśli (ya) jest układem inercjalnym to

∇a ρ = ∂aρ = J∂aρ+ ρ∂aJ .

Transformacja tej gęstości kowektorowej do układu współrzędnych (xk) daje nam:

∇k ρ = det(∂y

∂x

)(∂ya

∂xk· ∇aρ

)= J−1 (J∂kρ+ ρ∂kJ) = ∂kρ− J∂kJ−1 .

Ale J−1 = det(∂y∂x

). Pochodne takiego wyznacznika liczyliśmy już w rozdziale. W szczegól-

ności możemy zastosować in extenso formułę (504), zamieniając jednak rolami współrzędnexk ze współrzędnymi ya, Otrzymamy w ten sposób:

∂xkdet

(∂y

∂x

)= det

(∂y

∂x

)· ∂x

m

∂ya

(∂2ya

∂xm∂xk

)= J−1Γmmk . (712)

Wstawiając ten wynik do poprzedniego wzoru otrzymujemy uniwersalny wzór na pochodnąkowariantną gęstości skalarnej:

∇k ρ = ∂kρ− ρΓmmk . (713)

Widzimy, że „ślad” tablicy współczynników koneksji mierzy odstępstwo czynnika objętości„dx1 ∧ · · · ∧ dxn” od stałości kowariantnej.

Definicja 3: Pochodną kowariantną pola T w kierunku wektora v = vk ∂∂xknazywamy

wielkość ∇vT : = vk∇kT . Pole tensorowe T nazywamy kowariantnie stałym wzdłuż krzy-wej γ jeśli jego pochodna kowariantna w kierunku jej wektora stycznego γ znika: ∇γT = 0.Przykładem jest wektor przyśpieszenia zdefiniowany wzorem (649), który możemy teraz

przepisać jako pochodną kowariantną wektora prędkości γ = v = xk ∂∂xkw kierunku tegoż

wektora prędkości:a = ∇vv . (714)

Zatem ortodroma, czyli krzywa o zerowym przyśpieszeniu a = 0 może być zdefiniowanajako taka krzywa, że jej wektor styczny jest wzdłuż niej stały (kowariantnie!).

Uwaga: Równanie ∇γT = 0 jest niezmiennicze względem reparametryzacji krzywej:zamiana jednego parametru na inny spowoduje jedynie wydłużenie lub skrócenie wekto-ra stycznego, zatem równanie pozostanie prawdziwe. Widać więc, że stałość pola wzdłużkrzywej nie zależy od jej parametryzacji.Jako równanie różniczkowe pierwszego rzędu na wartość składowych tensora wzdłuż

krzywej, pozwala ono jednoznacznie znaleźć wartość składowych tensora T (y) w punkciekońcowym y = γ(t) krzywej γ, gdy znamy jego wartość T (x) w punkcie początkowymx = γ(0). Tak wyliczony tensor T (y) nazywamy transportem równoległym tensora T (x)wzdłuż krzywej γ.

248

Page 255: Rozn. Geom_ - Jerzy Kijowski

7.9 Powiązanie według metody Koszula

Wzór (707) na pochodną kowariantną pola wektorowego implikuje następującą interpreta-cję współczynników koneksji: wartość Γkij jest równa k-tej składowej pochodnej kowariant-nej pola bazowego ∂j względem pola bazowego ∂i:

Γkij =⟨dxk;∇i∂j

⟩, (715)

lub równoważnie∇i∂j = Γkij∂k . (716)

Aby się o tym przekonać wystarczy zastosować wzór (707) do pola wektorowego ∂j = δnj ∂n,to znaczy podstawić w nim Xn = δnj .Stosując wymienione w poprzednim paragrafie własności pochodnej kowariantnej (wzór

Leibniza oraz to, że pochodna kowariantna skalara jest równa zwykłej pochodnej cząstko-wej) możemy przekształcić wzór (715) w następujący sposób:

Γkij =⟨dxk;∇i∂j

⟩= ∂i

⟨dxk; ∂j

⟩−⟨∇idxk; ∂j

= −⟨∇idxk; ∂j

⟩,

lub równoważnie∇idxk = −Γkijdxj . (717)

W ujęciu francuskiego matematyka Jean-Louis Koszul’a powiązanie jest po prostustrukturą pochodnej kowariantnej. Wtedy wzór (716) staje się definicją współczynnikówkoneksji. W takim ujęciu współczynniki te wcale nie musiałyby spełniać warunku syme-trii Γkij = Γ

kji. Takie niesymetryczne powiązanie odgrywa ważną rolę w pewnych działach

geometrii. Pojawia się ono w naturalny sposób jako powiązanie w wiązce wektorowej. Czy-telnik bardzo łatwo odgadnie uogólnienie wszystkich istotnych formuł niniejszego rozdziałuna przypadek niesymetryczny. Należy jednak zwrócić uwagę, że niesymetryczne powiązaniena rozmaitości nie jest obiektem nieredukowalnym: daje się wszak jednoznacznie rozłożyćna część symetryczną i antysymetryczną:

Γkij = Γk(ij) + Γ

k[ij] = Γ

kij +Q

kij .

Jak już wiemy, część antysymetryczna Qkij := Γk[ij] jest polem tensorowym jako różnica

dwóch koneksji. Natomiast wzór (644) na transformację współczynników koneksji pokazuje,że część symetryczna Γkij = Γ

k(ij) jest już zwykłą koneksją symetryczną. Zatem cała teoria

koneksji niesymetrycznej sprowadza się do teorii koneksji symetrycznej, wzmocnionej okilka prostych wzorów z analizy tensorowej. W niniejszym rozdziale ograniczamy się doprzypadku powiązania symetrycznego.

7.10 Tożsamości Bianchi’ego drugiego rodzaju

Tensor Riemanna spełnia ważną tożsamość różniczkową, zwaną tożsamością Bianchi’egodrugiego rodzaju.

249

Page 256: Rozn. Geom_ - Jerzy Kijowski

Twierdzenie 1: Zachodzi tożsamość:

∇sRlmnk +∇nRlmks +∇kRlmsn = 0 (718)

Dowód:Jeśli to równanie tensorowe jest spełnione w jakimkolwiek układzie współrzędnych, to

jest spełnione w każdym innym. Użyjemy zatem układu inercjalnego. W takim układziepochodne kowariantne są zwykłymi pochodnymi cząstkowymi. Składowe tensora Riemanasą dane wzorem (687). Korzystając ze znikania współczynników koneksji w danym punkcie(ale ich pochodnych — już nie!) oraz z symetrii drugich pochodnych cząstkowych, możemynapisać:

∇sRlmnk +∇nRlmks +∇kRlmsn= ∂s

(∂nΓlmk − ∂kΓlmn + ΓlanΓamk − ΓlakΓamn

)+ cycl(snk)

= ∂s∂nΓlmk − ∂s∂kΓlmn + ∂s(Γlan

)Γamk + ∂s (Γ

amk) Γ

lan + cycl(snk)

= ∂s∂nΓlmk − ∂s∂kΓlmn + 0 + 0 + cycl(snk)= ∂s∂nΓlmk − ∂s∂kΓlmn + ∂n∂kΓlms − ∂n∂sΓlmk + ∂k∂sΓlmn − ∂k∂nΓlms= 0

Poprzez cycl(snk) oznaczyliśmy wyrażenia powstałe poprzez cykliczną zamianę wskaźnikóws, n oraz k.

Wygodnie jest oznaczać pochodną kowariantną znakiem średnika:

Rlmnk;s := ∇sRlmnk .

Oznaczenie to stosują szczególnie często fizycy teoretyczni. Wtedy drugą tożsamość Bian-chi’ego można zapisać w następującej, jeszcze prostszej, postaci:

Rlm[nk;s] = 0 .

Odpowiednia nierówność zachodzi również dla tensora krzywizny K lmkn:Twierdzenie 2: Druga tożsamość Bianchi’ego dla tensora krzywizny K przyjmuje na-

stępującą postać:K lm[kn;s] = 0

Dowód: Wykorzystując drugą tożsamość Bianchi’ego dla tensora Riemanna w postaci(718) oraz (682) otrzymujemy:

0 = ∇sRlmnk +∇nRlmks +∇kRlmsn= ∇s

(K lmkn −K lmnk

)+∇n

(K lmsk −K lmks

)+∇k

(K lmns −K lmsn

)

= ∇sK lmkn +∇nK lmsk +∇kK lmns −∇sK lmnk −∇nK lmks −∇kK lmsn= 6K lm[kn;s]

250

Page 257: Rozn. Geom_ - Jerzy Kijowski

7.11 Tensor Riemanna jako niesymetryczna część drugiej po-chodnej kowariantnej

Podamy jeszcze inną interpretację krzywizny, jako miary odstępstwa od symetrii drugiejpochodnej kowariantnej. Gdyby rozmaitość była płaska w otoczeniu x ∈ M , to istniałybyw tym otoczeniu współrzędne globalnie inercjalne. Ale pochodne kowariantne to zwykłepochodne cząstkowe liczone we współrzędnych inercjalnych. Ponieważ pochodne cząsto-we są symetryczne, pochodne kowariantne w płaskiej przestrzeni są też symetryczne. Naprzykład pochodne pola wektorowego X:

∇k∇lXm = ∇l∇kXm .

W przestrzeni o nieznikającej krzywiźnie wzór ten nie jest prawdziwy, a odstępstwo odsymetrii mierzy właśnie tensor Riemmana, według następującej formuły:

∇k∇lXm −∇l∇kXm = XnRmnkl . (719)

Wykażemy ten fakt w postaci nieco ogólniejszej.Twierdzenie: Jeśli X, Y i Z są trzema polami wektorowymi na rozmaitości z powią-

zaniem (M,Υ), to zachodzi tożsamość

∇X∇Y Z −∇Y∇XZ −∇[X,Y ]Z = ZnRmnklXkY l∂

∂xm. (720)

Uwaga: Wzór ten zapisuje się zazwyczaj w następującej postaci, bez użycia wskaźni-ków:

∇X∇Y Z −∇Y∇XZ −∇[X,Y ]Z = R(X, Y )Z (721)

interpretując prawą stronę w następujący sposób: ze względu na dwa ostatnie, antysyme-tryczne wskaźniki tensor Riemanna jest „dwu-formą różniczkową”:

R(X, Y ) = −R(Y,X) = RmnklXkY l .

Jednak wartość tej formy różniczkowej nie jest skalarem, lecz operatorem liniowym w prze-strzeni stycznej, to znaczy tensorem 1-kontra- (górny wskaźnik „m”) i 1-kowariantnym(dolny wskaźnik „n”). I właśnie działanie tego operatora na wektor Z oznaczamy jako:R(X, Y )Z := ZnRmnklX

kY l. Wzór (721) ma następującą interpretację geometryczną: wiel-kość „∇X∇Y Z−∇Y∇XZ” mierzy (z dokładnością do ǫ2) zmianę wektora Z po równoległymprzeniesieniu go wzdłuż obwodu „równoległoboku” rozpiętego przez pola ǫX oraz ǫY . Alerównoległobok ten nie domyka się i miarą tego niedomknięcia jest, jak wiemy, pole [X, Y ].Wkład do tej zmiany wywołany niedomknięciem jest mierzony przez wielkość „∇[X,Y ]Z”.Po odjęciu tego wkładu pozostaje wyłącznie efekt krzywizny: R(X, Y )Z.Dowód Twierdzenia: Zachęcamy czytelnika do ćwiczenia polegającego na przepro-

wadzeniu dowodu w dowolnym, nieinercjalnym układzie współrzędnych. My natomiastuprościmy sobie zadanie, używając układu współrzędnych inercjalnych w danym punkcie

251

Page 258: Rozn. Geom_ - Jerzy Kijowski

x. Oznacza to, że Γmkl znikają w interesującym nas punkcie, ale ich pochodne już nieko-niecznie. Mamy zatem:

(∇Y Z)m = Y l(∇lZm) = Y l (∂lZm + ΓmlnZn) ,(∇X∇Y Z)m = Xk∇k ((∇Y Z)m) = Xk

(∂k(∇Y Z)m + Γmkj(∇Y Z)j

).

I teraz właśnie skorzystajmy z faktu, że nasze współrzędne są inercjalne, zatem wszystkieczłony zawierające współczynniki koneksji znikają, a zostają jedynie ich pochodne. Zatem:

(∇X∇YZ)m = Xk∂k(∇Y Z)m = Xk∂k(Y l (∂lZm + ΓmlnZ

n))

=(Xk∂kY

l)∂lZ

m +XkY l∂k (∂lZm + ΓmlnZn)

=(Xk∂kY

l)∂lZ

m +XkY l∂k∂lZm + ZnXkY l∂kΓmnl .

(∇Y∇XZ)m =(Y k∂kX

l)∂lZ

m + Y kX l∂k∂lZm + ZnY kX l∂kΓmnl

=(Y k∂kX

l)∂lZ

m +XkY l∂l∂kZm + ZnXkY l∂lΓmnk .

W przedostatniej linijce zamieniliśmy X z Y , a w ostatniej „przechrzciliśmy” k na l iodwrotnie. Odejmując stronami człon zawierający drugie pochodne uprości się i pozostanie:

(∇X∇Y Z)m − (∇Y∇XZ)m =(Xk∂kY

l − Y k∂kX l)∂lZ

m + ZnXkY l (∂kΓmnl − ∂lΓmnk)= [X, Y ]l∂lZm + ZnXkY lRmnkl= ∇[X,Y ]Zm + ZnXkY lRmnkl ,

jako że w układzie inercjalnym pochodna cząstkowa jest pochodną kowariantną.

Uwaga: W podejściu Koszula do teorii powiązania wzór (721) staje się po prostudefinicją tensora Riemanna.

7.12 Koneksja metryczna i symbole Christoffela

Gdy rozmaitość M wyposażona jest w strukturę Riemanna (lub pseudo-riemannowską), totensor metryczny g wyróżnia na niej jednoznacznie pewną strukturę powiązania Υg, którąnazywa się „koneksją metryczną”, albo też koneksją Levi-Civitty, od nazwiska wielkiegowłoskiego matematyka, który badał tę strukturę.Definicja: Układ współrzędnych (ya) jest inercjalny względem struktury Υg w danym

punkcie x ∈ M wtedy i tylko wtedy, gdy pochodne tensora metrycznego znikają w tympunkcie, tzn. gdy zachodzi:

∂ycgab(x) = 0 . (722)

Lemat: Definicja ta jest poprawna, to znaczy określa jednoznacznie powiązanie Υg.Dowód: Gdyby rzeczywiście istniał układ współrzędnych spełniający warunek (722),

to pochodna kowariantna metryki w tym punkcie byłaby równa zeru: ∇mgkl = 0. Zatemna mocy wzoru (711) mielibyśmy:

∂mgkl = Γimkgil + Γimlgki .

252

Page 259: Rozn. Geom_ - Jerzy Kijowski

Permutując wskaźniki otrzymujemy również:

∂kglm = Γiklgim + Γikmgli ,

∂lgmk = Γilmgik + Γilkgmi .

Odejmując pierwsze z tych równań od od sumy dwu ostatnich otrzymujemy:

∂kglm + ∂lgmk − ∂mgkl = 2Γiklgim .

Mnożąc przez macierz odwrotną gmj oraz porządkując nieco wskaźniki dostajemy jedno-znacznie:

Γjkl =12gjm (∂kglm + ∂lgkm − ∂mgkl) . (723)

Odpowiadające im powiązanie rzeczywiście spełnia warunki zawarte w definicji, bowiemgdy znikają pochodne metryki, to znikają również współczynniki koneksji, czyli jest onametryczna.

Uwaga: Współczynniki koneksji dane tym wzorem nazywają się w literaturze symbo-lami Christoffela21 metryki.Wygodne w rachunkach oznaczenie:

gkl,m := ∂mgkl

prowadzi do następującej wersji wzoru (723) na symbole Christoffela:

Γjkl =12gjm (gmk,l + gml,k − gkl,m) . (724)

Ćwiczenie 1: Obliczmy współczynniki Christoffela dla metryki (461) na sferze S(R)o promieniu R w trójwymiarowej przestrzeni euklidesowej:

gij = R2[1 00 sin2 θ

]. (725)

Widać, że współczynniki te nie zależą od promienia sfery, bowiem czynnik R2 w metrycegAB upraszcza się z czynnikiem R−2 w metryce odwrotnej gAB. Wzór (724) daje natych-miast (635), to znaczy:

Γθϕϕ = − sin θ cos θ , Γϕθϕ = Γϕϕθ = ctg θ , (726)

czyli wynik, który uzyskaliśmy żądając, by współrzędne inercjalne na sferze były rzutemprostopadłym jakichkolwiek współrzędnych prostoliniowych na płaszczyźnie stycznej dosfery. Wydawać by się mogło, że w tamtej definicji udało nam się uniezależnić się od struk-tury metrycznej: płaszczyzna styczna i współrzędne prostoliniowe, to pojęcia afiniczne,które nie zależą od metryki. A tymczasem okazuje się, że w rezultacie otrzymaliśmy na

21Niekiedy nazywa się je „symbolami Christoffela drugiego rodzaju”.

253

Page 260: Rozn. Geom_ - Jerzy Kijowski

S(R) koneksję metryczną ! Skąd wzięła się ta metryka? Otóż z rzutu prostopadłego, któ-ry stosowaliśmy w definicji tamtej koneksji. Gdyby zamiast niego wziąć jakikolwiek rzutukośny, to otrzymana koneksja już nie musiałaby być metryczna.Ćwiczenie 2: Obliczmy „krzywiznę” równoleżnika, to znaczy przyśpieszenie punktu

poruszającego się jednostajnie po równoleżniku. W tym celu rozważamy krzywą γ(t) danąrównaniami: θ = const., ϕ(t) = c · t. Wektor styczny do niej jest równy: γ = c ∂

∂ϕ, zatem

jego długość wynosi:‖γ‖ =

√c2gϕϕ = c · R · sin θ .

Wybierzemy zatem c = (R sin θ)−1 aby mieć wektor unormowany, dzięki czemu parametrt będzie długością krzywej (zob. formuła (506)). Zatem:

aϕ = ϕ+ Γϕϕϕϕϕ = 0 ,

aθ = θ + Γθϕϕϕϕ = − sin θ cos θ · c2 = −1R2ctg θ ,

‖a‖ =√gθθaθaθ =

√1R2ctg2 θ =

cos θR sin θ

.

Zauważmy, że dla θ = π przyśpieszenie znika, zgodnie z faktem, że równik jest ortodromą.Natomiast w okolicach podbiegunowych, dla θ → 0, równoleżnik staje się okręgiem o pro-mieniu r = R sin θ, zaś jego krzywizna staje się odwrotnością tego promienia: ‖a‖ → 1

R sin θ,

tak jak w dwuwymiarowej, płaskiej geometrii. Odpowiada to naszej intuicji, że geome-tria małych obiektów zlokalizowanych w pobliżu bieguna niewiele różni się od geometriipłaskiej.

W przypadku konekcji metrycznej tensor krzywizny wykazuje dodatkowe symetrie. Bar-dzo łatwo je odnaleźć w układzie inercjalnym, a ich tensorowy charakter implikuje, iż sąspełnione także w dowolnym innym układzie współrzędnych. Niech więc (xk) będzie ukła-dem inercjalnym, to znaczy takim, w którym znikają wszystkie pierwsze pochodne metryki.Na mocy (687) otrzymujemy

Rskln = ∂lΓskn − ∂nΓskl ,Rmkln := gmsR

skln = gms (∂lΓ

skn − ∂nΓskl)

= ∂l (gmsΓskn)− ∂n (gmsΓskl)

=12∂l (∂kgnm + ∂ngkm − ∂mgkn)− ∂n (∂kglm + ∂lgkm − ∂mgkl) .

W ten sposób otrzymaliśmy ostatecznie wzór obowiązujący w dowolnym układzie inercjal-nym:

2Rmkln = ∂l∂kgnm − ∂l∂mgkn − ∂n∂kglm + ∂n∂mgkl . (727)

Wynika zeń natychmiastTwierdzenie: Tensor Riemanna koneksji metrycznej posiada następujące, dodatkowe

symetrie:

Rmkln = −Rmknl = −Rkmln = Rlnmk . (728)

254

Page 261: Rozn. Geom_ - Jerzy Kijowski

Oznacza to, że po opuszczeniu pierwszego wskaźnika tensor jest anty-symetryczny zarównow pierwszej jak i w drugiej parze, a także jest symetryczny względem zamiany par.

Uwaga: Tożsamości Bianchi’ego pierwszego rodzaju implikują znikanie części całkowi-cie anty-symetrycznej tensora:

R[mkln] = R[m[kln]] ≡ 0 , (729)

bowiem anty-symetryzując we wszystkich czterech wskaźnikach możemy najpierw anty-symetryzować w trzech wskaźnikach. Tożsamość tę zapisuje się również w następującejpostaci:

Rmklnǫmkln = 0 .

A priori ten jeden warunek jest słabszy niż 16 tożsamości Bianchi’ego. Tymczasem możnałatwo pokazać (co proponujemy Czytelnikowi w charakterze ćwiczenia), że dla tensoraspełniającego (728) ta jedna tożsamość (729) implikuje już tożsamości Bianchi’ego. A zatemukład (728) – (729) opisuje wszystkie symetrie tensora Riemanna w przypadku koneksjimetrycznej.Ćwiczenie 1: W teorii względności ważną rolę odgrywa tzw. tensor Ricci’ego, będący

zwężeniem tensora krzywizny w pierwszym i trzecim wskaźniku:

Rkl := Rmkml . (730)

W ogólnym przypadku nie ma on żadnych symetrii. Jednak dla koneksji metrycznej jegoczęść antysymetryczna znika i pozostaje jedynie część symetryczna, bowiem symetria (728)implikuje:

Rkl = Rmkml = gmnRnkml = gmnRmlnk = Rnlnk = Rlk .

Ćwiczenie 2:W równaniach Einsteina, rządzących ewolucją pola grawitacyjnego, wy-stępuje pewna kombinacja tensora Ricciego i metryki, zwana tensorem Einsteina:

Gkl := Rkl −12Rgkl , (731)

gdzie ślad tensora Ricci’ego: R = Rkk = gklRkl nazywa się krzywizną skalarną. Okazuje się,

że dla symetrii metrycznej (ale nie w przypadku ogólnym) prawdziwa jest tożsamość:

∇k Gkl = 0 . (732)

Przeprowadzenie prostego dowodu, korzystającego z tożsamości Bianchi’ego drugiego ro-dzaju oraz z symetrii (728), pozostawiam czytelnikowi. Nieznajomość tej tożsamości przezEinsteina opóźniła podanie prawidłowej wersji teorii grawitacji o kilka lat. Choć od daw-na miał on znakomitą intuicję, iż obecność grawitującej materii powinna „wykrzywiać”czasoprzestrzeń, jednak sądził on pierwotnie, że to właśnie tensor Ricciego powinien byćprzyrównany do tensora energii-pędu materii. W takiej teorii pojawiał się kłopot z pra-wami zachowania energii-pędu. Einstein uświadomił sobie, iż zachodzi tożsamość (732),dopiero pod wpływem dyskusji z Hilbertem. Zastąpienie tensora Ricciego tensorem G wy-eliminowało kłopoty poprzednich wersji teorii. Jej poprawna wersja została opublikowanaw listopadzie 1915 roku.

255

Page 262: Rozn. Geom_ - Jerzy Kijowski

7.13 Pochodna Liego metryki i koneksji. Równanie Killinga

Wzór (581) na pochodną Liego metryki w wersji (587) można przepisać następująco:

(£Xg)ij = ∂iXj + ∂jXi −Xlglk (∂igjk + ∂jgik − ∂kgij)= ∂iXj −XlΓlij + ∂jXi −XlΓlij ,

gdzie wykorzystaliśmy formułę (723), wyrażającą współczynniki koneksji metrycznej po-przez pochodne metryki. Porównując to z wzorem (709) na pochodną kowariantną jedno-formy różniczkowej X = Xjdxj , powstałej z pola wektorowego X przez opuszczenie wskaź-nika: Xj = gjkXk, otrzymujemy następującą formułę, zwaną wzorem Killinga:

(£Xg)ij = ∇iXj +∇jXi . (733)

Pamiętać przy tym należy, że pochodną kowariantną po prawej stronie liczymy względemkoneksji metrycznej wyznaczonej przez tensor metryczny, którego pochodną Liego liczymypo lewej stronie. Równanie Killinga na pola symetrii metryki g często zapisuje się w tejwłaśnie postaci: ∇iXj +∇jXi = 0.Pochodna Liego opisuje infinitezymalny transport obiektu geometrycznego. A czy moż-

na mówić o transporcie struktury powiązania, czyli pola inercjalnych układów współrzęd-nych? Dla dowolnego odwzorowania F : M → N trudno mówić o takim transporcie,bowiem układom współrzędnych po jednej stronie nie muszą odpowiadać układy współ-rzędnych po drugiej. Ale gdy F jest dyfeomorfizmem, takie pojęcie ma sens: transportemukładu inercjalnego (ya) w N do przestrzeni M nazywamy układ współrzędnych (F ∗ya).W szczególności dla dowolnego pola wektorowego X na rozmaitości M można w ten spo-sób zdefiniować transport „

(GXt

)∗Υ” koneksji Υ. Parametryzując abstrakcyjny obiekt „Υ”

przy pomocy współczynników koneksji „Γmkl” możemy nadać sens wyrażeniu „(GXt

)∗(Γmkl)”.

Jak zauważyliśmy w rozdziale 7.3 (zob. wzór (645)) różnica dwóch koneksji: pierwotnej iprzetransportowanej, jest tensorem. A skoro tak, to jest również dobrze określony ilorazróżnicowy oraz jego granica, którą właśnie nazwiemy pochodną Liego powiązania:

£XΓmkl := limt→0

(GXt

)∗(Γmkl)− Γmklt

. (734)

Twierdzenie: Następujące trzy równoważne wyrażenia reprezentują pochodną Liegokoneksji Υ względem pola wektorowego X:

£XΓmkl = ∇k∇lXm − RnlknXn = ∇(k∇l)Xm −Rn(lk)nXn = ∇(k∇l)Xm +32KnlknX

n . (735)

Dowód: Ostatnie dwa wyrażenia są sobie równe na mocy (684) (symetryzacja tensoraRiemanna odtwarza tensor krzywizny!). Natomiast jeśli pierwsze wyrażenie jest prawdziwe,to musi być symetryczne, bowiem współczynniki koneksji są symetryczne. Wobec tegojego symetryzacja — czyli drugie wyrażenie — jest również prawdziwe. Wystarczy zatemwykazać pierwszą równość.

256

Page 263: Rozn. Geom_ - Jerzy Kijowski

Uciekniemy się w tym celu do chwytu, który stosowaliśmy już kilkakrotnie: obliczymy(734) w specjalnym układzie współrzędnych, w którym pole X zostało „wyprostowane” iwynosi X = ∂

∂x1. (Gdyby pole X znikało w punkcie, to takie wyprostowanie nie byłoby

możliwe, ale wtedy stosujemy rozumowanie zawarte w dowodzie Twierdzenia o pochodnejLiego pola wektorowego, w rozdziale 3.6.) Ponieważ grupa transformacji generowana przezstałe pole to grupa przesunięć: GXt (x1, x2, . . . xn) = (x1 + t, x2, . . . xn), więc

(GXt

)∗(Γmkl)(x

1, x2, . . . xn) = Γmkl(x1 + t, x2, . . . xn) .

Wobec tego pochodna Liego w tym układzie współrzędnych to zwykła pochodna cząstkowa(por. rozdz.3.6):

£XΓmkl = ∂1Γmkl . (736)

Tymczasem mamy Xm = δm1 , więc formuły (707) oraz (710) implikują:

∇lXm = ∂lδm1 + δ

k1Γmkl = Γ

m1l ,

∇k(∇lXm) = ∂kΓm1l + Γn1lΓmnk − Γm1nΓnlk .

Natomiast na mocy formuły (687) mamy:

RnlknXn = Rmlk1 = ∂kΓ

ml1 − ∂1Γmlk + ΓmjkΓjl1 − Γmj1Γjlk ,

zatem dwie ostatnie tożsamości dają:

∇k∇lXm −RnlknXn = ∂1Γmlk = £XΓmkl . (737)

Lewa i prawa strona są tensorami, więc równość ich składowych w jakimkolwiek układziewspółrzędnych oznacza ich równość jako obiektów geometrycznych.

7.14 Krzywizna zewnętrzna

Niech S ⊂M będzie k-wymiarową podrozmaitością w n-wymiarowej rozmaitości różniczko-walnej M , zaś (xA), A = 1, . . . k; — układem współrzędnych na S. Jak wiemy (por. Twier-dzenie w rozdziale 2.15), układ ten można rozszerzyć do układu współrzędnych w M ,mianowicie: (xA, τa), a = 1, . . . , l; gdzie l = n− k jest ko-wymiarem S; i to w taki sposób,by współrzędne τa były stałe na S. W każdym punkcie x ∈ S przestrzeń TxS ⊂ TxMstyczna do podrozmaitości jest rozpięta na wektorach ∂

∂xA. Rozważmy podprzestrzeń ko-

wektorów w M znikających na wektorach stycznych do S. Taką podprzestrzeń nazwiemyanihilatorem przestrzeni TxS i oznaczymy symbolem (TxS)

⊂ T ∗xM . Przestrzeń ta jest

rozpinana przez kowektory dτa. Jeśli przestrzeń M jest wyposażona w powiązanie Υ tokładziemy:

KaAB := ΓaAB . (738)

Łatwo widać, że przy transformacjach współrzędnych wewnątrz wymienionej wyżej klasyobiekt ten zachowuje się jak „mieszany” tensor: przy transformacjach układu współrzęd-nych (xA) na S — jak tensor dwukrotnie kowariantny na S, zaś przy transformacjach

257

Page 264: Rozn. Geom_ - Jerzy Kijowski

współrzędnych (τa), które są stałe na S — jak wektor należący do anihilatora (TxS).

Natomiast nigdy nie pojawi się człon niejednorodny, zazwyczaj obecny przy przekształce-niach współczynników koneksji. Oznacza to, że ostatni człon we wzorze (644) jest zawszerówny zeru przy zamianie współrzędnych nie wyprowadzających poza opisaną wyżej klasęukładów. Korzystając z (715) możemy również napisać następującą definicję tego obiektu:

KaAB =

⟨dτa;∇A

∂xB

⟩. (739)

Definicja: Tensor K nazywamy tensorem krzywizny zewnętrznej podrozmaitości S.Wzór (739) mierzy jak bardzo przesunięcie równoległe wektora stycznego do S „wysta-

je” z S. Gdy K = 0, to przesuwając wektory styczne do S wzdłuż S otrzymujemy wektory,na których dya znikają, a zatem są to znów wektory styczne do S. Mówimy wtedy, że S jestzanurzona „płasko” wM i powiązanie Γ wyznacza pewne powiązanie w S. Jeśli natomiastK 6= 0, wtedy taka redukcja powiązania z M do S nie jest możliwa.Szczególnie ważny jest przypadek przestrzeni S, której ko-wymiar jest równy 1. Wtedy

anihilator przestrzeni TS jest jednowymiarowy i mamy tylko jedną współrzędną τ . Gdybyjeszcze udało się ją jakoś znormalizować, to składowa transwersalna zostałaby całkowicieujednoznaczniona. Dzieje się tak np. w przestrzeni Riemanna, bowiem możemy zażądać,by kowektor dτ miał długość równą 1 (tzn. był „ortonormalny” do S). Po takim przeska-lowaniu cała krzywizna zewnętrzna redukuje się do symetrycznego tensora KAB na samejpodrozmaitości.Przykład: Kartka papieru jest przykładem płaskiej geometrii euklidesowej. Wszelkie

wygięcia kartki nie zmieniają jej wewnętrznej geometrii. Zmieniają natomiast krzywiznę ze-wnętrzną jej zanurzenia w płaskiej przestrzeni trójwymiarowej. Jeśli bowiem wektor stycznydo takiej wygiętej kartki przesuniemy równolegle (ale równolegle w sensie trójwymiarowejprzestrzeni płaskiej!) do sąsiedniego punktu kartki, to może się zdarzyć, że przestanie onjuż być styczny do kartki i będzie z niej „wystawał”. Miarą tego „wystawania” jest właśnietensor krzywizny zewnętrznej KAB.Jeśli kowektor dτ nie jest spełnia warunku normalizacji, to wystarczy podzielić go przez

jego długość. Możemy zatem używać nienormalizowanej współrzędnej τ , kładąc:

KAB =1‖dτ‖

⟨dτ ;∇A

∂xB

⟩. (740)

W badaniach dotyczących teorii grawitacji wzór ten pojawia się bardzo często. W tymkontekście fizycy kładą na ogół τ = x0 i traktują tę współrzędną jako czas, zaś (xA)jako współrzędne przestrzenne. Mamy wtedy ‖dτ‖ =

√g00. (Podajemy tutaj jedynie wer-

sję euklidesową teorii. Czytelnik łatwo odtworzy sobie wersję pseudo-eulidesową, w którejnależy wziąć

√|g00|.) Zatem „fizyczna” definicja tensora krzywizny zewnętrznej wygląda

następująco:

KAB :=1√g00Γ0AB . (741)

Nie jest ona całkiem jednoznaczna, bowiem zawsze można zamienić τ na −τ , a wtedyK zamieni się na −K. Widać więc, że do pełnej jednoznaczności brakuje jeszcze wyboru

258

Page 265: Rozn. Geom_ - Jerzy Kijowski

orientacji (zewnętrznej!) powierzchni S, czyli odróżnienia „przyszłości” od „przeszłości”.Fizycy nazywają wybór takiej orientacji wyborem „strzałki czasu”.I znów najważniejszy przypadek to koneksja metryczna Levi-Civity. Stosując wzór (723)

otrzymujemy:

KAB =12√g00

g0λ (∂AgBλ + ∂BgAλ − ∂λgAB)

=√g00

2(∂AgB0 + ∂BgA0 − ∂0gAB) +

g0C

2√g00(∂AgBC + ∂BgAC − ∂CgAB) ,

gdzie wskaźnik λ numeruje wszystkie współrzędne wM , tzn. λ = 0, 1, . . . , n−1. Podzielimytensor metryczny na bloki: jednowymiarowy, odpowiadający zmiennej czasowej x0, oraz(n− 1)-wymiarowy, odpowiadający współrzędnym przestrzennym (xA):

gµν =

[g00 g0AgA0 gAB

]=

[N2 +NANA NA

NA gAB

],

gdzie oznaczyliśmy NA := g0A. Liczby NA są składowymi pewnego kowektora na powierzch-ni S, zaś gAB (gdzie A = 1, . . . n− 1) jest metryką na S indukowaną przez metrykę gµν nacałej przestrzeni. Jeśli symbolem gAB oznaczyć teraz odwrotną do gAB metrykę (n − 1)-wymiarową, to kwadrat długości kowektora NA wynosi:

NANB = NAgABNB .

Wreszcie liczba N2 została zdefiniowana wzorem g00 = N2+NANA. Czytelnik łatwo spraw-dzi, że w tych oznaczeniach n-wymiarowa metryka odwrotna ma następującą postać:

gµν =

[g00 g0A

gA0 gAB

]=

[1N2

−NAN2

−NAN2

gAB + NANB

N2

],

gdzie wektor ~n := NA∂A styczny do S powstał z kowektora NA przez zwykłe „podniesieniewskaźników” w (n− 1) wymiarach, to znaczy:

NA = gABNB ,

zaś N := 1√g00. Wersję pseudo-euklidesową powyższych wzorów, wychodzącą z założenia

iż zmienna τ = x0 ma charakter czasowy, tzn. g00 = − 1N2

< 0, otrzymuje się zamieniającw powyższych wzorach „N2” na „−N2”.Łatwo widać, że wektor

n :=1N

(∂0 −NA∂A

)=1N(∂0 − ~n) (742)

spełnia warunki:

(n|∂B) =1N

(∂0 −NA∂A

∣∣∣∂B)=1N

(g0B −NAgAB

)= 0,

(n|n) = 1N2

(∂0 −NA∂A

∣∣∣∂0 −NB∂B)=1N2

(g00 −NANA

)= 1 ,

259

Page 266: Rozn. Geom_ - Jerzy Kijowski

zatem jest to unormowany wektor normalny do powierzchni S. Zauważmy, że poprawkawektora ∂0 o wektor przestrzenny ~n we wzorze (742) była potrzebna do ortogonalności,zaś przeskalowanie o czynnik 1

Nbyło potrzebne do unormowania. W bardzo rozpowszech-

nionej terminologii relatywistycznej funkcję N na S nazywa się „lapse function”, zaś polewektorowe ~n na S nazywa się „shift vector”.Używając powyższych oznaczeń możemy przepisać ostatni wzór na krzywiznę zewnętrz-

ną w następujący sposób:

2NKAB = ∂ANB + ∂BNA − ∂0gAB −NC (∂AgBC + ∂BgAC − ∂CgAB)= −∂0gAB + ∂ANB + ∂BNA −ND gDC (∂AgBC + ∂BgAC − ∂CgAB)= −∂0gAB +

(∂ANB −NDΓDAB

)+(∂BNA −NDΓDAB

)

= −∂0gAB +∇ANB +∇BNA ,

gdzie przez Γ oznaczyliśmy koneksję metryczną na S. Zgodnie ze wzorem (733), ostatniedwa człony są równe pochodnej Liego metryki na powierzchni S. W ten sposób otrzyma-liśmy następujące wyrażenie na krzywiznę zewnętrzną powierzchni:

KAB = −12N(∂0gAB −£~ngAB) = −

12£ngAB . (743)

Definicja: Zewnętrzną krzywizną skalarną22 powierzchni S nazywamy ślad tensorakrzywizny zewnętrznej:

K = gABKAB . (744)

7.15 Współrzędne Gaussa

Z każdą podrozmaitością S ⊂M o ko-wymiarze równym 1 zawartą w n-wymiarowej rozma-itościM są związane szczególne lokalne układy współrzędnych wM zwane „współrzędnymiGaussa”.Definicja Układ współrzędnych (x0, xA) (gdzie A = 1, . . . , n− 1) w otoczeniu punktu

x ∈ S ⊂ M nazywamy układem Gaussa ze względu na podrozmaitość S jeśli: 1) współ-rzędna x0 jest stała na S, tzn. zachodzi S = x0 = const., 2) system (xA) jest układemwspółrzędnych na S, 3) tensor metryczny g naM ma w tych zmiennych następującą postać:

g00 = 1 ; g0A = 0 , (745)

to znaczy:

gµν =

[1 00 gAB

].

Stosując wprowadzoną w poprzednim paragrafie terminologię możemy powiedzieć, żewe współrzędnych Gaussa funkcje „laps” i „shift” zostały strywializowane:

N ≡ 1 ; ~n ≡ 0 ,22Przeskalowana wymiarem powierzchni: H = 1

dimSK, nosi nazwę średniej krzywizny.

260

Page 267: Rozn. Geom_ - Jerzy Kijowski

zatem ∂0 = n jest wektorem ortonormalnym do S. W dalszej części wykażemy istnienieukładów Gaussowskich. Teraz natomiast zauważmy, że w takim układzie wzory (743) oraz(744) na tensor krzywizny zewnętrznej oraz jej ślad znacznie się upraszczają.Twierdzenie 1: We współrzędnych Gaussa krzywizna zewnętrzna jest związana z po-

chodną „czasową” metryki „przestrzennej” następującymi wzorami:

KAB = −12∂0gAB , (746)

K = − 1√det gAB

∂0√det gAB = −∂0 log

√det gAB . (747)

Dowód: Pierwszy z tych wzorów wynika natychmiast z (743) gdy położymy N = 1oraz ~n = 0. Natomiast drugi z przeliczenia, w którym wykorzystamy wykazaną w rozdziale6.7 formułę (503) na pochodną wyznacznika macierzy. Formuła ta mówi, że pochodnawyznacznika po jej elemencie macierzowym jest równa dopełnieniu algebraicznemu tegoelementu, czyli iloczynowi wyznacznika przez odpowiedni element macierzy odwrotnej.Mamy zatem

∂(det g)∂gCD

= (det g) · gCD .

Wobec tego

∂0 log√det gAB =

12∂0 log(det gAB) =

12det gAB

∂0(det gAB) =12gCD∂0gCD

= −gCDKCD = −K .

W ten sposób tensor KAB koneksji metrycznej zyskał nową interpretację jako prędkośćzmian metryki S podczas ortonormalnej deformacji tej podprzestrzeni. Natomiast skalarK mierzy prędkość zmian jej objętości przy takiej deformacji.Przykład: Płaska metryka euklidesowa wyrażona we współrzędnych sferycznych (r, θ, ϕ)

wzorem (460) ma postać

gµν =

[1 00 r2γAB

], gµν =

[1 00 1

r2γAB

],

gdzie

γAB =

[1 00 sin2 θ

], γAB =

[1 00 1sin2 θ

]. (748)

jest metryką na sferze jednostkowej S2. Są to zatem współrzędne Gaussa dla dowolnej sferyS2(r) o promieniu r, przy czym rolę x0 pełni współrzędna radialna r. Tensor krzywiznyzewnętrznej wyraża się z wzoru (746) jako

KAB = −12∂r(r2γAB

)= −rγAB ,

261

Page 268: Rozn. Geom_ - Jerzy Kijowski

zaś skalar krzywizny zewnętrznej jako

K =1r2γABKAB = −

1rγABγAB = −

2r.

Twierdzenie 2: W otoczeniu dowolnego punktu x0 ∈ S ⊂M istnieje układ Gaussa.Dowód: Wybierzmy w punkcie x0 wektor n ortonormalny do S (jeden z dwóch możli-

wych). Wybór ten można jednoznacznie rozszerzyć przez ciągłość do całego otoczenia O.Mamy więc pole O ∋ x← n(x) ∈ (TxM). Wypuśćmy teraz z każdego punktu x ortodro-mę w kierunku wektora n(x). Podobnie jak w paragrafie 7.6, nazwiemy ją γx,n(x). Mamyzatem odwzorowanie:

R× S ∋ (τ,x)→ γx,n(x)(τ) ∈ M . (749)

Jeśli teraz wybrać jakikolwiek układ współrzędnych (xA) na S w otoczeniu O ⊂ S punktux0, to otrzymamy lokalną mapę w M :

Rn ∋ (x0, xA)→ γx,n(x)(x0) ∈M . (750)

W tym układzie współrzędnych ortodroma jest krzywą odpowiadającą stałej wartościwszystkich współrzędnych „przestrzennych” (xA), parametryzowaną współrzędną „czaso-wą” t = x0, to znaczy: x0(t) = t oraz xA(t) = const. Wobec tego otrzymujemy

x0 = 1 ; x0 = 0

xA = 0 ; xA = 0

więc równanie ortodromy wygląda następująco:

0 = xλ + Γλµν xµxν = Γλ00 =

12gλµ (∂0gµ0 + ∂0gµ0 − ∂µg00) .

Ponieważ metryka gλµ jest nieosobiwa, otrzymujemy stąd n równań:

2∂0gµ0 − ∂µg00 = 0 . (751)

Kładąc µ = 0 otrzymujemy tożsamość: ∂0g00 = 0. Ale na powierzchni S, czyli dla x0 = 0,mieliśmy

g00 = g(∂0, ∂0) = g(n,n) = 1 ,

bowiem wektor n był unormowany do jedności. Wynika stąd, że mamy wszędzie g00 ≡ 1.Kładąc teraz w równaniu (751) µ = A otrzymujemy tożsamość ∂0gA0 = 0. I znów napowierzchni S, czyli dla x0 = 0, mieliśmy

gA0 = g(∂A, ∂0) = g(∂A,n) = 0 ,

bowiem wektor n był ortogonalny do S. Wynika stąd, że mamy wszędzie gA0 ≡ 0, czyliukład (xµ) jest Gaussowski.

262

Page 269: Rozn. Geom_ - Jerzy Kijowski

8 Geometria symplektyczna

8.1 Symplektyczne układy kontrolne

Przestrzeń symplektyczna to przestrzeń wyposażona w strukturę antysymetrycznego „ilo-czynu skalarnego” wektorów. Struktury takie pojawiają się w naturalny sposób wszędzietam, gdzie mamy do czynienia z „kontrolą układu fizycznego” w sensie, który wyjaśnimyponiżej.W najprostszej wersji areną takiej kontroli jest para przestrzeni wektorowych, wza-

jemnie dualnych: V oraz V ∗. Punkty przestrzeni V należy wyobrażać sobie jako możliwekonfiguracje badanego układu, zaś punkty przestrzeni dualnej V ∗ jako możliwe siły, któremożemy doń przykładać. Wartość kowektora v∗ na wektorze v (zwaną niekiedy „pracą wir-tualną”) będziemy oznaczać przez 〈v∗;v〉. W przypadku skończenie wymiarowym, a tylkotaki rozpatrujemy w naszym wykładzie, rola obu przestrzeni jest symetryczna: zachodzi(V ∗)∗ = V , zatem vektory z V można traktować jako kowektory na V ∗ (i vice versa).Przykład: Wyobraźmy sobie szalkę zawieszoną na elastycznej sprężynie w jednorod-

nym polu grawitacyjnym. Układ ten możemy kontrolować na wiele różnych sposobów. Na

f

x

Rysunek 25: Pomiar relacji między siłą f a położeniem x przy zawieszeniu elastycznym.

przykład kładąc na szalce odważnik kontrolujemy przyłożoną siłę (zob. Rusunek 25), aodpowiedzią układu będzie przyjęcie odpowiedniego położenia. Możemy też bezpośred-nio („ręką”) kontrolować położenie, a odpowiedzią układu będzie odpowiednia siła, którejprzyłożenie okaże się niezbędne do podtrzymania żądanego położenia szalki. Możemy teżstosować mieszane sposoby kontroli, polegające na „popychaniu” szalki elastycznym drąż-kiem, w wyniku czego ustali się nie siła, nie położenie, lecz jakaś ich kombinacja deter-minowana własnościami elastycznymi drążka. Własności sprężyny opiszemy, gdy poznamyrelację wiążącą parametry kontroli z parametrami „odpowiedzi”. Na przykład jeśli spręży-na spełnia liniowe prawo Hooka, to wydłużenie x = ℓ− ℓ0 sprężyny jest proporcjonalne do

263

Page 270: Rozn. Geom_ - Jerzy Kijowski

przyłożonej siły f :f = k · x . (752)

Równanie to definiuje zbiór możliwych stanów naszej sprężyny jako jednowymiarową pod-przestrzeń przestrzeni dwuwymiarowej P , w której parametry (f, x) stanowią układ współ-rzędnych.

W ogólnym przypadku przestrzeń P := V ∗ ⊕ V będziemy nazywali „przestrzenią fa-zową” układu. Nosi ona na sobie kanoniczną strukturę symplektyczną, czyli zapowiadany„iloczyn skalarny”, który jest formą biliniową. Będziemy ją oznaczali symbolem ω(·, ·). Wodróżnieniu od geometrii euklidesowej, jest to forma antysymetryczna. Jeśli mianowiciemamy dwa wektory przestrzeni P :

P = V ∗ ⊕ V ∋ p(i) = (f(i),v(i)) ; i = 1, 2 ,

to kładziemy:ω(p(1),p(2)) :=

⟨f(1);v(2)

⟩−⟨f(2);v(1)

⟩. (753)

Zwracamy uwagę, że do określenia powyższej formy nie musieliśmy „wymyślać” żadnychnowych elementów oprócz tych, które należą do struktury samej przestrzeni P . Taką struk-turą jest właśnie forma 〈· ; ·〉. Mówimy zatem, że ω jest formą kanoniczną na P .Podobnie jak to miało miejsce w definicji iloczynu wewnętrznego (375), czy w definicji

„opuszczania wskaźników” przez tensor metryczny (patrz formuła (467)), forma biliniowadefiniuje odwzorowanie liniowe z przestrzeni P w przestrzeń dualną:

P ∋ p→ p ω := ω(p, ·) ∈ P ∗ . (754)

Lemat 1: Powyższe odwzorowanie jest odwracalne, tzn. jest izomorfizmem przestrzeniwektorowych.Dowód: Kowektor na P to para: 1) kowektor na V ∗ oraz 2) kowektor na V . Ale, jak

już wiemy, kowektor na przestrzeni dualnej może być utożsamiony z elementem przestrzeniV , no a kowektor na V to element przestrzeni V ∗. Zatem mamy naturalne utożsamienie:P ∗ = V ⊕ V ∗. Jeśli teraz p = (f , 0), to we wzorze (753) mamy v(1) = 0, zatem

ω(p, ·) = 〈f ; ·〉 = f ∈ V ∗ .

Jeśli natomiast p = (0,v), to we wzorze (753) mamy f(1) = 0, zatem

ω(p, ·) = −〈·;v〉 = −v ∈ V .

Badane odwzorowanie ma więc następującą postać:

P = V ∗ × V ∋ (f ,v)→ (−v, f) ∈ V ⊕ V ∗ = P ∗ .

Odwzorowanie to ma trywialne jądro, bowiem (−v, f) = 0 implikuje (f ,v) = 0. Zatem jestto odwzorowanie odwracalne. Ponieważ obie przestrzenie P i P ∗ mają ten sam wymiar,

264

Page 271: Rozn. Geom_ - Jerzy Kijowski

jest ono odzorowaniem odwracalnym na całą przestrzeń, czyli izomorfizmem przestrzeniliniowych.

Jeśli wybrać jakąkolwiek bazę (e(1), . . . , e(n)) w przestrzeni konfiguracyjnej V , oraz bazędualną (f (1), . . . , f (n)) w przestrzeni V ∗, a więc taką, że

⟨f (j); e(i)

⟩= δji , to każdy wektor w

P ma postać:p = pjf (j) + xie(i) , (755)

więc (pj, xi) stanowią prostoliniowy układ współrzędnych w P . W takim układzie współ-rzędnych mamy identyfikację (por. wzór (29) w rozdziale 2.5):

e(i) =∂

∂xi; f (j) =

∂pj.

Lemat 2: Forma kanoniczna ω ma następującą postać:

ω = dpi ∧ dxi . (756)

Dowód: Jeśli p jest dany wzorem (755) zaś q = qjf (j) + yie(i), to — zgodnie z (753)— mamy:

ω(p,q) = pjyj − qixi =⟨dpi ∧ dxi ; pi

∂pi+ xi

∂xi, qj

∂pj+ yj

∂xj

⟩.

Jeśli więc przyjąć jednolite oznaczenie (tµ) na 2n współrzędnych (pj, xi), kładąc dlaj = 1, . . . , n; następujące wartości: tj = pj oraz tn+j = xj , to macierz formy ω przyjmujew tych współrzędnych taką postać:

(ωµν) =

[0 I

−I 0

], (757)

gdzie literą I oznaczyliśmy macierz jednostkową rozmiaru (n× n).

Liniowe układy kontrolne to takie, w których „odpowiedź układu” (na przykład f ∈V ∗) jest proporcjonalna do parametrów kontroli (na przykład v ∈ V ). Wtedy możliwestany układu stanowią, podobnie jak stany elastycznie zawieszonej szalki we wzorze (752),podprzestrzeń liniową D ⊂ P . Podprzestrzeń ta jest wykresem operatora liniowego

V ∋ v→ Uv ∈ V ∗ .

Piszemy wtedy:D = graph(U) .

Natomiast symplektyczna teoria kontroli dotyczy szczególnej klasy takich układów, dlaktórych forma ω jest całkowicie zdegenerowana na D, to znaczy zachodzi:

ω(p,q) = 0

265

Page 272: Rozn. Geom_ - Jerzy Kijowski

dla dowolnych dwóch wektorów z tej podprzestrzeni: p,q ∈ D. Taką podprzestrzeń nazy-wamy izotropową. Okazuje się, że własność ta łatwo tłumaczy się na własności operatoraU , którego wykresem jest D. W tym celu zauważmy, że Uv jest kowektorem na V , więcjego wartość 〈Uv;w〉 na innym wektorze w określa formę biliniową na przestrzeni V :

U(v,w) := 〈Uv;w〉 .

W ten sposób operatory z przestrzeni V w przestrzeń V ∗ mogą być jednoznacznie utożsa-miane z formami biliniowymi na V .Twierdzenie 1: Podprzestrzeń D = graph(U) jest izotropowa dla formy kanonicznej

ω wtedy i tylko wtedy gdy forma U jest symetryczna.Dowód: Dowolny wektor styczny do wykresu operatora U ma postać v + Uv ∈ P .

Weźmy drugi taki wektor: w+Uw ∈ P . Na mocy definicji formy kanonicznej (753) mamy:

ω(v + Uv,w + Uw) := 〈Uv;w〉 − 〈Uw;v〉 = U(v,w)− U(w,v) . (758)

Widzimy, że znikanie lewej strony na dowolnej parze wektorów jest równoważne symetriiformy biliniowej U(v,w).

Prosty algorytm na odtwarzanie operatora U z formy biliniowej i symetrycznej polegana zastosowaniu formy kwadratowej:

V ∋ v→ FU(v) :=12U(v,v) .

Zachodzi oczywisty fakt:Lemat 3: Operator liniowy U jest pochodną formy kwadratowej FU , to znaczy zacho-

dzi: dFU (v) = Uv.Definicja: Formę kwadratową FU na V nazywamy funkcją tworzącą podprzestrzeni D

i piszemy:D = graph(dFU) . (759)

Jako wykres odwzorowania z V do V ∗, przestrzeń izotropowa D ma tutaj wymiar równyn = dimD = dimV = 1

2dimP . Jej dowolna podprzestrzeń o dowolnym wymiarze mniejszym

niż n też jest izotropowa. W szczególności dowolna przestrzeń jednowymiarowa jest izotro-powa, bowiem antysymetria formy ω pociąga za sobą tożsamość: ω(v,v) = −ω(v,v) = 0.Okazuje się natomiast, że n jest najwyższym możliwym wymiarem przestrzeni izotropowej.Lemat 4: Nie istnieje podprzestrzeń izotropowa D ⊂ P o wymiarze większym niż

n = 12dimP .Dowód: Jeśli p ∈ D, to p ω = ω(p, ·) ∈ D ⊂ P ∗, gdzie D ⊂ V ∗ jest anihilatorem

podprzestrzeni D, to znaczy podprzestrzenią złożoną z tych kowektorów, które zerują sięna D. Jest tak, bowiem zeruje się na dowolnym innym wektorze q ∈ D na mocy izotropii:

(p ω) (q) = ω(p,q) = 0 .

Na mocy Lematu 1 odwzorowanie p→ p ω jest odwracalne. Zatem przestrzeń D zawieraw sobie conajmniej obraz przestrzeni D przy tym odwzorowaniu, czyli ma wymiar nie

266

Page 273: Rozn. Geom_ - Jerzy Kijowski

mniejszy niż wymiar D: dimD ¬ dimD. Ale wymiar anihilatora podprzestrzeni jest równyko-wymiarowi tej podprzestrzeni, zatem zachodzi:

dimD ¬ dimD = dimP − dimD = 2n− dimD .

Stąd dimD ¬ n.

Definicja: Podprzestrzeń izotropową maksymalnego wymiaru w P nazywamy podprze-strzenią lagranżowską.

Powyższe rozważania można streścić w postaci następującej obserwacji.Wniosek: Każda podprzestrzeń lagranżowska D ⊂ P , która rzutuje się na całą prze-

strzeń V ma funkcję tworzącą, to znaczy przyjmuje postać (759), czyli jest wykresemróżniczki formy kwadratowej FU na V .

Zajmijmy się teraz takim podprzestrzeniami lagranżowskimi, które nie rzutują się nacałą przestrzeń V . Pojawiają się one w opisie ważnej klasy symplektycznych układów kon-trolnych (ciągle w klasie układów liniowych), tzw. układów z więzami. Dla takich układówparametry kontroli nie mogą przebiegać całej przestrzeni V lecz jedynie jej podprzestrzeń(wektorową!) C ⊂ V . Podprzestrzeń tę nazywamy właśnie „podprzestrzenią więzów” (con-straints). W takiej sytuacji można byłoby zapomnieć o reszcie przestrzeni V i budowaćcałą teorię kontroli w przestrzeni P := C∗ ⊕ C. I znów wykres operatora symetrycznegoz przestrzeni C w C∗ odpowiadałby izotropowej podprzestrzeni D ⊂ P , której funkcjątworzącą jest odpowiednia forma kwadratowa F na C:

D = graph(dF ) . (760)

Lemat 5: Przestrzeń C∗ dualna do podprzestrzeni C ∈ V może być utożsamiona zprzestrzenią ilorazową V ∗/C, gdzie C ⊂ V ∗ jest anihilatorem C.Dowód: Każdy kowektor f ∈ V ∗ na V jest jednocześnie kowektorem na podprzestrzeni

C, bowiem definiuje funkcjonał liniowy

C ∋ v→ 〈f ;v〉 ∈ R .

Dwa kowektory f(1), f(2) ∈ V ∗ na V definiują ten sam kowektor na C wtedy i tylko wtedy gdyzachodzi

⟨f(1);v

⟩=⟨f(2);v

⟩na każdym elemencie v ∈ C, to znaczy gdy

⟨f(1) − f(2);v

⟩= 0,

czyli właśnie: f(1) − f(2) ∈ C.

W zastosowaniach okazuje się, że warto jednak wrócić do opisu układu w pierwotnejprzestrzeni fazowej P . Zachodzi następującyLemat 6: Jeśli D = graph(dF ) jest podprzestrzenią lagranżowską w P , to podprze-

strzeń D ⊂ P złożona ze wszystkich klas równoważności [p] należących do D:

D = p ∈ P |[p] ∈ D , (761)

jest podprzestrzenią lagranżowską w P .

267

Page 274: Rozn. Geom_ - Jerzy Kijowski

Dowód: Jeśli p(i) ∈ D, i = 1, 2; to p(i) = (f(i),v(i)), gdzie v(i) ∈ C. Zgodnie z (753)mamy:

ωP (p(1),p(2)) =⟨f(1);v(2)

⟩V−⟨f(2);v(1)

⟩V=⟨[f(1)];v(2)

⟩C−⟨[f(2)];v(1)

⟩C

= ωP([p(1)

],[p(2)

])= 0 ,

bowiem D ⊂ P jest izotropowa. W ten sposób pokazaliśmy, że D ⊂ P jest izotropowa.Ale wymiar przestrzeni D wynosi tyle, ile wymiar przestrzeni więzów C, to znaczy wymiarprzestrzeni V minus ko-wymiar przestrzeni C:

dimC = dimV − codimC .

Tymczasem, na mocy Lematu 5, każdy punkt przestrzeni P to klasa [p] równoważnychpunktów przestrzeni P : punkty te różnią się o wektor z przestrzeni C, której wymiarwynosi właśnie tyle, ile wynosi ko-wymiar C. Wynika stąd, że przestrzeń złożona z tychklas ma wymiar równy dimV . Zatem D jest podprzestrzenią izotropową maksymalnegowymiaru, czyli lagranżowską.

Twierdzenie 2: Każda popdprzestrzeń lagranżowska D w P jest powyższej postaci.Oznacza to, że jeśli D jest lagranżowska, to istnieje podprzestrzeń więzów C ⊂ V orazforma kwadratowa F na C taka, że D jest „podniesieniem” z P do P przy pomocy formuły(761), rozmaitości D generowanej przez F , tzn. danej wzorem (760).Dowód: Oznaczmy przez C rzut podprzestrzeni D ⊂ P = V ∗ ⊕ V na drugi składnik

sumy prostej czyli na V . Zatem dla każdego p = (f ,v) ∈ D mamy v ∈ C. Pokażemy, żepodprzestrzeń (C, 0) jest zawarta w D. Jest tak, bowiem dla p = (f ,v) ∈ D oraz wektoraq = (h, 0), gdzie h ∈ C, mamy:

ω(q,p) = 〈h;v〉 = 0 .

Gdyby zatem wektor q nie należał do D, to można byłoby go dołączyć do niej i w tensposób otrzymać przestrzeń izotropową o wymiarze o jeden większym niż D. Ale D byłamaksymalną izotropową, więc q ∈ D.Rozważmy zatem przestrzeń ilorazową

D := D/C .

Przestrzeń ta jest izotropowa w P = C∗ ⊕ C i maksymalna, bowiem rzutuje się na całeC. Z Wniosku wynika, że ma ona funkcję tworzącą, która jest formą kwadratową na C. ZLematu 6 wynika zatem nasza teza.

Uwaga 1: Powyższe twierdzenie obejmuje również skrajny przykład gdy przestrzeńwięzów jest zero wymiarowa, tzn. C = 0. Wtedy C jest całą przestrzenią dualną V ∗.Otrzymujemy zatem D = (V ∗, 0). Również podprzestrzeń (0, V ) jest lagranżowska. Rzutujesię bowiem na całą V i jest wykresem operatora zerowego. Zatem jej funkcja tworząca znikatożsamościowo.

268

Page 275: Rozn. Geom_ - Jerzy Kijowski

Uwaga 2: Jeśli „kontrola” podlega więzom, to „odpowiedź” układu jest niejednoznacz-na, bowiem zgodnie z (761), przestrzeń D możliwych stanów układu składa się z całychklas kowektorów. Widzimy więc, że w każdym punkcie kontrolnym v ∈ C funkcja two-rząca F determinuje jedynie klasę odpowiedzi f ∈ V ∗ modulo dodawanie elementów z C.Jest to typowa sytuacja w mechanice, gdzie „siła reakcji więzów”, prostopadła do C, mo-że być dowolna. Tym niemniej okazuje się, że warto nadużyć nieco terminologii i funkcjęF generującą przestrzeń ilorazową D = D/C nazywać „funkcją generującą rozmaitościlagranżowskiej D”. W celu uproszczenia notacji warto pisać

D = graph(dF ) , (762)

zamiast formuły (760). Należy jedynie pamiętać, że różniczka funkcji określonej na pod-przestrzeni C ⊂ V to nie jest jeden kowektor na V , lecz cała klasa kowektorów na V ,reprezentująca kowektor na C.

8.2 Wersja wektorowa geometrii symplektycznej. Mody kontro-lne

W zastosowaniach mamy do czynienia z układami, które mogą być kontrolowane na wie-le różnych sposobów i żaden z nich nie jest wyróżniony. Nie mamy zatem wyróżnionegorozkładu przestrzeni fazowej P na „kontrolę”, czyli V i odpowiedź, czyli V ∗. Okaże się,że takich rozkładów może być bardzo wiele. Istotnym natomiast elementem teorii jest for-ma symplektyczna ω, określona na P , która jest wspólna dla wszystkich takich „modówkontrolnych”, to znaczy nie zmienia się przy przejściu od jednego z nich do drugiego.Definicja: Wektorową przestrzenią symplektyczną nazywamy parę (P, ω), gdzie P jest

przestrzenią wektorową zaś ω – nieosobliwą formą biliniową, antysymetryczną na P . Ostat-ni warunek oznacza, że odwzorowanie z P w P ∗ dane wzorem (754) jest izomorfizmemprzestrzeni wektorowych.Lemat 1: Wymiar przestrzemi symplektycznej musi być parzysty.Dowód: Niech t(µ) będzie dowolną bazą przestrzeni P , zaś

ωµν = ω(t(µ), t(ν))

– macierzą składowych formy w tej bazie. Macierz ta jest antysymetryczna: ωµν = −ωνµ.Ale wyznacznik macierzy transponowanej jest równy wyznacznikowi samej macierzy. Mamyzatem:

det (ωµν) = det (ωνµ) = det (−ωµν) = (−1)dimP det (ωµν) .Ale det (ωµν) 6= 0, bowiem forma jest nieosobliwa. Stąd (−1)dimP = 1, więc dimP = 2n. Z nieosobliwości formy wynika, że odwzorowanie

P ∋ p→ p ω =: p ∈ P ∗ (763)

jest odwracalne. Pozwoliliśmy sobie posłużyć się jeszcze raz muzycznym symbolem bemolana oznaczenie takiego „opuszczania wskaźników” w wektorze, w wyniku czego powstaje

269

Page 276: Rozn. Geom_ - Jerzy Kijowski

kowektor, choć w rozdziale 6 (patrz wzór (467)) symbol ten oznaczał podobną operację,ale wykonaną przy pomocy metryki riemannowskiej, czyli formy symetrycznej a nie, jak tu,antysymetrycznej. Takie oznaczenie jest bardzo wygodne, a do żadnej kolizji nie dojdzie,bowiem w niniejszym rozdziale nie używamy metryki. Odwzorowanie odwrotne będziemyoznaczali muzycznym symbolem krzyżyka:

(p)♯= p . (764)

W mocy pozostaje teza Lematu 4 z poprzedniego paragrafu mówiąca, że podprzestrzeńizotropowa D ⊂ P może mieć conajwyżej wymiar n = 1

2dimP , bowiem w dowodzie korzy-

staliśmy jedynie z nieosobliwości formy ω.Okazuje się, że model przestrzeni symplektycznej rozważany w poprzednim paragrafie

jest w jakimś sensie uniwersalny, zachodzi bowiem następujący fakt.Lemat 1 (Wektorowa wersja Twierdzenia Darboux): Jeśli (P, ω) jest wektorową

przestrzenią symplektyczną, to można w niej wybrać dwie podprzestrzenie V, V ∗ ⊂ P takie,że P = V ∗ ⊕ V , zaś forma symplektyczna ω jest równa formie (753).Na mocy rozważań poprzedniego paragrafu wiemy, że podprzestrzenie V i V ∗ są lagran-

żowskie. Wiemy również, że powyższy Lemat można sformułować w innej, równoważnejpostaci:Lemat 2: Istnieje baza w przestrzeni P , w której macierz formy ω ma standardową

postać (757).Dowód Lematu 2: Pokażemy najpierw jak konstruować podprzestrzenie lagranżow-

skie. Wybierzmy dowolny wektor e(1) ∈ P . Przestrzeń wektorów symplektycznie doń „or-togonalnych”, czyli takich, że ω(e(1),p) = 0, jest (2n − 1)-wymiarowa. Zawiera ona samwektor e(1), ale i tak jest w niej dostatecznie dużo miejsca na inny wektor, który nazwiemye(2). Przestrzeń D2, rozpięta na tych wektorach, jest izotropowa. A teraz będziemy po-stępowali indukcyjnie: jeśli mamy k-wymiarową podprzestrzeń izotropową Dk, rozpiętą nawektorach (e(1), . . .e(k)) to jej anihilator symplektyczny jest (2n− k)-wymiarowy. Zawieraon samą przestrzeń Dk, jednak dopóki k < n (czyli dopóki 2n − k > k), dopóty w prze-strzeni tej jest miejsce na następny, niezależny od poprzednich, wektor e(k+1). Ponieważjego „symplektyczny iloczyn skalarny” z wektorami z Dk zeruje się, więc dodając go do Dkotrzymamy (k+1)-wymiarową podprzestrzeń izotropową Dk+1. W ten sposób po n-krokachotrzymamy podprzestrzeń izotropową n-wymiarową, czyli lagranżowską.

Z bazy (e(1), . . . e(n)) tej podprzestrzeni utworzymy n kowektorów π(i) :=(e(i)

). Mamy

oczywiście tożsamość:0 = ω(e(i), e(i)) =

⟨π(i), e(j)

⟩.

Uzupełnijmy teraz (e(1), . . . e(n)) do bazy całej przestrzeni, wybierając w tym celu zestawdodatkowych n wektorów (f (1), . . . f (n)), a następnie uzupełnijmy (π(1), . . . π(n)) do bazydualnej przestrzeni P ∗, wybierając zestaw dodatkowych kowektorów (ξ(1), . . . ξ(n)) tak, iż

270

Page 277: Rozn. Geom_ - Jerzy Kijowski

zachodzi:⟨ξ(i), e(j)

⟩= δij ,⟨

π(i), f (j)⟩= δji ,

⟨π(i), e(j)

⟩=

⟨ξ(i), f (j)

⟩= 0 .

Dowolna dwu-forma różniczkowa ma w tej bazie postać:

ω =12ωij π(i) ∧ π(j) + ωij π(i) ∧ ξ(j) +

12ωij ξ

(i) ∧ ξ(j) .

Aleω(e(i), e(j)

)= ωij = 0 ,

orazπ(j) =

(e(j)

)= ω

(e(j), ·

)= −ωij π(i) .

Oznacza to, że −ωij = δij . Wobec tego:

ω =12ωij π(i) ∧ π(j) − π(i) ∧ ξ(i)

= π(i) ∧(−ξ(i) + 1

2ωijπ(j)

). (765)

Wynikają stąd następujące wzory:

ω(e(i), e(j)

)= 0 ,

ω(−f (i) + 1

4ωike(k), e(j)

)= δij ,

ω(−f (i) + 1

4ωike(k),−f (j) +

14ωjle(l)

)=12ωij +

14ωji − 1

4ωij = 0 .

To właśnie oznacza, że wektory e(k) stanowią bazę przestrzeni V zaś wektory

e∗(k) := −f (i) +14ωike(k)

stanowią dualną bazę przestrzeni V ∗, oraz że ω jest kanoniczną formą (753), to znaczy jejmacierz w tej bazie jest równa (757), bowiem (765) możemy przepisać jako

ω = π(i) ∧ x(i) ,

gdzie oznaczyliśmy: x(i) := −ξ(i) + 14ωijπ(j).

Takich izomorfizmów P ≃ V ∗ ⊕ V jest tyle, ile transformacji liniowych zachowującychmacierz (757). Jeśli więc A oznacza macierz transformacji liniowej zaś S—postać normalną

271

Page 278: Rozn. Geom_ - Jerzy Kijowski

(757) formy symplektycznej, to każdy nowy izomorfizm powstaje ze starego wtedy i tylkowtedy, gdy zachodzi

AT · S · A = S . (766)

Macierze te stanowią grupę, bowiem złożenie dwóch transformacji tego rodzaju znów jesttransformacją tego rodzaju. Grupę tę nazywa się grupą symplektyczną i oznacza Symp(2n).Definicja:Mod kontrolny w przestrzeni symplektycznej (P, ω) to jej izomorfizm z prze-

strzenią V ∗ ⊕ V , w którym ω przechodzi na formę kanoniczną (753). Gdy ustalimy modkontrolny, to każda podprzestrzeń Lagranżowska w P jest jednoznacznie wyznaczona przezswoją funkcję tworzącą, która jest formą kwadratową, określoną na jakiejś podprzestrzeniwięzów C ⊂ V .

8.3 Transformacje Legendre’a

Przykład 1: Przestrzeń symplektyczna P opisująca elastycznie zawieszoną szalkę (patrzrys. 21) jest dwuwymiarowa. Może być parametryzowana dwiema współrzędnymi (f, x),gdzie f jest siłą a x położeniem szalki w stosunku do położenia nieobciążonej szalki. Formasymplektyczna ma postać: ω = df ∧ dx. Jeśli wybrać x jako „parametr kontroli” (czyliprzestrzeń V ) zaś f jako „parametr odpowiedzi” (czyli przestrzeń V ∗), to podprzestrzeńD odpowiadająca prawu Hooka (752) ma funkcję tworzącą

U(x) =12kx2 ,

bowiem zachodzi: f = kx = ∂∂xU(x), czyli: D = graph(dU). Ale zachodzi również ω =

−dx∧ df . Można zatem traktować f jako „parametr kontroli”, a wtedy −x będzie „para-metrem odpowiedzi”. Teraz mamy nową funkcję tworzącą:

H(f) = − 12kf 2 ,

bowiem prawo Hooka oznacza teraz: −x = − 1kf = ∂

∂fH(f).

Przejście od jednego opisu do drugiego to najprostszy przykład „transformacji Legen-dre’a”, którą opisujemy tutaj w wersji liniowej, zanim w dalszych paragrafach przejdziemydo omówienia ogólnego przypadku nieliniowego.Uwaga: Z każdym modem kontrolnym µ : P → V ∗ ⊕ V w wektorowej przestrzeni

symplektycznej (P, ω) jest związana jedno-forma różniczkowa θ, dana wzorem:

θµ(p) := π∗(p) , (767)

gdzie przez π oznaczyliśmy rzutowanie na drugi składnik w sumie prostej V ∗ ⊕ V . Formętę będziemy nazywali kanoniczną jedno-formą na P . Powyższa definicja oznacza, że gdyp = (f ,v), zaś q = (h,u), to

〈θµ(p),q〉 = 〈π∗(p),q〉 = 〈p, π(q)〉 = 〈f ,u〉 . (768)

272

Page 279: Rozn. Geom_ - Jerzy Kijowski

Jeśli przyjmiemy układ współrzędnych prostoliniowych (pi, xi), gdzie xi są dowolnymiwspółrzędnymi liniowymi na V zaś pi — dualnymi współrzędnymi na V ∗, to:

p = pi∂

∂pi+ xi

∂xi,

q = qi∂

∂pi+ ui

∂xi,

〈θ(p),q〉 = 〈p,u〉 = piui =⟨pidxi,q

⟩.

Oznacza to, że w tych współrzędnych mamy:

θµ = pidxi . (769)

Zauważmy, że wobec wzoru (756), mamy tożsamość:

dθµ = ω . (770)

Przestrzeń V ∗ jest rozpięta przez wektory ∂∂pi, na których θµ zeruje się, natomiast przestrzeń

V to miejsce geometryczne punktów pi = 0, w których forma znika. A zatem forma θµ niesiecałą informację o modzie kontrolnym.Twierdzenie 1: Jeśli D ⊂ P jest podprzestrzenią lagranżowską, to cofnięcie23 (pull-

back) θµ|D formy θµ z P do D jest formą zamkniętą, a nawet zupełną. Zachodzi tożsamość:

θµ|D = d (π∗F ) , (771)

gdzie F jest funkcją tworzącą rozmaitości D w rozważanym modzie kontrolnym, danąrównaniem (759).Uwaga: Funkcja π∗U , której różniczką jest forma θµ|D, to podniesienie funkcji gene-

rującej naszej podrozmaitości D z przestrzeni parametrów kontrolnych V do samej pod-rozmaitości. Jeśli nie ma więzów, tzn. gdy D rzutuje się na całe V , mamy wtedy jedno-jednoznaczną odpowiedniość między punktami D i punktami V i π : D → V jest odwra-calne. Wtedy F wyznacza π∗F , ale też odwrotnie: F = (π−1)∗ (π∗F ). Ciekawe, że podobnaodpowiedniość ma miejsce również w przypadku z więzami, gdy π nie jest odwracalne naD, bowiem rzutuje się jedynie na podprzestrzeń więzów C ⊂ V . Wtedy można podnosićfunkcje z V do D ale na ogół nie można ich rzutować z D do V . Jednak, cudownym zrzą-dzeniem losu, funkcja pierwotna formy θµ|D jest stała na pionowych wektorach zawartychw D, bowiem sama forma θµ = pidxi zeruje się na wektorach pionowych, tzn. kombina-cjach wektorów postaci ∂

∂pi. Wynika stąd, że można ją jednoznacznie zrzutować do funkcji

na przestrzeni więzów: C = πD ⊂ V . Funkcję F := π∗F , określoną na podprzestrzeniLagranżowskiej D nazywa się niekiedy „funkcją własną” tej podprzestrzeni. Jej znajomość

23Cofnięciem formy różniczkowej θµ z P do podrozmaitości D ⊂ P nazywamy formę θµ|D := ι∗θµ, gdzieι : D → P jest odwzorowaniem identycznościowym. W niniejszym tekście preferujemy zapis „θµ|D”, któryzawiera explicite nazwę podrozmaitości, do której cofamy tę formę.

273

Page 280: Rozn. Geom_ - Jerzy Kijowski

implikuje znajomość samej funkcji generującej F i vice versa. A zatem równanie (771) możebyć przepisane w następujący sposób:

(pidxi)|D = dF (x) (772)

co stanowi alternatywną definicję funkcji generującej F .Dowód Twierdzenia 1: Forma θµ|D jest zamknięta, bowiem operacja „pull-back”

komutuje z różniczką zewnętrzną:

d (θµ|D) = (dθµ) |D = ω|D = 0 , (773)

bowiem D jest Lagranżowska. Z Lematu Poincare wynika, że jest ona również zupełna.Natomiast równanie (pidxi)|D = dF (x) plus powyższe uwagi na temat ewentualnych kie-runków pionowych rozmaitości D, na których obie strony tego równania są równe zeru izwiązanej z tym niejednoznaczności definicji różniczki funkcji określonej na więzach dowo-dzi, iż zachodzi (759), skąd teza.

Transformacja Legendre’a to transformacja opisu jednej podprzestrzeni LagranżowskiejD między dwoma modami kontrolnymi. Ponieważ cała informacja o D jest zawarta w jejfunkcji generującej, a ta z kolei jest wyznaczana przez jej funkcję własną, to wystarczypowiedzieć jak zmienia się funkcja własna rozmaitości D przy przejściu od jednego dodrugiego modu kontrolnego. W tym celu przydatny będzie pewien obiekt, jednoznaczniezwiązany z każdym modem kontrolnym.Definicja: Jeśli µ : P → V ∗ ⊕ V jest modem kontrolnym na wektorowej przestrzeni

symplektycznej P , to następująca funkcja kwadratowa na P :

Eµ(p) := 〈θµ(p),p〉 = 〈π∗(p),p〉 = 〈p, π(p)〉 (774)

nazywa się funkcją ewaluacji w tym modzie.Powyższy wzór oznacza, że gdy p = (f ,v), to

Eµ(p) = 〈f ,v〉 = pixi . (775)

Zatem wartość tej funkcji w punkcie p ∈ P polega rzeczywiście na ewaluacji składowej V ∗wektora (opisującej odpowiedź układu) na jego składowej V (opisującej stan parametrówkontrolnych układu).

Twierdzenie 2: Jeśli µ : P → V ∗ ⊕ V oraz µ : P → V ∗ ⊕ V są dwoma modamikontrolnymi w P , to zachodzi:

θµ − θµ =12d (Eµ − Eµ) . (776)

Dowód Twierdzenia 2: Różnica jednoform po lewej stronie jest zamknięta, bowiem:

d (θµ − θµ) = ω − ω = 0 ,

274

Page 281: Rozn. Geom_ - Jerzy Kijowski

a więc zupełna z powodów topologicznych. Dowód, że jest ona różniczką połowy różnicyodpowiednich funkcji ewaluacyjnych przeprowadzimy wykorzystując dwa układy współ-rzędnych w P , mianowicie układ (pi, xi) zgodny z modem kontrolnym µ, oraz (qa, ya)zgodny z drugim modem kontrolnym. Oznacza to, że xi są współrzędnymi na V zaś pi —dualnymi do nich współrzędnymi na V ∗, ya są współrzędnymi na V , zaś qa — dualnymido nich współrzędnymi na V ∗. Jak wiemy θµ = pidxi oraz θµ = qadya, przy czym musi być

ω = dpi ∧ dxi = dqa ∧ dya . (777)

Ponieważ transformacja między jednymi a drugimi współrzędnymi jest liniowa, więc mamy:

qa = Aaixi + A ia pi ,

ya = Baixi +Baipi .

Wstawiając te wzory do równości (777) otrzymujemy:

dpi ∧ dxi =(Aaidxi + A ia dpi

)∧(Bajdx

j +Bajdpj)

=(A ia B

aj − AajBai

)dpi ∧ dxj + AaiBajdxi ∧ dxj + A ia Bajdpi ∧ dpj .

Wynika stąd, że musi być:

δij = A ia Baj −AajBai ,

AaiBaj = AajB

ai ,

A ia Baj = A ja B

ai .

Zatem otrzymujemy:

qaya =

(Aaix

i + A ia pi) (Bajx

j +Bajpj)

= AaiBajxixj + A ia B

ajpipj +(A ia B

aj + AajB

ai)pixj

= AaiBajxixj + A ia B

ajpipj +(δij + 2AajB

ai)pixj ,

czyli

Eµ − Eµ = pixi − qaya = −AaiBajxixj −A ia Bajpipj − 2AajBaipixj . (778)

Tymczasem mamy:

θµ = qadya =(Aaix

i + A ia pi) (Bajdx

j +Bajdpj)

= AaiBajxidxj + A ia B

ajpidpj + AaiBajxidpj + A ja Baipjdx

i

= AaiBajxidxj + A ia B

ajpidpj + AaiBaj(d(xipj)− pjdxi

)+ A ja B

aipjdx

i

=12d(AaiB

ajxixj + A ia B

ajpipj + 2AaiBaj(xipj))+ δji pjdx

i

= −12d (Eµ − Eµ) + θµ ,

275

Page 282: Rozn. Geom_ - Jerzy Kijowski

skąd wynika teza.

Wniosek: Jeśli Fµ oraz Fµ są funkcjami własnymi podprzestrzeni Lagranżowskiej D ⊂P w dwu różnych modach kontrolnych µ i µ, to zachodzi:

Fµ − Fµ =12(Eµ − Eµ) |D . (779)

Dowód: Na mocy wzoru (771) mamy:

d (Fµ − Fµ) = θµ|D − θµ|D =12d (Eµ − Eµ) |D . (780)

Uwaga: Dwie formy kwadratowe na przestrzeni wektorowej, które mają tę samą róż-niczkę, są sobie równe. W dalszym ciągu niniejszego rozdziału będziemy rozważali ogól-ne rozmaitości symplektyczne, które nie są wyposażone w strukturę wektorową. I wtedyfunkcje tworzące czy funkcje własne są dane jedynie przez swoją różniczkę. A zatem za-wsze będziemy mieli dowolność w wyborze stałej addytywnej przy opisie takiej funkcji.W zastosowaniach funkcje te mają ważne znaczenie, bowiem opisują różne formy energii.Niejednoznaczność wyboru stałej addytywnej odpowiada fizycznemu faktowi, że zazwyczajnie mamy absolutnej miary energii, bowiem mierzymy jedynie zmiany energii przy przej-ściu od jednego stanu układu do innego. W praktyce ujednoznaczniamy definicję energiidekretując, że mierzymy jej przyrost w stosunku do wybranego stanu układu, który nazy-wamy „zerowym”. Na przykład energię potencjalną pola elektrycznego cechujemy tak, byznikała w nieskończoności. Można powiedzieć, że w wektorowej przestrzeni symplektycz-nej posługujemy się podobnym wybiegiem żądając, by nasze wszystkie funkcje generującezerowały się w „zerze” przestrzeni P . Traktując zatem punkt „0 ∈ P” jako wyróżnionąkonfigurację układu. Bardzo często w zastosowaniach dysponujemy takim wyróżnionym zpewnych względów stanem układu (w teorii pola byłby to stan próżni) co pozwala namujednoznacznić definicję energii. Wzór (779) piszemy też często w postaci formuły na nowąfunkcję generującą gdy znamy starą:

Fµ = Fµ −12(Eµ − Eµ) |D . (781)

W niektórych tekstach transformacją Legendre’a nazywa się właśnie powyższy wzór.Przykład 2: „Całkowitą” transformacją Legendre’a nazywamy „najbardziej radykal-

ną” z nich, polegającą na zamianie ról parametrów kontroli i parametrów odpowiedzi ukła-du. A zatem jeśli µ : P → V ∗ ⊕ V to µ : P → V ∗∗ ⊕ V ∗ = V ⊕ V ∗. Jeśli zatem θµ = pidxi,to θµ = −xidpi. Nowe „parametry odpowiedzi” układu są równe „−xi”. Znak „−” jestniezbędny po to, by odwzorowanie µ zachowywało formę symplektyczną, tzn. aby zacho-dził wzór: dθµ = ω = dpi ∧ dxi = dθµ. W tej sytuacji mamy: Eµ = −xipi = −Eµ, zatemEµ − Eµ = 2Eµ. Taką sytuację spotkaliśmy już w Przykładzie 1, na początku niniejszegoparagrafu. Rzeczywiście, pamiętając, że relacja między kontrolą a odpowiedzią w podprze-strzeni D ∈ P wynosi f = kx, mamy: U(x) = 1

2kx2 oraz H(f) = − 1

2kf 2, zatem zachodzi

H(f) = U(x)− (f · x)|D .

276

Page 283: Rozn. Geom_ - Jerzy Kijowski

8.4 Rozmaitość symplektyczna. Pola Hamiltonowskie i nawiasyPoissona

Opuszczamy wreszcie algebrę i przechodzimy do ogólnego przypadku rozmaitości symplek-tycznych.Definicja: Przestrzenią symplektyczną nazywamy parę (P, ω), gdzie P jest rozmaito-

ścią zaś ω nieosobliwą dwu-formą zamkniętą na P , tzn. dω = 0.W każdym punkcie p ∈ P przestrzeń (TpP, ω(p)) jest wektorową przestrzenią sym-

plektyczną, opisaną w poprzednich paragrafach. Stąd wniosek, że jej wymiar musi byćparzysty, a zatem i wymiar P jest parzysty: dimP = 2n. Poza tym mamy w niej określoneodwzorowanie (763), które jest izomorfizmem przestrzeni stycznej z ko-styczną

TpP ∋ v→ v ω(p) =: v ∈ T ∗pP . (782)

Rodzina tych wszystkich izomorfizmów definiuje izomorfizm wiązki stycznej na wiązkę ko-styczną, który będziemy oznaczali tą samą literą:

TP ∋ v→ v ω =: v ∈ T ∗P . (783)

Odwrotny izomorfizm będziemy oznaczali przez ♯ : T ∗P → TP .Przykład: Dla dowolnej rozmaitości Q jej wiązka ko-styczna P = T ∗Q jest przestrzenią

symplektyczną wyposażoną w kanoniczną formę różniczkową

ω := dθ , (784)

gdzie ta ostatnia jedno-forma jest dana wzorem:

θ(p) := π∗p , (785)

zaś π jest kanonicznym rzutowaniem w wiązce ko-stycznej, tzn. π : T ∗Q→ Q. Jeśli wybie-rzemy jakikolwiek układ współrzędnych (qi), i = 1, . . . , n; wQ, to każdy element przestrzeniko-stycznej T ∗

qQ ma postać p = pidqi, zatem (pi, qj) stanowi układ współrzędnych w P .

Rzutowanie wyraża się, jak wiemy, przez zapomnienie o zmiennych pi:

π(pi, qj) = (qj) ∈ Q ,

zatem obraz odwrotny polega na podstawieniu:

π∗(pidqi

)= pid

(π∗qi

)= pidqi .

Taki pedantyczny zapis niezmiernie utrudnia życie, bowiem π∗qi = qi to nic innego niżwłaśnie ta sama współrzędna qi, ale traktowana już jako współrzędna na TQ a nie na Q.Od tej pory będziemy popełniali nadużycie polegające na oznaczaniu tej współrzędnej wobu tych znaczeniach tą samą literą qi. Mamy zatem:

θ = pidqi , ω = dpi ∧ dqi , (786)

277

Page 284: Rozn. Geom_ - Jerzy Kijowski

co dowodzi, że forma ta jest: 1) nieosobliwa oraz 2) zamknięta.Definicja: Pole wektorowe X na przestrzeni symplektycznej nazywamy hamiltonow-

skim (ew. lokalnie hamiltonowskim) jeśli forma X = X ω jest zupełna (ew. zamknięta).Zauważmy, że

£Xω = X dω + d(X ω) = d(X ω)

bowiem ω jest zamknięta. Otrzymujemy stąd natychmiastowyWniosek: Pole X jest lokalnie hamiltonowskie wtedy i tylko wtedy gdy jest symetrią

struktury symplektycznej, tzn. gdy zachodzi

£Xω = 0 . (787)

Oznacza to, że grupa difeomerfizmów GXt generowana przez pole (lokalnie) hamiltonowskiezachowuje formę symplektyczną: (

GXt)∗ω = ω . (788)

Takie odwzorowania będziemy nazywali symplektomorfizmami.Natomiast jeśli X jest polem hamiltonowskim, to istnieje funkcja f taka, że X =

X ω = −df lub, równoważnie:X = − (df)♯ . (789)

Takie pole hamiltonowskie — generowane przez funkcję f — będziemy oznaczali Xf .Przykład:W wiązce ko-stycznej P = T ∗Q wyposażonej w kanoniczną formę symplek-

tyczną ω = dpi ∧ dqi rozważmy dowolne pole wektorowe:

X = qi∂

∂qi+ pj

∂pj. (790)

Oznaczenie (pj , qi) na składowe tego pola znacznie upraszcza dalsze rachunki i jest zgodne zrównaniem (163) definiującym grupę dyfeomeorfizmów generowaną przez to pole. Zachodziwzór

X ω = pjdqj − qidpi .Warunkiem tego, by było to pole Hamiltonowskie jest zatem równanie:

−X ω = qidpi − pjdqj = df(qi, pj) , (791)

lub, równoważnie, tzw. hamiltonowski układ równań

qi =∂f

∂pi, (792)

−pj =∂f

∂qj. (793)

Lemat: Jeśli Xf jest polem hamiltonowskim generowanym przez funkcję f zaś Y jestpolem przynajmniej lokalnie hamiltonowskim, to ich komutator [X, Y ] jest polem hamil-tonowskim generowanym przez funkcję h = −Y (f) = −Y df .

278

Page 285: Rozn. Geom_ - Jerzy Kijowski

Dowód:

dh = −d(Y df) = −d(Y df)− Y ddf = −£Y df= £Y (X ω) = (£YX) ω +X £Y ω = [Y,X] ω = −[X, Y ] ,

zatem[X, Y ] = − (dh)♯ . (794)

Zdefiniujemy teraz bardzo ważną strukturęDefinicja Nawiasem Poissona dwu funkcji f i g na przestrzeni symplektycznej nazy-

wamy funkcję:f, g := 〈ω;Xf ∧Xg〉 =

⟨ω; (df)♯ ∧ (dg)♯

⟩. (795)

Powyższą definicję możemy przekształcić do innej, równoważnej postaci:

ω((df)♯, (dg)♯

)=

⟨(dg)♯

∣∣∣(df)♯ ω⟩=⟨−Xg

∣∣∣∣[(df)♯

]⟩= 〈−Xg|df〉

= −Xg(f) .

Wyrażenie (795) zmienia znak przy zamianie f z g. Wykazaliśmy zatem następującą, al-ternatywną definicję nawiasu Poissona:

−Xg(f) = f, g = −g, f = Xf (g) . (796)

Jeśli zatem pole Y we wzorze (794) jest również polem hamiltonowskim: Y = Xg, to mamyh = −Xg(f) = f, g i wzór ten można przepisać jak następuje:

[Xf , Xg] = − (d(f, g))♯ = Xf,g . (797)

Wynika stąd podstawoweTwierdzenie: Nawias Poissona spełnia tożsamość Jacobi’ego. Zatem przyporządko-

wanie f → Xf jest morfizmem algebr Liego, bowiem na mocy wzoru (797) nawias Liegodwóch pól hamiltonowskich jest generowany przez nawias Poissona ich generatorów:

[Xf , Xg] = Xf,g . (798)

Dowód: Zachodzi

f, g, h+ g, h, f+ h, f, g = Xf (g, h) +Xg(h, f)−Xf,g(h) =Xf (Xg(h))−Xg(Xf(h))−Xf,g(h) = [Xf , Xg](h)−Xf,g(h) = 0

279

Page 286: Rozn. Geom_ - Jerzy Kijowski

8.5 Redukcja symplektyczna

Budując modele różnych zjawisk częstokroć spotykamy przestrzeń pre-symplektyczną. Takaprzestrzeń P jest wyposażona w formę zamkniętą ω, która jednakże jest osobliwa. Oznaczato, że odwzorowanie dane wzorem (782) może mieć nietrywialne jądro:

TpP ⊃ Kp := p | v ω(p) = 0 . (799)

Zbiór Kp jest oczywiście podprzestrzenią wektorową przestrzeni stycznej, czyli definiujedystrybucję. Pole wektorowe X leży w K jeśli zachodzi X ω = 0. Takie pole jest polemsymetrii formy ω bowiem zachodzi:

£X ω = X dω + d(X ω) = 0 . (800)

Łatwo widać, że dystrybucja K jest inwolutywna, więc na mocy Twierdzenia Frobeniusajest (lokalnie) całkowalna, bowiem zachodziLemat 1: Jeśli X, Y ∈ K to również [X, Y ] ∈ K.Dowód:

0 = £Y (X ω) = (£YX) ω +X £Y ω = [Y,X] ω .

Zgodnie z Twierdzeniem Frobeniusa dyskutowanym w rozdziale 3.10, w otoczeniu każ-dego punktu przestrzeni P istnieje taki układ współrzędnych (τ r, ti), że

K = span

∂t1, . . . ,

∂tk

,

zaś współrzędne (τ r) numerują różne powierzchnie całkowe dystrybucji. Możemy wtedyzdefiniować na P relację równoważności: dwa punkty sa równoważne jeśli leżą w tej samejpowierzchni całkowej, czyli gdy można je połączyć krzywą styczną do K. Przestrzeń po-wierzchni całkowych jest zatem przestrzenią ilorazową względem tej relacji. Oznaczmy jąP = P /K. Przestrzeń może mieć patologiczną strukturę.Jednak szczególnie ważny i często występujący w zastosowaniach jest przypadek gdy

dystrybucja K jest globalnie całkowalna, tzn. gdy P jest rozmaitością różniczkowalną. Wte-dy (τ r) możemy traktować jako współrzędne na P . Dla każdego punktu p ∈ P = P /K, toznaczy dla każdej rozmaitości całkowej p ∈ P , przestrzeń styczną do przestrzeni ilorazowejP w tym punkcie możemy traktować jako przestrzeń ilorazową

TpP ≃ TpP /Tpp .

To proste spostrzeżenie polega na tym, że ∂∂τrmożemy traktować jako wektory stycz-

ne do P , ale jednocześnie są one reprezentowane jako wektory styczne do P w układziewspółrzędnych (τ r, ti). Pamiętamy z dowodu Twierdzenia Frobeniusa, że (τ r) wzięły sięze współrzędnych na dowolnej powierzchni w P transwersalnej względem dystrybucji K.

280

Page 287: Rozn. Geom_ - Jerzy Kijowski

Takich dystrybucji transwersalnych w punkcie p jest wiele. Zmiana powierzchni transwer-salnej na inną skutkuje dodaniem do ∂

∂τrwektora stycznego do dystrybucji. Stąd powyższy

wzór.Twierdzenie: Jeśli P = P /K jest rozmaitością różniczkowalną to ω wyznacza na P

formę symplektyczną ω.Dowód: Wektory styczne z przestrzeni TpP możemy reprezentować przez wektory

styczne z przestrzeni TpP . Jeśli zatem X, Y ∈ TpP to kładziemy

ω(X, Y ) := ω(X, Y ) , (801)

gdzie X, Y ∈ TpP są ich dowolnymi reprezentantami. Prawa strona nie zależy od wyborureprezentantów, bowiem dwa różne reprezentanty różnią się o wektor leżący wK, na którymforma ω zeruje się.W układzie współrzędnych (τ r, ti) forma ω może być reprezentowana przez obcięcie

formy ω do dowolnej rozmaitościW transwersalnej względemK. Ale d(ω|W ) = (dω)|W = 0,więc ω jest zamknięta.

Uwaga: Obcięcie ω do dowolnej rozmaitości transwersalnej może być traktowane jakoalternatywna definicja formy ω: ω := ω|W . Wtedy niezależność ω od wyboru W wynikaz faktu, że przejście między dwiema takimi podrozmaitościami transwersalnymi względemK może być implementowane jako translacja wzdłuż pola X stycznego do K. Ale na mocyrównania (800) taka translacja nie zmienia formy ω, skąd teza.Przykład: Jeśli (P, ω) jest przestrzenią symplektyczną, to jej obcięcie ω|N do podroz-

maitości N ⊂ P jest przestrzenią pre-symplektyczną lecz na ogół nie jest symplektyczną.Podzielenie N przez jej degenerację K jest ważną techniką, która w wielu zastosowaniachprowadzi znów do rozmaitości symplektycznej N/K. Zauważmy, że z punktu widzenia całejprzestrzeni P degeneracja formy ω|N dana jest wzorem

Kp = TpN ∩ (TpN) .

Możliwe są tutaj różne sytuacje, w tym skrajne:

1. Maksymalna degeneracja, tzn. (TpN) ⊂ Tp. Mówimy wtedy, że N jest ko-izotropowa.

2. Minimalna degeneracja, tzn. TpN ∩ (TpN) = 0. Wtedy sama N jest symplektycz-na.

8.6 Twierdzenie Darboux

Twierdzenie: W otoczeniu każdego punktu przestrzeni symplektycznej (P, ω) istniejąwspółrzędne kanoniczne (pj , qi), tzn. takie, w których forma symplektyczna ma kanonicznąpostać (757), to znaczy zachodzi:

ω = dpj ∧ dqj . (802)

281

Page 288: Rozn. Geom_ - Jerzy Kijowski

Dowód: Niech (tµ), µ = 1, . . . , 2n; będzie układem współrzędnych w otoczeniu punktup ∈ P . Dla ustalenia uwagi załóżmy, że p = (0, . . . , 0). Wybierzmy jedną ze współ-rzędnych, np. t1, i oznaczmy ją p1. Generuje ona pole Hamiltonowskie, które oznaczymy

X(1) = − (dp1)♯, czyli dp1 = −(X(1)

). Zachodzi zatem

⟨dp1, X(1)

⟩= −ω

(X(1), X(1)

)= 0.

Pole wektorowe X(1) możemy potraktować jako 1-wymiarową dystrybycję całkowalną (bokażda jedno-wymiarowa jest całkowalna). Na mocy twierdzenia Frobeniusa, w otoczeniupunktu p istnieje (2n− 1) współrzędnych, które są stałe na liniach całkowych tego pola.Jedną z tych współrzędnych może być, jak już wiemy, nasze p1. Niech p2 będzie niezależnąod niej współrzędną spełniającą ten warunek. Generuje ona pole Hamiltonowskie, które

oznaczymy X(2) = − (dp2)♯, czyli dp2 = −(X(2)

). Ponieważ zachodzi:

0 =⟨dp2, X(1)

⟩= −ω

(X(2), X(1)

),

pole[X(2), X(1)

], jako pole Hamiltonowskie, generowane przez funkcję

g = −ω(X(2), X(1)

)≡ 0

musi znikać. Wobec tego układ pólX(1), X(2)

generuje dystrybucję całkowalną. Na mocy

twierdzenia Frobeniusa w otoczeniu punktu p istnieje (2n − 2) współrzędnych, które sąstałe na dwuwymiarowych powierzchniach całkowych tej dystrybucji. Jako dwie z tychwspółrzędnych możemy wziąć, jak już wiemy, nasze p1 oraz p2. Niech p3 będzie niezależnąod niej współrzędną spełniającą ten warunek. Generuje ona pole Hamiltonowskie, które

oznaczymy X(3) = − (dp3)♯, czyli dp3 = −(X3)

). Ponieważ

0 =⟨dp3, X(i)

⟩= −ω

(X(3), X(i)

),

gdzie i = 1, 2, zatem pola[X(3), X(i)

], jako pola Hamiltonowskie, generowane przez funkcje

g = −ω(X(3), X(i)

)≡ 0, muszą znikać. W ten sposób otrzymujemy trójwymiarową dys-

trybucję całkowalną, rozpiętą na polach hamiltonowskichX(1), X(2), X(3)

. Rekurencja ta

działa dopóty, dopóki wymiar dystrybucji nie przekroczy n. W ten sposób otrzymamy wotoczeniu naszego punktu p n współrzędnych (pi) oraz n generowanych przez nie pólwektorowych X(i) = − (dpi)♯, takich, że

0 =⟨dpi, X(j)

⟩= −ω

(X(i), X(j)

),

skąd wynika, między innymi, że pola te wzajemnie komutują. Generują one dystrybucjęcałkowalną D.Ale jeśli tak, to z Twierdzenia Frobeniusa wynika, iż zestaw współrzędnych (p1, . . . , pn),

stałych na tej dystrybycji, można uzupełnić do układu współrzędnych (p1, . . . , pn, ξ1, . . . ξn)w otoczeniu naszego punktu p ∈ P w taki sposób, że (ξ1, . . . ξn) są współrzędnymi na każ-dej rozmaitości całkowej tej dystrybucji, rozpiętymi przez te pola, tzn. takimi iż zachodzi:

∂ξi= X(i) . (803)

282

Page 289: Rozn. Geom_ - Jerzy Kijowski

We współrzędnych tych dowolna dwu-forma różniczkowa ma postać:

ω =12ωij dpi ∧ dpj + ωij dpi ∧ dξj +

12ωij dξi ∧ dξj .

Ponieważ na mocy (803) mamy:

ω(X(i), X(j)

)= ωij = 0 ,

orazdpj = −

(X(j)

)= −ω

(X(j), ·

)= ω

(·, X(j)

)= ωij dpi ,

otrzymujemy ωij = δij . Zatem nasza forma ma postać:

ω =12ωij dpi ∧ dpj + dpj ∧ dξj .

Pamiętajmy, że pola (803) są Hamiltonowskie, zatem

0 = £X(k)ω =∂

∂xkω =12

(∂

∂ξkωij)dpi ∧ dpj .

Oznacza to, że współczynniki ωij nie zależą od zmiennych ξi, czyli są jedynie funkcjamizmiennych pk. Ale forma ω jest zamknięta, więc — na mocy Lematu Poincare — lokalniezupełna. Oznacza to, że w otoczeniu punktu p istnieje jedno-forma θ = θi(p)dpi taka, żezachodzi:

12ωij = − ∂

∂piθj .

Skoro tak, to zachodzi wzór:

dpj ∧ d(ξj + θj(p)

)= dpj ∧ dξj −

12ωijdpj ∧ dpi = ω .

Zatem zmienna qj := ξj+θj(p) jest, do pary z pi, poszukiwaną zmienną kanoniczną, bowiemzachodzi ω = dpj ∧ dqj.

8.7 Miara Liouville’a

Przestrzeń symplektyczna nosi na sobie kanoniczną formę objętości zwaną formą Liouvil-le’a, daną wzorem

Λ :=1n!(ω)n :=

1n!

n razy︷ ︸︸ ︷ω ∧ ω ∧ · · · ∧ ω . (804)

Widać, że w układzie współrzędnych kanonicznych, w którym ω = dpj ∧ dqj , forma Lio-uville’a jest równa

Λ := dp1 ∧ dq1 ∧ dp2 ∧ dq2 ∧ · · · ∧ dpn ∧ dqn . (805)

283

Page 290: Rozn. Geom_ - Jerzy Kijowski

Z formuły tej wynika, że Λ 6= 0, zatem definiuje ona pewną („kanoniczną”) orientację prze-strzeni symplektycznej: zgodne z tą orientacją są układy współrzędnych (τµ), dla którychzachodzi

Λ

(∂

∂τ 1, . . . ,

∂τ 2n

)> 0 .

Poza tym dla dowolnego pola lokalnie hamiltonowskiego X tożsamość (787) implikuje:

£XΛ =1

(n− 1)! (£Xω)∧(n−1) razy︷ ︸︸ ︷

ω ∧ ω ∧ · · · ∧ ω= 0 .

Oznacza to, że transformacje generowane przez pole lokalnie hamiltonowskie X zachowująrównież formę objętości Liouville’a na przestrzeni symplektycznej:

(GXt

)∗Λ = Λ. Fakt ten

ma istotne znaczenie w fizyce statystycznej, gdzie stany układu są rozkładami prawdopodo-bieństwa na przestrzeni fazowej układu. Ważne informacje o układzie otrzymuje się właśnieprzez całkowanie względem miary Λ, która nie zmienia się podczas ewolucji generowanejprzez pole hamiltonowskie.

8.8 Symplektyczna teoria kontroli w pełnej wersji nieliniowej.Przykłady z termodynamiki i mechaniki

Definicja: W przestrzeni symplektycznej P mod kontrolny to symplektomorfizm ψ prze-strzeni P na pewną wiązkę ko-styczną T ∗Q traktowaną jako przestrzeń symplektyczna.Współrzędne (qi) na Q pełnią rolę parametrów kontroli, zaś składowe pi kowektorów na Q— parametrów odpowiedzi.Powyższa definicja oznacza, że ψ∗ω = ω, gdzie ω jest formą symplektyczną przestrzeni

P zaś ω jest kanoniczną formą symplektyczną w wiązce ko-stycznej, opisaną wzorami (784)oraz (785). Utożsamiając obie przestrzenie, tzn. pisząc: P = T ∗Q oraz ω = ω, gdy tylkonie prowadzi to do żadnych nieporozumień, znacznie uprościmy notację.Wiele praw fizycznych polega po prostu na wyróżnieniu w przestrzeni fazowej P pewne-

go podzbioru „stanów dopuszczalnych” D ⊂ P , będącego podrozmaitością Lagranżowską.Gdy wybrać w P mod kontrolny, to taka podrozmaitość może być często opisywana po-przez swoją funkcję tworzącą, określoną na przestrzeni parametrów kontroli Q, podobniejak to miało miejsce w liniowej wersji teorii (zob. wzór (762)). ZachodziTwierdzenie 1: Dla dowolnej funkcji gładkiej na Q wykres jej różniczki

D = graph(dF ) (806)

jest podrozmaitością Lagranżowską w T ∗Q. Odwrotnie: każda podrozmaitość Lagranżowskatranswersalna względem włókien wiązki T ∗Q (będąca cięciem tej wiązki) ma lokalnie tępostać. Funkcja tworząca F jest wyznaczona przez D z dokładnością do stałej addytywnej.Dowód: Izotropowość podrozmaitości D ⊂ T ∗Q jest równoważna temu, że jedno-forma

θ dana wzorem (785) po obcięciu do D jest zamknięta, czyli lokalnie zupełna, bowiem namocy (784) mamy:

d (θ|D) = (dθ) |D = ω|D = 0 .

284

Page 291: Rozn. Geom_ - Jerzy Kijowski

Lokalnie istnieje zatem „funkcja własna” F na D spełniająca równanie

θ|D = dF . (807)

Jednak kanoniczne rzutowanie π w wiązce ko-stycznej jest lokalnym izomorfizmem D i Q.Istnieje zatem funkcja F na Q, spełniająca równanie F = π∗F . Dla dowolnego p ∈ Doznaczmy πp = q ∈ Q. Na mocy (785) możemy przepisać równanie (807) w następującysposób:

π∗ (dF (q)) = d (π∗F ) (p) = dF (p) = θ(p) = π∗p ,

co jest równoważne tożsamościdF (q) = p , (808)

równoważnej z kolei równaniu (806).

Jeśli wybrać na Q jakikolwiek układ współrzędnych (qi), to powyższe równanie możnaprzepisać w postaci analogicznego równania (772) w liniowej teorii kontroli:

(pidqi)|D = dF (q) . (809)

Oznacza to, że następujący opis podrozmaitości D jest prawdziwy:

D = (pi, qj) ∈ T ∗Q | pi =∂F

∂qi . (810)

Różnica z teorią liniową polega jedynie na tym, że teraz nie ma wyróżnionego punktuprzestrzeni fazowej, jakim wtedy było zero przestrzeni wektorowej, a więc nie istnieje abso-lutna metoda wyboru funkcji generującej F . Tam zawsze żądaliśmy, by było F (0) = 0, coujednoznaczniało wybór funkcji F . Tutaj natomiast jedynie różniczka dF jest wyznaczonaprzez D, zatem F jest dana z dokładnością do dowolnej stałej addytywnej. W wielu przy-padkach własności układu wyróżniają jakąś szczególną jego konfigurację q ∈ Q. Wtedyżądanie F (q) = 0 może służyć jako praktyczny sposób ujednoznacznienia definicji.Przykład 1: Pierwsze prawo termodynamiki ciała prostego (na przykład pewnej ilości

gazu zamkniętego w naczyniu) zapisuje się w postaci następującego wzoru:

dU(V, S) = −pdV + TdS , (811)

gdzie parametry (V, S, p, T ) oznaczają kolejno: objętość, entropię, ciśnienie oraz temperatu-rę ciała, zaś U = U(V, S) nazywa się energią wewnętrzną ciała. Wzór ten można interpreto-wać jako analogiczną do (809) definicję rozmaitości Lagranżowskiej D w czterowymiarowejprzestrzeni symplektycznej P , wyposażonej w formę symplektyczną:

ω = −dV ∧ dp + dT ∧ dS , (812)

w której wybrano mod kontrolny P = T ∗Q, gdzie Q = (V, S) zaś (−p, T ) są odpowiedni-mi pędami. Odpowiednia jedno-forma kanoniczna θU (forma pierwotna dla dwu-formy ω)wyraża się wzorem:

θU = −pdV + TdS .

285

Page 292: Rozn. Geom_ - Jerzy Kijowski

Termodynamika takiego układu polega na wyróżnieniu w P dwuwymiarowej podrozma-itości lagranżowskiej D składającej się ze stanów „dopuszczalnych fizycznie”. Energia we-wnętrzna U jest funkcją tworzącą tej podrozmaitości zgodnie z formułą (811). Innymisłowy:

D = (V, S, p, T ) ∈ P | − p = ∂U

∂V; T =

∂U

∂S . (813)

Można również wybrać inny mod kontrolny: P = T ∗R, gdzie gdzie R = (p, S). Wtedyjedno-forma kanoniczna θF (forma pierwotna dla dwu-formy ω) wyraża się wzorem

θF = V dp+ TdS ,

co oznacza, że (V, T ) są odpowiednimi pędami. Zgodnie z rozważaniami paragrafu 8.3,transformacja Legendre’a od (811) do nowego modu kontrolnego polega na następującymprzekształceniu:

dU = −pdV + TdS = −d(p · V ) + V dp + TdS ,

d (U + p · V ) = V dp+ TdS .

Wynika stąd następujący związek między dwoma generatorami: F = U + pV . Funkcję Fnazywa się energią swobodną Helmholtza. Widać, że E = pV pełni rolę funkcji ewaluacyjnej(775), a przejście od jednego do drugiego opisu jest transformacją Legendre’a.Przykład 2: Niech G będzie symplektomorfizmem dwóch przestrzeni symplektycznych:

P = T ∗Q oraz P = T ∗Q:G : T ∗Q→ T ∗Q .

Warunek bycia symplektomorfizmem oznacza, że zachodzi

G∗ω = ω , (814)

gdzie ω oraz ω są kanonicznymi formami symplektycznymi w tych przestrzeniach.Rozważmy iloczyn kartezjański obu tych przestrzeni, który z pewnych względów ozna-

czymy jako P ⊖ P , oraz formę symplektyczną daną wzorem

ω(P,P ) := π∗Pω − π∗Pω , (815)

gdzie πP oraz πP oznacza rzutowanie iloczynu kartezjańskiego odpowiednio na P i na P .Wykres odwzorowania G jest podprzestrzenią w iloczynie kartezjańskim:

graphG = D = (p,p) ∈ P ⊖ P | p = G(p) .

Widać, że warunek (814) mówiący iż G jest symplektomorfizmem odpowiada temu, żeforma ω(P,P ) zeruje się na wykresie, to znaczy D jest podprzestrzenią Lagranżowską. Abysię o tym przekonać sparametryzujmy D przestrzenią P . Widzimy, że forma

ω(P,P )|D := G∗ω − ω (816)

286

Page 293: Rozn. Geom_ - Jerzy Kijowski

zeruje się wtedy i tylko wtedy gdy G jest symplektomorfizmem.Jeśli wybrać współrzędne (qi) na Q oraz (qj) na Q zaś odpowiednie pędy oznaczyć jako

(pi) oraz (pj), to forma symplektyczna (815) ma postać

ω(P,P ) := dpj ∧ dqj − dpi ∧ dqi . (817)

Traktując (qi, qj) jako parametry kontroli, zaś (−pi, pj) jako parametry odpowiedzi, możnaszukać funkcji generującej S(qi, qj) rozmaitości D, danej wzorem

pjdqj − pidqi = dS(qi, qj) , (818)

lub równoważnie:D =

(qi, qj, pi, pi

)| − pi =

∂S

∂qi; pj =

∂S

∂qj . (819)

Zamiana między pędami a położeniami w roli parametrów kontroli prowadzi do transfor-macji Legendre’a, gdzie tę samą podrozmaitość D (ten sam dyfeomerfizm G) opisujemy wnastępujący sposób:

dS(qi, qj) = pjdqj − pidqi = d(pj qj)− qjdpj − pidqi ,

zatem−qjdpj − pidqi = dK(pi, qj) , (820)

gdzieK = S − pj qj .

Równanie (820) daje następujący opis rozmaitości D:

D = (qi, qj, pi, pi

)| − qi = ∂S

∂pi;−pj =

∂S

∂qj .

Jak widać, są tu możliwe cztery naturalne mody kontrolne. Wszystkie one odgrywająistotną rolę w mechanice teoretycznej.

Uwaga: Podobnie jak miało to miejsce w teorii liniowej, możemy również opisywać sy-tuację, gdy na parametry kontrolne nałożono więzy C ⊂ Q. Wtedy funkcja generująca jestokreślona jedynie na więzach i kowektor dF nie jest jednoznacznie określony, tzn. więzynałożone na kontrolę skutkują niejednoznacznością odpowiedzi. Niejednoznaczność ta po-lega na możliwości dodania dowolnego ko-wektora należącego do anihilatora (TqC). Jeślizatem rozumieć dF (q) nie jako jeden ko-wektor, lecz jako całą podprzestrzeń kowektorówrównoważnych modulo anihilator (TqC), wtedy wzór (806) znów określa podrozmaitośćlagranżowską w T ∗Q. Podrozmaitość ta rzutuje się na C, jednak jej wymiar jest równy wy-miarowi całej rozmaitości Q (połowie wymiaru przestrzeni fazowej P ), bowiem nad każdympunktem q ∈ C podrozmaitość ta zawiera podprzestrzeń pionową π−1(q) ⊂ T ∗

qQ wymiaru

codimC, modelowaną na tym anihilatorze.

287

Page 294: Rozn. Geom_ - Jerzy Kijowski

Twierdzenie 2: Dla dowolnej funkcji gładkiej na podrozmaitości więzów C ⊂ Q wykresjej różniczki

D = graph(dF ) , (821)

jest podrozmaitością Lagranżowską w T ∗Q. Odwrotnie: każda podrozmaitość Lagranżow-ska, dla której π−1(q) ⊂ T ∗

qQ jest podprzestrzenią liniową stałego (niezależnego od q)

wymiaru, ma lokalnie tę postać. Funkcja tworząca F jest wyznaczona przez D z dokład-nością do stałej addytywnej.Dowód poprzedniego Twierdzenia niniejszego paragrafu został tak sformułowany, że

można go czytać również jako dowód Twierdzenia 2. Należy jedynie zauważyć, że forma θzeruje się na wektorach pionowych, więc funkcja F ma stałą wartość na całej podprzestrzeniπ−1(q), zatem jest podniesieniem pewnej funkcji F z bazy: F = π∗F .Najciekawsze pod pewnym względem są rozmaitości lagranżowskie, które nie spełniają

powyższego założenia, to znaczy ich położenie względem włókien wiązki ko-stycznej zmieniasię od punktu do punktu. Opisu takich podrozmaitości dostarcza tzw. teoria katastrof. Wnaszym wykładzie, mającym bardzo wstępny charakter, obiektami takimi nie będziemy sięjednak zajmować.

8.9 Wersja infinitezymalna symplektycznej teorii kontroli: roz-ważania heurystyczne

Rozważania niniejszego paragrafu będą miały charakter heurystyczny. W języku współ-rzędnych pokażemy, że zarówno Lagrange’owskie jak i Hamiltonowskie sformułowanie me-chaniki można traktować jako opis pewnej uniwersalnej struktury symplektycznej w dwuróżnych modach kontrolnych. Strukturę tę opiszemy w następnym paragrafie w sposóbniezależny od współrzędnych. Rozpocznijmy od przykładu konkretyzującego rozważaniapoprzedniego paragrafu.Przykład: Ogólnie znane równania ruchu oscylatora harmonicznego o masie m, pod-

danego działaniu siły f = −kq, mają postać:

p = mq (822)

p = −kq . (823)

Oznaczając ω :=√kmoraz κ =

√km, mamy: κω = k oraz ω

κ= m. Dowolne rozwiązanie

tego układu równań można zapisać w postaci:

q(t) = A cosω(t− τ) + B

κsinω(t− τ) ,

p(t) = −κA sinω(t− τ) +B cosω(t− τ) ,

gdzie stałe (A,B) oznaczają dane początkowe: A = q(τ), B = p(τ). Przez podstawieniełatwo sprawdzić, że odwzorowanie to jest symplektomorfizmem przestrzeni danych począt-kowych z przestrzenią danych końcowych, tzn. że zachodzi tożsamość:

dp(t) ∧ dq(t) = dB ∧ dA .

288

Page 295: Rozn. Geom_ - Jerzy Kijowski

Jeśli zatem (pi, qj) oznaczają dane początkowe w chwili t1 zaś (qj, pj) — dane w chwilit2, to podstawiając t1 zamiast τ oraz t2 zamiast t otrzymujemy następujący opis relacjisymplektycznej między danymi początkowymi a danymi końcowymi na odcinku [t1, t2]:

q = q cosω(t2 − t1) +p

κsinω(t2 − t1) , (824)

p = −κq sinω(t2 − t1) + p cosω(t2 − t1) . (825)

Wykresem tej relacji jest podrozmaitość Lagranżowska D[t1,t2] ⊂ P ⊖ P . Jej funkcja two-rząca S[t1,t2] = S[t1,t2](q, q) musi spełniać równanie:

dS[t1,t2](q, q) = pdq − pdq . (826)

Gdy sinω(t2− t1) 6= 0, to sprawa jest prosta, bowiem równanie (824) daje się rozwiązać zewzględu na p. Po wstawieniu tego rozwiązania do (825) otrzymujemy parametry odpowiedzi(p, p) jednoznacznie wyrażone przez parametry kontroli (q, q):

p =κ

sinω(t2 − t1)q − κq ctgω(t2 − t1) ,

p = − κ

sinω(t2 − t1)q + κq ctgω(t2 − t1) .

Wstawiając te wartości do formuły (826) otrzymujemy

S[t1,t2](q, q) =κ

2 sinω(t2 − t1)(q2 cosω(t2 − t1)− 2qq + q2 cosω(t2 − t1)

). (827)

Jeśli natomiast sinω(t2 − t1) = 0, to znaczy gdy (t2 − t1) = Nπω = N T2 , gdzie przez T = 2πωoznaczyliśmy okres drgań oscylatora, to zachodzi: cosω(t2 − t1) = (−1)N i równanie (824)implikuje więzy C dane równaniem

q = (−1)Nq =q = q for N = 2kq = −q for N = 2k + 1

. (828)

Jednocześnie równanie (825) implikuje podobny związek parametrów odpowiedzi:

p = (−1)Np =p = p for N = 2kp = −p for N = 2k + 1

, (829)

więc po wstawieniu tych związków do formuły generacyjnej (826) otrzymujemy dS[t1,t2] = 0.Możemy zatem przyjąć S[t1,t2] ≡ 0. Dwuwymiarowa rozmaitość D[t1,t2] ⊂ P ⊖ P rzutujesię na jednowymiarową podrozmaitość C parametrów kontroli, zawiera zatem kierunki pio-nowe, przez co parametry odpowiedzi są dane niejednoznacznie: muszą jedynie spełniać(829). Mogło by się zdawać, że opis ten jest nieciągły ze względu na zmianę czasu.Widzimy jednak, że ta pozorna nieciągłość wynika jedynie z wyboru konkretnej para-

metryzacji: przecież gdy sparametryzujemy D[t1,t2] danymi początkowymi (qj , pj), to wsta-

wiając wyrażenie (824) oraz (825) do (826) otrzymujemy doskonale ciągłą zależność funkcjiwłasnej od czasu, mianowicie:

S[t1,t2](p, q) =12

(1κp2 − κq2

)sinω(t2 − t1) cosω(t2 − t1)− qp sin2 ω(t2 − t1) . (830)

289

Page 296: Rozn. Geom_ - Jerzy Kijowski

Jest to ta sama funkcja co (827), tylko w innej parametryzacji. W szczególności dla ∆t =(t2 − t1) → 0 opis nasz wygląda na osobliwy, choć przecież samo D[t1,t2] jest w granicybardzo regularnym obiektem: wykresem odwzorowania tożsamościowego!Przedstawimy heurystycznie klarowną ideę pochodzącą od W. M. Tulczyjewa. Wyjaśnia

ona w jaki sposób warto patrzeć na to przejście graniczne. Jej matematycznie ścisły opisprzedstawimy w kolejnym paragrafie.Na miejsce danych końcowych (q, p) wpowadźmy podstawienie:

q = q + q ·∆t ,p = p+ p ·∆t .

Oto forma symplektyczna (817) zmiennych (q, p, q, p):

ω(t,t+∆t) := dp ∧ dq − dp ∧ dq = (dp ∧ dq + dp ∧ dq) ·∆t+ (dp ∧ dq) · (∆t)2 . (831)

Można zatem zdefiniować „infinitezymalną strukturę symplektyczną” jako granicę:

ωI = lim∆t→0

ω(t,t+∆t)∆t

= dp ∧ dq + dp ∧ dq . (832)

Tak więc „infinitezymalna przestrzeń fazowa” P I opisana współrzędnymi (q, p, q, p) jestprzestrzenią symplektyczną a równania ruchu (822) – (823) można traktować jako definicjępewnej podrozmaitości Lagranżowskiej DI ⊂ P I . Gdy (q, q) wybierzemy jako parame-try kontroli, to odpowiednią jedno-formę pierwotną dla formy symplektycznej będziemy

oznaczali symbolem

θ:

θ= pdq + pdq . (833)

Funkcja tworząca dynamiki infinitezymalnej DI w tym modzie kontrolnym nazywa sięLagrangianem. Może być ona uzyskana z funkcji tworzącej (827) przez identyczne przejściegraniczne:

L(q, q; t) = lim∆t→0

1∆tS[t,t+∆t](q, q + q∆t) . (834)

Ponieważ dla ∆t → 0 zachodzi sinω∆t ≃ ω∆t, widać, że wystarczy znaleźć rozwinięcielicznika wzoru (827) z dokładnością do drugich potęg. Kładąc zatem

cosω∆t ≃ 1− (ω∆t)2

2

otrzymujemy:

q2 cosω∆t− 2qq + q2 cosω∆t ≃ (q − q)2 − q2 + q2

2(ω∆t)2 ≃

q2 − q2ω2

(∆t)2

i, w konsekwencji,

L(q, q) =12

κ

ωq2 − q2κω

=12

mq2 − kq2

. (835)

290

Page 297: Rozn. Geom_ - Jerzy Kijowski

Widzimy więc, że równaniedL(q, q) = pdq + pdq (836)

definiuje rzeczywiście dynamikę, to znaczy równania ruchu (822) – (823).Wybierzmy teraz w infinitezymalnej przestrzeni fazowej P I inny mod kontrolny, różny

od (833), polegający na kontrolowaniu zmiennych (q, p) i traktowaniu pozostałych zmien-nych (p, q) jako parametry odpowiedzi. Odpowiednia jedno-forma pierwotna dla ωI wyglądanastępująco:

θI = pdq − qdp . (837)

Funkcja tworząca dynamiki infinitezymalnej DI w tym modzie nazywa się minus Hamilto-nianem teorii. Spełnia ona zatem równanie generujące:

−dH(p, q) = pdq − qdp (838)

równoważne hamiltonowskiemu układowi równań (792) – (793) dla pola hamiltonowskiegoXH , generowanego przez funkcję H . Można ją uzyskać z Lagrangianu przez transformacjęLegendre’a:

dL(q, q) = pdq + pdq = pdq + d(pq)− qdp ,czyli

−d(pq − L) = pdq − qdp , (839)

lub równoważnie:H = pq − L = 1

2

1mp2 + kq2

. (840)

Jeśli przez Q oznaczymy jednowymiarową przestrzeń konfiguracyjną oscylatora, odpo-wiadającą zakresowi wartości współrzędnej q, to (p, q) są współrzędnymi na T ∗Q. A czymjest tajemnicza „infinitezymalna przestrzeń fazowa” P I , opisywana współrzędnymi (p, q, p, q)?Jej uniwersalny i precyzyjny matematycznie opis przedstawimy w następnym paragrafie.Na razie zauważmy, że w dotychczasowych rozważaniach pojawiły się trzy różne reprezen-tacje tej przestrzeni.

1. P I = TT ∗Q, to znaczy punkt tej przestrzeni jest wektorem stycznym X do przestrzeniT ∗Q. Współrzędne (p, q) są składowymi wektora:

X = q∂

∂q+ p

∂p∈ T(p,q)T ∗Q ,

zaś (p, q) ∈ T ∗Q są współrzędnymi jego punktu zaczepienia.

2. P I = T ∗T ∗Q, to znaczy punkt tej przestrzeni p jest ko-wektorem na przestrzeni T ∗Q.Współrzędne (p, q) są składowymi ko-wektora:

p = −qdp+ pdq ∈ T ∗(p,q)T ∗Q ,

zaś (p, q) ∈ T ∗Q są współrzędnymi jego punktu zaczepienia.

291

Page 298: Rozn. Geom_ - Jerzy Kijowski

3. P I = T ∗TQ, to znaczy punkt tej przestrzeni jest ko-wektorem na przestrzeni stycznejTQ. Współrzędne (p, p) są składowymi ko-wektora:

ξ = pdq + pdq ∈ T ∗(q,q)TQ ,

zaś (q, q) ∈ TQ są współrzędnymi jego punktu zaczepienia.

Niezależnie od tego, którą z tych trzech reprezentacji wybierzemy, przestrzeń ta nosi nasobie strukturę symplektyczną daną wzorem (832). Dynamikę oscylatora harmonicznegomożna traktować jako podrozmaitość Lagranżowską DI ⊂ P I w tej przestrzeni. Wyprowa-dziliśmy trzy równoważne opisy tej dynamiki:

1. DI jest wykresem pola hamiltonowskiego XH . Wartości pola są wektorami stycznymido T ∗Q. Opisują je równania hamiltonowskie (792) – (793) dla Hamiltonianu f = H .

2. DI jest wykresem różniczki funkcji tworzącej „−H = −H(p, q)” w modzie kontrolnymP I = T ∗(T ∗Q), zgodnie z równaniem (838).

3. DI jest wykresem różniczki funkcji tworzącej „L = L(q, q)” w modzie kontrolnymP I = T ∗(TQ), zgodnie z równaniem (836).

Jak pokażemy w dalszym ciągu, ten ostatni opis można interpretować w postaci tzw. zasadywariacyjnej.

8.10 „Trójka” Tulczyjewa

Podamy teraz pełny opis struktur wyprowadzonych heurystycznie w poprzednim paragra-fie. Niech Q będzie dowolną rozmaitością różniczkowalną. Rozważymy następujące trzyprzestrzenie symplektyczne: T ∗T ∗Q, TT ∗Q oraz T ∗TQ. Pierwsza i ostatnia jest wiązkąko-styczną, noszą więc na sobie kanoniczne formy symplektyczne, które oznaczymy odpo-wiednio jako ωI (w przestrzeni T ∗T ∗Q) oraz ωT (w przestrzeni T ∗TQ).Przestrzeń TT ∗Q jest natomiast kanonicznie izomorficzna zarówno z pierwszą z nich

jak i z ostatnią. Izomorfizm z T ∗T ∗Q już znamy, bowiem jest on dany odwzorowaniem : TT ∗Q→ T ∗T ∗Q. Jak wiemy, zarówno to odwzorowanie jak i odwrotne doń, to znaczy♯ : T ∗T ∗Q→ TT ∗Q, są odwracalne.Ale przestrzeń TT ∗Q jest również kanonicznie izomorficzna przestrzeni T ∗TQ, co wy-

każemy jak następuje:Lemat 1: Dla każdego u ∈ TQ podzbiór Πu przestrzeni TT ∗Q złożony z tych wektorów,

które rzutują się na u przy odwzorowaniu stycznym π∗TT∗Q→ TQ, to znaczy zbiór

Πu = π−1∗ (u) = X ∈ TT ∗Q | π∗(X) = u ⊂ TT ∗Q ,

posiada kanoniczny izomorfizm αu z przestrzenią ko-styczną do TQ w punkcie u:

αu : Πu → T ∗u(TQ) .

292

Page 299: Rozn. Geom_ - Jerzy Kijowski

Dowód tego faktu będzie polegał na konstrukcji izomorfizmu αu. Zanim się tym zaj-miemy, przyjrzyjmy się bliżej zaistniałej sytuacji. Składając działanie αu dla wszystkichmożliwych punktów u ∈ TQ otrzymujemy izomorfizm

α : TT ∗Q→ T ∗TQ .

Możemy go zastosować do cofnięcia formy symplektycznej ωT do TT ∗Q.Ale mamy też izomorfizm

: TT ∗Q→ T ∗T ∗Q ,

który też możemy zastosować do cofnięcia formy symplektycznej ωI do TT ∗Q.Lemat 2: Zachodzi tożsamość:

α∗ωT = ∗ωI .

Przestrzeń TT ∗Q jest zatem wyposażona w kanoniczną formę symplektyczną, którąoznaczymy

ω:= α∗ωT = ∗ωI . (841)

Zanim przejdziemy do dowodów zauważmy, że otrzymaliśmy zestaw następujących trzechprzestrzeni symplektycznych: (T ∗T ∗Q,ωI), (TT ∗Q,

ω) oraz (T ∗TQ, ωT ), zwany trójką Tul-

czyjewa. Jako wniosek z powyższych rozważań otrzymujemy fundamentalnej wagiTwierdzenie: Wszystkie elementy trójki Tulczyjewa są izomorficzne. Izomorfizmy te:

T ∗T ∗Q← TT ∗Q

α→ T ∗TQ (842)

są symplektomorfizmami.

Pozostało zatem wykazać oba Lematy.Dowód Lematu 1: Dowolny punkt X ∈ TT ∗Q, czyli wektor styczny do T ∗Q, możemy

reprezentować jako wektor styczny do pewnej krzywej sparametryzowanej γ w T ∗Q:

X = γ(0) ∈ TT ∗Q .

Jeśli π : T ∗Q→ Q jest kanonicznym rzutowaniem, to β = π γ jest krzywą w Q. Zachodziwięc

β = π∗γ ∈ TQ ,

a w szczególności: β(0) = π∗X ∈ TQ.Wektor u ∈ TQ możemy również reprezentować jako wektor styczny do pewnej krzywej

sparametryzowanej w Q. Dla wektora spełniającego u = π∗X możemy jako tę krzywą wziąćwłaśnie opisany wyżej rzut β krzywej γ. Mamy więc β(0) = u, przy czym β(0) ∈ Q jestpunktem zaczepienia tego wektora.

293

Page 300: Rozn. Geom_ - Jerzy Kijowski

Gdy wzniesiemy się o jeden szczebel abstrakcji, wektor V ∈ Tu(TQ) możemy interpre-tować jako infinitezymalną translację elementu u, to znaczy wektora wraz z jego punktemzaczepienia. Taką translację można uzyskać działając na przykład grupą dyfeomerfizmówGYǫ generowaną przez jakieś pole wektorowe Y na Q. Wtedy otrzymamy nową krzywą

βǫ(t) := GYǫ (β(t)) ,

a więc nowy punkt βǫ(0) ∈ Q, oraz zaczepiony w nim nowy wektor uǫ := βǫ(0). W wynikutej konstrukcji powstała krzywa ǫ 7→ uǫ ∈ TQ, której wektorem stycznym jest nasz wektorV ∈ Tu(TQ).Takie kodowanie informacji o wektorze V jest bardzo rozrzutne. Na przykład zmiana

wartości pola Y poza krzywą β nie zmienia krzywej βǫ, zatem nie zmienia wyniku. Wystar-czy zatem znajomość wartości pola Y w punktach należących do krzywej β. Oznaczająct 7→ σ(t) := Y (β(t)) ∈ Tβ(t)Q otrzymujemy krzywą w TQ rzutującą się na krzywą β w Q.I taką właśnie reprezentacją przestrzeni TTQ będziemy się posługiwać w celu skonstru-owania izomorfizmu αu.Ustalmy zatem wektor u ∈ TQ i jego reprezentację w postaci krzywej β w Q. Każdy

element X zbioru Πu ⊂ TT ∗Q będziemy reprezentować krzywą γ w T ∗Q rzutującą się naβ. Każdy element V przestrzeni Tu(TQ) będziemy reprezentować krzywą σ w TQ, równieżrzutującą się na β. Teraz definicję ko-wektora αu(X) ∈ T ∗TQ możemy już podać:

〈αu(X)|V〉 :=ddt〈γ(t) | σ(t)〉

∣∣∣∣∣t=0

∈ R . (843)

Wyrażenie to niewątpliwie nie zależy od wyboru reprezentantów, to znaczy krzywych β,γ oraz σ, a jedynie od ich pochodnych w punkcie t = 0, czyli od obiektów u, X orazV, które te krzywe reprezentują. Wynik zależy liniowo od wektora V, zatem definiujeelement αu(X) ∈ T ∗uTQ. Pozostało zatem wykazać, że α jest izomorfizmem. Najprostszymsposobem dowodu będzie użycie opisu współrzędnościowego.Niech więc (qi) będzie układem współrzędnych wQ. Generuje on układy współrzędnych:

(pj, qi) w wiązce ko-stycznej oraz (qi, qj) w wiązce stycznej, gdzie odpowiadające im obiektysą równe: p = pidqi ∈ T ∗Q oraz u = qj ∂∂qi ∈ TQ.Każdy wektor X ∈ TT ∗Q ma w tych zmiennych postać

X = qi∂

∂qi+ pj

∂pj,

zaś V ∈ TTQ ma postaćV = V i

∂qi+ V i

∂qi.

Krzywe reprezentujące te obiekty mają postać γ(t) = (pj(t), qi(t)), zaś σ(t) = (vi(t), qi(t)),a ich wspólny rzut na Q to po prostu krzywa β(t) = (qi(t)). Natomiast krzywa βǫ opisanajest w tych współrzędnych następująco:

βǫ(t) = (qi(t) + ǫvi(t),+o(ǫ)) .

294

Page 301: Rozn. Geom_ - Jerzy Kijowski

Zatem uǫ = βǫ(0) ma współrzędne:

uǫ = βǫ(0) =(qi(0) + ǫvi(0), qi(0) + ǫvi(0)

).

Biorąc to wszystko pod uwagę możemy wyliczyć współrzędne naszych obiektów:

qi = qi(0) ; qi =ddtqi(t)

∣∣∣∣∣t=0

,

pi = pi(0) ; pi =ddtpi(t)

∣∣∣∣∣t=0

,

V i = vi(0) ; V i =ddtvi(t)

∣∣∣∣∣t=0

.

Zatem definicja (843) daje:

〈αu(X)|V〉 =ddt〈γ(t) | σ(t)〉

∣∣∣∣∣t=0

=ddt(pi(t)vi(t))

∣∣∣∣∣t=0

= piVi + piV i =

⟨pidqi + pidqi

∣∣∣V⟩.

„Uproszczenie” tej równości przez V prowadzi do wzoru:

α

(qi∂

∂qi+ pj

∂pj

)= pidqi + pidqi , (844)

co dowodzi, że odwzorowanie α jest izomorfizmem przestrzeni TT ∗Q na T ∗TQ.

Dowód Lematu 2:Aby znaleźć postać formy ∗ωI znów posłużymy się współrzędnymi. Dowolny element

przestrzeni T ∗T ∗Q zapisuje się we współrzędnych (pj , qi) jako

p = Πidqi + Ξjdpj ,

zatem (pj, qi,Πi,Ξj) stanowi układ współrzędnych w tej przestrzeni. Jak wiemy z rozważańparagrafu 8.4 (np. formuła (786)) forma kanoniczna ωI wyraża się wzorem:

ωI = dΠi ∧ dqi + dΞj ∧ dpj . (845)

Jeśli więc

X = qi∂

∂qi+ pj

∂pj,

to

X =

(qi∂

∂qi+ pj

∂pj

) (dpk ∧ dqk

)

= pjdqj − qidpi = Πidqi + Ξjdpj ,

295

Page 302: Rozn. Geom_ - Jerzy Kijowski

lub równowaznie:Πi = pi , Ξj = −qj . (846)

Wstawiając te wartości do (845) otrzymujemy:

∗ωI = −dqi ∧ dpi + dpi ∧ dqi = dpi ∧ dqi + dpi ∧ dqi . (847)

Z drugiej strony dowolny ko-wektor na TQ zapisuje się we współrzędnych (qi, qj) jakoKidqi + Ljdqj , zatem (qi, qj, Ki, Lj) stanowi układ współrzędnych na T ∗TQ, w którymkanoniczna forma symplektyczna ma postać:

ωT = dKi ∧ dqi + dLj ∧ dqj . (848)

Teraz wzór (844) na odwzorowanie α może być przepisany w następujący sposób:

α(qi, qi, pj , pj

)= (qi, qj, pi, pj) , (849)

czyli Ki = pi oraz Lj = pj . Wstawiając te wartości do (848) otrzymujemy:

α∗ωT = dpi ∧ dqi + dpi ∧ dqi = ∗ωI . (850)

Uwaga: Powyższy wzór jest wyrażeniem współrzędnościowym na formęω:= α∗ωT =

∗ωI , co zgadza się z wyprowadzoną heurystycznie w poprzednim paragrafie formą (832).Bardzo wygodne jest następujące oznaczenie24:

ω=ddt

(dpi ∧ dqi

)= dpi ∧ dqi + dpi ∧ dqi . (851)

Jeśli teraz D jest rozmaitością Lagranżowską (relacją symplektyczną) w przestrzeni

P I := T ∗T ∗Q ≃ TT ∗Q ≃ T ∗TQ , (852)

to w modzie kontrolnym T ∗TQ można ją opisać funkcją tworzącą L = L(q, q)

dL = pidqi + pidqi , (853)

to znaczy:

pi =∂L

∂qi; pi =

∂L

∂qi, (854)

24Takie formalne „zróżniczkowanie po czasie” formy symplektycznej ω = dpi∧dqi, które opisaliśmy powy-żej za pomocą wysoce nietrywialnych struktur, zyskuje pełne prawo obywatelstwa i znacznie się upraszcza,jeśli nie nalegamy, by cała ta konstrukcja odbywała się w jednej przestrzeni symplektycznej. Naturalnymjęzykiem jest tutaj struktura „czasoprzestrzeni” jako wiązki Q nad bazą, którą jest jednowymiarowa ośczasu B. Ustalona przestrzeń Q jest zastąpiona włóknami Qt, t ∈ B tej wiązki. Trajektorie opisujemy jakocięcia odpowiednich wiązek nad B a powyższa operacja (851) staje się matematycznie dobrze określonymoperatorem „rozszerzenia jetowego” („jet extension”) samej formy ω.

296

Page 303: Rozn. Geom_ - Jerzy Kijowski

lub, równoważniedL = θL|D , (855)

gdzie θL = pidqi + pidqi jest formą pierwotną formy symplektycznej ωI w tym modzie. Tęsamą relację można opisać w modzie kontrolnym T ∗T ∗Q funkcją tworzącą −H = −H(q, p)

−dH = pidqi − qidpi , (856)

to znaczy:

qi =∂H

∂pi; pi = −

∂H

∂qi, (857)

lub, równoważnie−dH = θH |D , (858)

gdzie θH = pidqi − qidpi jest formą pierwotną formy symplektycznej ωI w tym modzie.Natomiast w reprezentacji P I = TT ∗Q rozmaitośćD jest po prostu wykresem wektorowegopola hamiltonowskiego XH . Transformacja Legendre’a (839) daje: H = pq − L.

8.11 Składanie relacji symplektycznych. Zasady wariacyjne

Niech Pt1 , Pt2 , Pt3 będzie trójką przestrzeni symplektycznych natomiast D[t1,t2] ⊂ Pt2 ⊖Pt1 oraz D[t2,t3] ⊂ Pt3 ⊖ Pt2 – relacjami symplektycznymi. Złożenie relacji definiuje sięnastępująco:

D[t1,t2] D[t2,t3] :=(p1,p3) | istnieje p2 ∈ Pt2 że (p1,p2) ∈ D[t1,t2] , (p2,p3) ∈ D[t2,t3] ⊂ Pt3 ⊖ Pt1 .

Złożenie to nie musi być podrozmaitością. Interesujące są jednak wypadki, kiedy tak jest,a w szczególności kiedy wszystkie trzy podrozmaitości mają funkcję tworzącą. Niech więc(pi(ta), qi(ta)) będą układami współrzędnych w Pta = T ∗Qta , gdzie a = 1, 2, 3. Jeśli terazS[t1,t2](q

i(t1), qi(t2)) oraz S[t2,t3](qi(t2), qi(t3)) są ich funkcjami tworzącymi, to na mocy (819)

wiemy, że punkt (qi(t1), pi(t1), qj(t2), pj(t2)) należy do D[t1,t2] wtedy i tylko wtedy gdyzachodzi:

pj(t2) =∂S[t1,t2]∂qj(t2)

, pj(t1) = −∂S[t1,t2]∂qj(t1)

.

Podobnie (qi(t2), pi(t2), qj(t3), pj(t3)) należy do D[t2,t3] wtedy i tylko wtedy gdy zachodzi:

pj(t3) =∂S[t2,t3]∂qj(t3)

, pj(t2) = −∂S[t2,t3]∂qj(t2)

.

Wynika stąd oczywisty wniosek.Wniosek: Punkt (qi(t1), pi(t1), qj(t3), pj(t3)) należy do D[t1,t2] D[t2,t3] wtedy i tyl-

ko wtedy, gdy istnieje punkt stacjonarny (qi(t2)) ∈ Qt2 sumy dwu funkcji tworzących,tzn. spełniający równość:

∂qj(t2)

(S[t1,t2](q

i(t1), qi(t2)) + S[t2,t3](qi(t2), qi(t3))

)= 0 . (859)

297

Page 304: Rozn. Geom_ - Jerzy Kijowski

Wartość stacjonarna sumy stanowi funkcję tworzącą relacji D[t1,t3] := D[t1,t2] D[t2,t3].

Spostrzeżenie to można uogólnić na wielokrotne złożenie relacji symplektycznych. JeśliD[ta,ta+1], gdzie a = 1, 2, . . . , N są relacjami symplektycznymi na kolejnych odcinkach cza-sowych [ta, ta+1], zaś S[ta,ta+1] = S[ta,ta+1](q

i(ta), qi(ta+1)) są ich funkcjami tworzącymi, toich złożeniem nazywamy relację składającą się z takich par (p(t1),p(tN) ∈⊂ PtN ⊖Pt1 , dlaktórych istnieje taka sekwencja punktów p(ta) ∈ Pta , że kolejne pary należą do kolejnychrelacji:

(p(ta),p(ta+1)) ∈ D[ta,ta+1] .Widzimy, że funkcją tworzącą takiego złożenia jest wartość sumy wszystkich tych funkcjitworzących wzięta w punkcie stacjonarnym:

S[t1,tN ](qi(t1), qi(tN)) =

N−1∑

a=1

S[ta,ta+1](qi(ta), qi(ta+1))

∣∣∣∣∣stat

. (860)

Rzeczywiście, w punkcie stacjonarnym pochodna po pośrednich konfiguracjach qi(ta), a =2, 3, · · · , N − 1, znika. Oznacza to, że pędy pośrednie są dobrze zdefiniowane:

pj(ta) =∂S[ta−1,ta]∂qj(ta)

= −∂S[ta,ta+1]∂qj(ta)

czyli sekwencja par (qj(ta), pj(ta)) spełnia warunek sformułowany w definicji złożenia rela-cji.Jeśli na sekwencję konfiguracji (qj(ta)) spojrzeć jako na trajektorię układu, to waru-

nek stacjonarności nazywa się „zasadą wariacyjną”. Rzeczywiście, w wielu zastosowaniachoznacza on minimalizację wartości sumy (860) przy zadanych z góry wartościach brzego-wych konfiguracji, tzn. (qj(t1)) oraz (qj(tN)).Można też rozważać przejście graniczne, polegające na uwzglednianiu coraz drobniejsze-

go podziału ustalonego odcinka czasu [tin, tout] odcinkami [t, t+∆t], przy ∆t→ 0. Zgodniez wzorem (834) mamy w granicy

S[t,t+∆t](q, q + q∆t) ≃ ∆t · L(q, q; t) , (861)

zaś suma po wszystkich odcinkach podziału skończonego przechodzi w całkę

W (qin, qout) =N−1∑

a=1

S[ta,ta+1](qi(ta), qi(ta+1)) ≃

∫ touttin

L(q, q; t)dt . (862)

Złożenie infinitezymalnych praw dynamiki powinno zatem odpowiadać warunkowi stacjo-narności funkcjonałuW ze względu na trajektorię, której wartości brzegowe: q(tin) w chwilitin oraz q(tout) w chwili tout, są ustalone.Wiele praw fizycznych daje się sformułować w postaci zasad wariacyjnych. Niektóre

z nich odpowiadają rzeczywiście minimalizacji (np. energii) lub maksymalizacji (np. en-tropii), jednak najczęściej chodzi jedynie o znikanie pochodnych, a rozwiązanie problemu

298

Page 305: Rozn. Geom_ - Jerzy Kijowski

wcale nie jest punktem ekstremalnym lecz jedynie punktem siodłowym funkcjonału (862).Historycznie pierwszą taką zasadą była sformułowana w XVII w. zasada Fermata w optycegeometrycznej. Zauważył on, że promień świetlny w ośrodku o zmiennej gęstości optycznejwybiera drogę minimalizującą tzw. drogę optyczną, Warto przeprowadzić proste ćwiczeniepolegające na wyprowadzeniu z zasady Fermata prawa Snelliusa opisującego załamanieświatła na granicy dwóch ośrodków. Rzeczywiście, jeśli prędkości światła w obu ośrodkachsą stałe ale różnią się między sobą, to znane ze szkoły prawo sinusów sin θ1

sin θ2= n2n1= n21

oznacza, iż ze wszystkich możliwych trajektorii o ustalonym początku i końcu promieńświetlny wybiera najszybszą.Kilkadziesiąt lat później matematyk francuski Pierre Louis de Maupertuis sformułował

tzw. zasadę najmniejszego działania w mechanice, której uogólnieniem jest odgrywającaobecnie ogromną rolę zasada Hamiltona. Nazwa jest myląca, bowiem spełniające tę za-sadę prawdziwe trajektorie układu prawie nigdy nie minimalizują działania lecz jedyniestanowią jego punkt siodłowy. Znalezienie zasad wariacyjnych wywołało ogromną dyskusjęfilozoficzną, w której jedną ze stron byli myśliciele przekonani o „celowości” wszelkiej ewo-lucji czasowej w fizyce, gdzie celem miałoby być właśnie minimalizowanie pewnej wielkościfizycznej mierzącej „wysiłek” potrzebny do jej realizacji.Zauważmy tutaj, że rozważania niniejszego paragrafu dowodzą, że zasada wariacyjna

jest zawsze równoważna superpozycji lokalnych w czasie relacji symplektycznych. Podkre-ślamy przy tym, że w problemach dynamicznych prawie nigdy nie chodzi o optymalizacjęlecz o znalezienie punktu stacjonarnego.

8.12 Równania Eulera-Lagrange’a

Niech zatem będzie dana funkcja konfiguracji i prędkości L(q, q; t), być może zależna teżexplicite od czasu. Przy jej pomocy zdefiniujemy funkcjonał działania zależny od trajektoriiukładu t 7→ β(t) = (qi(t)) ∈ Q:

W (β) =∫ t2t1

L(q(t), q(t); t)dt . (863)

Zbadamy jak zmienia się wartość działania przy niewielkich odkształceniach trajektorii.W tym celu rozważmy jednoparametrową rodzinę trajektorii βs opisaną we współrzędnychfunkcją od dwóch parametrów: t i s:

βs(t) = (qi(t, s)) ∈ Qt . (864)

Pozwoliliśmy sobie na pewną ogólność: przestrzeń konfiguracyjna Q nie musi być stała wczasie lecz może być włóknem Qt pewnej wiązki Q której bazą jest oś czasu. Mamy zatemfunkcję parametru odkształcenia s:

f(s) :=W (βs) =∫ t2t1

L(q(t, s), q(t, s); t)dt .

299

Page 306: Rozn. Geom_ - Jerzy Kijowski

Oznaczmy, jak zwykle, pochodne po czasie kropką. Natomiast pochodne po parametrze soznaczmy stosując uświęcone tradycją oznaczenie „delta”, to znaczy:

∂qi

∂s=: δqi .

Zastosujmy twierdzenie o różniczkowaniu całek z parametrem. W ten sposób otrzymamynastępujący wzór na pochodną działania względem parametru odkształcenia:

δW =dfds=∫ t2t1

∂L

∂qiδqi +

∂L

∂qiδqidt .

Ale zachodzi δqi = ∂∂t(δqi) bowiem drugie pochodne są przemienne25. Wobec tego ostatni

człon możemy scałkować przez części otrzymując:

∫ t2t1

∂L

∂qi∂

∂t(δqi)

dt =

(∂L

∂qiδqi)∣∣∣∣∣

t2

t1

−∫ t2t1

∂t

∂L

∂qi

δqidt .

Ostatecznie więc

δW =∫ t2t1

∂L

∂qi− ∂

∂t

∂L

∂qi

δqidt+

(∂L

∂qiδqi)∣∣∣∣∣

t2

t1

. (865)

Jeśli ograniczyć się do trajektorii spełniających warunek brzegowy: q(t1) = qin oraz q(t2) =qout, to człon brzegowy w powyższej formule znika, bowiem δqi(t1) = δqi(t1) = 0. Zatemwarunek stacjonarności δW = 0 polega na zerowaniu się całki. Ponieważ musi się onazerować dla dowolnego odkształcenia δqi(t) trajektorii, zatem musi znikać czynnik mnożącyją pod całką:

∂L

∂qi− ∂

∂t

∂L

∂qi= 0 . (866)

Wyprowadziliśmy w ten sposób układ równań Eulera-Lagrange’a, będący warunkiem ko-niecznym na stacjonarność działania δW = 0 w problemie wariacyjnym z ustalonym brze-giem. Równania te pozwalają rozwiązać wiele klasycznych problemów optymalizacji. Jed-nym z pierwszych był postawiony przez Jakuba Bernoulliego w 1696 roku problemu brachi-stochrony. Tak się składa, że w wielu klasycznych problemach znaleziony tą metodą punktstacjonarny jest jednocześnie punktem ekstremalnym funkcjonału działania. Jednak praw-dziwa teoria optymalizacji, zawierająca kryteria pozwalające wyróżnić ekstremale spośródtrajektorii stacjonarnych, jest dużo trudniejsza i nie będziemy jej tu omawiać. Zajmu-jemy się jedynie poszukiwaniem punktów stacjonarnych działania. Wprowadzona przezMaupertuis’a nazwa „zasada najmniejszego działania” jest nadużyciem. Chodzi jedynie oukład równań Eulera-Lagrange’a będący ciągłą wersją formuły (860) na składanie relacjisymplektycznych. I rzeczywiście, układ ten można natychmiast zinterpretować jako relację

25W klasycznych podręcznikach ta prosta obserwacja nosi dumną nazwę „podstawowego lematu rachun-ku wariacyjnego”.

300

Page 307: Rozn. Geom_ - Jerzy Kijowski

symplektyczną (854) Dt ⊂ P It w modzie kontrolnym P It = T∗TQt. Różnica między równa-

niami drugiego rzędu (866) a równaniami pierwszego rzędu (854) polega na tym, że w tychostatnich zostały wprowadzone do gry pędy pi = ∂L∂qi nie jako „pomocnicze oznaczenie” napewną kombinację położeń i prędkości, lecz jako pełnoprawny element teorii.Ten sam układ można również opisywać w modzie hamiltonowskim P It = T ∗T ∗Qt

równaniami (857), gdzie wartość Hamiltonianu jest dana formułą H(p, q) = pq − L(q, q),przy czym transformacja Legendre’a wymaga jeszcze zrzutowania tej wartości z D naprzestrzeń parametrów kontrolnych, to znaczy wyrażenia wielkości q na D przez (p, q).Złożeniem tych relacji symplektycznych, z których każda opisuje zachowanie układu w

chwili t, na odcinku czasowym [t1, t2] jest relacja symplektyczna między danymi początko-wymi a danymi końcowymi, to znaczy D[t1,t2] ⊂ Pt2 ⊖ Pt1 . Zgodnie z intuicją, którą sobiewyrobiliśmy w poprzednim paragrafie, składając wiele relacji odpowiadających małym, aleskończonym odcinkom czasowym, to właśnie działanie W , traktowane jako funkcja od po-czątkowego i końcowego położenia, powinna być funkcją tworzącą tej relacji. I rzeczywiście,jeśli (odwrotnie niż w paragrafie 8.9) dane początkowe oznaczymy przez qi = qi(t1), zaśkońcowe przez qi = qi(t2), wtedy kładziemy

S(qi, qi) :=W (β) , (867)

gdzie β jest trajektorią spełniającą dwa warunki: 1) w każdej chwili czasu β spełnia rów-nania, czyli wyznacza punkt relacji Dt, oraz 2) spełnia warunki brzegowe26. ZachodziTwierdzenie: Funkcja S jest funkcją tworzącą dynamiki D[t1,t2] ⊂ Pt2 ⊖ Pt1 , bowiem

spełnione są równania:

pi = −∂S

∂qi; pi = −

∂S

∂qi. (868)

Dowód: Jeśli β spełnia równania dynamiki to zachodzi (866). Zatem całka po prawejstronie równania (865) znika i mamy:

δW =

(∂L

∂qiδqi)∣∣∣∣∣

t2

t1

=(pi(t)δqi(t)

)∣∣∣t2

t1= piδqi − piδqi , (869)

co natychmiast implikuje tożsamość (868).

8.13 Teoria Hamiltona-Jacobi’ego

Bardzo ważna metoda analizy własności układów hamiltonowskich wynika z badania za-leżności funkcji tworzącej S od czasu. Niech S = S(qi, qi; t) będzie skonstruowaną wyżejfunkcją tworzącą dynamiki na odcinku [t0, t] (uwaga: zmieniliśmy nieco oznaczenia). Ozna-cza to, że kładziemy

S(qi; qi, t) =∫ t

t0L(q(τ), q(τ); τ)dτ , (870)

26Jeśli warunki brzegowe nie wyznaczają jednoznacznie rozwiązania równań dynamiki, lub jeśli dla pew-nych warunków brzegowych nie ma rozwiązania, to mamy do czynienia z więzami. W naszej dyskusjiograniczamy się do przypadku bez więzów, gdy problem brzegowy jest dobrze postawiony. Jednak podanetutaj formuły są uniwersalne.

301

Page 308: Rozn. Geom_ - Jerzy Kijowski

przy czym całkę należy obliczyć na takim rozwiązaniu równań dynamiki q(τ), które spełniawarunki brzegowe: qi = qi(t0) oraz qi = qi(t). Posuwając się w przestrzeni zmiennych (qi, t)wzdłuż tej samej trajektorii, to znaczy w kierunku wektora u := ∂

∂t+ qi ∂

∂qi, obserwujemy

jedynie wydłużenie się odcinka całkowania w powyższym wzorze. Zatem pochodna funkcjiS w kierunku tego wektora jest równa funkcji podcałkowej L. Mamy więc:

u(S) =(∂

∂t+ qi

∂qi

)S = L .

Ale, zgodnie z (868), zachodzi27

pi =∂S

∂qi, (871)

wobec czego∂S

∂t= L(q, qi)− piqi = H(qi, pi) .

Podstawiając już raz wykorzystaną zależność (871) otrzymujemy następujące równanieróżniczkowe cząstkowe drugiego rzędu, zwane równaniem Hamiltona-Jacobi’ego, które musispełniać funkcja tworząca:

∂S

∂t= H

(qi,

∂S

∂qi

). (872)

Jedno rozwiązanie tego równania nie wystarcza do rozwiązania naszego układu hamilto-nowskiego: potrzebna jest rodzina rozwiązań parametryzowana stałymi qi. Taka rodzina,dla której zależność od stałych jest odpowiednio niezdegenerowana, nazywa się „rozwiąza-niem ogólnym”. Stałe te, oraz odpowiadające im pędy:

pi = −∂S

∂qi, (873)

interpretujemy jako opis danych początkowych układu w pewnej chwili t0. Możliwość znaj-dowania takiego rozwiązania ogólnego metodą tzw. „separacji zmiennych” odegrała bardzoważną rolę w opisie wielu problemów fizycznych i inżynierskich.

8.14 Linie geodezyjne jako ortodromy koneksji metrycznej

Na zakończenie tego rozdziału podamy opis i rozwiązanie klasycznego problemu wariacyj-nego: problemu najkrótszej drogi. NiechM będzie rozmaitością riemannowską (lub pseudo-riemannowską) o tensorze metrycznym g. Szukamy krzywej

R ⊃ [a, b] ∋→ β(t) ∈M ,

łączącej dwa punkty A = x(a) oraz B = x(b), której długość

W (β) =∫ b

a‖β(t)‖dt (874)

27Znak zmieniony, bo zmienione oznaczenia!

302

Page 309: Rozn. Geom_ - Jerzy Kijowski

jest ekstremalna. Taką krzywą (jeśli istnieje) nazywamy linią geodezyjną lub geodetyką.Wybierając układ współrzędnych (xi) otrzymujemy współrzędnościowy opis krzywej:

β(t) = (xi(t)) = x(t)

orazL(xi, xi) := ‖β(t)‖ = ‖x(t)‖ =

√gij(x)xixj . (875)

Warunkiem dostatecznym na ekstremum jest znikanie wariacji δW , co z kolei jest równo-ważne równaniom Eulera-Lagrange’a (866). Ale

∂L

∂xk=

12‖x(t)‖(∂kgij)x

ixj ,

oraz∂L

∂xk=

12‖x(t)‖2gkjx

j , (876)

więc

0 =∂L

∂xi− ∂

∂t

∂L

∂xi=

12‖x(t)‖(∂kgij)x

ixj − ∂

∂t

(1

‖x(t)‖gkjxj

). (877)

Jak wiemy, długość krzywej (wartość funkcjonału W ) nie zmienia się przy zmianie pa-rametryzacji krzywej. Jeżeli zatem mamy jakiekolwiek rozwiązanie tego układu, to możnaje reparametryzować tak, by długość jej wektora stycznego ‖x(t)‖ była stała. Tak zrepa-rametryzowana krzywa spełnia zatem prostsze równanie:

0 =12(∂kgij)xixj −

∂t

(gkjx

j)=12(∂kgij)xixj − gkjxj − (∂igkj)xixj . (878)

Działając na obie strony odwrotną metryką gkm otrzymamy równanie ortodromy (646):

0 = xm +12gmk (∂igkj + ∂jgki − ∂kgij) xixj = xm + Γmij xixj , (879)

gdzie Γmij są symbolami Christoffela zdefiniowanymi wzorem (723). A zatem pokazaliśmy,że linie geodezyjne metryki są ortodromami jej koneksji metrycznej.Warto jeszcze zauważyć, że niezmienniczość względem reparametryzacji dotyczy dużo

szerszej klasy Lagrangianów, a nie tylko szczególnego przypadku (875). Ma ona miejscezawsze wtedy, gdy Lagrangian jest jednorodny (lub dodatnio jednorodny) względem pręd-kości, to znaczy gdy zachodzi: L(x, c · x) = |c|L(x, x). Wtedy, na mocy tożsamości Euleraobowiązującej dla funkcji jednorodnych stopnia pierwszego, mamy

∂L

∂xkxk = L ,

zatem zachodzi:

H = L− ∂L

∂xkxk ≡ 0 .

303

Page 310: Rozn. Geom_ - Jerzy Kijowski

Hamiltonian jest więc tożsamościowo równy zeru na więzach Hamiltonowskich. Więzy tesą dane równaniem (876), które możemy przepisać następująco:

p =∂L

∂x=1‖x‖ (x)

=

(x‖x‖

). (880)

Oznacza ono, że pęd, jako obraz wektora jednostkowego, jest wektorem jednostkowym:

‖p‖ ≡ 1 ,

i to są właśnie te więzy hamiltonowskie, na których funkcja tożsamościowo równa zerugeneruje kompletną dynamikę (877). Aby się o tym przekonać zauważmy, iż więzy te mająko-wymiar równy jeden. Zatem różniczka Hamiltonianu jest dana z dokładnością do anihi-latora więzów, czyli dowolnego kowektora proporcjonalnego do różniczki więzów, zgodniez Twierdzeniem 2 w paragrafie 8.8 oraz poprzedzającą je Uwagą. Równania Hamiltona nawięzach przybierają więc następującą postać:

pkdxk − xkdpk = −dH + λd‖p‖ = 0− λd√gij(x)pipj = −

λ

2‖p‖d(gij(x)pipj

)

= −λ(gikpidpk +

12pipj(∂kgij)dxk

),

gdzie λ jest dowolnym współczynnikiem proporcjonalności. Przyrównując współczynnikiprzy dpk po obu stronach równości widzimy, że prędkość jest dowolnym wektorem propor-cjonalnym do pędu:

xk = λgikpi ⇐⇒ pk =1λgkix

i ,

przy czym ‖x‖ = λ. Wobec tego powyższe równanie odtwarza równanie (880). Wtedydrugie równanie Hamiltona, otrzymane z przyrównania współczynników przy dxk, możemyprzepisać następująco:

pk = −λ2pipj(∂kgij) = −

12λxmgmix

ngnj(∂kgij) =12‖x‖ x

mxn(∂kgmn) ,

lub równoważnie:

∂t

(gki

xi

‖x‖

)− 12‖x‖ x

mxn(∂kgmn) = 0 ,

czyli zostało odtworzone równanie (877).

304

Page 311: Rozn. Geom_ - Jerzy Kijowski

9 Posłowie

I to już wszystko co było do powiedzenia w tym Wykładzie. Daleko mu do wyczerpaniatematu. Stanowi on jedynie bardzo pobieżny wstęp do poważnych studiów współczesnejgeometrii różniczkowej. Zainteresowany nimi Czytelnik będzie musiał znacznie rozszerzyćswoją wiedzę, o co nie będzie trudno, bo kompetentnych podręczników jest w bród. OstatniRozdział pomyślany jako swoiste wprowadzenie do dalszych studiów zawiera spis ważnychpojęć, które w ich trakcie okażą się niezbędne.Zawarte tutaj definicje i przykłady są pomyślane również jako swego rodzaju słownik,

tłumaczący abstrakcyjną (niekiedy nawet bardzo!) terminologię zaawansowanych podręcz-ników na intuicyjny, związany z zastosowaniami, język niniejszego wykładu. Słownik tenpowinien przekonać fizyka czy inżyniera onieśmielonego tą terminologią (pozornie bardzoodległą od tego, z czym spotyka się w swojej pracy), iż ważne uogólnienia nie powstały zwoli ich twórców, jako dzieła sztuki eksperymentalnej, lecz że ich korzenie tkwią głębokow zastosowaniach i zostały odkryte jako sprawne narzędzia opisu i analizy zjawisk światamaterialnego.

9.1 Grupy Liego

Grupa Liego, to grupa, która jest rozmaitością różniczkowalną, a działania grupowe są róż-niczkowalne. Najprostszy przykład to grupa macierzy rzeczywistych n× n, o wyznacznikuróżnym od zera, gdzie działaniem grupowym jest mnożenie macierzy. Grupę tę oznaczasię symbolem GL(n,R). Można ją identyfikować z zestawem jej elementów macierzowychprzebiegających podzbiór przestrzeni rzeczywistej Rn

2, zdefiniowany warunkiem det g 6= 0.

Najprostszym topologicznie, nietrywialnym przykładem jest grupa SU(2), to znaczy gru-pa macierzy zespolonych 2 × 2, unitarnych (takie oznacza się U(2)), których wyznacznikjest równy 1 (literka „S” w symbolu SU(2) odpowiada temu właśnie warunkowi). Jeślia, b, c, d ∈ C są elementami macierzowymi macierzy g, to jej sprzężona g† oraz odwrotnag−1 wyrażają się następująco:

g =

[a bc d

], g† =

[a∗ c∗

b∗ d∗

], g−1 =

[d −b−c a

]. (881)

W tym ostatnim wzorze wykorzystaliśmy już fakt, że det g = ad−bc = 1. Porównując dwieostatnie macierze mamy: d = a∗ oraz c∗ = −b, czyli g jest wyznaczona przez dwie liczbyzespolone a i b:

g =

[a b−b∗ a∗

], (882)

spełniające warunek det g = a · a∗ + b · b∗ = 1. Jeśli oznaczyć a = x + iy, b = z + it, toparametry te przebiegają trójwymiarową sferę w R4:

SU(2) = (x, y, z, t) | x2 + y2 + z2 + t2 = 1 = S3 ∈ R4 .

Połączenie metod algebraicznych z geometrycznymi czyni z teorii grup Liego jedną z naj-piękniejszych i najbardziej efektywnych teorii matematycznych, niezbędne narzędzie opisu

305

Page 312: Rozn. Geom_ - Jerzy Kijowski

wielu zjawisk przyrodniczych. Tytułem reklamy wspomnę, że struktura grupy wyróżnia naniej grupę przekształceń zwanych lewymi bądź prawymi „przesunięciami o element grupy”.Dla ustalonego elementu grupy h ∈ G lewe przesunięcie Lh oraz prawe przesunięcie Rh oh definiuje się wzorami:

G ∋ g → Lh(g) = h · g ∈ G ,

G ∋ g → Rh(g) = g · h ∈ G .

Jednoparametrowe podgrupy w grupie przesunięć są generowane przez bardzo szczególnepola wektorowe, zwane (prawostronnie- lub lewostronnie-, zależnie od przyjętej konwen-cji) niezmienniczymi. Pola te stanowią algebrę Liego. Na przykład trójwymiarowa algebrageneratorów obrotów badana w rozdziale 3.4, której bazę stanowią pola (187) a strukturęwyznaczają reguły komutacyjne (188), jest algebrą Liego grupy obrotów SO(3), ale też igrupy SU(2) która stanowi jej tzw. uniwersalne pokrycie. Możliwość badania struktury gru-py w języku struktury jej algebry Liego jest najważniejszym wynikiem, którego dostarczanam ta teoria.

9.2 Abstrakcyjne wiązki włókniste

Z wiązkami włóknistymi mieliśmy do czynienia prawie od początku niniejszego wykładu.

Wiązka styczna TM , wiązka ko-styczna T ∗M , wiązki multikowektorówk∧T ∗M , czy też

wiązka układów odniesienia KM zdefiniowana w (642) były szczególnymi przykładamitakiej struktury.Definicja: Czwórkę (W,π,B, V ), gdzie W , B i V są rozmaitościami różniczkowalnymi

zaś π : W → B gładkim odwzorowaniem, nazywamy wiązką włóknistą jeśli każdy punktx ∈ B ma takie otoczenie U ⊂ B, że π−1 (U) jest dyfeomorficzne z U × V i to w takisposób, że π odpowiada rzutowaniu na pierwszy czynnik iloczynu kartezjańskiego. Prze-strzeń V nazywamy włóknem typowym wiązki. Zbiór Wx = π−1(x), dyfeomorficzny włóknutypowemu V , nazywamy włóknem wiązki nad punktem x. Dyfeomorfizm:

B × V ⊃ U × V ∋ (x,v)→ (x,v) ∈ π−1 (U) ⊂W , (883)

taki, że π (x,v) = x nazywamy lokalną trywializacją wiązki.W przypadku wiązki stycznej – włóknem typowym jest przestrzeń wektorowa Rn, gdzie

n jest wymiarem rozmaitości M , zaś lokalne trywializacje polegają na opisie wektorów wdowolnym układzie współrzędnych (xk) na M :

M × Rn ∋ (x, vl)→ vl∂

∂xl(x) ∈ TM .

Dla wiązki ko-stycznej odpowiedni wzór wygląda następująco:

M × Rn ∋ (x, αl)→ αldxl(x) ∈ T ∗M ,

306

Page 313: Rozn. Geom_ - Jerzy Kijowski

zaś dla wiązki układów odniesienia włóknem typowym jest RN , gdzie N = n2(n+1)2(patrz

wzór (643)), natomiast lokalna trywializacja wygląda następująco:

M × RN ∋ (x,Γmkl)→ [(ya)]x ∈ KM ,

gdzie [(ya)]xoznacza klasę równoważnych układów współrzędnych w punkcie x, reprezen-

towaną na przykład przez współrzędne (ya) zdefiniowane wzorem (641).Jeśli 1 oraz 2 są lokalnymi trywializacjami wiązki, określonymi w obszarach U1 oraz

U2 bazy, to na ich przecięciu U1⋂U2 zachodzi:

−12 1(x,v) = (x, gx(v)) ,

co definiuje nam „funkcję” gx, określoną na U1⋂U2, której wartościami są odwzorowania

włókna typowego V w siebie:

U1⋂U2 × V ∋ (x,v)→ gx(v) ∈ V . (884)

Odwzorowanie to będziemy nazywali transformacją cechowania łączącą dwie trywializacje.Trywializacja globalna to taka, której dziedzina U jest całą bazą B wiązki. Jeśli istnieje

globalna trywializacja to wiązkęW nazywamy trywializowalną, choć niektórzy matematycywolą określenie „trywialna”. Autorzy uprawiający matematykę stosowaną wolą posługiwaćsię tym ostatnim terminem w przypadku, gdy istnieje wyróżniona trywializacja globalna,czyli gdy rzeczywiście zachodzi W = B × V .

Jeśli (xi) jest lokalnym układem współrzędnych na bazie B, (va) – lokalnym układemwspółrzędnych we włóknie typowym V , zaś – lokalną trywializacją wiązki, to

B × V ⊃ U ×O ∋ (x,v) = (xi, va)→ (x,v) ∈W , (885)

definiuje lokalny układ współrzędnych na W , w którym rzutowanie π wyraża się jakooperator zapominania o współrzędnych (va):

π(xi, va) = (xi) .

Takie układy współrzędnych w W będziemy nazywali zgodnymi z rozwłóknieniem.

Bardzo często rozważa się klasę wiązek, których włókno typowe nosi jakąś dodatkowąstrukturę algebraiczną a lokalne trywializacje respektują tę strukturę. Oznacza to, że „do-puszczamy do konkurencji” jedynie takie trywializacje, dla których łączące je transformacjecechowania zachowują strukturę włókna typowego.I tak w przypadku wiązek stycznej i ko-stycznej wykorzystujemy strukturę wektorową

przestrzeni Rn, która jest zachowywana przy transformacji od jednej do drugiej trywializa-cji. Zachowanie to gwarantują liniowe prawa transformacyjne v→ gx(v): (54) dla wektorów

307

Page 314: Rozn. Geom_ - Jerzy Kijowski

oraz (285) dla kowektorów. Natomiast prawo transformacyjne (644) dla współczynnikówkoneksji nie respektuje struktury wektorowej, więc KM nie jest wiązką wektorową. Jednakprawo to jest „liniowe, choć niejednorodne”, zatem zachowuje strukturę afiniczną włókienKxM . Zauważyliśmy to pisząc we wzorze (645), iż różnica dwóch koneksji jest polem ten-sorowym. Zatem wiązka KM należy do klasy wiązek „afinicznych”.Bardzo ważną klasę stanowią tzw. wiązki główne, których włókno typowe jest „prawie”

grupą Liego, a konkretnie przestrzenią tej grupy bez wyróżnionego punktu odpowiadające-go jej jedności. Zakładamy więc, że mamy wolne i tranzytywne działanie grupyG na włóknietypowym V . Najczęściej stosowana konwencja polega na założeniu, iż jest to działanie „zprawej strony”, to znaczy:

V ×G ∋ (v, g)→ v · g ∈ V . (886)

Ten skrót myślowy oznacza po prostu, iż działanie to jest „łączne” w następującym sensie:

(v · g1) · g2 = v · (g1g2) ,

zaś (g1g2) oznacza iloczyn dwu elemetów grupy G. Gdy mamy włókno typowe V wypo-sażone w powyższą strukturę, to wiązką główną o włóknie V nazywa się taką wiązkę, wktórej transformacje cechowania mają postać:

gx(v) := v · g(x) ,

gdzie g(x) ∈ G. Zatem transformacje cechowania odpowiadają funkcjom na bazie B, owartościach w grupie G, i polegają na mnożeniu przez element grupy g(x) będący wartościątakiej funkcji.Przykład: Niech Lx będzie zbiorem wszystkich możliwych baz w przestrzeni stycznej

TxM i niech LM oznacza sumę wszystkich takich zbiorów. Jeśli wybrać jedną taką bazę(e(1), . . . , e(n)), to każda inna ma postać

e(b) =n∑

a=1

e(a)Aab,

gdzie detA 6= 0. (Konwencja sumacyjna nie obowiązuje, bo „a” nie jest wskaźnikiem od-noszącym się do współrzędnych na rozmaitości, lecz „numerem” wektora w bazie.) ZatemAab są dobrymi współrzędnymi na każdym Lx. Widzimy więc, że zbiór A takich macie-rzy stanowi włókno typowe wiązki baz (LM, π,M,A), która jest wiązką główną. Na tymwłóknie typowym działa grupa transformacji liniowych GL(n,R), którą identyfikujemy zgrupą macierzy (n×n), rzeczywistych i odwracalnych. Grupa ta działa „z prawej” wedługwzoru:

A×GL(n) ∋ (A, g)→ Ag ∈ A ,

gdzie macierz Ag jest po prostu iloczynem macierzy. Zarówno A jak i GL(n) są zbioramitakich samych macierzy. Różnica między tymi przestrzeniami polega na tym, że w A „za-pomnieliśmy” o strukturze grupy. W szczególności, nie została w niej wyróżniona macierzjednostkowa jako element neutralny grupy.

308

Page 315: Rozn. Geom_ - Jerzy Kijowski

9.3 Koneksja w wiązce abstrakcyjnej

Koneksja (powiązanie) jest strukturą pozwalającą na przenoszenie „równoległe” punktówwiązki wzdłuż krzywych w bazie B. Dla każdego punktu w ∈ Wx, gdzie x = π(w) ∈ Bjest jego rzutem na bazę, struktura taka musi określać wędrówkę punktu w, w miaręprzemieszczania jego rzutu w kierunku dowolnego wektora u ∈ TxB. A zatem musi to byćodwzorowanie

K : TxB → TwW (887)

takie, że π K = id. Ten ostatni warunek jest niezbędny, by punkt w przeniesiony równo-legle wzdłuż wektora u leżał we włóknie nad przeniesionym punktem bazy.Obraz tego odwzorowania jest podprzestrzenią wektorową κw ⊂ TwW transwersalną

względem wektorów „pionowych” (to znaczy stycznych do włókna Wx) i taką, że „po-krywa” wszystkie wektory styczne do B, tzn. jej obraz przy odwzorowaniu π∗ jest równycałej przestrzeni stycznej TxB. Można zatem powiedzieć, że koneksja to dystrybucja κ opowyższych własnościach.Gdyby ta dystrybucja była całkowalna, to powiedzielibyśmy, że koneksja jest płaska.

Oznaczałoby to, że każdy punkt w przeniesiony równolegle po dowolnej krzywej zamkniętejw bazie B wróci na swoje pierwotne miejsce.Jeszcze inaczej, choć równoważnie, można definiować koneksję przy pomocy tzw. formy

koneksji. Jej istnienie wynika z faktu, że dystrybucja κ na W jest transwersalna względemdystrybucji wektorów pionowych, czyli stycznych do włókien. A zatem każdy wektor stycz-ny do W można jednoznacznie rozłożyć na część pionową oraz poziomą, to znaczy leżącą wdystrybucji κ. Odwzorowanie przypisujące każdemu wektorowi X ∈Wx właśnie jego częśćpionową ω(X) nazywa się formą koneksji. Jest to więc jedno-forma naW (jej argumentamisą wektory) ale nie, jak zwykła jedno-forma, o wartościach skalarnych, lecz o wartościachw przestrzeni wektorów pionowych.Gdy koneksja nie jest płaska, to można mierzyć stopień jej „zakrzywienia” przy pomo-

cy odpowiednio zdefiniowanej pochodnej zewnętrznej formy koneksji, zrzutowanej na B.Jest to zatem dwu-forma F na B o wartościach w przestrzeni wektorów pionowych. Jejwartość na dowolnym dwu-wektorze v1 ∧ v2 mówi nam jak przesunie się infinitezymalniewe włóknie Wx punkt w przeniesiony wzdłuż równoległoboku rozpiętego na tych wekto-rach. Zwracam uwagę, że tensor Riemanna Rmijk zwykłej koneksji na rozmaitości M jestszczególnym przypadkiem takiej struktury. Jako wiązkę należy wziąć wiązkę składającąsię ze wszystkich baz przestrzeni stycznych TQ, czyli W = LM . Ostatnie dwa antysy-metryczne wskaźniki tego tensora są wskaźnikami dwu-formy różniczkowej na bazie M ,podczas gdy dwa pierwsze oznaczają właśnie „ jeden wskaźnik” w zbiorze baz, czyli wewłóknie LxM . Wzór (721) odpowiada właśnie powyższej interpretacji krzywizny. Stosującją można zdefiniować koneksję i jej krzywiznę w bardzo obszernej klasie wiązek.

9.4 Cięcia wiązek

Definicja: Cięciem wiązki nazywamy odwzorowanie z bazy w przestrzeń wiązki:

σ : B →W (888)

309

Page 316: Rozn. Geom_ - Jerzy Kijowski

takie, że π σ = id.W układzie współrzędnych (xi, va) zgodnym z rozwłóknieniem cięcie wiązki wyraża się

jako odwzorowanie:B ∋ (xi)→ σ(xi) = (xi, fa(xi)).

Cała informacja jest więc opisana funkcjami fa. Są one wyrażeniem współrzędnościowymodwzorowania F = πV −1 σ : B 7→ V , gdzie πV jest rzutowaniem iloczynu kartezjań-skiego B × V na V . Klasę gładkości cięcia określa klasa gładkości funkcji fa.

9.5 Jety

Jet28 cięcia wiązki włóknistej w punkcie x ∈ B to komplet informacji o jego wartości w tympunkcie oraz jego pochodnych do pewnego, ustalonego rzędu. Aby te informacje sprawniezakodować przyjmuje się następującą definicję.Definicja: Dwa lokalne cięcia wiązki W nazywamy stycznymi rzędu k ∈ N w punkcie

x0 ∈ B i piszemy: „σ ∼(x0,k) ρ”, jeśli w dowolnym układzie współrzędnych zgodnym zrozwłóknieniem odwzorowania F = πV −1 σ oraz G = πV −1 ρ mają w tympunkcie równe sobie wszystkie pochodne do rzędu k.Łatwo pokazać, że ∼(x0,k) jest relacją równoważności. Klasa równoważności cięcia σ

względem tej relacji nazywa się właśnie jetem rzędu k (albo k-tym jetem) tego cięciaw punkcie x0 i zapisuje się jako jkσ(x0). Zbiór wszystkich takich obiektów nazywa sięrozszerzeniem jetowym rzędu k (lub k-tym rozszerzeniem jetowym) wiązki W i oznacza sięjako JkW . Jet zerowego rzędu to po prostu wartość cięcia w punkcie x0. Zatem J0W =W .Jeśli (xi, va) są zgodnymi z rozwłóknieniem współrzędnymi na W zaś funkcje fa =

fa(xi) są opisem cięcia σ w tych współrzędnych, to oznaczając:

vai =∂fa

∂xi; vaij =

∂2fa

∂xi∂xj; vaijk =

∂3fa

∂xi∂xj∂xk,

i tak dalej, otrzymujemy dobrą parametryzację przestrzeni JkW układem zmiennych:

(xi, va, vai, vai1i2, . . . , vai1i2···ik) .

Zwracamy uwagę, że każda tablica vai1i2···ik jest ex definitione symetryczna w dolnych wskaź-nikach.Przestrzeń JkW jest znów wiązką nad B. Jej włókno nad punktem x ∈ B, oznaczane

jako JkWx, jest zbiorem wszystkich jetów w tym właśnie punkcie.Przykład: Pierwszy jet pola wektorowego j1X(x) jest całkowicie określony przez war-

tości pola i jego pochodnych w dowolnym układzie współrzędnych. A zatem (xi, X i, X ij)są dobrymi współrzędnymi w pierwszym rozszerzeniu jetowym wiązki stycznej TM , czyliw przestrzeni J1TM . Kodują one: punkt zaczepienia x ∈M , wartość pola X w tym punk-cie oraz wartość jego pochodnych: X ij := ∂jX

i(x). Jeśli (ya) są innymi współrzędnymi w

28Próbowano lansować polski termin „miot” na określenie tych ważnych obiektów geometrycznych, alesię nie przyjął.

310

Page 317: Rozn. Geom_ - Jerzy Kijowski

bazie M , to znając zależność jednych współrzędnych od drugich możemy przeliczyć stareparametry jetu na nowe, otrzymując:

Xa =∂ya

∂xi(x)X i ,

oraz

Xab = ∂b

(∂ya

∂xiX i)=∂ya

∂xi∂

∂ybX i +

(∂

∂yb∂ya

∂xi

)X i

=∂ya

∂xi∂xj

∂ybX ij +

(∂xj

∂yb∂2ya

∂xj∂xi

)X i .

Widać, że zgodnie z rozważaniami paragrafu (3.3), same pochodne (X ij) nie opisują żad-nego obiektu geometrycznego: znając je w jednym układzie współrzędnych nie potrafimyobliczyć ich w innym. Natomiast wzbogacone o wartość pola X i już opisują obiekt jakimjest pierwszy jet pola. Powyższe wzory stanowią prawo transformacyjne jego współrzędnych(xi, X i, X ij) przy przejściu z jednego do drugiego układu współrzędnych. Podkreślamy, żeobiekt ten nie jest tensorem!

9.6 Rachunek wariacyjny całek wielokrotnych i związana z nimkanoniczna struktura symplektyczna

Równanie Eulera-Lagrange’a będące warunkiem koniecznym na optymalizację funkcjonałucałkowego można łatwo uogólnić na całki wielokrotne. Niech zatem będzie dana wiązkawłóknista W o n-wymiarowej bazie B oraz Lagrangian, to znaczy funkcja na jetach cięćwiązki W o wartościach w gęstościach skalarnych na B:

(J1W )x ∋ j1σ(x)→ L(j1σ(x)) ∈n∧T ∗xB . (889)

Jeśli (xi, ϕa) jest układem współrzędnych na W zgodnych z rozwłóknieniem, to stosującopis współrzędnościowy jetu: j1σ(x) = (xi, ϕa, ϕai), możemy reprezentować Lagrangianjako funkcję wielu zmiennych:

L(j1σ(x)) = L(xi, ϕa, ϕai)⊗ dx1 ∧ · · · ∧ dxn . (890)

Jeśli O ⊂ B jest zwartą dziedziną z brzegiem, to możemy zdefiniować funkcjonał przypi-sujący cięciom wiązki wartość zwaną działaniem:

W (σ) =∫

OL(j1σ) =

OL(xi, ϕa, ϕai)d

nx . (891)

Zbadamy jak zmienia się wartość działania przy niewielkich odkształceniach cięcia σ. Wtym celu rozważmy jednoparametrową rodzinę cięć σs, opisaną we współrzędnych funkcjąod dwóch parametrów: (xi, s):

βs(xi) = (ϕa(xi, s)) ∈ Wx . (892)

311

Page 318: Rozn. Geom_ - Jerzy Kijowski

Oznaczmy pochodne po parametrze s uświęconym tradycją symbolem „delta”, to znaczy:

∂ϕa

∂s=: δϕa .

Zastosujmy twierdzenie o różniczkowaniu całek z parametrem. W ten sposób otrzymamynastępujący wzór na pochodną działania względem parametru odkształcenia:

δW =dWds=∫

O

∂L

∂ϕaδϕa +

∂L

∂ϕaiδϕai

dnx .

Ale zachodzi δϕai = δ∂iϕa = ∂iδϕ

a bowiem drugie pochodne są przemienne29. Wobectego ostatni człon możemy scałkować przez części otrzymując:

O

∂L

∂ϕai∂iδϕ

a

dnx =

∂O

∂L

∂ϕaiδϕa

(∂i dx1 ∧ · · · ∧ dxn

)−∫

O

∂i∂L

∂ϕai

δϕadnx .

Ostatecznie więc

δW =∫

O

∂L

∂ϕa− ∂i

∂L

∂ϕai

δϕadnx+

∂O

∂L

∂ϕaiδϕad

(∂i dx1 ∧ · · · ∧ dxn

). (893)

Jeśli ograniczyć się do trajektorii spełniających warunek brzegowy: ϕa|∂O = F a, to całkabrzegowa w powyższej formule znika, bowiem δϕa|∂O = 0. Zatem warunek stacjonarnościδW = 0 polega na zerowaniu się całki objętościowej. Ponieważ musi się ona zerować dladowolnego odkształcenia δϕa trajektorii, zatem musi znikać czynnik mnożący je pod całką:

∂L

∂ϕa− ∂i

∂L

∂ϕai= 0 . (894)

Podobnie jak dla całek jednokrotnych – i to równanie potrafimy zinterpretować jak relacjęsymplektyczną. W tym celu zauważmy, że wielkość

p ia :=∂L

∂ϕai(895)

jest składową ko-wektora na włóknieWx, podobnie jak w równaniu (854), ale jego wartościnie są skalarami, lecz (n−1)-formami na B, czyli „gęstościami wektorowymi”. Są to zatemskładowe następującego obiektu:

p = (p ia dϕa)⊗

(∂i dx1 ∧ · · · ∧ dxn

). (896)

Zbiór takich obiektów jest wiązką nad B, którą oznaczymy P . Jest on wyposażony wkanoniczną dwu-formę o wartościach w gęstościach wektorowych:

ω = (dp ia ∧ dϕa)⊗(∂i dx1 ∧ · · · ∧ dxn

). (897)

29Znów pojawia się „podstawowy lemat rachunku wariacyjnego”.

312

Page 319: Rozn. Geom_ - Jerzy Kijowski

Nie jest to oczywiście żadna forma symplektyczna: pędów p ia jest n razy więcej niż „po-łożeń” ϕa. Jednak gdy obliczymy dywergencję tej gęstości wektorowej, czyli pochodnązewnętrzną na rozmaitości B czynnika (∂i dx1 ∧ · · · ∧ dxn), to – przynajmniej formalnie– otrzymamy:

ωI = dBω = ∂i(dp ia ∧ dϕa)⊗(dx1 ∧ · · · ∧ dxn

). (898)

A czym są pochodne ∂i(dp ia ∧ dϕa)? Podobnie jak w przypadku formuły ωI = ddtω w

konstrukcji infinitezymalnej struktury symplektycznej dla całek jednokrotnych, działanieto nie jest określone na cięciach wiązki P , lecz na ich jetach:

∂i(dp ia ∧ dϕa) = d(∂ip ia ) ∧ dϕa + dp ia ∧ dϕai .

Oznacza to, że na przestrzeni J1P jest określona kanoniczna dwu-forma o wartościach wgęstościach skalarnych na B, która wyraża się we współrzędnych jako:

ωI =(d(∂ip ia ) ∧ dϕa + dp ia ∧ dϕai

)⊗(dx1 ∧ · · · ∧ dxn

). (899)

Przestrzeń jetów J1P ma jednakowoż wśród swoich współrzędnych wszystkie pochodne pę-dów: ∂jp ia . Tymczasem do formy wchodzi jedynie ich ślad ∂ip

ia (dywergencja). Oznacza to,

że forma ta jest zdegenerowana: wektory zmieniające pochodne pędów bez zmiany ich śladupozostają niezauważone przez ωI , zatem stanowią jej degenerację. Zgodnie z rozważaniamiparagrafu 8.5 możemy podzielić przez tę degenerację, to jest przez relację równoważności„∼” utożsamiającą jety, które mają tę samą wartość dywergecji. W wyniku otrzymamyinfinitezymalną przestrzeń fazową P I = J1/ ∼, której włókna P I

xsą już przestrzeniami

symplektycznymi dla każdego punktu x ∈ B bazy. Włókno takie może być parametryzo-wane zmiennymi (ϕa, ϕai, p

ia , ja), gdzie położyliśmy ja := ∂ip

ia , analogicznie do zmiennych

(q, q, p, p) w rachunku wariacyjnym całek jednorodnych. Twierdzenie z paragrafu 8.5 mówi,że otrzymamy w ten sposób formę symplektyczną

ωI =(dja ∧ dϕa + dp ia ∧ dϕai

)⊗(dx1 ∧ · · · ∧ dxn

). (900)

Wybierając J1Wx jako przestrzeń kontroli, czyli (ϕa, ϕai) jako parametry kontroli, zaś(p ia , ja) jako parametry odpowiedzi widzimy, że równania Eulera-Lagrange’a (894), uzupeł-nione definicją pędów (895), mogą być interpretowane jako definicja relacji symplektycznejDx, której funkcją generującą jest Lagrangian. Forma pierwotna formy ω odpowiadającatemu modowi:

θL =(jadϕa + p ia dϕ

ai

)⊗(dx1 ∧ · · · ∧ dxn

)

opisuje to generowanie podobnie jak we wzorze (855), a mianowicie:

dL = θL|D , (901)

lub równoważnie, po „uproszczeniu” przez n-formę (dx1 ∧ · · · ∧ dxn):

dL(ϕa, ϕai) = (∂ipia )dϕ

a + p ia dϕai . (902)

313

Page 320: Rozn. Geom_ - Jerzy Kijowski

Widzimy zatem, że układ równań składający się z definicji pędów (895) oraz z równańEulera-Lagrange’a (894) można interpretować jako relację symplektyczną.Wyprowadzona tutaj kanoniczna struktura symplektyczna stanowi źródło tak zwanej

„hamiltonowskiej teorii pola”. Termin ten jest bardzo wieloznaczny. Matematycy zajmu-jący się prawdziwymi problemami optymalizacji, prowadzącymi do eliptycznych równańcząstkowych, mają tu na myśli mod kontrolny, w którym parametrami kontroli są (ϕa, p ia ),zaś (ϕai, ∂ip

ia ) są parametrami odpowiedzi i nazywają „Hamiltonianem” funkcję generującą

dynamiki w tym modzie. Natomiast fizycy zajmujący się problemami ewolucji pól fizycz-nych w czasoprzestrzeni, prowadzącymi do hiperbolicznych równań cząstkowych, mają namyśli mod kontrolny, w którym pochodne „przestrzenne” pozostały parametrami kontroli,a jedynie pochodna „czasowa” jest zastąpiona odpowiednim pędem. Funkcja generującadynamiki w tym modzie opisuje energię pola i również nosi miano Hamiltonianu, choć tozupełnie inny obiekt. Jej wartość zależy od podziału czasoprzestrzeni na „przestrzeń” i„czas”, to znaczy od wyboru układu odniesienia w sensie teorii względności.Przedstawioną powyżej konstrukcję łatwo uogólnić na przypadek zasad wariacyjnych

wyższego rzędu, tzn. takich, dla których Lagrangian zależy od jetów rzędu k > 1.Studia hamiltonowskiej teorii pola powinno się rozpocząć od analizy infinitezymalnej

struktury symplektycznej ωI opisanej w niniejszym paragrafie.

314