Wir wollen uns in diesem Kapitel nun Ableitungen von Tangentialvektorfeldern anschauen. Eine Möglichkeit, dies zu tun, besteht darin, eine weitere Struktur auf der Mannigfaltigkeit zu definieren, die als kovariante Ableitung oder auch als affiner Zusammenhang bezeichnet wird (eine andere Möglichkeit ist die sogenannte Lie-Ableitung, die ein Vektorfeld und den dadurch generierten Fluss voraussetzt -- Details kommen in einem späteren Kapitel). Die Einführung dieser affinen Struktur bewirkt, dass man von differenzierbaren Mannigfaltigkeiten zur sogenannten affinen Geometrie auf diesen Mannigfaltigkeiten übergeht. Es wird nämlich möglich werden, beispielsweise von einer möglichst geraden Kurve (einer geodätischen Linie) zu sprechen.
Wie verändert sich nun also ein Tangentialvektorfeld, wenn wir uns auf einer Mannigfaltigkeit in eine bestimmte Richtung (gegeben durch eine Kurve) bewegen?
Wir werden feststellen, dass die naive Ableitung eines Tangentialvektorfeldes in einer bestimmten Richtung in einem Punkt p im Allgemeinen keinen Tangentialvektor in p ergibt. Veranschaulichen wir uns die Situation durch zweidimensionale Flächen, eingebettet im dreidimensionalen Raum, so besitzt die naive Ableitung eines Vektorfeldes im dreidimensionalen Raum auch eine Komponente senkrecht zur Fläche. Diese senkrechte Komponente ist darauf zurückzuführen, dass sich die Fläche krümmt und sich das Tangentialvektorfeld eben nicht nur parallel zur Fläche ändert, sondern auch senkrecht dazu, wenn man sich ein kleines Stück auf der Fläche fortbewegt. Nur so kann das Tangentialvektorfeld tangential zur gekrümmten Fläche bleiben.
Möchte man auf eine Einbettung verzichten, so stört die Komponente senkrecht zur Fläche, denn sie ist zunächst gar nicht definiert. Man definiert daher die sogenannte kovariante Ableitung, bei der man einfach die senkrechte Änderungskomponente weglässt. Man projeziert also gleichsam den Ableitungsvektor auf den Tangentialraum, so dass der kovariante Ableitungsvektor selbst ein Element des Tangentialraums ist. Diese Vorgehensweise kann man dann leicht auf allgemeine differenzierbare Mannigfaltigkeiten ohne Einbettung verallgemeinern.
Einen Punkt muss man jedoch bedenken: Da wir die Änderungskomponente senkrecht zur Fläche weggelassen haben, liefert die kovariante Ableitung nicht mehr in linearer Näherung die Veränderung des Tangentialvektorfeldes mit Formeln wie u(γ(dt)) = u(p) + Dγ'(0) u(p) dt (mit γ(0) = p und der kovarianten Ableitung Dγ'(0) u(p) in γ'(0) -Richtung). Man muss sich daher etwas anderes überlegen, um benachbarte Tangentialvektoren über die kovariante Ableitung miteinander in Beziehung zu setzen. Das Zauberwort heißt Paralleltransport (Parallelverschiebung) -- wir werden weiter unten genauer darauf eingehen.
Kovariante Ableitung auf zweidimensionalen Flächen im dreidimensionalen Raum:
Wir wollen die obigen Ideen nun präzisieren. Dabei betrachten wir zunächst zweidimensionale gekrümmte Flächen, eingebettet im dreidimensionalen euklidischen Raum, um eine anschauliche Vorstellung der auftretenden mathematischen Ausdrücke zu ermöglichen.
Wiederholen wir kurz ein Ergebnis aus Kapitel 5.1.4 über Tangentialvektoren: Einen Punkt p unserer zweidimensionalen Fläche M können wir aufgrund der Einbettung als einen dreidimensionalen Vektor X(x) im Einbettungsraum R3 darstellen. Dabei liefert x = (x1, x2) die beiden Koordinaten des Punktes p, d.h. x = f(p) mit der Koordinatenfunktion (Karte) f. Man sagt auch, X(x) liefert eine Parametrisierung der Fläche M im Einbettungsraum R3. Wegen p = X(x) und umgekehrt x = f(p) ist X die Umkehrfunktion zur Koordinatenfunktion f, d.h. p = X(x) = f -1(x) .
Ein Beispiel: M ist die Kugeloberfläche einer Kugel mit Radius 1, und x1 = θ sowie x2 = φ sind die Kugelkoordinatenwinkel, analog zu Längen- und Breitengrad auf der Erde. In den euklidischen Koordinaten des umgebenden dreidimensionalen Raums ist dann X(θ, φ) = (sin θ cos φ , sin θ sin φ , cos θ) . Der Winkel φ wächst also von Westen nach Osten von 0 bis 2π (also bis 360 Grad) an, der Winkel θ dagegen von Norden nach Süden von 0 bis π (also bis 180 Grad).
Einen Tangentialvektor u(p) können wir aufgrund der Einbettung nun schreiben als
u(p) = ∑μ uμ(p) dX(x)/dxμ
mit x = f(p) . Der Vektor u(p) ist demnach ein dreidimensionaler Vektor, der in p tangential zur Fläche M liegt. In der Summe läuft der Koordinatenindex μ von 1 bis 2.
Wir betrachten nun wie üblich eine Kurve γ(t) mit γ(0) = p . Dabei muss u(p) hier nicht tangential zu dieser Kurve liegen. Wir interessieren uns nun für die Änderung von u(γ(t)) bei t = 0 in Kurvenrichtung. Da u(γ(t)) für jedes t ein dreidimensionaler Vektor ist, ist auch die Ableitung nach t in t = 0 direkt definiert (ohne Einbettung wäre diese naive Ableitung dagegen erst einmal nicht definiert, da formal im Differenzenquotienten der Ableitung die Differenz zweier Tangentialvektoren aus verschiedenen Tangentialräumen auftritt, die nur bei einer Einbettung eine Bedeutung hat). Rechnen wir die Ableitung aus (wobei wir benutzen, dass f(γ(0)) = f(p) = x ist):
du(γ(t)) / dt |t = 0 = d/dt|t = 0
∑μ
uμ(γ(t)) dX(f(γ(t))) / dxμ =
= ∑μ
duμ(γ(t)) / dt |t = 0 dX(x)/dxμ
+
∑μ
uμ(p) d/dt|t = 0 dX(f(γ(t))) / dxμ
=
= ∑μ
duμ(γ(t)) / dt |t = 0 dX(x)/dxμ
+
∑μ ∑ν
uμ(p) d/dxν
dX(x)/dxμ
df(γ(t))ν / dt |t = 0
= ...
Der erste Term beschreibt die Veränderung aufgrund der Änderung der Vektor-Komponenten, und der zweite Term enthält die Veränderung der Tangential-Basisvektoren dX(x)/dxμ in ν-Koordinatenrichtung aufgrund der Veränderung der Koodinatenlinien-Richtungen im Einbettungsraum. Wegen der Einbettung ist diese Veränderung eines Basisvektors (d.h. μ fest) in xν -Koordinatenrichtung ein dreidimensionaler Vektor, den wir nach drei Basisvektoren in R3 entwickeln können. Im Punkt p sind solche Basisvektoren gegeben durch die beiden Tangentialvektoren dX(x)/dx ρ (mit ρ gleich 1 und 2) sowie dem dazu senkrechten Vektor N. Wir können also schreiben:
d/dxν dX(x)/dxμ =: ∑ρ Γ ρνμ dX(x)/dx ρ + hνμ N
Durch diese Gleichung werden die Christoffel-Symbole Γ ρνμ definiert (wir verwenden die Konvention, dass der Index, nach dem abgeleitet wird, vorne steht). Die obige Gleichung zeigt, dass sie die folgende anschauliche Bedeutung haben:
|
Dies können wir nun verwenden, um die obige Rechnung weiterzuführen. Außerdem wollen wir noch γ'(0) =: v(p) schreiben, d.h. df(γ(t))ν / dt |t = 0 = vν(p) . Ergebnis:
... = ∑μ
duμ(γ(t)) / dt |t = 0 dX(x)/dxμ
+
∑μν
uμ(p) {
∑ρ Γ ρνμ
dX(x)/dx ρ
+ hνμ N }
vν(p)
= ...
... = ∑ρ {
duρ(γ(t)) / dt |t = 0
+
∑μν
uμ(p) Γ ρνμ
vν(p)
} dX(x)/dx ρ
+
+
∑μν
uμ(p) hνμ N
vν(p)
Soweit also unser Ergebnis zu du(γ(t)) / dt |t = 0 (also die Änderung von u in Kurvenrichtung). Das Ergebnis enthält drei Anteile:
Oben hatten wir betreits erwähnt, dass die Änderung der Basisvektoren senkrecht zum Tangentialraum stört, wenn man ohne eine Einbettung auskommen will. Ohne eine Einbettung ist du(γ(t)) / dt |t = 0 gar nicht definiert. Wenn wir aber die Komponente senkrecht zum Tangentialraum weglassen, so lassen sich die übrigen Terme problemlos einbettungsfrei umschreiben. Das verwundert auch nicht, denn die Projektion von du(γ(t)) / dt |t = 0 auf den Tangentialraum in p is ja selbst ein Element dieses Tangentialraums. Wir definieren daher die kovariante Ableitung wie folgt:
|
Man kann für die Christoffelsymbole noch eine etwas griffigere Formel ableiten, indem man in Dv(p) u für u(p) den Basisvektor dX(x)/dxμ und für v(p) den Basisvektor dX(x)/dxν einsetzt. Die Laufindizes in der Summe erhalten zur Unterscheidung dann einen Strich. Es ist dann uμ'(p) = δμ'μ und vν '(p) = δν 'ν , so dass in den Summen über μ' und ν ' jeweils nur ein Term übrig bleibt. Die Zeitableitung duρ(γ(t)) / dt |t = 0 fällt weg, da uρ(p) = δρμ konstant ist.
DdX(x)/dxν
dX(x)/dxμ =
=
∑ρ {
duρ(γ(t)) / dt |t = 0
+
∑μ' ∑ν '
uμ'(p) Γ ρν 'μ'
vν '(p)
} dX(x)/dx ρ
=
=
∑ρ
Γ ρνμ
dX(x)/dx ρ
Der Vergleich mit der Formel etwas weiter oben für die Christoffelsymbole zeigt, dass für den Operator der kovarianten Ableitung DdX(x)/dxν gilt:
DdX(x)/dxν = P|T(p) d/dxν
Dieser Ausdruck ist wegen dem Projektionsoperator P|T(p) allerdings nur bei einer Einbettung definiert.
Nachdem wir uns nun eine anschauliche Vorstellung von der kovarianten Ableitung verschafft haben, wollen wir nun versuchen, diesen Begriff auf die einbettungsfreie Formulierung zu übertragen. Die Tangentialvektoren werden dabei durch Richtungsableitungen dargestellt, was im Wesentlichen bedeutet, dass man formal in Ausdrücken wie u(p) = ∑μ uμ(p) dX(x)/dxμ das X(x) weglässt und so zu den Richtungsableitungen u(p) = ∑μ uμ(p) d/dxμ|p übergeht. Entsprechend könnte man die kovariante Ableitung in Analogie zu oben direkt einbettungsfrei über die folgenden Formeln definieren:
|
Auf diese Weise wird beispielsweise in der physikalischen Literatur die kovariante Abbildung häufig definiert. Dabei muss man die Christoffelsymbole vorgeben oder aufgrund anderer Prinzipien festlegen. Unsere obigen Überlegungen haben gezeigt, dass beispielsweise bei einer Einbettung die Christoffelsymbole eindeutig festgelegt sind. Analog ist es, wenn eine Metrik auf der Mannigfaltigkeit vorliegt (siehe ein späteres Kapitel).
Noch eine wichtige Randbemerkung: Leitet man die Christoffelsymbole wie oben gezeigt aus einer Einbettung ab (man spricht davon, dass die Einbettung den affinen Zusammenhang induziert), so sind die Christoffelsymbole symmetrisch in den unteren beiden Indices. Bei der einbettungsfreien Formulierung dagegen haben wir die Freiheit, auch nicht-symmetrische Christoffelsymbole zuzulassen. Man spricht in diesem Fall von Torsion (siehe nächstes Kapitel).
Die obige Definition hat den Nachteil, dass man expliziten Bezug auf Koordinaten nimmt, um den koordinaten-unabhängigen Ausdruck Dv(p) u zu definieren. Dass Dv(p) u koordinatenunabhängig sein muss, ist für den Fall der Einbettung anschaulich klar, denn dort hatten wir den koordinaten-unabhängigen Ausdruck Dv(p) u := P|T(p) du(γ(t)) / dt |t = 0 als Ausgangspunkt der Rechnung gewählt. Bei der obigen einbettungsfreien Definition über Koordinaten müsste man aber die Koordinaten-Unabhängigkeit noch explizit nachweisen bzw. von den Christoffelsymbolen ein entsprechendes Transformationsverhalten verlangen.
In der mathematischen Literatur geht man daher gerne einen anderen Weg: Man definiert die kovariante Ableitung in v(p)-Richtung als Abbildung Dv(p) , die aus einem Tangentialvektorfeld u, das in einer Umgebung von p definiert sein muss, einen neuen Tangentialvektor Dv(p) u macht (bei der Definition über eine Einbettung Dv(p) u := P|T(p) du(γ(t)) / dt |t = 0 ist Dv(p) u ja auch ein Tangentialvektor). Von dieser Abbildung verlangt man nun eine Reihe von Eigenschaften, so wie sie auch bei der Definition über die Einbettung gegeben sind. Diese Eigenschaften müssen dann ausreichen, um den obigen koordinatenabhängigen einbettungsfreien Ausdruck für die kovariante Abbildung (also der mit den Christoffelsymbolen) reproduzieren zu können, so dass die Gleichwertigkeit zu dieser Definition gewährleistet ist. Schauen wir uns die Details an:
|
einbettungsfreie Definition der kovarianten Ableitung ohne Koordinaten:
|
Man kann sich alle diese Regeln mit Hilfe einer Einbettung und der dortigen Definition Dv(p) u := P|T(p) du(γ(t)) / dt |t = 0 plausibel machen. Ebenso kann man verifizieren, dass diese Regeln bei der weiter oben getroffenen koordinatenabhängigen einbettungsfreien Definition (mit Christoffelsymbolen) erfüllt sind. Wir wollen dies hier überspringen.
Schauen wir umgekehrt nach, ob die Regeln ausreichen, um die koordinatenabhängige einbettungsfreie Formulierung (mit Christoffelsymbolen) zurückzugewinnen. Damit stellen wir sicher, dass wir keine wichtige Regel übersehen haben:
Dv(p) u = Dv(p) ∑μ uμ d/dxμ = ...
wir verwenden die Addiditivität:
... = ∑μ Dv(p) uμ d/dxμ = ...
wir verwenden die Produktregel:
... = ∑μ { [Dv(p) uμ] d/dxμ|p + uμ(p) [Dv(p) d/dxμ] } = ...
Im ersten Term verwenden wir, dass nach Definition
Dv(p) uμ =
v(p) uμ
=
duμ(γ(t)) / dt |t = 0
ist.
Im zweiten Term schreiben wir v(p) = ∑ν
vν(p) d/dxν|p . Ergebnis:
... = ∑μ { (v(p) uμ) d/dxμ|p + uμ(p) [D( ∑ν vν(p) d/dxν|p ) d/dxμ] } = ...
wir verwenden die algebraische Linearität im zweiten Term:
... = ∑μ { (v(p) uμ) d/dxμ|p + uμ(p) ∑ν [vν(p) Dd/dxν|p d/dxμ] } = ...
Im zweiten Term können wir über Dd/dxν|p d/dxμ = ∑ρ Γ ρνμ d/dx ρ|p die Christoffelsymbole einführen (eine solche Gleichung muss gelten, denn Dd/dxν|p d/dxμ ist nach Definition ein Tangentialvektor, der sich nach den Basisvektoren des Tangentialraums entwickeln lassen muss):
... = ∑μ { (v(p) uμ) d/dxμ|p + uμ(p) ∑ν [vν(p) ∑ρ Γ ρνμ d/dx ρ|p] } = ...
Umsortieren und Indexumbenennung ergibt schließlich:
... = ∑ρ { v(p) uρ + ∑μν uμ(p) Γ ρνμ vν(p) } d/dx ρ|p
Das ist genau unsere Formel von der koordinatenabhängigen Definition der kovarianten Ableitung, die wir hiermit reproduzieren konnten. Dabei haben wir genau die Regeln gebraucht, deren Gültigkeit wir oben gefordert haben. Diese Regeln reichen also aus, und wir haben keine weitere Regel benötigt.
Transformationsverhalten:
Die kovariante Ableitung Dv(p) u ist nach Definition ein Tangentialvektor, dessen Komponenten gegeben sind durch
Dv(p) u = ∑ρ { v(p) uρ + ∑μν uμ(p) Γ ρνμ vν(p) } d/dx ρ|p
mit den Christoffelsymbolen Γ ρνμ , die durch
Dd/dxν|p d/dxμ|p = ∑ρ Γ ρνμ d/dx ρ|p
definiert sind. Insgesamt müssen sich also die Komponenten, die durch die geschweifte Klammer definiert sind, wie die Komponenten eines Tangentialvektors bei Koordinatenwechseln transformieren. Sie transformieren sich also genauso wie die Komponenten uμ(p) und vμ(p) , die in der geschweiften Klammer ebenfalls vorkommen. Als Folge davon weist das Christoffelsymbol ein komplexeres Transformationsverhalten auf, das gerade so beschaffen sein muss, dass die geschweifte Klammer das gewünschte Transformationsverhalten aufweist. Dabei ist besonders wichtig, dass die Klammer die Richtungsableitung v(p) uρ von Tangentialvektorkomponenten enthält. Bei Koordinatentransformationen entstehen dadurch Zusatzterme, die durch das Transformationsverhalten der Christoffelsymbole kompensiert werden müssen. Physiker kennen das von Eichtheorien, bei denen das Eichpotential Aμ(x) die Zusatzterme von δμ ψ(x) bei Eichtransformationen neutralisieren muss, so dass Dμ(A) ψ(x) sich bei Eichtransformationen genauso transformiert wie ψ(x) (Details siehe Die Grenzen der Berechenbarkeit, Kapitel 5.4.6 Eichtheorien). Analog hier: Die Komponenten von Dv(p) u sollen sich bei Koordinatentransformationen genauso transformieren wie die Komponenten von u(p), d.h. Dv(p) u soll ein Tangentialvektor sein wie u(p). Halten wir fest:
Um es konkret zu machen: Am einfachsten lässt sich das Transformationsverhalten beschreiben, wenn man die folgenden Objekte mit Hilfe der Basisvektoren des Co-Tangentialraums definiert:
Θ ρμ := ∑ν Γ ρνμ dxν
Θ ist also eine Matrix, deren Elemente Co-Tangentialvektoren sind. Die ν-Koordinate wird durch die Bildung von Θ gleichsam versteckt, denn Θ enthält keine μ-Koordinatenabhängigkeit mehr. Insbesondere ist
Θ ρμ(p) v(p) = ∑ν Γ ρνμ dxν|p v(p) = ∑ν Γ ρνμ vν(p)
Damit lässt sich die kovariante Ableitung kurz schreiben als
Dv(p) u = ∑ρ { v(p) uρ + ∑μ uμ(p) (Θ ρμ(p) v(p)) } d/dx ρ|p
Als Spaltenvektor gesehen ist Dv(p) u also gegeben durch v(p) u + Θ(v) u(p) , wobei der Spaltenvektor v(p) u die Komponenten v(p) uρ hat und Θ(v) als Matrix mit Komponenten Θ ρμ(p) v(p) zu lesen ist. Die Matrix Θ(v) wird dabei mit dem Spaltenvektor u(p) multipliziert.
Geht man nun von Koordinaten x zu Koordinaten x' über mit der Jacobi-Matrix Jλμ := dxλ/dx'μ , so gilt die Matrixgleichung
Θ' = J − 1 Θ J + J − 1 dJ
Dabei ist Θ' die Matrix bezüglich der neuen Koordinaten x', und dJ ist die Matrix mit Elementen analog zur Definition von dΦ im Kapitel über Co-Tangentialvektoren. Details ersparen wir uns hier.
Einige weitere Anmerkungen:
Dv(p) (ω u) =: ω(p) (Dv(p) u) + (Dv(p) ω) u(p)
Dabei ist (ω u) eine skalare Funktion, d.h. Dv(p) (ω u) = v(p) (ω u) . Wir werden am Schluss dieses Kapitel noch einmal darauf zurückkommen und sehen, warum diese Vorgehensweise sinnvoll ist und wie man sie auf weitere Objekte (z.B. Tensoren wie die Metrik) übertragen kann.
Parallelverschiebung (Paralleltransport):
Wenn wir eine Einbettung voraussetzen, lässt sich die Richtungsableitung eines Vektorfeldes u in γ'(0)-Richtung in t = 0 durch den üblichen Grenzwert des Differenzenquotienten ausdrücken:
du(γ(t)) / dt |t = 0 = lim t → 0 [u(γ(t)) − u(p)] / t
Man kann aufgrund des Einbettungsraumes direkt die Differenz der zwei Vektoren bilden.
Ohne Einbettung geht das nicht, denn u(γ(t)) und u(p) gehören zu zwei verschiedenen Tangentialräumen. Deshalb ist die obige Richtungsableitung ohne Einbettung gar nicht definiert, und wir haben sie durch die kovariante Ableitung ersetzt, die die obige Richtungsableitung auf den Tangentialraum in p projeziert. Die kovariante Ableitung benötigt keine Einbettung. Man kann sich nun die Frage stellen, ob sich für die kovariante Ableitung ein Ausdruck analog zu oben finden lässt, bei dem eine Art Unterschied zwischen Tangentialvektoren eine Rolle spielt.
Das Problem ist, dass die Differenz oben die Tangentialvektoren an zwei unterschiedlichen Punkten γ(t) und γ(0) = p miteinander vergleicht. Wir dürfen ohne Einbettung jedoch nur Tangentialvektoren des gleichen Tangentialraums voneinander abziehen. Der Tangentialvektor u(γ(t)) muss dazu irgendwie von γ(t) nach γ(0) = p verschoben (transportiert) werden, und zwar so, dass anschließend der Ausdruck gerade die kovariante Ableitung ergibt. Nennen wir den Transportoperator, der aus u(γ(t)) einen Tangentialvektor in p macht, T(γ)− t , d.h. T(γ)− t u(γ(t)) ist ein Tangentialvektor in p. Wir können T(γ)− t so lesen, dass dieser Operator einen sogenannten Paralleltransport entlang der Kurve γ bewirkt, und zwar so, dass der Kurvenparameter um − t geändert wird. Allgemein soll der Paralleltransportoperator T(γ)t aus einem Tangentialvektor im Tangentialraum T(γ(s)) einen Tangentialvektor im Tangentialraum T(γ(s + t)) machen. Also ist T(γ)t eine Abbildung vom Tangentialraum T(γ(s)) in den Tangentialraum T(γ(s + t)) für jeden Wert s des Kurvenparameters. Dabei soll T(γ)0 = 1 sein, denn der Transport um Nichts soll auch Nichts ändern.
Wir wollen den Transportoperator nun so konstruieren, dass folgendes gilt:
Dv(p) u = lim t → 0 { [ T(γ)− t u(γ(t)) ] − u(p) } / t
wobei v(p) der zur Kurve γ(t) gehörende Tangentialvektor in t = 0 ist.
Insgesamt wollen wir einen möglichst einfachen Transportoperator konstruieren. Da der Transportoperator eine Abbildung zwischen zwei Vektorräumen ist, wollen wir versuchen, mit einem linearen Transportoperator auszukommen. Außerdem soll
T(γ)t' T(γ)t = T(γ)t + t'
gelten, was der Vorstellung entspricht, dass der Transportoperator einen Tangentialvektor entlang einer Kurve verschiebt, wobei man den Transport um t + t' in zwei Teiltransporte zerlegen kann (wie üblich, muss man diese Operator-Beziehung von rechts nach links lesen: erst wird immer der Operator rechts ausgeführt). Setzt man hier t' = − t , so folgt
T(γ)− t T(γ)t = 1
d.h. ein Transport hin und wieder zurück ändert nichts. Wichtig ist bei all diesen Regeln, dass immer dieselbe Kurve γ für den Transport verwendet wird. Das Transportergebnis kann ja vom Transportweg abhängen (und tut es auch im Allgemeinen)!
Für die folgende Rechnung ist es günstig, den Tangentialvektor u(γ(t)) nach den Basisvektoren [T(γ)t d/dxμ|p] entwickeln. Dies sind die von p = γ(0) nach γ(t) paralleltransportierten Basisvektoren d/dxμ|p . Wir schreiben also
u(γ(t)) =: ∑μ wμ(γ(t)) [T(γ)t d/dxμ|p]
mit entsprechenden Entwicklungskoeffizienten wμ(γ(t)) . Vorsicht: die Basisvektoren [T(γ)t d/dxμ|p] müssen nicht identisch sein mit den Basisvektoren d/dxμ|γ(t) -- deswegen haben wir die Koeffizienten hier auch wμ(γ(t)) anstatt uμ(γ(t)) genannt.
Wir wollen nun die kovariante Ableitung im Punkt γ(t) (also nicht in p = γ(0) ) ausrechnen:
Dv(γ(t)) u = lim ε → 0 { [ T(γ)− ε u(γ(t + ε)) ] − u(γ(t)) } / ε
Dabei ist v(γ(t)) der zu γ(t) gehörende Tangentialvektor im Punkt t. Wenn wir die obige Darstellung von u(γ(t)) einsetzen, so erhalten wir aufgrund der geforderten Eigenschaften des Transportoperators:
Dv(γ(t)) u =
=
lim ε → 0
{ [ T(γ)− ε u(γ(t + ε)) ] − u(γ(t)) } / ε
=
=
lim ε → 0
{ [ T(γ)− ε
∑μ
wμ(γ(t + ε))
[T(γ)t + ε d/dxμ|p]
]
− u(γ(t)) } / ε
=
=
lim ε → 0
{ ∑μ
wμ(γ(t + ε))
[ T(γ)− ε
T(γ)t + ε d/dxμ|p ]
− u(γ(t)) } / ε
=
=
lim ε → 0
{ ∑μ
wμ(γ(t + ε))
[ T(γ)t d/dxμ|p ]
− u(γ(t)) } / ε
=
=
lim ε → 0
{ ∑μ
wμ(γ(t + ε))
[ T(γ)t d/dxμ|p ]
−
∑μ
wμ(γ(t))
[ T(γ)t d/dxμ|p ]
} / ε
=
=
lim ε → 0
{ ∑μ
[ wμ(γ(t + ε))
− wμ(γ(t)) ] } / ε }
[ T(γ)t d/dxμ|p ]
=
=
∑μ
dwμ(γ(t')) / dt' |t' = t
[ T(γ)t d/dxμ|p ]
=
=
∑μ
(v(γ(t)) wμ)
[ T(γ)t d/dxμ|p ]
Andererseits ist die kovariante Ableitung additiv und es gilt die Produktregel, d.h. wir können Dv(γ(t)) u auch mit Hilfe dieser Regeln berechnen und dann die Ergebnisse vergleichen. Dazu brauchen wir die Basisentwicklung des Tangential-Vektorfeld u:
u(γ(t)) = ∑μ wμ(γ(t)) [T(γ)t d/dxμ|p] =: [∑μ wμ [T(γ) d/dxμ|p]] (γ(t))
mit [T(γ) d/dxμ|p] (γ(t)) := T(γ)t d/dxμ|p . Der Operator T(γ) erzeugt dabei allgemein aus einem Vektor im Punkt p durch Paralleltransport ein Vektorfeld entlang der Kurve γ. Aufgrund der Eigenschaften der kovarianten Ableitung gilt nun:
Dv(γ(t)) u =
=
Dv(γ(t))
∑μ
wμ
[T(γ) d/dxμ|p]
=
= ∑μ
(v(γ(t)) wμ)
[T(γ)t d/dxμ|p]
+
∑μ
wμ(γ(t)) Dv(γ(t))
[T(γ) d/dxμ|p]
Vergleichen wir dies mit dem Ergebnis für Dv(γ(t)) u etwas weiter oben, so sehen wir: Es muss
Dv(γ(t)) [T(γ) d/dxμ|p] = 0
gelten. Die kovariante Ableitung des Vektorfeldes, das durch Parallelverschiebung eines Basis-Tangentialvektors d/dxμ|p entlang einer Kurve γ entsteht, muss Null sein. Dies gilt für jeden Punkt γ(t) der Kurve.
Wir können nun mit Hilfe von T(γ) aus einem festen Vektor u(p) allgemein ein Vektorfeld entlang der Kurve γ definieren durch
T(γ)t u(p) =: [T(γ) u(p)] (γ(t))
Das Vektorfeld T(γ) u(p) wollen wir als Parallel-Vektorfeld längs der Kurve γ bezeichnen. Jeder Vektor dieses Vektorfeldes geht dabei durch eine Parallelverschiebung aus dem festen Vektor u(p) hervor, d.h. T(γ) erzeugt aus einem festen Vektor u(p) durch Parallelverschiebung das entlang γ parallele Vektorfeld [T(γ) u(p)] . Dabei ist speziell [T(γ) u(p)](p) = u(p) .
An dieser Stelle noch eine kurze Nebenbemerkung: Man kann in Analogie zum Push-Forward-Fluss der Lie-Ableitung (siehe ein späteres Kapitel) auch noch das parallelverschobene Vektorfeld T(γ)t u auf der Kurve γ definieren. Dieses Vektorfeld geht aus dem Vektorfeld u dadurch hervor, dass jeder Vektor u(γ(t')) um ein festes t parallelverschoben wird:
T(γ)t u(γ(t')) =: [T(γ)t u] (γ(t' + t))
Entsprechend könnten wir in der Formel für die kovariante Ableitung T(γ)− t u(γ(t)) = [T(γ)− t u] (p) mit p = γ(0) einsetzen. Die Formel für die kovariante Ableitung sieht dann vollkommen analog zur Formel der Lie-Ableitung aus, die wir in einem späteren Kapitel noch kennenlernen werden.
Wie sieht es mit der kovarianten Ableitung Dv(γ(t)) [T(γ) u(p)] des Parallelfeldes aus? Um unser Ergebnis bezüglich der Basisvektoren verwenden zu können, zerlegen wir T(γ) u(p) nach dieser Basis:
[T(γ) u(p)] (γ(t))
=
=
T(γ)t u(p) =
=
T(γ)t
∑μ uμ(p) d/dxμ|p
=
=
∑μ uμ(p)
[T(γ)t d/dxμ|p]
=
=
∑μ uμ(p) [T(γ) d/dxμ|p] (γ(t))
also T(γ) u(p) = ∑μ uμ(p) [T(γ) d/dxμ|p] . Dabei sind uμ(p) feste Zahlenwerte, die nicht von γ(t) abhängen. Für die kovariante Ableitung haben wir dann:
Dv(γ(t)) [T(γ) u(p)] = Dv(γ(t)) ∑μ uμ(p) [T(γ) d/dxμ|p] = ∑μ uμ(p) Dv(γ(t)) [T(γ)t d/dxμ|p] = 0
Unser Ergebnis lautet also:
|
Der Zusammenhang zwischen Paralleltransport und kovarianter Ableitung
durch die Gleichung
Dv(p) u = lim t → 0 { [ T(γ)− t u(γ(t)) ] − u(p) } / t
wird uns in ganz analoger Form bei der Lie-Ableitung in einem späteren Kapitel wiederbegegnen. Man benötigt dabei eine Abbildung zwischen verschiedenen Tangentialräumen entlang einer Kurve. Bei der kovarianten Ableitung ist dies der Paralleltransport; bei der Lie-Ableitung dagegen verwenden wir eine sogenannte Fluss-Abbildung. Diese Abbildung definiert gleichsam das Referenz-Vektorfeld, mit dem man das gegebene Vektorfeld vergleicht und so eine Ableitung des Vektorfeldes definieren kann. Bei der kovarianten Ableitung ist das Referenz-Vektorfeld durch das längs einer Kurve γ parallele Vektorfeld gegeben. Entsprechend ist die kovariante Ableitung dieses Referenz-Vektorfeldes in Kurvenrichtung Null, denn man misst ja durch die kovariante Ableitung gerade die Änderung gegenüber dem Referenz-Vektorfeld.
Noch eine Bemerkung zur Vorgehensweise: Im vorliegenden Kapitel sind wir von einer Definition der kovarianten Ableitung ausgegangen und haben daraus den Paralleltransport und damit das Referenzvektorfeld herleiten können. In der Literatur (z.B. in Matt Visser: Math 464: Notes on differential geometry, Victoria University of Wellington, New Zealand, 2004, http://www.mcs.vuw.ac.nz/courses/MATH464/2004T1/Lecture-Notes/notes.ps ) wird teilweise auch anders herum vorgegangen und zunächst der Paralleltransport konstruiert, bevor man daraus die zugehörige kovariante Ableitung herleitet. Diese Vorgehensweise bietet sich später bei der Lie-Ableitung an, bei der wir von der Fluss-Abbildung ausgehen werden und daraus die Lie-Ableitung herleiten werden.
Wir können nun die Bedingung Dv(γ(t)) [T(γ) u(p)] = 0 dazu verwenden, die Wirkung des Parallel-Transportoperators durch eine Differenzialgleichung zu beschreiben. Dazu müssen wir die Bedingung einfach nur in Koordinaten ausschreiben. Um die Schreibweise zu vereinfachen, verlangen wir von unserem Vektorfeld u, dass es ein Parallelfeld längs γ ist, d.h. es soll gelten: u(γ(t)) = T(γ)t u(p) oder kurz u = T(γ) u(p) . Das Vektorfeld entlang der Kurve soll also durch Parallelverschiebung entstehen. Legen wir los:
Dv(γ(t)) [T(γ) u(p)] =
Dv(γ(t)) u =
=
∑ρ {
duρ(γ(t')) / dt' |t' = t
+
∑μν
uμ(γ(t)) Γ ρνμ(γ(t))
vν(γ(t))
} d/dx ρ|γ(t) =
= 0
Das bedeutet:
|
Das Lösen dieser Differenzialgleichung entspricht dem Ausrechnen der Wirkung des Parallel-Transportoperators. Sind beispielsweise als Anfangswert die Werte uμ(γ(0)) vorgegeben (d.h. u(p) ist vorgegeben), so liefert die Lösung der Differenzialgleichung die Werte uμ(γ(t)) und damit den nach t parallelverschobenen Tangentialvektor. Da es sich um eine lineare Differenzialgleichung erster Ordnung für uμ(γ(t)) handelt, ist die Lösung bei vorgegebenem Anfangswert eindeutig bestimmt. Man kann daher die Differenzialgleichung als eindeutige Definition des Parallel-Transportoperators auffassen. Diese Definition ist konsistent zu den oben geforderten Eigenschaften des Parallel-Transportoperators, denn die Lösung uμ(γ(t)) der Differenzialgleichung hängt linear von den Anfangsbedingungen uμ(γ(0)) ab, und auch die anderen Eigenschaften kann man nachweisen. Damit ist es uns tatsächlich gelungen, den gewünschten Parallel-Transportoperator eindeutig zu konstruieren. Ist ein affiner Zusammenhang (eine kovariante Ableitung) gegeben, so ist der Paralleltransport eindeutig festgelegt und umgekehrt, wie unsere obigen Überlegungen zeigen.
Das Einzige, was uns noch fehlt, ist eine explizite Formel für den Parallel-Transportoperator. In der Mathematik verzichtet man zumeist auf eine solche Formel, da die Differenzialgleichung oben bereits alle Informationen enthält. In der Physik dagegen kennt man aus ähnlichen Fragestellungen bereits explizite Formeln für solche Lösungs-Operatoren von linearen Differenzialgleichungen. Ein bekanntes Beispiel ist die Lösung der zeitabhängigen Schrödingergleichung in der Quantenmechanik. Man braucht nur noch den Formalismus auf unser obiges Problem zu übertragen.
Die Details der Konstruktion wollen wir hier überspringen. Man findet die Ideen in jedem Buch über Quantenmechanik (Stichworte: zeitabhängige Schrödingergleichung, Zeitordnung, Störungstheorie) oder aber in dem unten angegebenen Skript von Matt Visser in Anhang D. Das Ergebnis ist das sogenannte weggeordnete Integral (path ordered integral). Im Rahmen der Eichtheorie wird daraus der Eich-Transportoperator, der bei einem geschlossenen Weg (d.h. Anfangspunkt gleich Endpunkt) zum sogenannten Wilson loop wird. Wir werden hier nicht näher darauf eingehen.
Geodätische Linien:
Man kann die Idee des Paralleltransports dazu nutzen, um eine möglichst gerade Kurve zu konstruieren. Eine solche Kurve wollen wir geodätische Linie nennen. Dabei soll möglichst gerade bedeuten, dass die Tangentialvektoren entlang der Kurve bis auf einen Faktor durch Parallelverschiebung auseinander hervorgehen. Anschaulich bedeutet das bei einer Einbettung, dass sich der Tangentialvektor der Kurve nur senkrecht zur Tangentialfläche sowie parallel zu sich selbst ändern darf. Veranschaulichen wir uns den Tangentialvektor als Geschwindigkeit, so darf die Beschleunigung also nur senkrecht zur Fläche wirken (wird benötigt, damit die Geschwindigkeit im Lauf der Bewegung tangential zur Fläche bleibt) sowie in Bewegungsrichtung beschleunigend oder abbremsend wirken.
Wichtig ist, dass innerhalb der Tangentialfläche keine Beschleunigung zur Seite stattfindet. Übertragen auf ein Schiff im Ozean bedeutet das: Das Schiff fährt immer geradeaus, weder nach rechts, noch nach links. Dabei darf es auch mal schneller oder langsamer werden. Aufgrund der Erdkrümmung gibt es während der Fahrt eine kleine Beschleunigung senkrecht zur Wasseroberfläche, denn das Schiff verlässt die Wasseroberfläche nicht.
Man kann durch Umparametrisierung der Kurve erreichen, dass die parallele Beschleunigung gleich Null wird, d.h. die Bewegung erfolgt dann mit konstanter Geschwindigkeit. Dies wäre dann eine spezielle Parametrisierung der geodätischen Linie. Für unser Schiff bedeutet das, dass es mit gleichmäßiger Geschwindigkeit über die Wellen gleitet.
Man kann sich eine geodätische Linie auf einer gekrümmten Fläche auch noch anders veranschaulichen. Dazu stellen wir uns vor, dass wir ein dünnes langes Band, z.B. aus einem dünnen Blech, flach auf einer gekrümmten Fläche anbringen. Das Band liegt dann entlang einer geodätischen Linie auf der Fläche, da es so beschaffen sein soll, dass es sich nur senkrecht zur Fläche biegen lässt.
Präzisieren wir diese Überlegung: Wir verlangen, dass die kovariante Ableitung des Tangentialvektors v(γ(t)) der Kurve γ an jedem Punkt γ(t) der Kurve proportional zum Tangentialvektor selbst ist. Es soll also gelten:
Dv(γ(t)) v = c(t) v(γ(t))
wobei man durch Umparametrisierung der Kurve c(t) = 0 erreichen kann, so dass die Tangentialvektoren der Kurve ein Parallelfeld entlang der Kurve bilden. Natürlich kann man auch diese Gleichung bezüglich einer Koordinatenfunktion f in Komponenten ausschreiben:
|
mit d(f ο γ)μ(t') / dt' |t' = t = vμ(γ(t)) . Es gilt nun, diese Differenzialgleichung für vρ(γ(t)) bei vorgegebenen Anfangswerten und gegebenen Christoffelsymbolen zu lösen und dann durch Integration die Kurvenkoordinaten (f ο γ)μ(t) zu bestimmen, wobei man meist c(t) = 0 setzt und damit die Parametrisierung der Kurve gleich festlegt. Übrigens: wegen der Symmetrie in μ und ν spielt Torsion in dieser Gleichung keine Rolle.
kovariante Ableitung für Co-Tangentialvektoren und weitere Tensoren:
Wir hatten oben bereits erwähnt, dass man die kovariante Ableitung für Co-Tangentialvektoren ω(p) über die Produktregel
Dv(p) (ω u) =: ω(p) (Dv(p) u) + (Dv(p) ω) u(p)
definieren kann. Da φ := (ω u) eine skalare Funktion ist, ist dabei Dv(p) (ω u) = v(p) (ω u) . Der Paralleltransport ermöglicht es uns, diese Vorgehensweise besser zu verstehen. Wir können nämlich nicht nur Tangentialvektoren, sondern auch Co-Tangentialvektoren paralleltransportieren, indem wir fordern, dass bei diesem Paralleltransport der Wert der skalaren Funktion ω u sich nicht ändern soll. Anschaulich sagen wir ja, dass der Paralleltransport einen Tangentialvektor v(p) so wenig wie möglich ändert (was bei einer Einbettung unmittelbar eine anschauliche Bedeutung hat). Analog wollen wir auch, dass der Paralleltransport einen Co-Tangentialvektor ω(p) so wenig wie möglich ändert. Dazu passt dann, dass sich ω(p) u(p) beim gleichzeitigen Paralleltransport von ω(p) und u(p) überhaupt nicht ändert. Wir definieren also den Paralleltransport der skalaren Funktion φ(p) := (ω u)(p) := ω(p) u(p) durch
[T(γ) φ(p)](γ(t)) :=
T(γ)t φ(p)
:= φ(p) und somit dann
[T(γ) (ω u)(p)](γ(t)) :=
T(γ)t (ω u)(p)
:= (ω u)(p) = ω(p) u(p)
d.h. die Funktion [T(γ) (ω u)(p)] ist entlang der Kurve γ konstant. Diese Definition des Paralleltransports einer skalaren Funktion ist zwingend, wenn wir für die kovariante Ableitung einer skalaren Funktion φ die Formel
Dv(p) φ = lim t → 0 { [ T(γ)− t φ(γ(t)) ] − φ(p) } / t
analog zur Formel für Tangentialvektoren erreichen wollen. Aus der Konstanz von φ
beim Paralleltransport folgt nämlich
T(γ)− t φ(γ(t)) = φ(γ(t)) ,
so dass
Dv(p) φ =
lim t → 0
{ φ(γ(t)) − φ(p) } / t
= dφ(γ(t)) / dt |t = 0
= v(p) φ
ist. Genau so war ja die kovariante Ableitung einer skalaren Funktion definiert.
Mit Hilfe dieser Funktion können wir nun den Paralleltransport des Co-Tangentialvektors ω(p) definieren durch
ω(p) u(p) = T(γ)t (ω u )(p) =: [T(γ)t ω(p)] [T(γ)t u(p)]
d.h. der gleichzeitige Paralleltransport von ω(p) und u(p) entlang der Kurve ändert den Wert der Kombination dieser beiden Vektoren nicht.
Die kovariante Ableitung eines Co-Tangentialvektors ω definieren wir nun analog zu skalaren Funktionen und Tangentialvektoren durch
Dv(p) ω =
=
lim t → 0
{ [ T(γ)− t ω(γ(t)) ] − ω(p) } / t
=
=
d [ T(γ)− t ω(γ(t)) ] / dt |t = 0
Nun ist [ T(γ)− t ω(γ(t)) ]
ein Co-Tangentialvektor im Punkt p, den wir schreiben können als
[ T(γ)− t ω(γ(t)) ] =
∑μ
[ T(γ)− t ω(γ(t)) ]μ(p)
dxμ|p
d.h. die t-Abhängigkeit steckt alleine in den Koeffizienten.
Analog ist es beim Tangentialvektor
[ T(γ)− t u(γ(t)) ] =
∑μ
[ T(γ)− t u(γ(t)) ]μ(p)
d/dxμ|p
Daraus folgt, dass wir in der folgenden Rechnung die Produktregel anwenden dürfen:
v(p) (ω u) =
Dv(p) (ω u) =
= d(ω u)(γ(t)) / dt |t = 0 = ...
wir verwenden die Konstanz von (ω u) beim Paralleltransport:
= d [ T(γ)− t (ω u)(γ(t))] / dt |t = 0 = ...
wir setzen die Definition des Paralleltransports für einen Co-Tangentialvektor ein:
= d { [T(γ)− t ω(γ(t))] [T(γ)− t u(γ(t))] } / dt |t = 0 = ...
umschreiben in Komponenten ergibt:
= d { ∑μ [T(γ)− t ω(γ(t))]μ [T(γ)− t u(γ(t))]μ } / dt |t = 0 = ...
Produktregel anwenden:
= ∑μ d [T(γ)− t ω(γ(t))]μ / dt |t = 0 uμ(p) + ∑μ ωμ(p) d [T(γ)− t u(γ(t))]μ / dt |t = 0 = ...
die Definition der kovarianten Ableitung für Tangential- und Co-Tangentialvektoren über den Paralleltransport ergibt:
= ∑μ [Dv(p) ω]μ uμ(p) + ∑μ ωμ(p) [Dv(p) u]μ =
= [Dv(p) ω] u(p) + ω(p) [Dv(p) u]
Damit haben wir die Produktregel von oben reproduziert. Fassen wir zusammen:
|
Die Formeln
ω(p) u(p) = T(γ)t (ω u )(p) =: [T(γ)t ω(p)] [T(γ)t u(p)] sowie
v(p) (ω u) = Dv(p) (ω u) = [Dv(p) ω] u(p) + ω(p) [Dv(p) u]
sind im Grunde gleichwertig. Man kann entweder über die erste Formel den Paralleltransport von ω definieren (dann legt die zweite Formel die dazu passende kovariante Ableitung fest), oder man definiert über die zweite Formel die kovariante Ableitung (dann legt die erste Formel den dazu passenden Paralleltransport fest). In der Literatur findet man beide Vorgehensweisen.
Die obige Vorgehensweise ist nicht auf Co-Tangentialvektoren beschränkt. Man kann mit ihr schrittweise die kovariante Ableitung beliebigen Tensoren definieren. Betrachten wir als Beispiel die bilineare Abbildung g(p)(u(p), w(p)) , die zwei Tangentialvektoren aus T(p) eine reelle Zahl zuordnet (die Metrik ist ein Beispiel für eine solche Abbildung). In Komponenten ausgeschrieben haben wir
g(p)(u(p), w(p)) = ∑μν gμν(p) uμ(p) wν(p)
d.h. die p-Abhängigkeit von g(p)(...) ist (neben der p-Abhängigkeit der Argumente u(p) und w(p) ) durch die p-Abhängigkeit der Komponenten gμν(p) gegeben. Wir können nun als skalare Funktion g(p)(u(p), w(p)) verwenden (analog zu ω(p) u(p) von oben) und analog zu oben vorgehen:
|
Interessant ist der Fall [Dv(γ(t)) g] = 0 , also [Dv(γ(t)) g]μν = 0 für jeden Punkt γ(t) der Kurve. Es gilt dann T(γ)− t g(γ(t)) = g(p) bzw. umgekehrt T(γ)t g(p) = g(γ(t)) und somit
v(p) g(u,w) =
g(p)( Dv(p) u , w(p))
+
g(p)(u(p) , Dv(p) w) sowie
g(p)(u(p), w(p)) =
g(γ(t))( [T(γ)t u(p)], [T(γ)t w(p)] )
Die erste Gleichung werden in Kapitel 5.1.9 Abstände und Winkel: die Metrik noch kennenlernen: es handelt sich um die Verträglichkeitsbedingung von Metrik und affinem Zusammenhang. Wie wir sehen, können wir diese Bedingung auch durch [Dv(γ(t)) g] = 0 abkürzen. Die zweite Gleichung wiederum besagt, dass sich dann die Metrik zwischen zwei gleichzeitig paralleltransportierten Tangentialvektoren nicht ändert.
Soviel zum Thema Kovariante Ableitung und Paralleltransport. Richtig interessant werden diese Begriffe, wenn wir uns mit den Themen Krümmung und Metrik befassen und Zusammenhänge zwischen diesen Begriffen untersuchen. Das wollen wir in den nächsten Kapiteln tun.
Literatur zu dem Thema:
last modified on 30 December 2008