Das d'Alembert'sche Prinzip führt im Zusammenhang mit Koordinatentransformationen
"beinahe von selbst" zu einer weiteren
Variante der klassischen Mechanik, die nach dem Physiker Lagrange
benannt ist.
In diesem Kapitel soll diskutiert werden, wie sich die virtuelle Arbeit
unter der Koordinatentransformation
verhält. Hierzu setzen wir in die Gleichung für die virtuelle Arbeit
die virtuelle Verschiebung
ausgedrückt in den neuen Koordinaten, ,
sowie ein:
.
Hierin wenden wir auf den zweiten Summanden (der letzte Gleichung
rechts) die Produktregel der Differenzialrechnung an:
.
Auf der rechten Seite wird dann erneut die Produktregel angewandt:
,
wodurch ein Term mit der Ableitung der kinetischen Energie T
nach der neuen Koordinate q entsteht. Auch
lässt sich weiter umformen: Mit Hilfe der Kettenregel der Differenzialrechnung
können wir nämlich folgern:
,
woraus wir zum Einen ablesen können, dass
nicht nur eine Funktion der Zeit t und der neuen Koordinate
q ist, wie dies ja auch bei x der Fall ist, sondern dass
auch noch von der Zeitableitung der neuen
Koordinate, , abhängt. Aus dieser Tatsache
folgt das sog. "Punktekürzen": .
Zum Andern können wir jetzt dadurch den folgenden Term (erneut mittels
der Produktregel) umformen:
.
Zusammenfassend dürfen wir also jetzt Folgendes schreiben:
.
Bei nicht verschwindender Variation gilt
daher:
mit .
Wegen ist auch die
kinetische Energie T im Allg. eine Funktion von
und nicht nur von q bzw. t.
Wir werden wie beim Federpendel mit Stokes'schem Reibungsterm annehmen,
dass sich die Kraft F aus einer Potentialkraft
und einer Nicht-Potentialkraft f' zusammensetzt:
.
Man beachte, dass wir es zulassen, dass das Potential
sogar explizit von der Zeit abhängt, eine Abhängigkeit von
schließen wir jedoch weiterhin aus. Dem aufmerksamen Leser wird aufgefallen
sein, dass in diesem Kapitel
statt wie in den Kapiteln zuvor verwendet
wurde: Hiermit tragen wir nochmals der Tatsache Rechnung, dass V
neben x auch von t explizit abhängen darf.
Weil wir x ja auf die neue Koordinate q transformieren,
werde aus V als Funktion der alten Koordinate unter dieser Transformation
eine Funktion U der neuen Koordinate:
.
Mit dieser Nomenklatur und der Kettenregel folgern wir
,
sodass nun
geschrieben werden kann. Da das Potential U in der neuen Koordinate
nicht explizit von abhängt, gilt natürlich:
.
Dadurch können wir aber die letzte Gleichung mit Hilfe der sog. "(natürlichen)
Lagrangefunktion"
ausdrücken:
.
Diese Gleichung wird auch "Euler-Lagrange-Gleichung"
genannt. Die Koordinate q wird gerne als verallgemeinerte (oder
generalisierte) Koordinate bezeichnet. Zu ihr gesellt sich der verallgemeinerte
(oder generalisierte bzw. kanonische) Impuls .
Ob diese Gleichung auch wirklich auf Bewegungsgleichungen führt, möchten
wir wieder am Beispiel des gedämpften harmonischen Oszillators untersuchen.
Hierzu verwenden wir als erstes die einfachste Koordinatentransformation,
die uns in den Sinn kommt: Dies dürfte wohl die identische Transformation
sein, so dass
gilt. Die (natürliche) Lagrangefunktion L nimmt dann wegen
die folgende Form an:
.
Die zugehörige Euler-Lagrange-Gleichung
führt dann wegen der Stokes'schen Reibungskraft
tatsächlich auf die gewohnte Bewegungsgleichung:
.
Der verallgemeinerte Impuls fällt hier übrigens mit dem (Newton'schen)
Impuls p zusammen: .
Im Falle der Koordinatentransformation
,
aus dem vorangegangenen Kapitel erhalten wir für die (natürliche)
Lagrangefunktion hingegen
.
Die Euler-Lagrange-Gleichung lautet daher
,
also ,
was wir auch als transformierte Bewegungsgleichung bereits kennen.
Der verallgemeinerte Impuls
ist in diesem Fall nicht mehr gleich dem Impuls p: .
Der Grund, warum wir hier der Lagrangefunktion das Attribut "natürlich"
hinzugefügt haben, wird im nächsten Kapitel deutlich, in dem von sog.
"Eichtransformationen" die Rede sein wird.
Die (natürliche) Lagrangefunktion
ist nicht die einzige, die auf die Bewegungsgleichung
führt. Sie lässt sich nämlich noch mit einer beliebigen Funktion der
Form "eichen",
weil
ist. Demzufolge führt die Funktion
auf dieselbe Bewegungsgleichung wie L:
.
Um dies zu glauben, müssen wir aber noch zeigen, dass tatsächlich
gilt:
.
Der letzte Schritt in dieser Gleichung ist subtiler als man vielleicht
zunächst annehmen möchte, denn es wird dort nicht die partielle Ableitung
mit der gleichermaßen
partiellen Ableitung vertauscht,
sondern mit der totalen
Ableitung . Ersteres ist bei entsprechenden
(stetigen) Differenzierbarkeiten (die hier immer vorausgesetzt sein
sollen) der Funktion unproblematisch,
letzteres ist jedoch nicht selbstverständlich, aber hier gültig:
.
Um dies alles zu verifizieren, wählen wir z.B.
mit beliebigem (und einem in q und
t konstanten Faktor A), woraus ja
folgt. Auf Letzteres wenden wir die Ableitungen
an:
.
Daher führt
auf dieselbe Bewegungsgleichung wie .
Der verallgemeinerte Impuls
ist jedoch nicht gleich .
Dies gilt auch ganz allgemein, weil ja
ist und somit der verallgemeinerte Impuls zu
wird.
Haben wir sogar zwei Sätze von neuen Koordinaten, nämlich sowohl q
als auch Q, dann soll die Transformation zwischen diesen Koordinaten
bzw.
lauten. Der Zusammenhang zwischen der alten Koordinate x und
der einen neuen Koordinate q, d.h. ,
führe auf folgende Euler-Lagrange-Gleichung:
,
während der Zusammenhang zwischen
x und der anderen neuen Koordinate Q auf die Bewegungsgleichung
führe. Gelte zusätzlich noch wie folgt der Zusammenhang zwischen den
beiden Lagrangefunktionen L und (die
ja beide jeweils noch mit den Funktionen
bzw. geeicht sein können,
was wir hier auch der größeren Allgemeingültigkeit wegen annehmen
möchten):
.
Man kann sich nun die Frage stellen, welche Eigenschaften die Transformation
zwischen den beiden neuen Koordinaten q bzw. Q besitzen
muss, damit unsere Forderungen auch alle erfüllt sind. Diese Forderungen
bedeuten ja nur, dass die Beschreibung des betrachteten Systems in
der einen neuen Koordinate q mit der Beschreibung in der anderen
neuen Koordinate Q gleichwertig ist. Der physikalische Gehalt
muss unabhängig von der getroffenen Koordinatenwahl sein, so dass
die (beliebig geeichten) Lagrangefunktionen in beiden neuen Koordinatensystemen
gleich sind und sich auch an der Form der Bewegungsgleichungen - d.h.
den Euler-Lagrange-Gleichungen - nichts ändert. Die Antwort auf jene
Frage versuchen wir auf folgendem Weg zu erhalten:
.
Als erstes müssen wir uns darüber Gedanken machen, was
eigentlich bedeutet, indem wir die totale Zeitableitung auf Q
mittels Kettenregel ausdrücken: .
Dadurch erkennen wir, dass die totale Zeitableitung von Q nicht
nur eine Funktion von q und t ist, wie dies ja bei Q
der Fall ist, sondern auch noch zusätzlich explizit von
abhängt. Dies drücken wir im Folgenden durch
aus, wobei hier V für die zu Q gehörende Geschwindigkeit
(und analog v für die Geschwindigkeit
von q) stehen soll (und somit hier nicht die potenzielle
Energie bedeute, die wir in einem Kapitel zuvor gleichermaßen mit
V bezeichnet hatten). Dadurch verschwindet die partielle Ableitung
von nach nicht, sondern
ergibt
(was ein erneutes Beispiel für das oft wohl eher scherzhaft genannte
"Punktekürzen" darstellt).
Dann betrachten wir zunächst
.
Neben Ketten- und Produktregel der Differenzialrechnung haben wir
zusätzlich noch das "Punktekürzen" angewandt.
Weil außerdem noch
gilt, erhalten wir:
.
Jetzt müssen wir noch den Term
untersuchen. Wegen
und
erhalten wir
.
Wenden wir auf Letzteres die totale Zeitableitung an, so folgt
.
Dies vergleichen wir mit
und müssen dabei feststellen, dass beide Terme gleich sind, weil
gilt, d.h.
.
Insgesamt können wir also folgern, dass
sein muss. Aus der Gültigkeit von
ergibt sich also nur dann die Gültigkeit von ,
wenn ist. Nach
dem sog. mathematischen "Satz über implizite Funktionen"
bedeutet diese Bedingung, dass sich die Abbildung
zu umkehren lässt, was wir ja
eingangs in diesem Kapitel einfach stillschweigend vorausgesetzt haben.
Nun soll gezeigt werden, dass sich die Euler-Lagrange-Gleichung auch
aus dem sog. "Wirkungsintegral" (wobei
die sog. "Wirkung" W die Dimension
Energie mal Zeit besitzt)
durch Variation nach q gewinnen lässt, wenn die Variation von
auf dem Rand des Zeitintervalls verschwindet,
d.h. wenn
gilt. Hierzu variieren wir also die Wirkung W nach q und
beachten, dass die Variation mit dem Integral
über die Zeit vertauscht, da . Gleichermaßen
vertauscht sie mit Zeitableitungen, was wir einmal bei der Variation
der Geschwindigkeit betrachten:
.
Aus der Variation des Wirkungsintegrals erhalten wir beim ersten Summanden
des Integranden daher:
mittels Vertauschens von Variation und Zeitintegral bzw. Zeitableitung,
partieller Integration und der Tatsache, dass die Variationen von
q auf dem Rand des Zeitintervalls verschwinden. Für den zweiten
Summanden im Integranden von W nutzen wir zusätzlich noch den
ersten Hauptsatz der Analysis aus:
.
Übrig bleibt somit nur noch
,
wobei wir im letzten Schritt ausgenutzt haben, dass ja immer
erfüllt ist. Aus der Variation von W folgt also die Euler-Lagrange-Gleichung,
wenn gilt, d.h. die Wirkung W ein
Extremum annimmt.
Außerdem können wir das Extremalprinzip auch nutzen, um zu klären,
wann eine sog. »Punkttransformation«
»zulässig« ist: Hierunter verstehen wir ja eine solche Transformation,
die umkehrbar ist und die Euler-Lagrange-Gleichung mit einer zu Q
gehörenden (geeichten) Lagrangefunktion
invariant lassen, so dass also wieder
gilt. In einem vorangegangenen Kapitel haben wir bereits bewiesen,
dass eine solche Transformation ,
die
in
überführt (und umgekehrt), die Gleichung
erfüllt. Mit Hilfe des Hamilton'schen Extremalprinzips lässt sich
dies besonders leicht zeigen. Dazu gehen wir von der letzteren Gleichung
aus und verwenden sie in
,
wovon wir ja bereits wissen, dass hieraus die Euler-Lagrange-Gleichung
folgt. Somit ergibt sich die Gleichung
.
Man beachte, dass diese geeichten Lagrangefunktion hier bzgl. q
statt Q variiert werden soll. An dieser Stelle machen wir uns
aber zu Nutze, dass
und
gelten müssen. Ersteres können wir z.B. auch in folgendem Term verwenden:
,
da ja die Variation von q auf dem Rand des Zeitintervalls verschwindet.
Insgesamt können wir daher zur Schlussfolgerung gelangen, dass
gilt. Der Term
ist aber gleich Null, wenn
ungleich Null ist (Im letzten Schritt haben wir zudem unser Wissen
darüber ausgenutzt, dass
ist). Letzteres ist (nach dem Satz über implizite Funktionen) der
Fall, weil die betrachtete Transformation umkehrbar sein soll. D.h.
es gilt auch für Q und
wieder die Euler-Lagrange-Gleichung, wodurch unsere Behauptung bewiesen
wäre.
Auf die geeichte Lagrangefunktion ,
worin L die natürliche Lagrangefunktion bedeuten soll, lassen
wir nun die totale Zeitableitung wirken, in der Hoffnung auf diesem
Weg Aussagen über Konstanten der Bewegung zu erhalten:
.
Der verallgemeinerte Implus bzgl. lautet
ja
und die zugehörige Euler-Lagrange-Gleichung ist .
Im Ausdruck für die totale Zeitableitung von
können somit
durch sowie
mittels der Euler-Lagrange-Gleichung ersetzt werden:
.
Hierdurch erhalten wir einen Ausdruck für die totale Zeitableitung
einer Größe :
.
Nur dann, wenn die rechte Seite dieser Gleichung Null wird, ist jene
neue Größe auch tatsächlich eine Konstante
der Bewegung. Doch worum handelt es sich bei dieser Größe überhaupt?
Um diese Frage zu klären, setzen wir darin
ein und berücksichtigen, dass
und daher auch
gelten:
,
worin den verallgemeinerten Impuls hinsichtlich
der natürlichen Lagrangefunktion L bedeuten soll.
Die in auftretende natürliche Lagrangefunktion
,
die sich ja aus der Differenz zwischen kinetischer Energie T
und potentieller Energie U zusammensetzt, möchten wir nun dahin
gehend spezialisieren, dass darin die kinetische Energie nur noch
eine sog. "homogene Funktion zweiten Grades"
in ist, d.h. folgendes gilt: ,
was ja z.B. für die kinetische Energie eines freien Teilchens der
Masse m oder des Federpendels der Fall ist, da sie dort
lautet. Für diesen Fall wird es möglich, den Term
genauer zu spezifizieren, da
gilt und jetzt noch die Homogenität zweiten Grades von T ausgenutzt
werden kann:
.
In der somit gewonnenen Gleichung
setzten wir schließlich noch gleich Eins:
.
Die Größe ergibt einen Ausdruck, der die
Gesamtenergie enthält, wenn wir darin die natürliche
Lagrangefunktion sowie die soeben hergeleitete
Gleichung einsetzen:
.
Die Größe ist unter den gewählten Bedingungen
gleich der Gesamtenergie, wenn zusätzlich noch die Eichfunktion M
nicht explizit von der Zeit abhängt, d.h.
gilt. Die Gesamtenergie ist nur dann erhalten, wenn keine Nicht-Potenzialkraft
f (wie z.B. eine Reibungskraft) am System wirkt und außerdem
mit
verschwindet. Letzteres ist aber nur der Fall, wenn auch die potenzielle
Energie U nicht mehr explizit von der Zeit abhängt, d.h. .
Diese Aussagen lassen sich alle am Federpendel mit der natürlichen
Lagrangefunktion
verifizieren, in der ja die kinetische Energie eine homogene Funktion
zweiten Grades in der Geschwindigkeit ist und wie die potenzielle
Energie nicht explizit von der Zeit abhängt. Als Eichfunktion haben
wir dort z.B. mit beliebigem
und einem in q und t konstanten
Faktor A verwendet. Da diese Eichfunktion nicht explizit von
der Zeit abhängt, d.h.
gilt, muss die Größe gleich der Gesamtenergie
des Systems sein, was wir mittels ;
,
,
und
leicht nachvollziehen können: .
Weil die Lagrangefunktion nicht explizit
von der Zeit abhängt, d.h.
gilt, muss
sein. Für die identische Koordinatentransformation (die wir hier bereits
stillschweigend angenommen haben), d.h. ,
und einem Stokes'schen Reibungsterm
erhalten wir für die Zeitableitung der Gesamtenergie wieder ,
deren Gültigkeit wir bereits im Kapitel über Koordinatentransformationen
bewiesen haben. Die Gesamtenergie ist also nur erhalten, wenn keine
Reibungskraft vorhanden ist, d.h. gilt.
Nachdem wir uns schon so viele Gedanken über die Energieerhaltung
gemacht haben, stellt sich die Frage, wie es um eventuelle weitere
Konstanten der Bewegung steht. Im Kapitel über die Newton'sche Mechanik
haben wir ja z.B. noch die Impulserhaltung kennen gelernt. Wir haben
dort festgestellt, dass diese gilt, wenn die äußere Kraft F
verschwindet (später, bei Mehrteilchensystemen, werden wir sagen:
wenn die Summe aller äußeren Kräfte verschwindet). Für die natürliche
Lagrangefunktion bedeutet dies aber, dass sie ausschließlich den Term
für die kinetische Energie enthält, d.h.
gilt, weil dann die potenzielle Energie Null sein muss und auch keine
Nicht-Potenzialkraft (wie z.B. die Reibungskraft) auftritt, d.h
ist, so dass sich die Bewegungsgleichung (d.h. die zugehörige Euler-Lagrange-Gleichung)
folgendermaßen formulieren lässt:
.
Diese Gleichung lässt sich sehr elementar nach der Zeit integrieren:
der verallgemeinerte Impuls ist offensichtlich
eine zeitliche Konstante. Diese besonders günstige Situation hat sich
aus der Tatsache ergeben, dass die (natürliche) Lagrangefunktion nicht
mehr explizit von der (verallgemeinerten) Koordinate q abhängt:
Man spricht dann auch gerne davon, dass die Lagrangefunktion "zyklisch"
in der Koordinate q ist. Es ist daher oft das Ziel, möglichst
Koordinatentransformationen
bzw. verallgemeinerte Koordinaten q zu finden, in denen die
Lagrangefunktion zyklisch wird.
Beim Betrachten der Lagrangefunktion ist es oft möglich zu erkennen,
ob sie sich unter bestimmten Koordinatentransformationen nicht verändert,
d.h. darunter invariant bleibt. Beim freien Teilchen mit
ist dies z.B. die Transformation ,
die eine Translation von q um das s-fache des konstanten
Betrages darstellt (wobei auch der Parameter
s nicht von der Zeit abhänge): .
Die Lagrangefunktion ist in diesem Beispiel offensichtlich unabhängig
vom Parameter s, sodass ihre Ableitung danach verschwindet:
,
wobei wir einmal mit
Hilfe der Euler-Lagrange-Gleichung
ersetzt haben. Die Größe
ist ein Integral der Bewegung und entspricht z.B. beim freien Teilchen
dem Impulserhaltungssatz: .
Dies ist der Satz von Emmy Noether, der einen Zusammenhang zwischen
Transformationen, unter denen die Lagrangefunktion invariant bleibt,
und Konstanten der Bewegung herstellt bzw. die Transformationen diesen
zuordnet: Die in diesem Beispiel gefundene Invarianz der Lagrangefunktion
unter Translationen der Koordinate q hat auf den Impulserhaltungssatz
geführt.