Einführung in den Vektorraum – Serlo „Mathe für Nicht-Freaks“

Wir kennen aus der Schule bereits die Vektorräume und . Dort haben wir sie in Form des Koordinatensystems kennengelernt. Der Begriff des Vektorraums ist in der Mathematik sehr viel weiter gefasst. Im Folgenden werden wir ausgehend von den aus der Schule bekannten Vektorräumen den abstrakten mathematischen Begriff des Vektorraums entwickeln.

Der Vektorraum Bearbeiten

Erklärung und Definition des Vektorraums (YouTube-Video vom YouTube-Kanal "MJ Education")

Im   und   sind uns Vektoren in Form von Punkten in der Ebene bzw. im Raum bekannt. Manchmal begegnen uns auch Pfeile als Repräsentanten von Vektoren im Koordinatensystem. Vektoren können im   durch zwei und im   durch drei Koordinaten beschrieben werden. Die Koordinaten stehen für bestimmte Werte. Die folgende Abbildung zeigt zum Beispiel die Pfeildarstellung des Vektors  :

 
Vektor im   in Pfeildarstellung

Oft reichen drei Koordinaten allerdings nicht aus, um alle gewünschten Informationen abzubilden. Dies zeigen die folgenden zwei Beispiele:

Beispiel (Radiosonde)

Mithilfe einer Radiosonde (Messballon) wollen wir die Erdatmosphäre untersuchen. Neben der Position der Sonde (drei Datenpunkte) erfassen wir verschiedene Messdaten, nämlich Temperatur und Luftdruck. Die drei Koordinaten des   werden bereits benötigt, um die Position der Sonde darzustellen. Für die Darstellung der übrigen Messwerte benötigen wir zwei weitere Koordinaten. Wir nehmen an, dass sich die Sonde ausgehend von der Messstation 20 m in östlicher Richtung, 30 m in nördlicher Richtung und in einer Höhe von 15 m befindet. Unsere Instrumente in der Radiosonde zeigen zu diesem Zeitpunkt eine Temperatur von 13° C und einen Luftdruck von 1 bar an. Um alle erfassten Werte zu einem Zeitpunkt aufzuschreiben, notieren wir den Vektor  . Dabei ermöglicht das hochgestellte T (transponiert) die platzsparende Schreibweise als Zeilenvektor. Die Schreibweise als Spaltenvektor ist

 

Somit befinden wir uns im  , weil wir fünf Zahlen brauchen, um den Vektor zu beschreiben.

Beispiel (Aktien)

Wir betrachten die Aktienwerte der 30 im DAX (Deutscher Aktienindex) gelisteten Unternehmen zu einem bestimmten Zeitpunkt. Diese können wir in einem Vektor mit 30 Einträgen festhalten, wobei jeder Eintrag für den Wert der jeweiligen Aktie zu dem bestimmten Zeitpunkt steht. Wir erhalten einen Vektor im  , der den aktuellen Zustand des Finanzmarktes angibt. Diesen können wir weiter ausbauen, indem wir nicht nur den DAX betrachten, sondern andere Aktien mit aufnehmen. Letztendlich können wir als Dimension unseres „Aktienvektors“ also eine beliebige natürliche Zahl   wählen. Der aktuelle Zustand eines Aktienmarktes kann so durch einen Vektor aus dem   mit   Einträgen kodiert werden.

An den Beispielen haben wir gesehen, dass es notwendig ist,   durch Hinzufügen weiterer Dimensionen zu einem allgemeinen Vektorraum   zu erweitern. Beim Übergang vom   zum   können wir uns noch anschaulich vorstellen, dass wir die Dimension durch das Hinzufügen einer unabhängigen Richtung erhöhen. In höheren Dimensionen fehlt uns diese geometrische Vorstellung. Jedoch können wir uns höherdimensionale Vektorräume sehr gut in der Tupelschreibweise vorstellen. Eine zusätzliche Dimension können wir durch das Hinzufügen einer weiteren Zahl erreichen. Diese Zahlen können alle unabhängig voneinander gewählt werden und wir nennen sie Koordinaten.

Verallgemeinerung auf den Bearbeiten

Bisher haben wir durch Hinzufügen weiterer Dimensionen zu   Vektorräume erzeugt. Nun wollen wir uns anschauen, welche Eigenschaften der reellen Zahlen dafür relevant sind und darauf aufbauend den Vektorraumbegriff weiter verallgemeinern. Mit den Rechenregeln in   sind wir gut vertraut. Wir kennen auch schon die Vektoraddition und die skalare Multiplikation im   und im  . Diese können wir uns anschaulich vorstellen.

Genauso können wir aber auch in höheren Dimensionen rechnen. So ist die Summe der Vektoren   und  :

 

Die skalare Multiplikation von   mit dem Skalar   können wir folgendermaßen berechnen:

 

Genauso wie im   können wir allgemein auch im   verfahren. Wir wollen uns jetzt überlegen, welche Eigenschaften von   das Rechnen mit Vektoren im   gewährleisten. Wir sehen an obigen Beispielen, dass die skalare Multiplikation und die Addition von Vektoren in den einzelnen Komponenten der Multiplikation beziehungsweise der Addition in   entspricht. So rechnen wir in der ersten Komponente bei der Addition  . Ebenso gilt für die skalare Multiplikation in der dritten Komponente  .

Das Rechnen im   wird also auf die Addition und Multiplikation in   zurückgeführt. Hier haben wir eine weitere Möglichkeit der Abstraktion. Eine Menge, in der man wie in den reellen Zahlen addieren und multiplizieren kann, wird Körper genannt. Es sollte also ausreichen, wenn die Zahlen des Vektortupels aus einem Körper stammen. Somit können wir aus jedem allgemeinen Körper  , wie den rationalen Zahlen   oder den komplexen Zahlen  , einen Vektorraum bilden. Analog zum   starten wir dabei mit dem Körper   und bauen durch Hinzufügen weiterer unabhängiger Richtungen einen Vektorraum   auf.

Beispiel (Der Vektorraum  )

Der Vektorraum   ist wie der   eine Menge von Tupeln  , nur dass die Einträge ausschließlich rationale Zahlen aus   und nicht reelle Zahlen aus   sind. Es ist also  . So sind   und   Vektoren aus  . Demgegenüber ist   kein Vektor aus  , da in der zweiten Komponente mit   keine rationale Zahl im Tupel steht.

Hinweis

Nicht nur in Körpern kann man Elemente addieren und multiplizieren, sondern auch in Ringen. Warum also abstrahieren wir nicht weiter von Körpern   zu Ringen   und betrachten  ? Tatsächlich kann man das auch machen. Das resultierende Objekt heißt dann nicht mehr Vektorraum, sondern Modul. Einiges der Theorie von Vektorräumen überträgt sich auch auf Moduln. Jedoch ist die Theorie von Moduln komplizierter, weil wir in Ringen nicht durch alle Elemente teilen können, d.h. nicht immer multiplikative Inverse haben. Deshalb machen wir diesen zweiten Abstraktionsschritt erstmal nicht, sondern bleiben bei allgemeinen Körpern.

Zusammenhang mit Polynomstrukturen Bearbeiten

Oben haben wir Vektoren des   in der Tupelschreibweise verwendet, um Systeme mit   Informationseinheiten zu beschreiben. Die Struktur des Rechnens mit Tupel finden wir auch an anderer Stelle. Betrachten wir das Polynom zweiten Grades  . Wir sortieren die Summanden stets so, dass die Exponenten vom Grad des Polynoms bis zur   absteigend geordnet sind. Dabei stellen wir fest, dass dieses Polynom Ähnlichkeiten zum Vektor   aufweist. Dabei steht der erste Koeffizient des Polynoms in der ersten Komponente des Vektors und so weiter.

Dieselbe Ähnlichkeit können wir auch zwischen der Addition und skalaren Multiplikation von Polynomen auf der einen und den zugehörigen Verknüpfungen von Vektortupeln auf der anderen Seite beobachten. Nehmen wir die Polynome   mit   und   mit   sowie den Skalar  . Die Polynome können wir als Tupel schreiben:


 


Nun berechnen wir   in beiden Darstellungsformen:

 


Auch die Multiplikation von   mit dem Faktor   korrespondiert mit der entsprechenden Rechnung in den zugehörigen Tupel:


 


Jedes Polynom zweiten Grades lässt sich auf die beschriebene Art durch einen dreidimensionalen Vektor eindeutig darstellen. Umgekehrt beschreibt jeder dreidimensionale Vektor eindeutig ein Polynom zweiten Grades. Somit finden wir eine bijektive Abbildung zwischen der Menge der Polynome zweiten Grades und dem  . Analog existiert eine bijektive Abbildung zwischen Polynomen dritten Grades und dem   und allgemein zwischen Polynomen  -ten Grades und dem  .

Bisher haben wir als Koeffizienten von Polynomen alle reellen Zahlen zugelassen. Wir können auch Polynome betrachten, deren Koeffizienten Elemente von   sind. Dementsprechend sind die Einträge des korrespondierenden Vektors rationale Zahlen. Polynome  -ten Grades mit rationalen Koeffizienten korrespondieren damit zu Vektoren aus dem Vektorraum  .

Übergang zum allgemeinen Vektorraum-Begriff Bearbeiten

Wir haben festgestellt, dass wir mit Polynomen  -ten Grades genauso wie mit Vektoren des   rechnen können. Die Menge der Polynome  -ten Grades weist also eine ähnliche Struktur wie der   auf. Bei der Betrachtung aller Polynome, sprich der Polynome beliebigen Grades, stoßen wir mit der Vorstellung des   allerdings an unsere Grenzen. In dieser Menge können die Polynome beliebig große Exponenten besitzen:

 

Um diese Menge durch Tupel zu beschreiben, brauchen wir unendlich viele Einträge. Der Raum aller Polynome umfasst unendlich viele Dimensionen, während wir im   auf   Dimensionen beschränkt sind. Damit kann die Menge aller Polynome nicht durch eine Menge   ausgedrückt werden. Dennoch haben Polynome und Tupel eine gemeinsame Struktur, wie wir bereits gesehen haben. Dies ermöglicht einen weiteren Abstraktionsschritt: Indem wir diese gemeinsame Struktur in einer Definition zusammenfassen, können wir sowohl über Tupel als auch über Polynome und über andere Mengen mit diesen Strukturen sprechen.

Was ist diese gemeinsame Struktur? Die Gemeinsamkeit von Polynomen und von Tupel liegt darin, dass man sie addieren und skalieren kann und dass beide Operationen sich auf beiden Mengen ähnlich verhalten. Dies ist die gemeinsame Struktur, die Vektorräume haben: Vektoren sind Objekte, die man addieren und skalieren kann.

Wir haben einen strukturellen Unterschied zwischen dem   und dem Vektorraum aller Polynome festgestellt. Gemeinsam ist ihnen jedoch, dass man ihre Elemente addieren und skalieren kann. Somit erscheint es naheliegend, diese Eigenschaft von Vektoren als definierende Eigenschaft eines jeden Vektorraums anzusehen.

Bis jetzt haben wir noch nicht überlegt, welche Rechenregeln für die Addition und Skalarmultiplikation von Vektoren in allgemeinen Vektorräumen gelten. In   haben wir die Assoziativ- und Kommutativgesetze sowie das Distributivgesetz und kennen neutrale und inverse Elemente bezüglich der Addition und der Multiplikation. Wie wir oben gesehen haben, lässt sich das Rechnen im   auf das Rechnen in   zurückführen. Dementsprechend übertragen sich bestimmte Rechenregeln der reellen Zahlen auf den Vektorraum   und analog von jedem Körper   auf den  .

Herleitung der Definition eines Vektorraums Bearbeiten

Die Addition, skalare Multiplikation und alle dazugehörigen Rechengesetze liefern die formale Definition des Vektorraumes. Ausgangspunkt unserer Beschreibung eines Vektorraums ist eine Menge  , die alle Vektoren eines Vektorraums enthält. Damit unser Vektorraum   mindestens einen Vektor enthält, fordern wir, dass   nicht leer ist. Wir haben gesehen, dass die wesentliche Struktur eines Vektorraumes durch die Rechenoperationen, die auf ihm durchgeführt werden, gegeben wird. Wir müssen also Addition und skalare Multiplikation auf einem Vektorraum formal beschreiben.

Die additive Struktur eines Vektorraums Bearbeiten

Wir haben bereits definiert, dass ein Vektorraum   eine nicht leere Menge sein soll. Nun definieren wir über Axiome, welche Eigenschaften ihre additive Struktur haben muss. Zunächst stellen wir fest, dass eine Addition von Vektoren eine innere Verknüpfung [1]   ist. Sie ist also eine Abbildung, bei der zwei Vektoren auf einen anderen Vektor abgebildet werden. Der Funktionswert ist dabei die Summe der beiden Eingangsvektoren.

Diese Abbildung bezeichnen wir mit dem Symbol  . So ist   die Summe der beiden Vektoren   und  . Die Schreibweise   ist analog zur Schreibweise   zu verstehen, wobei wir anstelle von „ “ das Symbol „ “ schreiben. Statt der Notation   wird in der Regel die sogenannte Infixnotation   verwendet, die wir im Folgenden nutzen wollen.

Wir nutzen hier das Operationszeichen „ “ zur besseren Unterscheidung zwischen der Vektoraddition und der Addition von Zahlen „ “, die wir zunächst unabhängig voneinander betrachten können. In den meisten Lehrbüchern wird das Symbol „ “ auch für die Vektoraddition verwendet. Ob die Addition von Vektoren oder von Zahlen gemeint ist, muss aus dem jeweiligen Kontext erschlossen werden. Auch wir werden später das Symbol „ “ anstelle von „ “ benutzen.

Um zu zeigen, dass die Menge   mit einer Verknüpfung „ “ versehen ist, schreiben wir  . Damit wir aber „ “ als Addition ansehen können, muss diese Operation gewisse charakteristische Eigenschaften erfüllen, die wir bereits aus der Addition von Zahlen kennen. Diese sind:

  1.   ist abgeschlossen bezüglich  . Die Summe zweier Vektoren ergibt also wieder einen Vektor:
     
  2. Die Vektoraddition ist kommutativ (  erfüllt das Kommutativgesetz):
     
  3. Die Vektoraddition ist assoziativ (  erfüllt das Assoziativgesetz):
     
  4. Die Vektoraddition besitzt ein neutrales Element. Dies bedeutet, dass es mindestens einen Vektor   gibt, für den gilt:
     

    Später werden wir zeigen, dass aus den anderen Axiomen bereits folgt, dass jeder Vektorraum genau ein neutrales Element besitzt. Dieses neutrale Element   wird Nullvektor genannt. Für den Nullvektor aus dem Vektorraum   schreiben wir „ “. Wenn klar ist, aus welchem Vektorraum der Nullvektor stammt, dann notieren wir „ “.

  5. Für jeden Vektor   existiert mindestens ein inverses Element  . Für den zu   inversen Vektor   gilt:
     

    Das heißt, dass die Addition jedes Vektors mit seinem Inversen stets das neutrale Element   bzw. den Nullvektor ergibt. Wir werden später zeigen, dass der inverse Vektor   eindeutig ist. Zu jedem Vektor   gibt es also genau einen zu ihm inversen Vektor  . Diesen Vektor nennen wir Inverses oder Negatives zu   und schreiben dafür meist „ “.

Eine Menge mit einer Verknüpfung, die die obigen fünf Axiome erfüllt, nennt man auch eine abelsche Gruppe[2].

Die skalare Multiplikation Bearbeiten

Wir haben bereits definiert, welche Eigenschaften die Addition von Vektoren erfüllen muss. Es fehlt noch die Skalierung von Vektoren. Damit wir die skalare Multiplikation von der normalen Zahlenmultiplikation unterscheiden können, verwenden wir dafür zunächst das Symbol „ “. In Lehrbüchern wird das Symbol „ “ anstelle von „ “ benutzt oder der Punkt wird sogar ganz weggelassen. Welche Operation dann gemeint ist, ergibt sich aus dem Kontext. Wir werden diese Notation später ebenfalls verwenden. Die skalare Multiplikation bildet eine Zahl, auch Skalierungsfaktor oder Skalar genannt, und einen Vektor auf einen anderen Vektor ab.

 

Die Schreibweise   bedeutet, dass   um   gestreckt (oder gestaucht) wird. Es liegt nahe, den Skalar durch   zu definieren. Wir können dies aber noch verallgemeinern. Alle Mengen, in denen man ähnlich zu den reellen Zahlen addieren und multiplizieren kann, kommen als Grundmenge für Skalierungsfaktoren infrage. Eine solche Menge wird in der Mathematik Körper genannt.

Die Eigenschaften der skalaren Multiplikation „ “ sind denen der Multiplikation von Zahlen ähnlich. Wir wollen die skalare Multiplikation nun formal durch Axiome definieren. Wie bei der Addition ist eine nicht leere Menge   der Ausgangspunkt der Definition. Außerdem benötigen wir einen Körper  . Die skalare Multiplikation ist eine äußere Verknüpfung  , die folgende Eigenschaften erfüllt:

  1. Skalares Distributivgesetz:
     
  2. Vektorielles Distributivgesetz:
     
  3. Assoziativgesetz für Skalare:
     
  4. Sei   das neutrale Element der Multiplikation im Körper  , dann ist   auch das neutrale Element der skalaren Multiplikation:
     

Um Vektoren skalieren zu können, benötigen wir für die Definition eines Vektorraums neben diesem auch einen Körper  , aus dem die Skalierungsfaktoren stammen. Deswegen werden Vektorräume   immer über einem Körper   definiert. Wir sagen „  ist ein Vektorraum über  “ oder kurz „  ist ein  -Vektorraum“, um auszudrücken, dass die Skalierungsfaktoren für   aus   stammen.

Definition des Vektorraums Bearbeiten

Unsere Überlegungen können wir komprimiert aufschreiben, um die formale Definition eines Vektorraums zu erhalten:

Definition (Vektorraum)

Sei   eine nichtleere Menge mit einer inneren Verknüpfung   (der Vektoraddition) und einer äußeren Verknüpfung   (der skalaren Multiplikation). Die Menge   mit diesen beiden Verknüpfungen heißt Vektorraum über dem Körper   bzw.  -Vektorraum, wenn folgende Axiome gelten:

  •   bildet zusammen mit der Verknüpfung   eine abelsche Gruppe. Das heißt, folgende Axiome sind erfüllt:
    1. Assoziativgesetz: Für alle   gilt:  
    2. Kommutativgesetz: Für alle   gilt:  
    3. Existenz eines neutralen Elements: Es gibt ein Element  , so dass für alle   gilt:  . Dieser Vektor   heißt neutrales Element der Addition oder Nullvektor.
    4. Existenz eines inversen Elements: Zu jedem   gibt es ein Element  , so dass gilt:  .   heißt inverses Element zu  . Statt   schreiben wir auch  .
  • Zusätzlich müssen folgende Axiome der skalaren Multiplikation   erfüllt sein:
    1. Skalares Distributivgesetz: Für alle   und alle   gilt:  
    2. Vektorielles Distributivgesetz: Für alle   und alle   gilt:  
    3. Assoziativgesetz für Skalare: Für alle   und alle   gilt:  
    4. Neutrales Element der skalaren Multiplikation: Für alle   und für   (das neutrale Element der Multiplikation in  ) gilt:  . 1 heißt neutrales Element der skalaren Multiplikation.

Anstelle von „ “ schreibt man oft auch „ “. Die letzte Schreibweise macht deutlich, dass zur Menge   die Verknüpfungen   und   gehören.

Hinweis

Wir verwenden die Symbole „ “ und „ “, um sie von der Addition „ “ und der Multiplikation „ “ zu unterscheiden. In der Literatur wird diese Unterscheidung häufig nicht getroffen und aus dem Kontext wird deutlich, ob beispielsweise mit „ “ eine Addition von Zahlen oder von Vektoren gemeint ist.