GNU R: Einleitung
Was ist R?
BearbeitenDieses Buch führt in das Programm R ein. R steht dabei für The R Project for Statistical Computing.
- R ist eine Software zur statistischen Datenverarbeitung, sowie deren grafischer Darstellungen (Visualisierung).
- R ist eine Umsetzung der statistischen Programmiersprache S.
- R läuft unter diversen UNIX-, Linux- und Unix-ähnlichen Betriebsystemen, sowie auf Windows und Mac OS X. Ältere R-Versionen sind auch noch für das klassische Mac OS verfügbar. Für viele Betriebssysteme gibt es bereits kompilierte Pakete.
- Die Sprache kann leicht durch neue Funktionen erweitert werden.
- Eine große Anzahl von existierenden Zusatzpaketen ergänzen die R-Funktionalität um Methoden aus Spezial- und Anwendungsbereichen der Statistik.
- R kann mit anderen Programmiersprachen wie GRASS, Perl, Python, C oder Java verbunden werden.
- R kann sowohl interaktiv, also im Einzelbefehlsmodus, als auch als Skriptsprache und im Batch-Modus verwendet werden.
- Der R-Quelltext wird unter der GNU General Public License (GPL) der Free Software Foundation veröffentlicht.
Die Homepage von R lautet http://www.r-project.org |
Zusätzliche Skripte zur Einführung in R können im Internet kostenfrei abgerufen werden (z.B. Handl 2006).
Des Weiteren stehen diverse (meist englischsprachige) Internetseiten (z.B. Das R Wiki) sowie Publikationen
(siehe Literatur) zum Thema R zur Verfügung.
Warum ?
Bearbeiten- Neben gängigen Programmen zur statistischen Auswertung, wie beispielsweise „SPSS“ oder „STATA“, bietet den Vorteil, dass es auf der ganzen Welt kostenlos (unter der freien GNU-Lizenz) zur Verfügung steht.
- kann die meisten gängigen Formate importieren, gewährleistet volle Kontrolle über die Daten und bietet ein verlässliches, quelloffenes Format für erstellte Datensätze.
- Darüber hinaus stellt z.T. mächtigere und mehr Auswertungsverfahren zur Verfügung als andere Programme.
- ist eine Programmierumgebung. Funktionen können bequem den eigenen Bedürfnissen angepasst werden. Komplexe Probleme lassen sich auch dann lösen, wenn die Entwickler diese (noch) nicht implementiert haben.
- wird von der Scientific Community kontinuierlich weiterentwickelt und erweitert. Neue statistische Verfahren werden in der Regel auch in integriert. Ein standardisiertes Pakete-System erleichtert die Nachinstallation ebenso wie die Veröffentlichung eigener Pakete.
- erstellt professionelle Graphiken in einer Vielzahl an Formaten.
- ist auch eine funktionierende Benutzer- und Entwickler-Gemeinschaft, die für Fragen offen ist und so den Einstieg erleichtert.
- kann systemübergreifend auf verschiedenen Plattformen genutzt werden.
- verfügt über äußerst flexible Schnittstellen der Daten-Ein- und -Ausgabe und kann mit verschiedenen anderen Applikationen zusammenarbeiten.
- kann in einem Batch-Mode zur automatisierten Auswertung und Dokumenterstellung verwendet werden und lässt sich auch in Webserver / dynamische Websites integrieren.
- ist trotz graphischer Benutzeroberflächen textbasiert. Im Zentrum steht nicht Design, sondern Funktion.
Was spricht gegen ?
Bearbeiten- Für den Anfänger ist die Funktionsweise und Bedienung von R zweifellos gewöhnungsbedürftig.
- Bei der Programmierung in R fällt im Vergleich mit modernen Sprachen auf, dass Einiges in unerwarteter Weise funktioniert.
- Bestimmte Grundverfahren (z. B. Modus/Modalwert) sind zur Zeit nur umständlich oder gar nicht implementiert.
Literatur
BearbeitenMit folgender Literatur haben wir einen guten Einstieg in R gefunden:
- Günter Faes (2007): "Einführung in R, Ein Kochbuch zur statistischen Datenanalyse mit R", BoD, ISBN 9783833491849
- Dubravko Dolic (2003): „Statistik mit R. Einführung für Wirtschafts- und Sozialwissenschaftler“, Oldenbourg, ISBN 3486275372
InhaltsverzeichnisBearbeiten
|