LinkedIn Logo

Einführung in die Webanalyse mit R

Lesezeit: 4 Minuten
SHARE

Inhalte

 

Einführung in die Webanalyse mit der Statistiksoftware R

In Abhängigkeit der Präferenzen des Webanalysten oder gemäß der Sichtweise eines Unternehmens bzw. der Webanalyse Agentur auf die Webanalyse, kann es zum Einsatz der Statistiksoftware R kommen. Diese Software eignet sich vor allem, wenn der Webanalyst Datenmengen statistisch auswerten muss oder Prognosen getroffen werden sollen.

Was ist R? 

R ist eine im Internet kostenlos erhältlich Software bzw. objekt-orientierte Programmiersprache für statistische Berechnungen und Visualisierungen. Entstanden ist die Programmiersprache im Jahre 1992.

Über das Basispaket von R können die wichtigsten statistischen Tests und Berechnungen durchgeführt werden. Jedoch werden durch die große R-Community stetig neue Pakete vorgestellt und zum Download angeboten. Damit entwickelt sich die Software stets weiter. Bspw. kann ein Webanalyst einer Webanalyse Agentur, der mit dem Tracking Tool Google Analytics über R Analysen durchführen möchte das Google Analytics Paket herunterladen. Damit besteht dann die Möglichkeit die Trackingdaten über der Google Analytics API direkt in R zu bearbeiten.

Wo kann R heruntergeladen werden? 

R kann kostenlos auf der Plattform https://www.r-project.org/ heruntergeladen werden. Unter „Download“ befindet sich die Begrifflichkeit „Cran“ diese steht für „Comprehensive R Archive Network“. Hier befinden sich die Pakete sowie die Software selbst.

Google Analytics Paket in R installieren und laden

a) Installieren

Um ein beliebiges Paket, welches nicht in dem Standardpaket von R vorhanden ist zu installieren klicken wir in der oberen Menüleiste auf „Pakete“ und wählen „installierte Pakete“ aus.

In dem sich anschließend öffnenden Fenster, können wir ein CRAN-Mirror auswählen. Dies ist ein Server auf denen die Daten gespeichert sind, diesen kann man beliebig wählen.

Nach der Serverauswahl erscheint ein weiteres Fenster, bei dem alle Pakete nach alphabetischer Reihenfolge angezeigt werden, die zur Installation bereitstehen.

Alternativ wäre es auch möglich über die Eingabe install.packages(„googleAnalyticsR“)  in der R Konsole das gewünschte Paket zu installieren.

 

b) Laden

Ist ein Paket installiert, kann es jederzeit für neue Projekte geladen werden. Dies geschieht über den Reiter „Pakete“ bei der Menüleiste. Anschließend muss auf „Lade Paket“ geklickt werden.

 

Erste Befehle in R

In R werden die Befehle nach dem Eingabezeichen „>“ (auch als „Prompt“ bezeichnet) eingegeben. Hierbei ist wichtig zu erwähnen, dass zwischen Klein- und Großschreibung unterschieden wird.

Wird hinter dem prompt 5+15 eingegeben erscheint 20 als Ergebnis. Weiterhin können logische Abfragen wie 3>2 durchgeführt werden.

Jeweils mit der Bestätigungstaste (Enter) werden die Eingaben ausgeführt.

Erstes Objekt anlegen

Bei der Arbeit mit R ist es notwendig Ergebnisse von Funktionen in einem Objekt zu schreiben. Möchte der Webanalyst bspw. einen Vektor erstellen mit dem Namen „OrganicTraffic“ und diese mit den Sitzungszahlen der letzten fünf Tage füllen, dann kann er folgendes eingeben:

OrganicTraffic <- c(100,120,150,180,200)

Beim Aufruf von „OrganicTraffic“ werden die Werte angezeigt (siehe Abbildung).

Ein Objekt wird also erstellt, indem zunächst ein Objektname eingegeben wird und dann mindestens eine Funktion aufgerufen wird. In diesem Fall wurde die Funktion „c“, welches für „combine“ steht angewendet. Dadurch werden die Werte zusammengefügt.

Möchte der Webanalyst wissen wie hoch der Durchschnittswert der Sitzungen innerhalb dieser ausgewählten fünf Tagen ist, kann er mean(OrganicTraffic) eintippen.

Alternativ hätte der Webanalyst auch ein neues Objekt erstellen können:

Faktoren erstellen

 

In der Statistik und in der Webanalyse gibt es Daten die in keinerlei natürlicher Reihenfolge gesetzt werden können. Bei solch einer Datenmenge handelt es sich um nominalskalierte Daten. In der Webanalyse wären das bspw. Der Besuchertyp (neu- und wiederkehrender Besucher oder die verschiedenen Einstiegskanäle wie Paid, Organic, Display, Direct, etc.)

In R wird ein Objekt bzw. ein Vektor folgendermaßen in einem Faktor konvertiert:

Zunächst wird ein Vektor mit den jeweiligen Einstiegskanälen erstellt. 1 steht hier für „Direct“, 2 für „SEO“ und 3 für „SEA“

Einstiegskanal <- c(1,2,2,1,3,1,3,2,2,2)

Um die Konvertierung durchzuführen, muss nun die Funktion factor(Vektorname) verwendet werden:

In diesem Beispiel beinhaltet der Faktor Einstiegskanal.faktor drei Level bzw. Ausprägungen: 1, 2 und 3.

 

Data Frames

 

Häufig kommen Daten nicht nur in einer Zeile oder einer Spalte vor, sondern dem Analysten werden mehrere Zeilen und Spalten mit unterschiedlichsten Datentypen angezeigt. Ein typischer Google Analytics CSV Export mit mindestens einer Dimension und einer Metrik ist ein Beispiel für einen Data Frame.

Da wir erst zu einem späteren Zeitpunkt R mit Google Analytics verknüpfen werden, erstellen wir unser eigenes Data Frame.

Zunächst legen wir neben den bereits erstellten Vektor „OrganicTraffic“ noch zwei weitere Vektoren an:

Anschließend verbinden wird die Daten in einem Data Frame, indem wir die Funktion data.frame(a,b) verwenden. Damit kann der Vektor a mit dem Vektor b verknüpft werden.

Über den Aufruf dataframe.channel werden unsere drei Online Einstiegskanäle nun angezeigt.

Eine einfachere Möglichkeit, um solch ein Data Frame zu erstellen wäre die Erstellung einer leeren Tabelle:

Mit der Funktion edit(as.data.frame(NULL)) wird eine leere Tabelle erstellt und im Dateneditor aufgerufen. In dieser Tabelle kann per Mausklick eine beliebige Zelle aufgerufen und die Daten manuell eingetippt werden.

 

Hier geht es zum Teil 2 der Webanalyse mit R:

Der IT-WINGS Blog -
Immer auf dem neusten Stand bleiben