donderdag 24 november 2011

Masters of the Dataset

Vorig weekend zijn Sebas en ik romantisch een weekendje weg geweest, naar RĂ¼gen, een eiland in het noorden van Duitsland. Via Groupon hadden we 3 nachten in een strandhotel geboekt, met halfpension en leuke extras. Hoogtepunt van het weekend was een ritje in de Razende Roland, een oude trein die nog op het eiland rijdt. We zijn naar een jachtkasteel in de bossen gereden, om daar de kasteel toren te beklimmen. Er was helaas niets te zien, want het gehele weekend was het eiland gehuld in een dikke mist. Het was best apart, alsof we in een soort capsule waren geplaatst en op een andere planeet waren beland. De planeet van de eeuwige mist en mysterieuze oranje besjes overal. Ondanks de kou hebben we toch gebruik gemaakt van de gratis fietsen van het hotel en lekker rond gefietst op het eiland, met gemiddeld 100 meter zicht. Op zondag zijn we via zonnig Stralsund weer terug naar de bewoonde wereld gegaan, lekker uitgerust en met een lichte kater van de fles sekt die we op de kamer gevonden hadden. Ik heb de foto's van het weekend in een Picasa album geplaatst, mocht je het leuk vinden om een kijkje te nemen >

Ik ben op de uni ondertussen begonnen met het voorbereiden van mijn dataset in SPSS (Statistical Package for Social Sciences). Het is nu de bedoeling dat ik de dataset zo bewerk dat ik straks precies die variabelen tot mijn beschikking heb die ik in mijn analyse wil meenemen. Voorbeeldje: ik neem alleen respondenten mee die al minstens 6 maanden lang een LAT relatie hebben. Echter geeft de dataset alleen informatie over het jaar en de maand waarin de relatie begon en het jaar en de maand waarop het interview is gehouden. Door een complexe formule heb ik nu het jaartal en de maand omgezet naar een totaal aantal maanden dat verlopen is tussen 1900 en het begin van de relatie evenals vanaf 1900 en het moment dat het interview is gehouden. Vervolgens heb ik hiervan het verschil genomen en SPSS opdracht gegeven alle respondenten eruit te gooien waarbij het eindresultaat kleiner is dan 6. Pffff, ik begin er al van de te dromen, al die cijfertjes, en vergeet soms dat er mensen achter zitten. Onze docent stuurde ons deze week een email, met het volgende bemoedigende bericht:


"Dear students,

as I went from project to project yesterday, helping you with the recoding, I saw that you are all facing very similar problems. You are trying to reshape the data in a way that you need it for your particular question, but sometimes the nasty data doesn't seem to cooperate with you. Instead variables don't come out the way you want them to or cases seem to vanish.

However, if you work with such a complex dataset for the first time, this is absolutely normal. You should understand the present stage as a fight, at the end of which you will be masters of the dataset and it will do what you want. Until then, when you are puzzled, always go back to where the trouble began, and try to find the error. In the end you will succeed."

Haha ik voel me net Luke Skywalker die advies krijgt van Yoda. Wie had gedacht dat statistiek zo diep kon zijn?



Geen opmerkingen:

Een reactie posten