Podaci koje želite pohraniti moraju biti očišćeni i razumljivi drugim ih istraživačima koji ih žele koristiti. Pod očišćenim podacima podrazumijevamo ispravljene podatke, očišćene od neispravnih, nepotpunih, nepravilno oblikovanih ili duplih zapisa podataka. Za pomoć oko čišćenja, pogledajte naše Smjernice za čišćenje podataka.
Dodatna dokumentacija trebala bi sadržavati što više materijala kako bi podaci bili razumljivi i prikladni za ponovnu upotrebu. Dodatni materijali koji se arhiviraju uz podatke mogu biti metodološki izvještaji, kodne knjige, upitnici, upute za kodiranje, upute za anketare, baze riječnika, bibliografski zapisi o publikacijama koje se odnose na podatke te poveznice na korištene internet izvore, online alate i ostale izvore informacija.
Smjernice za pripremu podataka
- Koristite dosljedne i suvisle nazive koji će razumljivo reprezentirati sadržaj datoteka. Izbjegavajte razmake i posebne znakove; ako su podaci osjetljivi ili ograničeni, naznačite to u imenu datoteke;
- Uklonite sve izravne identifikatore iz vašeg skupa podataka (imena, adrese, telefonske brojeve i sve druge varijable koje bi omogućile laku identifikaciju pojedinaca);
- Nazovite varijable jasno i logično, ukratko objasnite njihovo značenje i povežite ih s odgovarajućim pitanjima i upitnicima. Objasnite koje su opcije odgovaranja bile dostupne;
- Osigurajte da se varijable ne ponavljaju, izbjegnite suvišnost u izvedenim varijablama;
- Zamijenite vrijednosti koje nedostaju sa izričitim kodom (npr. kod 88- ‘nije poznato’). Vrijednosti koje nedostaju ne bi se trebale pojavljivati kao prazan slučaj ili kao standardno nepoznata vrijednost u statističkom programu koji koristite;
- Provjerite učestalost, ustanovite te ispravite ili obrišite sve nedosljednosti i nenormalnosti u vašim podacima;
Smjernice za pripremu popratne dokumentacije
- Pripremite instrumente (upitnike, upute anketara…) korištene za prikupljanje podataka (koje želite pohraniti) u posebne datoteke, kao i sve materijale unaprijed poslane ispitanicima (npr. pozivna pisma), sve materijale prezentirane ispitanicima za vrijeme intervjuiranja (npr. pokazne kartice (showcards)) i sve upute ili materijale koje su koristiti ispitivači (npr. objašnjenja pitanja, često postavljana pitanja);
- Pripremite odgovarajuću dokumentaciju koja bi trebala sadržavati sljedeće informacije:
- opis projekta, ciljevi,
- dizajn istraživanja,
- ciljana skupina,
- uzorkovanje,
- veličina uzorka,
- jedinica analize,
- način prikupljanja podataka (CATI, CAPI, mail, web, itd.),
- stupanj odaziva,
- vremenski i prostorni obuhvat,
- opis strukture datoteka, veze između datoteka (ako je primjenjivo),
- opis postupaka validacije podataka, provjere i čišćenja te drugih postupake osiguravanja kvalitete podataka i čuvanja povjerljivosti podataka
- upotrebu varijabli utežavanja i izvedenih varijabli nastalih nakon procesa prikupljanja podataka opisanu kodom ili algoritmom korištenim da bi se te varijable stvorile.
Formati podataka
- Tablični podaci: SPSS portable format (.por), SPSS (.sav), Stata (.dta), Excel ili drugi tablični format koji može biti adaptiran u tab- ili sa odvajanjem kolona znakom, R (.txt)
- Tekst: Adobe Portable Document Format (PDF/A, PDF) (.pdf), plain text data, ASCII (.txt)
- Audio: Waveform Audio Format (WAV) (.wav) from Microsoft, Audio Interchange File Format (AIFF) (.aif) from Apple, FLAC (.flac)
- Images: TIFF (.tif) idealno verzija 6 nekompresirano JPEG (.jpeg, .jpg) samo kada je datoteka stvorena u tom formatu, Adobe Portable Document Format (PDF/A, PDF) (.pdf), RAW image format (.raw), Photoshop files (.psd)
- Video: MPEG-4 (.mpg4), motion JPEG 2000 (.mj2)
- Komprimirane datoteke: prihvaćaju se tako dugo dok se mogu otvoriti pomoću otvorenih i besplatno dostupnih softvera, kao što je 7- Zip ili WinZip