Pusing nyari data buat riset / skripsi / tesis / desertasi?
Oleh: Irwansyah Saputra, S.Kom., M.Kom.
Prolog
Banyak mahasiswa yang pusing mikirin riset karena (katanya) datanya susah dicari. Apalagi minta data perusahaan yang sifatnya sangat privat, susah banget. Mau ambil data publik di UCI Repository dan sejenisnya, takut ditolak karena udah banyak yang pake. Sedih akutu...
Padahal, banyak data yang bisa kita pake loh... Kebanyakan data ini sifatnya ga terstruktur. "susah dong?" Lah kan udah pada belajar statistika deskriptif, pasti bisa dong gimana caranya organize data yang ga terstruktur sehingga bisa siap buat diolah.
Apa sih data itu?
Sebelum bingung nyari data, kalian harus tau dulu apa itu data. Banyak sih pengertian data di internet, tapi gw bakal bahas dengan bahasa yang gampang dicerna sehingga kalian bakal bilang "lah... kalo gini nyari data gampang dong". Garis besar pengertian data itu adalah fakta. Fakta kek gimana? Ya fakta yang biasa kita liat tiap hari. Kalian nyalain kipas, keluarlah angin. Itu data. Contoh lain, lagi santuy di rumah trus ada tukang dagang mukulin mangkok, kalian bisa bedain mana tukang bakso mana tukang somay hanya dengan beda bunyi mangkoknya. Itu juga data, bahkan disini kalimat "kalian bisa bedain" itu udah termasuk informasi. Contoh lebih serius, coba jalan-jalan ke mall jual beli laptop. Mereka itu kan jualan berjejeran kan? satu lantai diisi sama mereka semua, tapi tetep aja ga ngerasa tersaingi oleh temen disebelahnya. Padahal, pasti ada toko yang lebih rame dari pada toko lainnya. Dari sini, kita bisa munculin pertanyaan "kok bisa sih......?". Pertanyaan yang kek gitu bisa ngasah daya kritis kita loh. "kok bisa sih toko ini lebih rame padahal dia posisinya lebih di dalem mall", "kok bisa sih disini lebih rame padahal laptop yang dijual harganya lebih mahal". Itu dua contoh pertanyaan yang bisa jadi modal buat riset. Kita udah dapet 2 kelas / label, yaitu rame dan sepi. Tinggal nyari data penunjangnya (baca: atribut) kenapa bisa rame dan kenapa bisa sepi. "trus harus nanya yang punya konter dong?". Bagusnya sih kek gitu. Tapi kalo ga mau, kita bisa pake data publik dari eksternal, misalnya harga yang ditawarin, tampilan toko dari luar, jarak pintu masuk ke toko dan bandingin dengan toko lainnya, pelayanannya, kecepatan servis, atitude karyawan, repeat order dan lain sebagainya. Itu atributnya.
Dengan data itu, kalian bisa bikin beberapa judul riset. Ga usah gw kasih tau kan? Kalo masih ga tau apa judulnya, baca paragraf di atas itu berulang-ulang. Nanti juga ketemu judul yang gw maksud.
Based on My experience
Gw waktu bikin tesis, datanya dari chat grup whatsapp. cuma bikin metode yg bisa misahin mana kalimat bully dan yang engga. gw ajarin tu komputer pake 3 metode klasifikasi NBC, SVM, k-NN, biar pinter. Eh pas gw cek datanya, ternyata gw yg sering ngebully. astaghfirullah.. tapi btw begitu aja alhamdulillah lulus.
Gw pake data itu karena ambil kuliah kelas karyawan, mager aja harus nyari data melanglang buana ke tiap perusahaan yang more than 80% gw bakal ditolak.
kadang orang mikir terlalu jauh hingga yang deket ga keliatan. semua hal yg di sekitar kita itu adalah data. tinggal gimana kita mau ngobrol sama data itu dan bikin kesepakatan sama dia.
"eh.. lu data suhu ruangan kelas ya? gini nih.. gw mau pake lu buat riset. gw mau bikin ada ga pengaruhnya suhu ruangan lu yang dingin terhadap fokus siswa di kelas?"
dari suhu ruangan doang bisa jadi riset. banyak deh pokoknya yang bisa dijadiin riset dari kegiatan sehari-hari.
Penutup
Ga usah mikir terlalu jauh, ntar sawan.. trus jatoh aja... syahid di tengah jalan. Mending di jalan Allah, ini di jalanin aja dulu, cocoknya gimana ntar. *apa sih