Di masa seperti ini hampir seluruh masyarakat sudah menggunakan media social. Mulai dari lapisan masyarakat bawah hingga atas, dari anak-anak hingga dewasa. Perkembangan inilah yang menjadi pendorong dunia akademisi maupun industri mulai memanfaatkan media sosial sebagai sumber data.
Dalam kegiatan yang bertajuk “Big Data Analysis: Mining and Exploration of Twitter Data” (19/04), Ujang Fahmi dari Sagasitas Journal and Research Center membenarkan hal tersebut. Mengacu pada Statista (2017), Ujang mengungkapkan bahwa setidaknya ada 500 juta tweet setiap harinya dikirim oleh pengguna Twitter. Hal ini menunjukkan bahwa media sosial terutama Twitter merupakan big data yang bisa dimanfaatkan baik untuk kebutuhan akademik maupun industri.
Kegiatan yang diselenggarakan oleh Career Development Center (CDC) Fisipol UGM ini diikuti bukan hanya mahasiswa tetapi juga beberapa dosen. Bertempat di Ruang BA 101 Fisipol UGM, Ujang lebih menekankan pada pengenalan aplikasi dan praktik langsung bagaimana mengambil data di media sosial Twitter.
Dalam kesempatan kali ini, Ujang memperkenalkan dan menggunakan R Program dan RStudio yang dapat mempermudah dalam proses pengambilan dan analisis data di Twitter. R Program adalah bahasa pemograman dan lingkungan program yang digunakan untuk komputasi statistik dan pemodelan atau analisis data. Sedangkan, RStudio merupakan program terintegrasi dengan R yang dapat digunakan untuk menulis Rscript.
Terdapat lima langkah awal yang harus diketahui agar program RStudio bisa digunakan dalam proses pengambilan data di media sosial.
- Mengenal lima bagian halaman permukaan asal (default) RStudio
Dalam menjalankan program ini tentu kita harus mengetahui tools yang terdapat dalam aplikasi tersebut. RStudio mempunyai lima default yang wajib diketahui kegunaannya. Pertama, Script berfungsi sebagai halaman kerja. Kedua, Environment digunakan untuk melihat data yang dimasukkan dan akan diolah, serta hasil dari script yang dijalankan. Ketiga, Console digunakan untuk mengeksekusi script secara langsung dan melihat proses script berjalan. Keempat, Files untuk melihat data yang ada dalam folder di mana kita menyimpan script yang ditulis. Kelima, Viewer digunakan untuk melihat hasil visualisasi script.
- Menulis dan Menyimpan sebuah Script
Setelah mengenal tools yang ada di Rstudio, langkah awal adalah menuliskan sebuah script. Untuk membuat halaman script bisa langsung klik menu file (di pojok kanan atas), lalu pilih New File dan pilih jenis file yang akan ditulis. Dalam hal ini Ujang menyarankan untuk memilih jenis RScript. Sedangkan untuk menyimpan sebuah script bisa melalui menu File dan pilih save atau command + s (macbook) / ctrl + s (windows).
- Mengenal Library dan Package
Library dan Package di R berfungsi ini menggunakan kode atau algoritma yang sudah ditulis ulang dengan script untuk R sehingga pengguna R dapat langsung menggunakannya dalam berbagai aktivitas yang dilakukan di lingkungan R. Jika ingin mengambil data di Twitter maka kita harus meng-install package twitteR dengan menggunakan kode: install.packages(“twitteR”) atau library(twitteR). Setelah package twitteR telah ter-install maka kita bisa melakukan data mining dari Twitter dengan API.
- Setting API
Sebelum melakukan pengambilan data di Twitter, kita perlu melakukan pengaturan di halaman aplikasi API Twitter yang telah buat. Langkah pertama, klik bagian Keys and Access Token dimana pada bagian atas akan ditemukan Consumer Key (API Key) dan Consumer Secret (API Secret). Jika di scroll ke bawah akan ada tulisan Your Access Token, klik create atau generate dan akan menemukan Access Token dan Access Token Secret.
- Mining Twitter Data
Kemudian untuk mendapatkan data dengan library twitteR kita bisa menggunakan fungsi searchTwitter() dari library ini. Selain fungsi tersebut juga masih ada beberapa fungsi lain, misalnya untuk mengetahui trending, user timeline, dan lain sebagainya. Contoh kode: raw_jkw <- searchTwitter(“@jokowi”, n=5000, lang=”id”, resultType = “recent”). Dalam kode ini berarti, kita ingin mengambil 5000 data yang men-twit akun @jokowi.