Archive | seputar IT RSS feed for this section

Metode Sampling pada Data Mining

2 Oct

Pada post kali ini saya akan membahas tentang metode sampling yang biasanya digunakan pada data mining. Yang saya tulis di bawah ini adalah salah satu tugas kuliah di semester lalu. Semoga bermanfaat 🙂


 

Dalam beberapa tahun terakhir, data selalu dikumpulkan dan diakumulasikan oleh berbagai organisasi dalam jumlah yang sangat besar. Data tersebut tidak akan bermanfaat jika dibiarkan begitu saja, oleh karena itu dibutuhkan suatu cara untuk mengolah data agar dapat berubah menjadi pengetahuan. Metode untuk mengolah kumpulan data menjadi suatu pengetahuan yang berguna disebut penggalian data atau data mining.

Skalabilitas dari algoritma data mining dibatasi oleh beberapa hal, salah satu batasan utama adalah ukuran data. Dengan meningkatnya ukuran data, maka waktu komputasi dari sebuah algoritma data mining juga akan semakin meningkat. Padahal suatu model yang akurat membutuhkan himpunan data yang besar guna membantu algoritma untuk menemukan struktur kompleks dan membuat estimasi parameter secara akurat. Untuk menangani batasan tersebut maka digunakan suatu metode yang disebut sampling.

Sampling adalah suatu proses untuk memilih perwakilan data (sample) yang dapat menggambarkan keseluruhan data dalam himpunan data dengan menguji suatu bagian data. Sampling dibutuhkan untuk membuat abstraksi dari suatu permasalahan yang kompleks serta untuk memperoleh sub himpunan yang merangkum himpunan data yang lebih besar. Sampling dapat diterima jika jumlah data sample dirasa cukup dan mampu menunjukkan karakteristik dari populasi yang lebih besar. Terdapat beberapa alasan mengapa sampling menjadi metode yang dapat dipilih untuk menangani batasan ukuran data, yaitu:

  1. Membantu untuk bekerja di sekitar konstrain tertentu.
  2. Lebih ekonomis.
  • Sampling dapat mengurangi biaya I/O.
  • Data cleansing sangat menghabiskan waktu komputasi, melakukan data cleansing pada sample akan mengurangi waktu komputasi dibandingkan dengan penggunaan keseluruhan data pada basis data.
  • Time-lag yang lebih pendek karena jumlah observasi yang lebih kecil.
  1. Dapat mewakili keseluruhan data dengan jumlah kehilangan informasi yang lebih kecil.
  2. Dapat mewakili jangkauan data yang lebih luas, sampling mampu beradaptasi dan fleksibel.

Terdapat beberapa metode sampling yang banyak digunakan. Metode tersebut antara lain simple random sampling, stratified sampling, systematic sampling dan cluster sampling.

  1. Simple Random Sampling

Simple Random Sampling adalah dasar dari proses pemilihan dari sampling dan merupakan metode yang paling mudah dipahami. Simple Random Sampling adalah sebuah  prosedur sampling yang memberikan probabilitas yang sama untuk setiap subjek dalam populasi dipilih sebagai sample. Subjek dalam populasi dipilih dengan proses acak, dapat menggunakan random number generator atau tabel bilangan acak.

Langkah utama untuk memilih simple random sample adalah sebagai berikut.

  • Tentukan target populasi.
  • Identifikasi sebuah kerangka sampling yang sudah ada dari target populasi atau buat kerangka yang baru.
  • Evaluasi kerangka sampling, lakukan perubahan jika dibutuhkan.
  • Pilih sebuah bilangan unik untuk setiap subjek pada kerangka.
  • Tentukan ukuran sample.
  • Pilih target sample dari populasi secara acak, dapat menggunakan random number generator atau tabel bilangan acak.

Continue reading

Histogram Equalization – Matlab

25 Sep

Sudah lebih dari satu tahun saya meninggalkan blog ini, sedih juga sih karena saya nggak pernah menyempatkan waktu untuk menulis. Untuk post kali ini saya akan membahas tentang Histogram Equalization. Histogram equalization merupakan salah satu metode untuk melakukan contrast stretching, hal ini dilakukan untuk gambar yang warnanya cukup seragam dan memiliki kontras rendah. Dengan histogram equalization sebuah gambar dapat dilebarkan kontrasnya sehinga gambar menjadi lebih jelas. Teknik ini biasanya dilakukan pada tahan praproses untuk meningkatkan kualitas gambar. Langkah-langkah histogram equalization adalah sebagai berikut:

  1. Baca matrix dari gambar yang ingin diproses.
  2. Ubah gambar dari jpg ke rgb.
  3. Untuk setiap isi matrix, hitung frekuensi pixel dari nilai 1 hingga 256.
  4. Hitung jumlah kumulatif dari pixel dari nilai 1 hingga 256.
  5. Hitung probabilitas dari pixel dari nilai 1 hingga 256 dengan membagi jumlah kumulatif dengan jumlah pixel.
  6. Dari nilai probabilitas lakukan pembulatan.
  7. Ubah nilai matrix dari citra awal dengan nilai pembulatan probabilitas yang sesuai.

Penerapan histogram equalization dapat dilihat pada sorce code Matlab berikut ini. Continue reading

Perbedaan HTML, CSS, dan PHP

9 Dec

Bagi sebagian besar orang yang baru belajar pemrograman web, istilah-istilah seperti HTML, CSS, PHP pasti akan cukup membingungkan. Apalagi kalau ketiga-tiganya digunakan secara bersama-sama dalam membangun sebuah web. Terus, apa sih sebenarnya perbedaan antara HTML, CSS, dan PHP?

HTML adalah singkatan dari HyperText Markup Language , yaitu markup language  yang digunakan untuk membuat suatu halaman web, sehingga HTML dapat menampilkan berbagai informasi baik tulisan maupun gambar pada sebuah web browser.  HTML biasanya menggunakan tag-tag tertentu yang berada dalam tanda kurung <>. Sebagian besar tag pada HTML adalah tag yang berpasangan, contoh : jika kita menggunakan <head> harus ditutup dengan </head>, atau jika kita menggunakan <p> harus ditutup dengan </p>. Tapi ada juga beberapa tag yang tidak berpasangan, contohnya adalah <img>.

Contoh penggunaan HTML :

<!DOCTYPE html>

<html>

<head>

<title>Hello HTML</title>

</head>

<body>

<p>Hello World!</p>

</body>

</html>

CSS adalah singkatan dari Cascading Style Sheet, yaitu suatu aturan yang digunakan untuk mengatur tampilan maupun format dari suatu halaman web, sehingga tampilan web akan menjadi lebih teratur. CSS juga digunakan untuk meningkatkan keindahan suatu web dengan style-style tertentu. Contoh penggunaan CSS adalah untuk mengatur warna font, ukuran font, ketebalan font, mengganti background web, mengubah border dari suatu tabel, perubahan tampilan suatu link saat dipilih, dan lainnya.

PHP adalah singkatan dari Hypertext Preprocessor, yaitu suatu script yang disisipkan pada HTML dan bersifat server-side. Dengan menggunakan PHP, fungsionalitas dari sebuah halaman web dapat diatur dan dikendalikan. Penggunaan PHP pada HTML memerlukan tag tersendiri, yaitu <?php  dan dtutup dengan ?> .PHP biasanya digunakan oleh suatu web untuk berhubungan dengan database, sehingga untuk membuat form yang membutuhkan input dari pengguna harus menggunakan PHP juga. Fungsi perulangan dan percabangan juga dapat diterapkan di PHP.

Jadi intinya, perbedaan diantara ketiganya adalah :

HTML merupakan dasar suatu halaman web untuk menampilkan segala informasi.

CSS adalah penunjang HTML agar tampilan HTML menjadi lebih bagus dan menarik.

Dan PHP digunakan sebagai controller, biasanya sebagai perantara halaman web dengan database.