MEDIAN POLISH

Median polish adalah teknik statistik yang robust untuk menganalisis data cross-clasified untuk mengidentifikasi adanya suatu trends dan outliers dengan menghitung median dari kolom dan baris secara iteraksi dimana hasil akhirnya adalah sebuah model linear dari data tersebut. Hasil dari median polish adalah sebuah tabel residual yang mana data yang outliers seketika itu pula dapat dibedakan dan untuk median keseluruhan relativ tidak sensitiv dengan data-data yang outlier tersebut. Hal inilah yang menjadi alasan kenapa median polish diterima sebagai salah satu metode analisis data.(Rucker)


Metode yang pertama kali diperkenalkan oleh John Tukey ini lebih robust daripada ANOVA untuk menguji kesignifikanan faktor dalam model multi faktor. Median polish hampir sama dengan analisis varians tetapi median digunakan sebagai rata-rata sehingga lebih robust terhadap data-data yang bersifat outlier(“Data Analysis and Regression,”Mosteller and Tukey-Wesley, 1977(chapter 9)).

Ada 3 metode yang digunakan untuk menghitung nilai keberartian faktor yaitu one way, two way dan faktorial. Berikut ini prosedur masing-masing metode:

Metode One Way Median Polish
Metode one way adalah salah satu metode penghitungan median polish yang bertujuan menguji kesignifikanan faktor dari model multi faktor. Banyak faktor yang merupakan variabel independen harus diantara 1 sampai 5. Banyak level tidak sama dengan banyaknya faktor. Kombinasi dari faktor dan level adalah sebuah cell yang merupakan nilai dari kombinasi keduanya. Metode ini dapat dilakukan untuk observasi yang berimbang, model dari metode one way adalah :

Yij = μ +τi + eij (i = 1, 2, . . . , k; j = 1, 2, . . . , n) (1)

dimana :
Yij : respon pada perlakuan baris ke-i dan kolom ke-j
μ : rata-rata keseluruhan
τi : efek tiap blok
eij : random error
dalam salah satu jurnal iteraksi untuk metode one way median polish normalnya dilakukan sebanyak 2-3 kali atau untuk lebih tepatnya dilakukan sampai nilai rasio SUM of residual dari step sebelumnya dan sesudahnya kurang dari nilai cut-off-nya

Metode Two Way Median Polish
Dalam median polish two way elemen y(i,j) merupakan nilai kesesuaian dari tabel metode two way dimana i sebagai indek baris dan j sebagai indeks kolom. Setiap y(i,j) menjelaskan terminology dari sebuah model additive yang terdiri dari tiga komponen yaitu: nilai efek umum(common), Et, yang merupakan ringkasan dari semua level respon secara umum;nilai efek baris, Er(i), merupakan nilai dari perubahan respon dalam baris; nilai efek kolom, Ec(j), merupakan nilai dari perubahan respon dalam kolom. Secara matematis model dari median polish adalah sebagai berikut :

y(i,j) = Et + Er(i) + Ec(j) + R(i,j) (2)

dimana R(i,j) adalah nilai residual dari respon atau nilai yang tidak dijelaskan oleh model. (Rucker).

Metode menghitung adanya pengaruh dari efek baris dan kolom. Tujuan lain dari metode ini adalah melakukan perbandingan mean (fix) untuk kencenderungan (analisis regresi) dan melakukan perbandingan varians. Langkah-langkah dari metode ini adalah mencari median baris kemudian mengurangkan nilai data pada baris ke-i dengan median baris ke-i tersebut, selanjutnya mencari nilai median dari kolom pada kolom ke-j. kemudian mengurangkan tiap nilai di kolom ke-j tersebut dengan nilai mediannya. Iterasi ini diulangi sebanyak 2 kali. Untuk lebih jelasnya dapat dilihat dalam gambar 1 mengenai interaksi metode two way yang didapat dari buku A-B-C of EDA pada halaman 226 bab 8.

Gambar 1. Iteraksi Two Way Median Polish

gambar 1 menunjukkan bagaimana iteraksi pada metode median polish two dimana melakukan 4 kali iteraksi untuk mendapatkan nilai median kolom dan baris serta nilai common.

dalam penulisan ini masih ada yang kurang,mohon diteliti...

BOOTSTRAP

METODE BOOTSTRAP
Bootstrap adalah suatu metode yang dikembangkan pertama kali oleh Brad Efron dengan tujuan menaksir parameter (standard deviasi, Confidence Interval, uji hipotesis, bias) suatu data sampel yang berukuran kecil. Jumlah sampel yang kecil sangat rawan mengakibatkan parameter yang didapat bias, under estimate atau over estimate. Terdapat 2 macam bootstrap yaitu non parametrik dan parametric bootstrap perbedaa terletak pada asumsi, parametric bootstrap memiliki asumsi/informasi mengenai data awal baik berupa distribusinya dan parameternya sedangkan non parametric bootstrap tidak memiliki asumsi tersebut. Jika asumsi distribusi yang di berikan benar maka non parametric bootstrap akan lebih baik dan berlaku sebaliknya bila asumsi salah maka nonparametric bootstrap akan lebih baik. Selanjutnya dalam tulisan ini bootstrap yang digunakan adalah bootstrap nonparametric.
Konsep dari metode ini adalah re-sampling (sampling ulang ) data asli sebanyak N dengan pengembalian yang diulangi sebanyak B kali. Ukuran B adalah terserah pengguna metode karena tidak terdapat ukuran yang pasti. Dari suatu sumber dijelaskan ukuran B=25 sudah cukup bila hanya dalam taraf member informasi, B=50 sudah cukup untuk mengestimasi Standar Deviasi secara kasar, sedangkan untuk mengestimasi Confidence Interval nilai B dianjurkan lebih dari 500 atau B=1000.
Untuk metode lebih lengkap, hub saya…

Metode Quick Sort

Metoda quick sort dikenalkan pertama kali oleh C.A.R. Hoare pada tahun 1962. Metode ini sering juga disebut metoda partition exchange sort .

Dasar strateginya adalah "memecah dan menguasai". Quicksort dimulai dengan menscan daftar yang disortir untuk nilai median. Nilai median ini selanjutnya disebut tumpuan (pivot), kemudian dipindahkan ke satu sisi pada daftar dan butir-butir yang nilainya lebih besar dari tumpuan di pindahkan ke sisi lain. Dalam perkembangannnya nilai yang digunakan sebagai pivot tidak harus nilai median namun bisa sembarang nilai dalam data tersebut.

Misalkan ingin mengurutkan data sebanyak N elemen maka kita memilih salah satu nilai yang akan digunakan sebagai pivot dalam hal ini digunakan nilai paling depan yang diberi kode a . Selanjutnya nilai a akan membagi data menjadi 2 subvektor untuk nilai diatas a dan dibawah a yang diberi symbol masing-masing k untuk lebih dari a dan n-k untuk kurang dari a. Setelah terbagi maka langkah selanjutnya adalah melakukan hal yang sama pada kedua subvektor. Selanjutnya mengulangi langkah-langkah sampai subvektor dari subvektor habis yang biasa disebut rekursi. Secara visual dapat dilihat pada gambar berikut :

Divide and Conquer: Quicksort(n)

Gambar ini menunjukan subvektor data yang lebih dari a dengan symbol k dan kurang dari a dengan n-k.

Secara lebih detailnya metode ini adalah sebagai berikut :

1. Ambil sebuah Pivot (Tumpuan)

2. Bagi menjadi dua subvektor data yang kurang dan lebih dari pivot yang dipilih.

http://upload.wikimedia.org/wikipedia/commons/thumb/8/84/Partition_example.svg/200px-Partition_example.svg.png

Dalam gambar ini nilai 5 digunakan sebagai pivot.

3. Melakukan rekursi ke subvektor-subvektor selanjutnya.

Analisis metode

Dalam beberapa jurnal diasumsikan pivot diambil secara random maka akan terdistribusi exponential dengan running time sebesar O(n log2 n). Metode ini akan meksimal bila nilai pengambilan pivot pertama bagus dalam artian tepat sebagai median yang membagi data subvektor sama besar dan sebaliknya bila pengambilan pivot dalam setiap subvektor adalah data yang tertinggi atau terendah sehingga pembagian subvektor satunya nilai diatas atau dibawah pivot dan subvektor keduanya adalah subvektor yang kosong maka metode ini tidak berjalan maksimal atau biasa disebut worst case dengan running time sebesar O(N2). Hal ini dapat dilihat dalam gambar berikut :

Recursion depth of quicksort: a) best case, b) average case, c) worst case

Gambar (a) menunjukkan kondisi yang terbaik (best case) dimana pemilihan pivot tepat sebagai median vector tersebut, gambar (b) menunjukkan kondisi biasa (average case) dan gambar (c) menunjukkan kondisi terburuk (worst case).

Dalam jurnal Tamassia Goodrich perfoma beberapa metode pengurutan dapat dibandingkan sebagai berikut :

Dalam tabel tersebut metode quick sort sangat bagus untuk data yang banyak karena peluang worst case akan semakin kecil sehingga performanya akan lebih maksimum.

O(n log n) Sorts


Dalam grafik tersebut memperlihatkan perbandingan kecepatan dalam menyelesaikan suatu kasus. Untuk data kecil kecepatan dalam pengurutan tidak berbeda jauh namun untuk data skala tinggi metode quick sort adalah yang paling optimal

peresmian

dengan ini saya resmikan blog saya...
glUDag...

Bismillah, semoga bermanfaat...