PERBANDINGAN UJI TUKEY (UJI BEDA NYATA JUJUR (BNJ)) DENGAN UJI FISHER (UJI BEDA NYATA TERKECIL (BNT)) DALAM UJI LANJUT DATA RANCANGAN PERCOBAAN

PERBANDINGAN UJI TUKEY (UJI BEDA NYATA JUJUR (BNJ)) DENGAN UJI FISHER (UJI BEDA NYATA TERKECIL (BNT)) DALAM UJI LANJUT DATA RANCANGAN PERCOBAAN

Oleh : Bonifasius MH. Nainggolan
Dosen STEIN, Jakarta


Abstract
The aim of this research is to find out the difference between of Tukey test (BNJ) and Ficher Test (BNT) of Design Experiment. BNJ Test is Based on the probability of missing experiment (if we do the same experiment). BNT test is based on the comparison of the number experiment in the case. BNJ test is more conservative than test BND because it tends to declare that there are no difference even through there are the further experiment by Tukey methode is better then Ficher test specially if used  for  simple compare.

Keywords: Tukey, Fisher, Design Experiments





PENDAHULUAN
1. Latar Belakang
Sesuai dengan asumsi-asumsi tertentu rataan contoh adalah penduga terbaik bagi nilai tengah populasi (), meskipun tidak ada jaminan bahwa kedua nilai tersebut akan persis sama. Bahkan kita tidak memiliki petunjuk berapa besar kemungkinan bahwa rataan yang diperoleh dari contoh tersebut akan sama nilainya dengan .
Hipotesis nol pada analisis ragam adalah kesamaan rata-rata atau efek dari beberapa kelompok. Jika uji F menolak hipotesis ini akan menceritakan kepada kita bahwa rata-rata semua kelompok tidak sama, untuk itu tahapan selanjutnya adalah kita harus pergi ke tahap simultan, dan berikutnya pada analisis data untuk memastikan rata-rata mana yang berbeda dan dan menulisnya dalam kesimpulan yang beralasan mengenai rata-rata tersebut. Hasil percobaan biasanya diringkas menjadi deretan rataan masing-masing perlakukan yang disajikan bersama penduga ukuran ketidakpastiannya.
                Uji F untuk individual kontras digambarkan jika kontras telah ada di dalam pikiran pembuat percobaan sebelum percobaan dilakukan. Jika beberapa uji dibawa keluar pada beberapa tingkat signifikan, keseluruhan tingkat signifikan untuk semua uji atau semuanya melindungi pernyataan yang salah mengenai rata-rata merupakan persoalan sulit. Teknik khusus  yang disebut prosedur perbandingan   ganda dapat dikembangkan untuk tujuan ini.

2. Tujuan
Tujuan dari penulisan makalah ini adalah untuk mengetahui bagaimana perbandingan uji lanjut metode Tukey dengan metode Fisher untuk data rancangan percobaan.

TINJAUAN PUSTAKA
1. Tingkat Kesalahan
Untuk mendukung prosedur statistik inference simultan untuk semua eksperiment, jelas diinginkan bahwa pengguna ingin melindungi diri dari kesalahan pengambilan kesimpulan. Frekuensi dari kesimpulan yang salah ketika prosedur ini diadopsi perlu konsentrasi lebih besar. Saat hanya satu kesimpulan dicoba yaitu, tingkat kesalahan  “kesalahan jenis pertama’ atau komplemen dari koefisien kepercayaan dari suatu interval kepercayaan, atau peluang menolak hipotesis nol padahal hipotesis nol itu benar. Tetapi pada keadaan sederhana, jarang terjadi pada banyak kesimpulan yang dicoba pada tiap percobaan, konsep tingkat kesalahan sangat kompleks.
Comparisonwise tingkat kesalahan jenis I didefenisikan sebagai rasio dari banyaknya jumlah pembandingan yang salah yang dinyatakan signifikan ke keseluruhan jumlah yang tidak signifikan dari perbandingan yang diuji.
 Tingkat kesalahan tipe I dari dari experimentwise didefenisikan sebagai rasio dari banyaknya jumlah dari percobaan dengan satu atau lebih perbandingan yang salah yang dinyatakan signifikan ke seluruh jumlah dari percobaan dengan paling sedikit dua rata-rata sama. Di sini tidak ada perbedaan dibuat antara menolak kesalahan satu pembandingan dengan menolak kesalahanan dengan 15 perbandingan pada percobaan yang sama.
Jika ada k rataan, (kemudian ada k-1 kontras dengan BLUES orthogonal) dan jika  diketahui, kemudian ada k-1 uji yang semuanya saling bebas, tingkat kesalahan  dari cara percobaan E dan tingkat kesalahan dari cara pembandingan  akan dihubungkan dengan formula:
                                                           rumus (1)
Tingkat kesalahan digunakan pada suatu pilihan yang subjektif. Suatu kesalahan dari experimentwise konservatif. Suatu tingkat kesalahan pembandingan digunakan jika suatu kesimpulan yang salah tidak memberikan pengaruh kepada kesimpulan sisa dari percobaan yang sama.


2. Metode LSD Fisher’s

Jika seluruh uji F dari rataan semua kelompok signifikan, maka hanya Metode Fisher Least Signifikance Difference (LSD) yang dapat digunakan. Jika adalah rataan dari  pengamatan dari i kelompok dan adalah rata-rata dari pengamatan dari u kelompok dan adalah Jumlah Kuadrat Error (JKE)  dibagi dengan derajat kebebasannya, maka LSD didefenisikan untuk 2 rataan adalah:
        rumus (2)
di mana didefenisikan dengan
     rumus (3)
Dengan t adalah distribusi t Student,s dengan derajat kebebasan f . Ini memberikan arti bahwa :
           rumus (4).
Interval kepercayaan  untuk atau .
maka .
LSD untuk semua pasangan dari rataan akan sama jika  sama, sehingga akan menjadi
                                         rumus (5)
di mana n=n1=…=nk.

Pada Fisher yang tidak dilindungi metode LSD, semua uji F tidak dibawa keluar. Perbandingan tingkat kesalahan untuk setiap individu adalah , dimana m adalah total banyaknya perbandingan dari satu cara yang dilakukan. Tingkat kesalahan cara percobaan, paling besar .  Uji banding Fisher ini disebut juga uji Beda Nyata Terkecil (BNT) yang tak lain adalah pembandingan dengan statistik t.

3. Metode Tukey
Misalkan x1,…,xk adalah  dan  saling bebas dan menyebar dengan derajat kebebasan f , selanjutnya jika statistik q dirumuskan sebagai berikut:
                                rumus (6)
Yang disebut dengan kisaran baku (studentized range). Kita defenisikan, nilai dengan probabilitas
                                rumus (7)
Tukey semula mengusulkan suatu metode yang mana diketahui sebagai metode HSD (Honestly Significant Difference methode) dan metode ini lebih dikenal dengan uji Beda Nyata Jujur (BNJ). Kita membutuhkan ni =n untuk metode ini untuk dapat menetapkan rataan yi . Dua rataan yi dan yu dilaporkan berbeda (artinya ) jika
                  rumus (8).
Tingkat kesalahan dari metode ini adalah experimentwise. Untuk itu  yang direkomendasikan  0.1. Jika perbedaan              rumus (9)
maka
 rumus (9)
Karena itu, interval kepercayaan simultan untuk  adalah
                              rumus (10)
dengan koefisien kepercayaan simultan 1-.

Jika terdiri dari kontras sederhana, satu tertarik ke dalam kontras umum seperti , di mana =0, akan diganti dengan
                      rumus (11)
Jika nilai ni tidak sama, maka n diganti dengan nH, dimana  atau diganti dengan                              rumus (12)
5. Metode uji Range Berganda Newman-Keul’s
Selanjutnya akan didiskusikan metode Newman-Keul’s. Newman (1939) sebagai orang yang pertama sekali menurunkan metode ini.  Diasumsikan seluruh ni sama, k rata-rata diurutkan dari yang terkecil. Rank dari yi dari urutan ini adalah Yi dan Yu adalah Yu >Yi. Perbedaan  signifikan, ketika  , di mana p=Yu+Yi+1                rumus(12)
Pada metode Tukey (ukuran perbandingan), HSD sama untuk semua perbandingan. Di sini variable-variabel sebagai p merupakan suatu nilai dari 2 sampai k. Selain daripada ini merugikan, hal-hal yang merugikan lainnya adalah ketidakmampuan untuk memperoleh interval dugaan dan  suatu tingkat kesalahan yang membingungkan. Itu bukan cara percobaan maupun cara perbandingan.
4. Metode Multiple Range
Dalam metode ini, nilai HSD pada metode Tukey diganti dengan  dimana p=Yu+Yi+1            rumus (13)
Sehingga menjadi:
            rumus (14)


5. Metode Scheffe,s
Untuk hipotesis general linier diketahui  pada model general linier , interval kepercayaan untuk dan semua kombinasi liniernya dapat diturunkan sebagai berikut:
          rumus (15)
Di mana m adalah rank dari dan f=derajat kebebasan dari Jumlah Kuadrat Error. Pada Analisis ragam, saat perbandingan dibuat sepanjang efek dari k kelompok  akan diganti dengan , di mana C adalah kontras dari matriks dengan rank k-1, dan C adalah suatu matriks di mana setiap baris C adalah orthogonal terhadap Ekl; adalah vektor dari efek k kelompok. Selanjutnya m akan diganti dengan k-1 dan interval kepercayaan Scheffe untuk kontras untuk jenis akan diberikan oleh:
                       rumus (16),
dimana
Menggunakan metode ini, dapat menemukan interval kepercayaan untuk suatu kontras (sederhana atau umum). Jika interval untuk n perbedaan sederhana tidak mencakup nilai=0. Metode Scheffe tidak mensyaratkan ni sama. Untuk kontras umum, metode Scheffe lebih baik tetapi untuk perbandingan sederhana, metode Tukey lebih baik.
6. Uji Range Berganda Duncan
Dasar pemikiran uji Duncan adalah bahwa jika uji saling bebas p-1 ditunjukkan pada suatu tingkat signifikan, keseluruhan tingkat signifikan adalah                           rumus(17)
Di mana  adalah peluang paling sedikit satu dari p-1 test signifikan. Dunkan menganjurkan menyatakan signifikan jika               rumus(18)
di mana  p=Yu+Yi+1, setelah menyusun dalam suatu urutan dari yang terkecil ke yang terbesar, dan .  Ini memiliki kesamaan dengan Metode Newman-Keuls, dimana ukuran Wp berbeda untuk perbandingan-perbandingan berbeda. Ukuran Rp pada symbol ini tidak hanya variable tetapi selalu memiliki nilai yang berbeda dari tingkat signifikan dan memiliki nilai non standar (tidak seperti 0.05, 0.01 dan umumnya) di mana mereka ditetapkan dari .  Kekurangan ini tidak menyusahkan sebab Dunkan memiliki untuk dan berbagai p dan f.  
                Metode Duncan pertama sekali diterapkan ke rataan yang  yang ekstrim di dalam keseluruhan himpunan. Jika dua rataan ditemukan tidak signifikan dengan metode ini, tidak ada uji lanjutan dilakukan untuk kedua rataan tersebut. Interval kepercayaan tidak dapat ditemukan pada metode ini, untuk ukuran sample ni yang tidak sama, menggunakan rataan harmonis disarankan.
7.  Bonferroni t Statistik
Metode ini berdasarkan kepada ketidaksamaan Bonferroni, di mana memberitahukan bahwa jika Ai,…,Ak kejadian, tidak perlu saling bebas dan jikan P(Ai) peluang dari Ai,
                          rumus(19)
 Dimana adalah gabungan dan adalah irisan.
Misalkan , i=1,…,k dan misalkan (i=1,…,k) adalah penduga dari  yang mengacu kepada dengan derajat kebebasan fi ( dengan derajat kebebasan fi. Zi dapat tidak bebas dan tidak bebas, tetapi zi dan  saling bebas, jika                         rumus(20)
Dan sebaran Ti adalah student dengan derajat kebebasan fi, misalkan didefenisikan dengan menggunakan
Prob rumus(21)
Jjika Ai mewakili kejadian dengan interval mengandung , ada , maka,
                                rumus(22)
Terdiri dari , kita dapat memilih  yang berbeda u ntuk setiap Ai, di mana semuanya ditambahkan ke dan akan selalu diperoleh 1-.
                Sekarang dapat menggunakan hasil ini di dalam analisis ragam. Sebagai contoh, jika kita tertarik di dalam statistic inferensi simultan dengan m kontras,  ,                           rumus(23)
diperoleh
                         rumus (24)
Dengan                                                                                                     
 
dan        rumus(25)
Dengan menerapkan 1-, diperoleh
                                                                  rumus(26)
                Yang sama dengan interval kepercayaan simultan untuk kontraks dengan koefisien kepercayaan lebih besar atau sama dengan 1-., di mana f adalah derajat kebebasan dari jumlah kuadrat error. Duncan telah memberikan tabel untuk untuk nilai f dan k yang bervariasi.
PEMBAHASAN
Perbandingan Uji Tukey dengan Uji Fisher (Uji Beda Nyata Jujur (BNJ) dengan Uji Beda Nyata Terkecil (BNT)
            Kesamaan nilai tengah dua populasi atau perlakuan umumnya dapat diuji dengan statistic t, sedangkan untuk pembandingan lebih dari dua perlakukan dilakukan dengan statistic F melalui Analisis ragam. Jika hasil uji F menolak H0 bahwa semua nilai tengah perlakuan sama, maka berarti paling tidak ada sepasang perlakuan yang berbeda pengaruhnya dan sangat  logis bila peneliti ingin mengetahui perlakukan mana yang berbeda nyata secara statistik. Hasil percobaan biasanya diringkas menjadi deretan rataan masing-masing perlakuan yang disajikan bersama penduga  ukuran ketidakpastiannya. Ukuran ini bisa berupa simpangan baku atau berupa selang kepercayaan. Untuk tujuan pembandingan, salah satu metode sederhana yang digunakan adalah Uji Banding Tukey  yang disebut juga Beda Nyata Jujur (BNJ). Uji ini didasarkan pada perbedaan terbesar diantara pasangan ilai tengah perlakukan , seandainya peubah yang diamati adalah peubah normal dan saling bebas sesamanya. Uji beda nyata jujur mensyaratkan bahwa semua perlakuan memiliki ulangan yang sama, uji ini juga didasarkan pada asumsi bahwa ragam masing-masing perlakuan relative seragam. Bila semua perlakuan memiliki ulangan yang sama uji ini dapat digunakan untuk membandingkan pengaruh perlakuan secara serentak. Bentuknya yang berupa satu nilai patokan pembanding menjadikan uji ini cukup popular.

Contoh Kasus
Seorang peneliti ingin membandingkan keefektifan empat jenis pencahayaan lampu dalam ruangan belajar. Responnya adalah cahaya yang jatuh di permukaan meja (diukur dalam satuan cahaya lilin) dengan 5 ulangan (Aunuddin. 2005), data percobaan disajikan dalam tabel berikut :

Tabel 1: Data hasil percobaan pencahaan lampu
Ulangan
Tipe Pencahayaan
A
B
C
D
1
2
3
4
5
31
38
38
33
31
31
34
27
27
29
34
35
39
35
30
37
34
27
32
26
Rataan
34.2
29.6
34.6
31.2
Std
3.564
2.966
3.209
4.658
Sumber: Aunudin (2005)
Ragam gabungan dari tabel di atas dapat diduga dengan
Berarti :
Perbedaan antar perlakuan untuk percobaan di atas adalah sebanyak enam pasangan perlakuan, yaitu:
A-B=34.2-29.6=4.6                                                 A-C=34.2-34.6=-0.4                             
A-D=34.2-31.2=3.0                                                 B-C=29.6-34.6= -5.0
B-D=-1.6                                                                   C-D=34.6-31.2=3.4                              
Oleh karena nA=nB=…=nD, dan derajat bebas S(ni-1)=k(n-1). Dengan uji BNJ (Metode Tukey) diperoleh atau  
BNJ= (dalam hal ini , terdiri dari 4 perlakuan dengan derajat bebas =4(5-1)=16, diperoleh q table =4.046 ) yang menunjukkan tidak terdapat perbedaan nyata antar perlakuan karena jarak yang terbesar dari antara perlakuan B dan C hanya sebesar 5.0 yang lebih kecil dari patokan BNJ.
Jika kita dibandingkan dengan Uji Banding Fisher (Beda Nyata Terkecil (BNT)), dalam hal ini uji BNT adalah pembandingan dengan statistic t, di mana  jika
Maka nilai BNT pada taraf nyata  adalah
BNT=(ttabel dengan a=0.025, dan derajat bebas=16 adalah 2.120).
Sehingga berdasarkan patokan pembeda ini, perlakuan yang dinyatakan berbeda nyata karena nilai mutlak selisihnya lebih besar dari 4.90 adalah perlakuan B dengan C.
                Kelemahan dari tata cara pembandingan ini ialah tidak danya sifat menghantar, sebagai contoh jika menggunakan BNT dapat dilihat antara B dan D tidak nyata perbedaannya demikian pula dengan D dan C, akan tetapi tidak berarti tidak terdapat perbedaan yang nyata antara B dan C.  Untuk mengatasi persoalan ini disarankan memperhatikan dengan seksama perlakuan mana saja yang dingin dibandingkan (pembandingan terencana). Hal lain yang dapat mengganggu adalah hasil uji BNJ dan BNT dapat memberikan kesimpulan yang berbeda karena ada perbedaan tafsiran tentang arti dari  (resiko jenis I ) yang digunakan.
                Peluang salah jenis I atau  pada uji BNT didasarkan pda banyaknya pasangan perlakuan yang dibandingkan dalam satu percobaan, sedangkan dalam uji BNJ didasarkan pada peluang untuk melakukan kekeliruan dalam sederetan percobaan (seandainya dilakukan sejumlah percobaan serupa). Untuk pembandingan dua perlakuan  =P(menyatakan , padahal keduanya sama) sedangkan untuk 3 perlakuan, ada 3 pasangan perlakukan yaitu:
Untuk 4 perlakuan terdapat 6 pasangan, sehingga untuk k perlakuan tedapat k*=k(k-1)/2 kemungkinan pasangan, sehingga semakin banyak perlakuan yg dibandingkan akan semakin tinggi pula kemungkinan melakukan kekeliruan yaitu: menyatakan pasangan  tersebut berbeda nyata padahal sebenarnya keduanya identik.
                Pada uji banding berdasarkan pasangan perlakuan, resiko sebesar 5% (taraf nyata 5%) menyatakan bahwa setiap pasangan perlakuan yang sebenarnya tak berbeda memiliki peluang 5% untuk dinyatakan berbeda nyata. Sedangkan dalam uji banding dengan resiko berdasarkan percobaan berarti jika seseorang melakukan percobaan serupa sebanyak N kali dan dalam M kali diantaranya terdapat peling sedikit dua perlakuan yang sama pengaruhnya, maka kira-kira 5% dari M percobaan tersebut paling sedikit sepasang perlakuan yang sama pengaruhnya akan dinyatakan secara statistic.
                Hubungan antara besarnya resiko jenis I menurut pasangan perlakuan (misalkan dengan resiko berdasarkan yang dilambangkan dengan  adalah:
 dan
Untuk perbandingan antar buah perlakuan yang bersifat orthogonal.
                Jika ditetapkan =0.05 pada uji BNT untuk pembandingan 10 perlakuan, maka akan diperoleh  yang berartio bahwa peluang yang menyatakan paling sedikit ada sepasang perlakuan yang berbeda sebesar 0.37 meskipun Hipotesis nol benar. Angka ini adalah resiko yang sebenarnya yang akan dihadapi meskipun telah ditetapkan resiko tersebut berdasarkan percobaan. Untuk uji BNJ, maka resiko sebesar  untuk pembandingan 10 perlakuan (dalam pembandingan orthogonal ada 9 buah pasangan) akan menghasilkan resiko untuk setiap pasangan pembandingan sebesar 0.057.
                Kelemahan uji banding berdasarkan pasangan perlakuan adalah dalam besar resiko jenis I yang sebenarnya, untuk pembandingan 2 perlakuan maka nilai , tetapi semakin banyak perlakuan yang dibandingkan akan semakin besar dari resiko total pengujian tersebut. Sedangkan dalam BNJ pemilihan resiko sebesar  tertentu menghasilkan resiko perpasang perlakuan menjadi relative kecil. Hal ini menyebabkan uji BNJ dinilai konservatif karena lebih cenderung menyatakan tidak ada perbedaan meskipun sebenarnya ada perbedaan.
                Kelemahan ini dapat diatasi dengan memilih nilai yang lebih kecil untuk uji BNT. Dengan demikian kalu kita melakukan m permbandingan maka resikonya menjadi:

 dan
Dengan demikian akan diperoleh resiko total sebesar . Kalau pembandingan dilakukan bagi semua kemungkinanpasangan maka m=k(k-1)/2
Jadi bila m=5 maka resiko total yang dipilih =0.05 maka nilai t dibaca pada taraf  =0.01 atau 0.005.
                Pendekatan ini merupakan prosedur Bonferroni, dengan cara ini peneliti tidak perlu memeriksa apakah hasil uji F dalam tabel analisis ragam nyata atau tidak. Untuk memperkecil resiko , dalam uji BNJ disarankan agar mempertinggi resiko totalnya menjadi sebesarr 10-15% sewaktu membaca nilai kritis q nya.
                Tidak adanya aturan  yang pasti dalam memilih salah satu dari kedua pendekatan yang ada membuat si pengguna harus hati-hati dan mengerti betul akan arti dari resiko pegujian di atas. Resiko jenis I sama kecuali dalam pembandingan dua perlakuan saja. Kesulitan lain adalah adanya asumsi ulangan yang sama dan kehomogenan ragam perlakuan. Dalam uji BNT kesamaan ulangan tidak terlalu menjadi persoalan. Sedangkan bagi BNJ jika ulangannya tidak sama maka besar ulangan diperoleh dengan menghitung rataan harmonic berbagai nilai ulangan, sehingga pembandingan 2 perlakuan diperoleh dengan banyak ulangan dan untuk k perlakuakn


KESIMPULAN
Beberapa kesimpulan yang disampaikan dalam tulisan ini adalah:
1.       Uji BNJ didasarkan pada peluang melakukan kekeliruan dalam sederetan percobaan (seandainya dilakukan percobaan serupa), sedangkan pada uji BNT didasarkan pada banyaknya pasangan perlakuan yang dibandingkan dalam satu percobaan.
2.       Kelemahan uji banding berdasarkan pasangan perlakuan adalah dalam besar resiko jenis I yang sebenarnya, untuk pembandingan 2 perlakuan maka nilai , tetapi semakin banyak perlakuan yang dibandingkan akan semakin besar dari resiko total pengujian tersebut.
3.       Uji Range Berganda Duncan memiliki kesamaan dengan Metode Newman-Keuls, dimana ukuran Wp berbeda untuk perbandingan-perbandingan berbeda.
4.       Uji BNJ dinilai konservatif karena lebih cenderung menyatakan tidak ada perbedaan meskipun sebenarnya ada perbedaan.
5.       Untuk kontras umum, metode Scheffe lebih baik tetapi untuk perbandingan sederhana, metode Tukey lebih baik.


DAFTAR PUSTAKA
Anant M. Kshirsagar, A Course in Liner Models, Marcel Dekkeer Inc, New York, 1983

Aunuddin, Statistika: Rancangan dan Analisis Data, IPB Press, 2005

Douglas C. Montgomery, Design and Analysis of Experiments, Fifth Edition, John Wiley & Sons, Inc, New York, 2001

Nalini Ravishanker and Dipak K. Dey, A First Course in Linear Model Theory, Chapman & Hall/CRC, Boca Raton Florida, 2002









Komentar

Postingan populer dari blog ini

PENERAPAN ANALISIS LATEN KLAS UNTUK PENGELOMPOKAN INDIVIDU

PENERAPAN REGRESI LOGISTIK FAKTOR-FAKTOR YANG MEMPENGARUHI LOYALITAS MEREK KONSUMEN PADA RESTORAN AYAM GORENG CEPAT SAJI