PERBANDINGAN UJI TUKEY (UJI BEDA NYATA JUJUR (BNJ)) DENGAN UJI FISHER (UJI BEDA NYATA TERKECIL (BNT)) DALAM UJI LANJUT DATA RANCANGAN PERCOBAAN
PERBANDINGAN UJI TUKEY (UJI BEDA NYATA JUJUR
(BNJ)) DENGAN UJI FISHER (UJI BEDA NYATA TERKECIL
(BNT)) DALAM UJI LANJUT DATA RANCANGAN
PERCOBAAN
Oleh : Bonifasius MH. Nainggolan
Dosen STEIN, Jakarta
Abstract
The aim of this research is to find out the difference
between of Tukey test (BNJ) and Ficher Test (BNT) of Design Experiment. BNJ
Test is Based on the probability of missing experiment (if we do the same
experiment). BNT test is based on the comparison of the number experiment in
the case. BNJ test is more conservative than test BND because it tends to
declare that there are no difference even through there are the further
experiment by Tukey methode is better then Ficher test specially if used for
simple compare.
Keywords:
Tukey, Fisher, Design Experiments
PENDAHULUAN
1. Latar Belakang
Sesuai dengan asumsi-asumsi tertentu rataan contoh
adalah penduga terbaik bagi nilai tengah populasi (
), meskipun tidak ada jaminan bahwa kedua nilai tersebut akan
persis sama. Bahkan kita tidak memiliki petunjuk berapa besar kemungkinan bahwa
rataan yang diperoleh dari contoh tersebut akan sama nilainya dengan
.


Hipotesis nol pada analisis ragam adalah kesamaan
rata-rata atau efek dari beberapa kelompok. Jika uji F menolak hipotesis ini
akan menceritakan kepada kita bahwa rata-rata semua kelompok tidak sama, untuk
itu tahapan selanjutnya adalah kita harus pergi ke tahap simultan, dan
berikutnya pada analisis data untuk memastikan rata-rata mana yang berbeda dan
dan menulisnya dalam kesimpulan yang beralasan mengenai rata-rata tersebut. Hasil
percobaan biasanya diringkas menjadi deretan rataan masing-masing perlakukan
yang disajikan bersama penduga ukuran ketidakpastiannya.
Uji F untuk individual kontras
digambarkan jika kontras telah ada di dalam pikiran pembuat percobaan sebelum
percobaan dilakukan. Jika beberapa uji dibawa keluar pada beberapa tingkat
signifikan, keseluruhan tingkat signifikan untuk semua uji atau semuanya
melindungi pernyataan yang salah mengenai rata-rata merupakan persoalan sulit.
Teknik khusus yang disebut prosedur
perbandingan ganda dapat dikembangkan
untuk tujuan ini.
2. Tujuan
Tujuan dari penulisan makalah ini adalah untuk
mengetahui bagaimana perbandingan uji lanjut metode Tukey dengan metode Fisher untuk data rancangan
percobaan.
TINJAUAN PUSTAKA
1. Tingkat Kesalahan
Untuk mendukung prosedur statistik inference simultan
untuk semua eksperiment, jelas diinginkan bahwa pengguna ingin melindungi diri dari
kesalahan pengambilan kesimpulan. Frekuensi dari kesimpulan yang salah ketika
prosedur ini diadopsi perlu konsentrasi lebih besar. Saat hanya satu kesimpulan
dicoba yaitu, tingkat kesalahan
“kesalahan jenis
pertama’ atau komplemen dari koefisien kepercayaan dari suatu interval
kepercayaan, atau peluang menolak hipotesis nol padahal hipotesis nol itu benar.
Tetapi pada keadaan sederhana, jarang terjadi pada banyak kesimpulan yang dicoba
pada tiap percobaan, konsep tingkat kesalahan sangat kompleks.

Comparisonwise
tingkat kesalahan jenis I
didefenisikan sebagai rasio dari banyaknya jumlah pembandingan yang salah yang dinyatakan
signifikan ke keseluruhan jumlah yang tidak signifikan dari perbandingan yang
diuji.
Tingkat
kesalahan tipe I dari dari experimentwise
didefenisikan sebagai rasio dari banyaknya jumlah dari percobaan dengan
satu atau lebih perbandingan yang salah yang dinyatakan signifikan ke seluruh jumlah
dari percobaan dengan paling sedikit dua rata-rata sama. Di sini tidak ada perbedaan
dibuat antara menolak kesalahan satu pembandingan dengan menolak kesalahanan
dengan 15 perbandingan pada percobaan yang sama.
Jika ada k rataan, (kemudian ada k-1 kontras dengan
BLUES orthogonal) dan jika
diketahui, kemudian
ada k-1 uji yang semuanya saling bebas, tingkat kesalahan dari cara percobaan E dan tingkat kesalahan
dari cara pembandingan
akan dihubungkan
dengan formula:



Tingkat kesalahan digunakan pada
suatu pilihan yang subjektif. Suatu kesalahan dari experimentwise konservatif. Suatu tingkat kesalahan pembandingan
digunakan jika suatu kesimpulan yang salah tidak memberikan pengaruh kepada
kesimpulan sisa dari percobaan yang sama.
2. Metode
LSD Fisher’s
Jika seluruh uji F dari rataan
semua kelompok signifikan, maka hanya Metode Fisher Least Signifikance
Difference (LSD) yang dapat digunakan. Jika
adalah rataan dari
pengamatan dari i kelompok dan
adalah rata-rata dari
pengamatan dari u kelompok dan
adalah Jumlah Kuadrat Error (JKE)
dibagi dengan derajat kebebasannya, maka LSD didefenisikan untuk 2
rataan adalah:






di mana
didefenisikan dengan


Dengan t adalah distribusi t Student,s dengan
derajat kebebasan f . Ini memberikan arti bahwa :

Interval kepercayaan
untuk
atau
.



maka
.

LSD untuk semua pasangan dari rataan akan sama
jika
sama, sehingga akan menjadi


di mana n=
n1=…=nk.

Pada Fisher yang tidak dilindungi
metode LSD, semua uji F tidak dibawa keluar. Perbandingan tingkat kesalahan
untuk setiap individu adalah
, dimana m adalah total banyaknya perbandingan dari satu cara yang
dilakukan. Tingkat kesalahan cara percobaan, paling besar
. Uji banding Fisher ini disebut
juga uji Beda Nyata Terkecil (BNT) yang tak lain adalah pembandingan dengan
statistik t.


3. Metode
Tukey
Misal
kan x1,…,xk adalah
dan
saling bebas dan menyebar
dengan derajat kebebasan f , selanjutnya jika statistik q dirumuskan
sebagai berikut:





Yang disebut dengan kisaran baku (studentized
range). Kita defenisikan, nilai
dengan probabilitas

rumus
(7)
Tukey semula mengusulkan suatu metode yang mana
diketahui sebagai metode HSD (Honestly Significant Difference methode) dan
metode ini lebih dikenal dengan uji Beda Nyata Jujur (BNJ). Kita membutuhkan ni
=n untuk metode ini untuk dapat menetapkan rataan yi . Dua rataan yi
dan yu dilaporkan berbeda (artinya
) jika


Tingkat kesalahan dari metode ini adalah experimentwise. Untuk itu
yang direkomendasikan
0.1. Jika perbedaan
rumus (9)



maka

Karena itu, interval kepercayaan simultan untuk
adalah


dengan koefisien kepercayaan simultan 1-
.

Jika terdiri dari kontras sederhana, satu tertarik
ke dalam kontras umum seperti
, di mana
=0, akan diganti dengan



Jika nilai ni tidak sama, maka n
diganti dengan nH, dimana
atau diganti dengan
rumus (12)


5. Metode
uji Range Berganda Newman-Keul’s
Selanjutnya akan didiskusikan
metode Newman-Keul’s. Newman (1939) sebagai orang yang pertama sekali
menurunkan metode ini. Diasumsikan
seluruh ni sama, k rata-rata
diurutkan dari yang terkecil. Rank dari yi dari urutan ini
adalah Yi dan Yu adalah Yu >Yi.
Perbedaan
signifikan, ketika
, di mana p=Yu+Yi+1 rumus(12)



Pada metode Tukey (ukuran
perbandingan), HSD sama untuk semua perbandingan. Di sini variable-variabel
sebagai p merupakan suatu nilai dari 2 sampai k. Selain daripada ini merugikan,
hal-hal yang merugikan lainnya adalah ketidakmampuan untuk memperoleh interval dugaan
dan suatu tingkat kesalahan yang membingungkan.
Itu bukan cara percobaan maupun cara perbandingan.
4. Metode
Multiple Range
Dalam metode ini, nilai HSD pada
metode Tukey diganti dengan
dimana p=Yu+Yi+1 rumus (13)

Sehingga menjadi:

5. Metode
Scheffe,s
Untuk hipotesis general linier
diketahui 
pada model general linier
, interval kepercayaan untuk
dan semua kombinasi liniernya dapat diturunkan sebagai berikut:





Di mana m adalah rank dari
dan f=derajat kebebasan dari Jumlah Kuadrat Error. Pada Analisis ragam,
saat perbandingan dibuat sepanjang efek dari k kelompok
akan diganti dengan
, di mana C adalah kontras dari matriks dengan rank k-1, dan C adalah suatu
matriks di mana setiap baris C adalah orthogonal terhadap Ekl;
adalah vektor dari efek k kelompok. Selanjutnya m akan diganti dengan k-1
dan interval kepercayaan Scheffe untuk kontras untuk jenis
akan diberikan oleh:






dimana 

Menggunakan metode ini, dapat
menemukan interval kepercayaan untuk suatu kontras (sederhana atau umum). Jika
interval untuk n perbedaan sederhana
tidak mencakup nilai=0. Metode Scheffe tidak mensyaratkan ni
sama. Untuk kontras umum, metode Scheffe lebih baik tetapi untuk perbandingan
sederhana, metode Tukey lebih baik.

6. Uji
Range Berganda Duncan
Dasar pemikiran uji Duncan adalah
bahwa jika uji saling bebas p-1 ditunjukkan pada suatu tingkat signifikan,
keseluruhan tingkat signifikan adalah
rumus(17)

Di mana
adalah peluang paling sedikit satu
dari p-1 test signifikan. Dunkan menganjurkan menyatakan
signifikan jika
rumus(18)



di mana p=Yu+Yi+1,
setelah menyusun
dalam suatu urutan dari yang terkecil ke yang terbesar, dan
. Ini memiliki kesamaan dengan
Metode Newman-Keuls, dimana ukuran Wp berbeda untuk
perbandingan-perbandingan berbeda. Ukuran Rp pada symbol ini tidak
hanya variable tetapi selalu memiliki nilai
yang berbeda dari tingkat signifikan dan memiliki nilai non standar (tidak
seperti 0.05, 0.01 dan umumnya) di mana mereka ditetapkan dari
. Kekurangan ini tidak menyusahkan
sebab Dunkan memiliki
untuk
dan berbagai p dan f.






Metode
Duncan pertama sekali diterapkan ke rataan yang yang ekstrim di dalam keseluruhan himpunan. Jika
dua rataan ditemukan tidak signifikan dengan metode ini, tidak ada uji lanjutan
dilakukan untuk kedua rataan tersebut. Interval kepercayaan tidak dapat
ditemukan pada metode ini, untuk ukuran sample ni yang tidak sama,
menggunakan rataan harmonis disarankan.
7. Bonferroni t Statistik
Metode ini berdasarkan kepada ketidaksamaan
Bonferroni, di mana memberitahukan bahwa jika Ai,…,Ak
kejadian, tidak perlu saling bebas dan jikan P(Ai) peluang dari Ai,

Dimana
adalah gabungan dan
adalah irisan.


Misalkan
, i=1,…,k dan misalkan
(i=1,…,k) adalah penduga dari
yang mengacu kepada
dengan derajat kebebasan fi (
dengan derajat
kebebasan fi. Zi dapat tidak bebas dan
tidak bebas, tetapi zi dan
saling bebas, jika
rumus(20)








Dan
sebaran Ti adalah student dengan derajat kebebasan fi,
misalkan
didefenisikan dengan menggunakan

Prob
rumus(21)

Jjika
Ai mewakili kejadian dengan interval
mengandung
, ada
, maka,







Terdiri
dari
, kita dapat memilih
yang berbeda u ntuk
setiap Ai, di mana semuanya ditambahkan ke
dan akan selalu diperoleh 1-
.




Sekarang dapat menggunakan hasil
ini di dalam analisis ragam. Sebagai contoh, jika kita tertarik di dalam
statistic inferensi simultan dengan m kontras,
, rumus(23)

diperoleh

Dengan

dan
rumus(25)

Dengan menerapkan 1-
, diperoleh


Yang
sama dengan interval kepercayaan simultan untuk kontraks dengan koefisien
kepercayaan lebih besar atau sama dengan 1-
., di mana f adalah derajat kebebasan dari jumlah kuadrat
error. Duncan telah memberikan tabel untuk
untuk nilai f dan k yang bervariasi.


PEMBAHASAN
Perbandingan
Uji Tukey dengan Uji Fisher (Uji Beda Nyata Jujur (BNJ) dengan Uji Beda Nyata Terkecil
(BNT)
Kesamaan
nilai tengah dua populasi atau perlakuan umumnya dapat diuji dengan statistic
t, sedangkan untuk pembandingan lebih dari dua perlakukan dilakukan dengan
statistic F melalui Analisis ragam. Jika hasil uji F menolak H0
bahwa semua nilai tengah perlakuan sama, maka berarti paling tidak ada sepasang
perlakuan yang berbeda pengaruhnya dan sangat logis bila peneliti ingin mengetahui
perlakukan mana yang berbeda nyata secara statistik. Hasil percobaan biasanya
diringkas menjadi deretan rataan masing-masing perlakuan yang disajikan bersama
penduga ukuran ketidakpastiannya. Ukuran
ini bisa berupa simpangan baku atau berupa selang kepercayaan. Untuk tujuan
pembandingan, salah satu metode sederhana yang digunakan adalah Uji Banding
Tukey yang disebut juga Beda Nyata Jujur
(BNJ). Uji ini didasarkan pada perbedaan terbesar diantara pasangan ilai tengah
perlakukan
, seandainya peubah yang diamati adalah peubah normal dan saling
bebas sesamanya. Uji beda nyata jujur mensyaratkan bahwa semua perlakuan
memiliki ulangan yang sama, uji ini juga didasarkan pada asumsi bahwa ragam
masing-masing perlakuan relative seragam. Bila semua perlakuan memiliki ulangan
yang sama uji ini dapat digunakan untuk membandingkan pengaruh perlakuan secara
serentak. Bentuknya yang berupa satu nilai patokan pembanding menjadikan uji
ini cukup popular.

Contoh Kasus
Seorang peneliti ingin membandingkan keefektifan empat
jenis pencahayaan lampu dalam ruangan belajar. Responnya adalah cahaya yang
jatuh di permukaan meja (diukur dalam satuan cahaya lilin) dengan 5 ulangan
(Aunuddin. 2005), data percobaan disajikan dalam tabel berikut :
Tabel 1: Data hasil percobaan pencahaan lampu
Ulangan
|
Tipe Pencahayaan
|
|||
A
|
B
|
C
|
D
|
|
1
2
3
4
5
|
31
38
38
33
31
|
31
34
27
27
29
|
34
35
39
35
30
|
37
34
27
32
26
|
Rataan
|
34.2
|
29.6
|
34.6
|
31.2
|
Std
|
3.564
|
2.966
|
3.209
|
4.658
|
Sumber: Aunudin (2005)
Ragam gabungan dari tabel di atas dapat diduga dengan 

Berarti :

Perbedaan antar perlakuan untuk percobaan di atas
adalah sebanyak enam pasangan perlakuan, yaitu:
A-B=34.2-29.6=4.6 A-C=34.2-34.6=-0.4
A-D=34.2-31.2=3.0 B-C=29.6-34.6=
-5.0
B-D=-1.6 C-D=34.6-31.2=3.4
Oleh karena nA=nB=…=nD,
dan derajat bebas S(ni-1)=k(n-1). Dengan uji BNJ (Metode Tukey) diperoleh
atau

BNJ=
(dalam hal ini
, terdiri dari 4 perlakuan dengan derajat bebas =4(5-1)=16,
diperoleh q table =4.046 ) yang menunjukkan tidak terdapat perbedaan nyata
antar perlakuan karena jarak yang terbesar dari antara perlakuan B dan C hanya
sebesar 5.0 yang lebih kecil dari patokan BNJ.


Jika kita dibandingkan dengan Uji Banding Fisher (Beda
Nyata Terkecil (BNT)), dalam hal ini uji BNT adalah pembandingan dengan
statistic t, di mana
jika 


Maka nilai BNT pada taraf nyata
adalah

BNT=
(ttabel dengan a=0.025, dan derajat bebas=16 adalah 2.120).

Sehingga berdasarkan patokan pembeda ini, perlakuan
yang dinyatakan berbeda nyata karena nilai mutlak selisihnya lebih besar dari
4.90 adalah perlakuan B dengan C.
Kelemahan
dari tata cara pembandingan ini ialah tidak danya sifat menghantar, sebagai contoh
jika menggunakan BNT dapat dilihat antara B dan D tidak nyata perbedaannya
demikian pula dengan D dan C, akan tetapi tidak berarti tidak terdapat
perbedaan yang nyata antara B dan C. Untuk mengatasi persoalan ini disarankan
memperhatikan dengan seksama perlakuan mana saja yang dingin dibandingkan
(pembandingan terencana). Hal lain yang dapat mengganggu adalah hasil uji BNJ
dan BNT dapat memberikan kesimpulan yang berbeda karena ada perbedaan tafsiran
tentang arti dari
(resiko jenis I ) yang
digunakan.

Peluang
salah jenis I atau
pada uji BNT
didasarkan pda banyaknya pasangan perlakuan yang dibandingkan dalam satu
percobaan, sedangkan dalam uji BNJ didasarkan pada peluang untuk melakukan
kekeliruan dalam sederetan percobaan (seandainya dilakukan sejumlah percobaan
serupa). Untuk pembandingan dua perlakuan
=P(menyatakan
, padahal keduanya sama) sedangkan untuk 3 perlakuan, ada 3
pasangan perlakukan yaitu: 




Untuk 4 perlakuan terdapat 6 pasangan, sehingga untuk
k perlakuan tedapat k*=k(k-1)/2 kemungkinan pasangan, sehingga
semakin banyak perlakuan yg dibandingkan akan semakin tinggi pula kemungkinan
melakukan kekeliruan yaitu: menyatakan pasangan
tersebut berbeda nyata padahal sebenarnya keduanya identik.
Pada
uji banding berdasarkan pasangan perlakuan, resiko sebesar 5% (taraf nyata 5%)
menyatakan bahwa setiap pasangan perlakuan yang sebenarnya tak berbeda memiliki
peluang 5% untuk dinyatakan berbeda nyata. Sedangkan dalam uji banding dengan
resiko berdasarkan percobaan berarti jika seseorang melakukan percobaan serupa
sebanyak N kali dan dalam M kali diantaranya terdapat peling sedikit dua
perlakuan yang sama pengaruhnya, maka kira-kira 5% dari M percobaan tersebut
paling sedikit sepasang perlakuan yang sama pengaruhnya akan dinyatakan secara
statistic.
Hubungan
antara besarnya resiko jenis I menurut pasangan perlakuan (misalkan
dengan resiko berdasarkan yang dilambangkan dengan
adalah:




Untuk perbandingan antar buah perlakuan yang bersifat
orthogonal.
Jika
ditetapkan
=0.05 pada uji BNT untuk pembandingan 10 perlakuan, maka akan
diperoleh
yang berartio bahwa
peluang yang menyatakan paling sedikit ada sepasang perlakuan yang berbeda
sebesar 0.37 meskipun Hipotesis nol benar. Angka ini adalah resiko yang
sebenarnya yang akan dihadapi meskipun telah ditetapkan resiko tersebut
berdasarkan percobaan. Untuk uji BNJ, maka resiko sebesar
untuk pembandingan 10
perlakuan (dalam pembandingan orthogonal ada 9 buah pasangan) akan menghasilkan
resiko untuk setiap pasangan pembandingan sebesar 0.057.



Kelemahan
uji banding berdasarkan pasangan perlakuan adalah dalam besar resiko jenis I
yang sebenarnya, untuk pembandingan 2 perlakuan maka nilai
, tetapi semakin banyak perlakuan yang dibandingkan akan
semakin besar dari resiko total pengujian tersebut. Sedangkan dalam BNJ
pemilihan resiko sebesar
tertentu menghasilkan
resiko perpasang perlakuan menjadi relative kecil. Hal ini menyebabkan uji BNJ
dinilai konservatif karena lebih cenderung menyatakan tidak ada perbedaan
meskipun sebenarnya ada perbedaan.


Kelemahan
ini dapat diatasi dengan memilih nilai
yang lebih kecil untuk uji BNT. Dengan demikian kalu kita
melakukan m permbandingan maka resikonya menjadi:



Dengan demikian akan diperoleh resiko total sebesar
. Kalau pembandingan dilakukan bagi semua kemungkinanpasangan
maka m=k(k-1)/2

Jadi bila m=5 maka resiko total yang dipilih
=0.05 maka nilai t dibaca pada taraf
=0.01 atau 0.005.


Pendekatan
ini merupakan prosedur Bonferroni, dengan cara ini peneliti tidak perlu
memeriksa apakah hasil uji F dalam tabel analisis ragam nyata atau tidak. Untuk
memperkecil resiko
, dalam uji BNJ disarankan agar mempertinggi resiko totalnya
menjadi sebesarr 10-15% sewaktu membaca nilai kritis q nya.

Tidak
adanya aturan yang pasti dalam memilih
salah satu dari kedua pendekatan yang ada membuat si pengguna harus hati-hati
dan mengerti betul akan arti dari resiko pegujian di atas. Resiko jenis I sama
kecuali dalam pembandingan dua perlakuan saja. Kesulitan lain adalah adanya
asumsi ulangan yang sama dan kehomogenan ragam perlakuan. Dalam uji BNT
kesamaan ulangan tidak terlalu menjadi persoalan. Sedangkan bagi BNJ jika
ulangannya tidak sama maka besar ulangan diperoleh dengan menghitung rataan
harmonic berbagai nilai ulangan, sehingga pembandingan 2 perlakuan diperoleh
dengan banyak ulangan
dan untuk k perlakuakn 


KESIMPULAN
Beberapa kesimpulan yang disampaikan dalam tulisan ini
adalah:
1. Uji BNJ didasarkan pada peluang melakukan kekeliruan
dalam sederetan percobaan (seandainya dilakukan percobaan serupa), sedangkan
pada uji BNT didasarkan pada banyaknya pasangan perlakuan yang dibandingkan
dalam satu percobaan.
2. Kelemahan uji banding berdasarkan pasangan perlakuan
adalah dalam besar resiko jenis I yang sebenarnya, untuk pembandingan 2
perlakuan maka nilai
, tetapi semakin banyak perlakuan yang dibandingkan akan
semakin besar dari resiko total pengujian tersebut.

3. Uji Range Berganda Duncan memiliki kesamaan dengan
Metode Newman-Keuls, dimana ukuran Wp berbeda untuk
perbandingan-perbandingan berbeda.
4. Uji BNJ dinilai konservatif karena lebih cenderung
menyatakan tidak ada perbedaan meskipun sebenarnya ada perbedaan.
5. Untuk kontras umum, metode Scheffe lebih baik tetapi
untuk perbandingan sederhana, metode Tukey lebih baik.
DAFTAR
PUSTAKA
Anant M. Kshirsagar, A
Course in Liner Models, Marcel Dekkeer Inc, New York, 1983
Aunuddin, Statistika:
Rancangan dan Analisis Data, IPB Press, 2005
Douglas C. Montgomery, Design and Analysis of Experiments, Fifth Edition,
John Wiley & Sons, Inc, New York, 2001
Nalini Ravishanker
and Dipak K. Dey, A First Course in Linear Model Theory, Chapman &
Hall/CRC, Boca Raton Florida, 2002
Komentar
Posting Komentar