VALIDITAS DAN RELIABILITAS
MAKALAH
Diajukan untuk
memenuhi salah satu tugas Mata Kuliah Evaluasi Proses dan Hasil Belajar dengan
Dosen Prsetyaningsih M.Pd
Disusun oleh :
Bella Rosaline (2281143141)
Eka Sonike Sitohang (2281142154)
Hayati Nufus (2281142315)
Sindi Maharani (2281142592)
JURUSAN PENDIDIKAN IPA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS SULTAN AGENG TIRTAYASA
SERANG – BANTEN
2016
KATA PENGANTAR
Puji syukur penulis
haturkan kepada Tuhan Yang Maha Esa, karena berkat rahmat dan karunianya
penulis dapat menyelesaikan makalah yang berupa tugas dari mata kuliah Evaluasi
Proses dan Hasil Belajar .
Terimakasih penulis
sampaikan kepada pihak – pihak yang telah membantu dalam penulisan makalah ini,
terutama untuk dosen pengampu mata kuliah Evaluasi Proses dan Hasil Belajar Ibu
Prasetyaningsih M.Pd , yang telah membimbing penulis sehingga dapat
menyelesaikan makalah yang berjudul Validitas
dan Reliabilitas. Penulis berharap makalah ini dapat brmanfaat bagi
masyarakat banyak
Mohon maaf bila
terdapat penulisan kata, kritik dan
saran yang membangun sangat diperlukan
untuk kemajuan penulis untuk memperbaiki makalah selanjutnya.
Serang , 15 Oktober 2016
Penulis
ii
DAFTAR ISI
HALAMAN JUDUL ……………………………………………………………………i
KATA PENGANTAR ………………………………………………………………….ii
DAFTAR ISI ……………………………………………………………………………iii
BAB I PENDAHULUAN
A. Latar Belakang
……………………………………………………………………….1
B. Rumusan Masalah
……………………………………………………………………1
C. Tujuan
………………………………………………………………………………..2
BAB II PEMBAHASAN
A. Validitas ……………………………………………………………………………..3
B. Reliabilitas ………………………………………………………………………….10
BAB III PENUTUP
A. Kesimpulan ………………………………………………………………………….17
DAFTAR PUSTAKA …………………………………………………………………..19
iii
BAB I
PENDAHULUAN
A.
Latar Belakang
Penilaian pendidikan adalah proses untuk
mendapatkan informasi tentang prestasi atau kinerja peserta didik. Hasil
penilaian digunakan untuk melakukan evaluasi terhadap ketuntasan belajar
peserta didik dan efektivitas proses pembelajaran (Rama dalam Sudijono,2012).
Perkembangan
konsep penilaian pendidikan yang ada pada saat ini menunjukkan arah yang lebih
luas.Penilaian program pendidikan atau penilaian kurikulum menyangkut penilaian
terhadap tujuan pendidikan, isi program, strategi pelaksanaan program dan
sarana pendidikan. Penilaian proses belajar-mengajar menyangkut penilaian
terhadap kegiatan guru, kegiatan siswa, pola interaksi guru-siswa dan
keterlaksanaan program belajar-mengajar. Sedangkan penilaian hasil hasil
belajar menyangkut hasil belajar jangka pendek dan hasil belajar jangka
panjang.
Dengan
demikian, inti penilaian adalah proses memberikan atau menentukan nilai kepada
objek tertentu berdasarkan suatu kriteria tertentu. Proses pemberian nilai
tersebut berlangsung, baik dalam bentuk validitas maupun reliabilitas. Hal ini
mengisyaratkan bahwa objek yang dinilainya adalah hasil belajar siswa.
Keberhasilan
mengungkapkan hasil dan proses belajar siswa sebagaimana adanya (objektivitas
hasil penilaian) sangat tergantung pada kualitas alat penilaiannya di samping pada
cara pelaksanaannya.
Berdasarkan
hal yang dipaparkan diatas, maka pada kesempatan ini pemakalah membahas tentang
Validitas dan Reliabilitas pada tes
hasil belajar siswa agar dapat lebih memahami apa itu sebenarnya
validitas dan reliabilitas serta lebih memahami bagaimana mengetahui suatu alat
penilaian dikatakan mempunyai kualitas yang baik.
1
2
B.
Rumusan Masalah
1.
Bagaimanakah ketetapan atau validitas dalam tes hasil belajar?
2.
Apa saja macam-macam validitas?
3.
Bagaimana reliabilitas dalam tes hasil belajar?
4.
Apa saja macam-macam reliabilitas?
C.
Tujuan
1.
Untuk menjelaskan ketetapan atau validitas dalam
tes hasil belajar.
2.
Untuk menjelaskan jenis-jenis validitas dalam tes
hasil belajar.
3.
Untuk menjelaskan reliabilitas dalam tes hasil
belajar.
4.
Untuk menjelaskan jenis-jenis reliabilitas
dalam tes hasil belajar.
BAB II
PEMBAHASAN
A.
Validitas
1.
Pengertian Validitas
Validitas
berasal dari kata validity yang berarti sejauh mana ketepatan dan kecermatan
suatu alat ukur dalam melakukan fungsi ukurnya.Suatu tes atau instrumen
pengukuran dikatakan memiliki validitas yang tinggi apabila alat tersebut
menjalankan fungsi ukurnya atau memberikan hasil ukur yang sesuai dengan maksud
dilakukannya pengukuran tersebut. Artinya hasil ukur dari pengukuran tersebut
tepat fakta atau keadaan sesungguhnya dari apa yang diukur. Kemudian, Arikunto
menjelaskan bahwa validitas adalah suatu ukuran yang menunjukkan tingkat
keandalan atau kesahihan suatu alat ukur.Alat ukur yang kurang valid berarti
memiliki validitas rendah. Untuk menguji validitas alat ukur, terlebih dahulu
dicari harga korelasi antara bagian-bagian dari alat ukur secara keseluruhan
dengan cara mengkorelasikan setiap butir alat ukur dengan skor total yang
merupakan jumlah tiap skor butir, dengan menggunakan rumus Pearson Product Moment. (Sujarwadi, 2011)
Validitas tes biasa juga
disebut sebagai kesahihan suatu tes adalah mengacu pada kemampuan suatu tes
untuk mengukur karakteristik atau dimensi yang dimaksudkan untuk
diukur.Sedangkan reliabilitas atau biasa juga disebut sebagai kehandalan suatu
tes mengacu pada derajat suatu tes yang mampu mengukur berbagai atribut secara
konsisten (Brennan, 2006).Konstruksi tes yang baik harus memenuhi kedua syarat
tersebut, sehingga tes itu mampu memberikan gambaran yang sebenarnya terhadap
kondisi testee (siswa) yang diuji.
Sifat valid diperlihatkan
oleh tingginya validitas hasil ukur suatu tes. Suatu alat ukur yang tidak valid
akan memberikan informasi yang keliru mengenai keadaan subjek atau individu
yang dikenai tes itu. Apabila informasi yang keliru itu dengan sadar atau tidak
dengan sadar digunakan sebagai dasar pertimbangan dalam
3
4
pengambilan suatu keputusan, maka keputusan itu
tentu bukan merupakan suatu keputusan yang tepat.
Pengertian validitas juga
sangat erat berkaitan dengan tujuan pengukuran.Oleh karena itu, tidak ada
validitas yang berlaku umum untuk semua tujuan pengukuran.Suatu alat ukur
biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang
spesifik.Dengan demikian, anggapan valid seperti dinyatakan dalam "alat
ukur ini valid" adalah kurang lengkap. Pernyataan valid tersebut harus
diikuti oleh keterangan yang menunjuk kepada tujuan (yaitu valid untuk mengukur
apa), serta valid bagi kelompok subjek yang mana? Istilah validitas ternyata
memiliki keragaman kategori. Ebel (dalam Nazir 1988) membagi validitas
menjadi concurrent validity, construct validity, face validity,
factorial validity, empirical validity, intrinsic validity, predictive
validity, content validity, dan curricular validity (Rama dalam
Sudijono,2012)
Validitas berkenaan dengan ketepatan alat
ukur terhadap konsep yang diukur, sehingga betul‑betul mengukur apa yang
seharusnya diukur. Sebagai contoh,
ingin mengukur kemampuan siswa dalam matematika. Kemudian diberikan
soal dengan kalimat yang panjang dan yang berbelit‑belit sehingga sukar
ditangkap maknanya.Akhimya siswa tidak dapat menjawab, akibat tidak memahami
pertanyaannya. Contoh lain, peneliti ingin mengukur kemampuan berbicara, tapi
ditanya mengenai tata bahasa atau kesusastraan seperti puisi atau sajak.
Pengukur tersebut tidak tepat(valid).Validitas tidak berlaku universal sebab
bergantung pada situasi dan tujuan penelitian. Instrumen yang telah valid
untuk suatu tujuan tertentu belum otomatis akan valid untuk tujuan yang lain. (Buning,
2009).
2.
Macam-macam Validitas
Pada tahun 1940-an dan awal tahun 1950 para
ahli pengukuran pendidikan telah melakukan berbagai macam pengkajian terhadap
bagaimana menentukan dan menilai validitas. Pada tahun 1954 misalnya the
American Psychological Association Test and Diagnostic Techniques mengusulkan
empat pendekatan yang sering dinamakan
5
empat muka validitas (four faces of validity) yang digunakan untuk menentukan validitas.
Empat validitas tersebut dapat dikelompokkan menjadi validitas yang dapat
diketahui melalui pemikiran (validitas logis) dan hal yang kedua diketahui
melalui uji empiris (validitas empiris). Dua hal inilah yang merupakan garis
besar sebagai dasar pengelompokan validitas tes. Berikut penjelasan dari jenis-jenis
validitas tersebut, yaitu:
a.
Validitas Logis
Istilah ”validitas logis” mengandung kata
”logis” berasal dari kata ”logika”, yang berarti penalaran. Dengan demikian
validitas logis menunjuk pada kondisi instrumen valid berdasarkan hasil
penalaran.
Ada
dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu:
validitas isi (content validity) dan validitas konstruk (construct validity).
Donald dalam wik rama mengartikan bahwa
validitas isi adalah hubungan isi dengan item atau pertanyaan-pertanyaan di
dalam tes yang representatif dari semua domain-domain isi pelajaran atau sesuai
dengan tujuan instruksional khusus yang telah ditentukan. Senada dengan itu,
Wayan mendefinisikan validitas isi sebagai kejituan dari pada suatu tes ditinjau
dari isi tes tersebut.
Suatu
tes hasil belajar dapat dikatakan valid jika materi tes tersebut benar-benar
bahan yang representatif terhadap bahan-bahan pelajaran yang diberikan.Untuk
menilai apakah suatu tes memiliki validitas isi atau tidak, dapat dilakukan
dengan jalan membandingkan materi tes tersebut dengan analisa rasional yang
kita lakukan terhadap bahan-bahan yang seharusnya dipergunakan dalam menyusun
tes tersebut.
Apabila
materi tes tersebut cocok dengan analisa rasional yang kita lakukan, berarti
tes yang kita nilai itu mempunyai validitas isi, sebaliknya jika materi tes
tersebut menyimpang dari analisa rasional kita, berarti tes tersebut tidak
valid.Sebagian ahli tes berpendapat bahwa tidak satupun pendekatan statistik
yang dapat digunakan untuk menentukan validitas isi suatu tes.
Validitas
isi hanya dapat ditentukan berdasarkan judgmen para ahli. Validitas isi suatu
tes tidak mempunyai besaran tertentu yang dihitung secara
6
statistika, tetapi dipahami bahwa tes itu
sudah valid berdasarkan telaah kisi-kisi tes. Oleh karena itu, Wiersma dan Jurs dalam wik rama menyatakan bahwa validitas isi
sebenarnya mendasarkan pada analisis logika. Berikut merupakan prosedur yang
dapat digunakan, antara lain:
1. mendefiniskan domain yang hendak diukur.
2. menentukan domain yang akan diukur oleh
masing-masing soal.
3. membandingkan masing-masing soal dengan
domain yang sudah ditetapkan
1) Validitas isi
Validitas isi berkenaan dengan kesanggupan
instrumen mengukur isi yang harus diukur. Artinya, alat ukur tersebut mampu
mengungkap isi suatu konsep atau variabel yang hendak diukur.Misalnya tes hasil
belajar bidang studi IPS, harus bisa mengungkap isi bidang studi tersebut. Hal
ini bisa dilakukan dengan cara menyusun tes yang bersumber dari kurikulum
bidang studi yang hendak diukur.
7
Di samping kurikulum dapat juga diperkaya
dengan melihat/mengkaji buku sumber.Sungguhpun demikian tes hasil belajar tidak
mungkin dapat mengungkap semua materi yang ada dalam bidang studi tertentu
sekalipun hanya untuk satu semester.Oleh sebab itu harus diambil sebagian dari materi
dalam bentuk sampel tes.Sebagai sampel maka harus dapat mencerminkan materi
yang terkandung dari seluruh materi bidang studi.Cara Yang ditempuh dalam
menetapkan sampel tes adalah memilih konsep‑konsep yang esensial dari materi
yang di dalamnya.Misalnya menetapkan sejumlah konsep dari setiap pokok bahasan
yang ada.Dari setiap konsep dikembangkan beberapa pertanyaan tes (lihat
bagan).Di sinilah pentingnya peranan kisi‑kisi sebagai alat untuk memenuhi
validitas isi.
Dalam hal tertentu tes yang telah disusun
sesuai dengan kurikulum (materi dan tujuannya) agar memenuhi validitas isi,
peneliti atau pemakai tes dapat meminta bantuan ahli bidang studi untuk menelaah
apakah konsep materi yang
8
diajukan telah memadai atau tidak, sebagai sampel tes.Dengan demikian
validitas isi tidak memerlukan uji coba dan analisis statistik atau dinyatakan
dalam bentuk angka-angka.
2)
Validitas Konstruksi (Construct
Validity)
Validitas bangun atau bangun pengertian (Construct
validity) berkenaan dengan kesanggupan alat ukur mengukur pengertian‑pengertian
yang terkandung dalam materi yang diukurnya. Pengertian‑pengertian yang
terkandung dalam konsep kemampuan, minat, sebagai variabel penelitian dalam
berbagai bidang kajian harus jelas apa yang hendak diukurnya. Konsep‑konsep
tersebut masih abstrak, memerlukan penjabaran yang lebih spesifik, sehingga
mudah diukur.Ini berarti setiap konsep harus dikembangkan indikator‑indikatomya.
Dengan adanya indikator dari setiap konsep maka bangun pengertian akan nampak
dan memudahkan dalam menetapkan cara pengukuran. Untuk variabel tertentu,
dimungkinkan penggunaan alat ukur yang beraneka ragam dengan cara mengukurnya
yang berlainan.
Secara
etimologis, kata ”konstruksi” mengandung arti susunan, kerangka, atau rekaan.
Adapun secara terminologis, tes hasil belajar dapat dinyatakan sebagai tes yang
telah memiliki validitas konstruksi, apabila tes hasil belajar tersebut
(ditinjau dari susunan, kerangka, atau rekaannya)
Konstruk
(construct) adalah suatu yang
berkaitan dengan fenomena dan objek yang abstrak, tetapi gejalanya dapat
diamati dan diukur.Validitas konstruk mengandung arti bahwa suatu alat ukur
dikatakan valid apabila cocok dengan konstruksi teoritik dimana tes itu dibuat.
Dengan kata lain sebuah tes dikatakan memiliki validitas konstruksi apabila
soal-soalnya mengukur aspek yang diuraikan dalam standar kompetensi, kompetensi
dasar, maupun indikator yang terdapat dalam kurikulum. Konstruksi contoh dari
kompetensi dasar, hasil belajar, dan indikator yang terdapat dalam kurikulum
9
b.
Validitas Eksternal
Validitas eksternal dapat dibagi menjadi dua,
yaitu validitas bandingan (concurrent
validity) dan validitas ramalan (predictive
validity).
1)
Validitas Bandingan (concurrent validity)
Validitas bandingan artinya kejituan daripada
suatu tes dapat dilihat dari korelasinya terhadap kecakapan yang telah dimiliki
saat kini secara riil. Cara yang digunakan untuk menilai validitas bandingan
adalah dengan cara mengkorelasikan hasil-hasil yang dicapai dalam tes tersebut
dengan hasil-hasil yang dicapai dalam tes yang sejenis yang diketahui mempunyai
validitas tinggi (misalnya tes standar). Tinggi rendahnya koefisien korelasi
yang diperoleh menunjukkan tinggi rendahnya validitas tes yang akan kita nilai
kualitasnya.
2)
Validitas Ramalan (Prediktif
Validity)
Validitas prediktif adalah ketepatan
(kejituan) dari suatu alat ukur ditinjau dari kemampuan tes untuk meramalkan
prestasi yang dicapainya kemudian.Cara yang dipergunakan untuk menilai tinggi rendahnya
validitas prediktif ini ialah dengan jalan mencari korelasi antara nilai-nilai
yang dicapai oleh anak-anak dalam tes tersebut dengan nilai-nilai yang
dicapainya kemudian.
3.
Pengujian Validitas Instrumen
Pada dasarnya terdapat dua macam instrumen, yaitu
instrumen yang berbentuk test untuk mengukur hasil belajar dan instrumen non
test untuk mengukur sikap. Instrumen yang berupa test, opsi jawabannya bersifat
“benar atau salah”,
10
sedangkan instrumen sikap jawabannya tidak
ada yang “salah atau benar” tetapi bersifat “positif dan negatif”.
B.
Realibilitas
1.
Pengertian Reliabilitas
Kata
reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam bahasa
Inggris, berasal dari asal kata reliabel yang artinya dapat dipercaya.
Instrumen tes dikatakan dapat dipercaya jika memberikan hasil yang tetap
apabila diteskan berkali-kali. Jika kepada siswa diberikan tes yang sama pada
waktu yang berlainan, maka setiap siswa akan tetap berada dalam urutan yang
sama atau ajeg dalam kelompoknya.21 Uno, dkk. memberikan penekanan pada
pengertian reliabilitas sebagai konsistensi tes. Yaitu, seberapa konsisten skor
tes dari satu pengukuran ke pengukuran berikutnya. Reliabilitas merujuk pada
ketetapan/keajegan alat tersebut dalam menilai apa yang diinginkan, artinya
kemampuan alat tersebut digunakan akan memberikan hasil yang relatif sama (
Sujarwadi, Sri : 2011)
Reliabilitas alat ukur adalah
ketetapan atau keajegan alat tersebut dalam mengukur apa yang diukurnya.
Artinya, kapan pun alat ukur tersebut digunakan akan memberikan hasil ukur yang
sama. Contoh paling nyata adalah timbangan atau meteran. Hal yang sama terjadi
untuk alat ukur suatu gejala, tingkah laku, ciri atau sifat individu dan lain‑lain.
Misalnya alat ukur prestasi belajar seperti tes hasil belajar, alat ukur sikap,
kuesioner dan lain‑lain, hendaknya meneliti sifat keajegan tersebut.
Tes hasil
belajar dikatakan ajeg apabila hasil pengukuran saat ini menunjukkan kesamaan
hasil pada saat yang berlainan waktunya, terhadap siswa yang sama. Misalnya siswa
kelas V pada hari ini di tes kemampuan matematik.Minggu berikutnya siswa
tersebut di tes kembali. Hasil dari kedua tes relatif sama. Sungguhpun demikian
masih mungkin terjadi ada perbedaan hasil untuk hal‑hal tertentu akibat faktor
kebetulan, selang waktu, terjadinya perubahan pandangan siswa terhadap soal
yang sama. Jika ini terjadi, kelemahan terletak dalam alat ukur itu,
11
yang tidak memiliki kepastian jawaban atau meragukan
siswa. Dengan kata lain derajat reliabilitasnya masih rendah.
Di lain pihak perbedaan hasil pengukuran bukan disebabkan
oleh alat ukurnya, melainkan kondisi yang terjadi pada diri siswa. Misalnya
fisik siswa dalam keadaan sakit pada waktu tes yang pertama, motivasi pada
waktu tes pertama berbeda dengan motivasi tes pada berikutnya.
Atas dasar itu perbedaan hasil pengukuran
pertama dengan hasil pengukuran berikutnya bisa teijadi akibat perubahan pada
diri subjek yang diukur dan atau oleh faktor yang berkaitan dengan pemberian
tes itu sendiri.Hal ini tidak mengherankan dan sudah umum terjadi, yang sering
dinyatakan dengan sebutan/istilah kesalahan pengukuran. Ini berarti, skor
hasil pengukuran yang pertama dan skor hasil pengukuran kedua terhadap subjek
sama, dimungkinkan terjadinya kesalahan pengukuran disebabkan oleh dua faktor
di atas. Oleh karenanya setiap skor hasil pengukuran menghasilkan dua bagian,
yakni hasil pengukuran pertama yang disebut skor sejati dan hasil pengukuran
berikutnya terhadap subjek yang sama, yang mengandung hasil skor plus
kesalahan pengukuran.
Komponen skor sejati dan skor yang mengandung
kesalahan pengukuran dinyatakan dalam suatu persamaan matematis sebagai
berikut:
X =b +
s,
dengan:
X =
skor yang diamati
b =
skor sejati
s =
kesalahan pengukuran
Dalam suatu penelitian skor yang diamati adalah skor sejati ditambah
skor kesalahan pengukuran sehingga variansi skor yang diamati X2
adalah variansi skor sejati Tb2 ditambah variansi skor kesalahan Ts2
atau Tx2 = Tb2 + Ts2.
12
Indeks reliabilitas alat ukur dalam suatu penelitian dapat dicari dengan
mengkorelasikan skor‑skor yang diperoleh dari hasil pengukuran yang berulang‑ulang
pada waktu yang berbeda, atau dengan kelompok pertanyaan yang sepadan. Prosedur
ini dilakukan dengan cara memberikan tes dua kali kepada subjek yang sama pada
waktu yang berbeda. Cara kedua adalah membagi alat ukur (tes) menjadi dua
bagian yang sama atau yang setarap untuk melihat keajegan tes tersebut. Cara
yang pertama dikenal dengan tes ulang (test retest) dan cara kedua
dikenal dengan pecahan sebanding/setara.
a. Reliabilitas tes ulang
Tes
ulang (test‑retest) adalah penggunaan alat ukur terhadap subjek yang
diukur, dilakukan dua kali dalam waktu yang berlainan.Misalnya tes hasil
belajar matematika untuk siswa SD kelas V, diberikan hari ini, lalu diperiksa
hasilnya. Seminggu kemudian tes tersebut diberikan lagi pada siswa yang sama
dan hasilnya diperiksa. Hasil pengukuran yang pertama kemudian dikorelasikan
dengan hasil pengukuran yang kedua untuk mendapatkan koefisien korelasinya
(r). Koefisien korelasi ini disebut koefisien reliabilitas tes ulang, yang
hasilnya akan bergerak dari ‑ 1,0 sampai + 1,0. Bila koefisien reliabilitas
mendekati angka 1,0 merupakan indeks reliabilitas tinggi. Artinya hasil
pengukuran yang pertama relatif sama dengan hasil pengukuran yang kedua. Dengan
kata lain alat ukur tersebut memiliki tingkat keajegan atau ketetapan
(reliabel). Untuk pengukuran ilmu‑ilmu sosial dan pendidikan indeks
reliabilitas 0,75 sudah dianggap cukup mengingat sifat dan ilmu sosial dan
pendidikan berbeda dengan ilmu‑ilmu eksakta.
Jarak atau selang waktu antara pengukuran
pertama dengan pengukuran kedua sebaiknya tidak terlalu dekat dan juga tidak
terlalu jauh.Jika terlalu dekat/pendek, hasil pengukuran banyak dipengaruhi
oleh ingatan siswa tentang jawaban yang diberikan pada pengukuran yang
pertama, bukan karena keajegan alat ukurnya.Sebaliknya jika selang waktu
pengukuran pertama dengan pengukuran kedua terlalu lama, bisa terjadi adanya
perubahan pengetahuan dan pengalaman siswa sehingga mempengaruhi koefesien reliabilitasnya.Asumsi
yang digunakan
13
dalam tes ulang ialah karakteristik yang
diukur oleh alat ukur tersebut stabil sepanjang waktu, sehingga jika ada
perubahan skor hasil kedua pengukuran lebih disebabkan kesalahan alat
ukur.Cara tes ulang (test‑retest) banyak digunakan dalam menetapkan
atau menentukan tingkat reliabilitas alat ukur dalam penelitian sosial dan
pendidikan.
b.
Reliabilitas pecahan setara
Reliabilitas bentuk pecahan
setara tidak dilakukan pengulangan pengukuran kepada subjek yang sama tetapi
menggunakan hasil dari bentuk tes yang sebanding atau setara yang diberikan
kepada subjek yang sama pada waktu yang sama pula. Dengan demikian diperlukan
dua perangkat alat ukur yang disusun sedemikian rupa agar memiliki derajat
kesamaan atau kesetaraan baik dari segi, isi, tingkat kesukaran alat ukur,
abilitas yang diukur, jumlah pertanyaan, bentuk pertanyaan dan segi‑segi teknis
lainnya.Yang berbeda hanyalah pertanyaan.Bila penyusun kesetaraan alat ukur
bisa dicapai seoptimal mungkin maka koefisien reliabilitas dari prosedur ini
dianggap paling baik dibandingkan dengan prosedur tes ulang.Namun kesulitannya
terletak dalam menyusun perangkat alat ukur yang benar‑benar mengandung
derajat kesetaraan tinggi.
c.
Reliabilitas belah dua
Reliabilitas belah dua mirip
dengan reliabilitas pecahan setara terutama dari pelaksanaannya.Dalam prosedur
ini alat ukur diberikan kepada kelompok subjek cukup satu kali atau satu
saat.Butir‑butir soal dibagi dua bagian yang sebanding, biasanya membedakan
soal nomor genap dengan soal nomor ganjil.Setiap bagian soal diperiksa
hasilnya, kemudian skor dari kedua bagian tersebut dikorelasikan untuk dicari
koefisien korelasinya.Mengingat korelasi tersebut hanya berlaku separuh tidak
untuk seluruh pertanyaan, maka koefisien korelasi yang didapatkannya tidak
untuk seluruh soal, tapi hanya separuhnya. Oleh sebab itu koefisien korelasi
belah dua perlu diubah ke dalam koefisien korelasi untuk seluruh soal dengan
menggunakan rumus ramalan Spearmen Brown:
14
rxx
=
rxx=
koefisien reliabilitas keseluruhan
r
= korelasi (r) dari belah dua.
Contoh:
Koefisien korelasi belah dua adalah 0,60
rxx=
=
Dari
contoh di atas terjadi peningkatan koefisien korelasinya, setelah dilakukan
pengubahan.Assumsi yang digunakan dalam prosedur belah dua adalah kedua bagian
alat ukur itu pararel, sekalipun sering keliru atau tidak benar.Akibat adanya
pengubahan koefisien reliabilitas, prosedur belah dua cenderung menunjukkan
koefisien reliabilitas yang tinggi daripada prosedur tes ulang dan pecahan
setara.Oleh sebab itu penggunaan belah dua harus lebih berhati‑hati. Prosedur
ini digunakan bila alat ukur mengandung atau terdiri dari banyak item, item
relatif berat/sukar (power test), materi yang diuji cukup komprehensif sehingga
memungkinkan penyusunan dua soal untuk satu permasalahan yang sama untuk
memenuhi belah dua.
d.
Kesamaan rasional
Di samping cara‑cara yang
dijelaskan di atas ada prosedur menghitung reliabilitas tanpa melakukan
korelasi dari dua pengukuran atau pecahan setara dan belah dua.Cara tersebut
adalah kesamaan rasional.Prosedur ini dilakukan dengan menghubungkan setiap
butir dalam satu tes dengan butir‑butir lainnya dan dengan tes itu sendiri
secara
15
keseluruhan. Salah satu cara yang sering digunakan adalah menggunakan
rumus Kuder-Rechardson atau KR 21.
Rumusnya:
rxx =
rxx = reliabilitas tes secara keseluruhan
K = jumlah butir soal dalam tes
s2= variasi skor
=
mean skor
Misalnya disusun tes sebanyak 80 soal.Setelah
diberikan kepada sejumlah siswa dalam kelas tertentu, lalu dicari nilai rata‑rata
dan simpangan bakunya.Misalnya diperoleh nilai rata‑rata 60 dan simpangan bakunya
8. Dengan rumus di atas maka:
rxx =
=
=
=
0,77
Uraian ukuran reliabilitas yang telah
dijelaskan di atas dapat dipertimbangkan oleh peneliti, cara mana yang paling
tepat digunakan bergantung pada peneliti. Pertimbangan tersebut, antara lain
sifat variabel yang diukur, jenis alat ukur, jumlah subjek yang diukur, serta
hasil‑hasil pengukuran yang diharapkan sesuai dengan tujuan penelitian
16
Faktor-Faktor yang Mempengaruhi Reliabilitas
Dalam mengestimasi reliabilitas tes ada beberapa faktor yang dapat mempengaruhi
reliabilitas tes, sehingga tes tersebut tidak reliabel. Pada umumnya, dalam
pendidikan reliabilitas sebuah tes dipengaruhi oleh adanya perbedaan
individual. Terkadang reliabilitas dipengaruhi oleh faktor yang permanen
ataupun faktor yang terjadi karena faktor sementara seperti karena kelelahan,
menerka, atau pengaruh latihan.
Selanjutnya (Donald,dkk) menggambarkan
faktor-faktor yang turut mempengaruhi reliabilitas instrumen penelitian:
Factor
|
Potensial effect
|
1.
Length of the test
2.
Heterogeneity of group
3.
Ability level of group
4.
Techniques used to estimate reliability
5.
Nature of the variable
6. Objectivity of scoring
|
The
longer the test, the greater the reliability.
The
more heterogeneous the group, the greater the reliability.
A
test that too easy or too difficult
for a
group results in lower reliability.
Test-retest
and split-half give higher estimates. Equivalent forms give lower estimates.
Tests
of variables that are easier to measure yield higher reliability estimates.
The
more objective the scoring, the greater the reliability.
|
BAB III
PENUTUP
A. Kesimpulan
1. Ketetapan atau
validitas dalam hasil belajar
Sifat valid
diperhatikan oleh tingginya validitas hasil ukur suatu tes. Jika alat ukur yang
digunakan tidak valid maka akan memberikan informasi yang keliru mengenai
subjek atau individu yang dikenai tes tersebut. Suatu tes hasil belajar
dikatakan memiliki validitas yang tinggi ketika alat tersebut menjalankan
fungsi ukurannya atau memberikan hasil ukur yang sesuai dengan maksud
dilakukannya pengukuran tersebut. Namun ketika alat ukur yang digunakan kurang
baik maka akan berdampak pada rendahnya validitas yang dihasilkan.
2. Macam – macam
Validitas yaitu :
a.
Validitas Logis
1)
Validitas isi
2)
Validitas konstruksi (Construct Validity)
b.
Validitas eksternal
1)
Validitas bandingan (Concurrent validity)
2)
Validitas ramalan (Prediktif
validity )
3. Reliabilitas dalam tes hasil belajar
Reliable
memiliki arti yaitu dapat dipercaya. Reliabilitas merujuk pada ketetapan
/keajegan alat tersebut dalam menilai apa yang diinginkan , artinya kemampuan
tersebut ketika digunakan akan memberikan hasil yang relatif sama. Suatu tes
hasil belajar dikatakan kuat apabila hasil pengukuran menunjukan kesamaan hasil
pada saat yang berlainan waktunya, terhadap siswa yang sama. Namun jika
terdapat perbedaan hasil pada pengukuran pertama dan pengukuran kedua bukan
disebabkan oleh alat ukurnya melainkan kondisi fisik dari siswa tersebut.
Indeks reliabilitas alat ukur dalam suatu penelitian dapat dicari dengan
mengkorelasikan skor – skor yang
17
18
diperoleh
dari pengukuran yang dilakukan berulang-ulang pada waktu berbeda, atau dengan
kelompok pertanyaan yang sepadan.
4. Macam
– macam reliabilitas
a. Reliabilitas
tes ulang
b. Reliabilitas
pecahan setara
c. Reliabilitas
belah dua
d. Kesamaan
rasional
DAFTAR PUSTAKA
Arikunto,
Suharsimi. 2013. Prosedur penelitian-suatu pendekatan praktik.
Jakarta: PT. Rineka
Cipta. Hlm. 221.
Brenan, Robert L. 2006. Educational Measurement.
Washington: AmericanCouncil on Education Praeger.
Prasetyo, Bambang., Jannah L. Miftahul. 2005. Metode
Penelitian Kuantitatif-teori dan aplikasi. Jakart:
PT. Raja Grafindo Persada. Hlm. 89.
Prasetyo, Bambang., Jannah L. Miftahul. 2005. Metode
Penelitian Kuantitatif-teori dan aplikasi. Jakart:
PT. Raja Grafindo Persada. Hlm. 104.
Sudijono,Anas.2012.Pengantar
Evaluasi Pendidikan, Jakarta:Rajawali Press.
Sugiono.
2011. Metode Penelitian Kuantitatif Kualitatif dan R&D. Bandung: ALFABETA. Hlm. 267.
19
Tidak ada komentar:
Posting Komentar