Bias in Psychological Assesment

Bias in Psychological Assesment
  • Bias in Psychological Assesment

  • Views 12

  • Downloads 0

  • File size 202KB
  • Author/Uploader: denise allaya pratomo

Tugas I Psikodiagnostik Bias in Psychological Assessment: An Empirical Review and Recommendation

Kelompok 4 Kelas B : Nindya Fadillah S

(151301034)

Kiki Amelia

(151301036)

Rizki Ananda Irawan(151301038) Wirda Verawati

(151301040)

Hanifa Alia

(151301044)

FAKULTAS PSIKOLOGI UNIVERSITAS SUMATERA UTARA

KEBERATAN MINORITAS ATAS TES DAN PENGUJIAN Sejak tahun 1968, Association of Black Psychologists (ABP) telah menyerukan moratorium administrasi tes psikologi dan pendidikan dengan peserta ujian minoritas (Samuda, 1975; Williams, Dotson, Dow, & Williams, 1980). The ABP membawa panggilan ini untuk asosiasi profesional lain dalam psikologi dan pendidikan. American Psychological Association (APA) menanggapi dengan meminta bahwa Dewan Urusan Ilmiah membentuk komite untuk mempelajari penggunaan tes ini dengan siswa yang kurang beruntung (lihat laporan komite, Cleary, Humphreys, Kendrick, & Wesman, 1975). Asosiasi profesional lainnya mengeluarkan pernyataan kebijakan pada pengujian. Williams et al. (1980) dan Reynolds, Lowe, dan Saenz (1999) mengutip Asosiasi Nasional untuk Kemajuan Orang Kulit Berwarna (NAACP), Asosiasi Pendidikan Nasional, National Association of Kepala Sekolah Dasar, dan Amerika Personalia dan Bimbingan Association, antara lain , sebagai organisasi merilis laporan tersebut. The ABP, mungkin dimotivasi oleh tindakan dan dorongan pada bagian dari NAACP, mengadopsi sebuah resolusi yang lebih rinci pada tahun 1974. ASAL USUL UJI BIAS KONTROVERSI Nilai sosial dan Keyakinan Kini konflik bias dalam tes standar dimotivasi terutama oleh kekhawatiran publik. dorongan, dapat dikatakan, terletak dengan keyakinan fundamental bagi demokrasi di Amerika Serikat. Kebanyakan orang Amerika, setidaknya orang-orang dari etnis mayoritas, melihat Amerika Serikat sebagai tanah kesempatan-semakin, kesempatan yang sama yang diperpanjang untuk setiap orang. Kami ingin percaya bahwa setiap anak dapat tumbuh menjadi presiden. Bersamaan, kami percaya bahwa semua orang diciptakan sama, bahwa semua orang pelabuhan potensi untuk sukses dan prestasi. kesetaraan ini kesempatan tampaknya paling masuk akal jika semua orang sama-sama bisa mengambil keuntungan dari itu. Orang tua dan profesional pendidikan memiliki keyakinan yang sesuai: Anak-anak kami melayani memiliki potensi besar untuk sukses dan prestasi; upaya besar kita curahkan untuk mengajar atau membesarkan anak-anak adalah upaya dihabiskan; anak saya sendiri adalah cerdas dan mampu.

Karakter Tes dan Pengujian Sifat karakteristik psikologis dan pengukuran mereka ikut bertanggung jawab atas keprihatinan lama lebih dari tes Bias (Reynolds & Brown, 1984a). karakteristik psikologis internal, sehingga para ilmuwan tidak dapat mengamati atau mengukur langsung tetapi harus menyimpulkan mereka dari perilaku eksternal seseorang. Dengan ekstensi,

dokter

harus

bersaing

dengan

keterbatasan

yang

sama.

Menurut

MacCorquodale dan Meehl (1948), proses psikologis merupakan variabel intervensi jika diperlakukan hanya sebagai komponen dari suatu sistem dan tidak memiliki sifat luar orang-orang yang secara operasional mendefinisikan itu. Dalam biologi, gen adalah contoh dari sebuah konstruksi hipotetis. Gen memiliki sifat luar penggunaannya untuk menggambarkan transmisi sifat-sifat dari satu generasi ke generasi berikutnya. Kecerdasan dan kepribadian memiliki status konstruksi hipotetis. Sifat proses psikologis dan konstruksi hipotetis tak terlihat lainnya sering subyek perdebatan terus-menerus (lihat Ramsay, 1998b, untuk satu pendekatan). Intelijen, proses psikologis yang sangat kompleks, telah menimbulkan perselisihan yang terutama sulit untuk menyelesaikan (Reynolds, Willson, et al., 1999). Prosedur pengembangan tes (Ramsay & Reynolds, 2000a) pada dasarnya sama untuk semua tes standar. Awalnya, penulis tes mengembangkan atau mengumpulkan kolam besar item berpikir untuk mengukur karakteristik bunga. Teori dan kegunaan praktis standar yang biasa digunakan untuk memilih kolam renang barang. Proses seleksi yang rasional. Artinya, itu tergantung pada alasan dan pertimbangan; sarana ketat melaksanakannya sama sekali tidak ada. Pada tahap ini, maka, tes penulis telah diterima tidak umum bukti bahwa mereka telah memilih item yang sesuai. Langkah kedua yang umum adalah untuk membuang barang-barang berkualitas tersangka, lagi dengan alasan yang rasional, untuk mengurangi kolam renang untuk ukuran dikelola. Selanjutnya, penulis tes atau penerbit mengelola item untuk kelompok ujian

disebut sampel

tryout.

prosedur

statistik

kemudian

membantu

untuk

mengidentifikasi item yang tampaknya akan mengukur karakteristik yang tidak diinginkan atau lebih dari satu karakteristik. Penulis atau penerbit membuang atau memodifikasi item ini.

Akhirnya, pemeriksa mengelola item yang tersisa untuk kelompok besar, beragam orang disebut sampel standardisasi atau sampel norma. Sampel ini harus mencerminkan setiap karakteristik penting dari populasi yang akan mengambil versi fi nal dari test.Statisticians menyusun sejumlah sampel norming ke dalam sebuah array disebut distribusi norma. Akhirnya, klien atau peserta ujian lainnya mengikuti tes dalam bentuk fi nal nya. Skor yang mereka peroleh, dikenal sebagai skor mentah, belum memiliki meaning.Aclinician diinterpretasi membandingkan skor tersebut dengan norming perbandingan distribution.The adalah proses matematika yang menghasilkan baru, nilai standar untuk ujian. Dokter dapat menafsirkan skor tersebut, sedangkan interpretasi aslinya, skor mentah akan sulit dan tidak praktis (Reynolds, Lowe, dkk., 1999). Divergent Ideas of Bias (Ide-ide yang berbeda bias) Selain karakter proses psikologis dan pengukuran mereka, berbeda pemahaman yang diselenggarakan oleh berbagai segmen penduduk juga menambah kontroversi tes Bias. Peneliti dan orang awam melihat bias yang berbeda. Dokter dan profesional lainnya membawa pandangan berbeda tambahan. Banyak pengacara melihat Bias sebagai ilegal, praktik diskriminatif pada bagian dari organisasi atau individu (Reynolds, 2000a; Reynolds & Brown, 1984a). Untuk masyarakat luas, Bias kadang-kadang memunculkan gagasan dari sikap merugikan. Seseorang dilihat sebagai berprasangka dapat mengatakan, “Kau bias terhadap Hispanik.” Untuk orang awam lainnya, bias lebih umum miring karakteristik dalam pemikiran orang lain, kurangnya objektivitas yang ditimbulkan oleh keadaan hidup seseorang. Petugas penjualan mungkin mengatakan, “Saya pikir pegawai penjualan harus lebih baik dibayar.” “Ya, tapi kau bias,” pendengar dapat membalas. Pandangan ini berbeda dari statistik dan penelitian definisi bias untuk istilah lain, seperti yang signifikan, asosiasi, dan membingungkan. Penelitian definisi bias yang sangat spesifik, istilah tersebut tidak terbiasa untuk hampir semua orang. Akibatnya, pembaca belum tahu dan sering salah menafsirkan laporan penelitian.

EFEK DAN IMPLIKASI DARI UJI BIAS KONTROVERSI Sengketa tes bias telah memberikan dorongan ke korpus semakin canggih penelitian. Dalam kebanyakan tempat, tes kualitas statistik cukup tinggi tampaknya sebagian besar berisi. Untuk tes neuropsikologi, hasilnya baru dan masih jarang, tapi sejauh ini mereka muncul untuk menunjukkan sedikit Bias. Kedua sisi perdebatan telah mengabaikan sebagian besar temuan ini dan telah menekankan, sebaliknya, perbedaan berarti antara kelompok etnis (Reynolds, 2000b). Selain itu, penerbit telah merilis langkah-langkah baru seperti “budaya bebas” tes nonverbal dan “budaya adil” atau; praktisi menafsirkan skor sehingga dapat diduga meminimalkan pengaruh bias; dan, akhirnya, penerbit merevisi tes langsung, untuk menghapus perbedaan kelompok. Untuk anggota kelompok minoritas, revisi ini mungkin memiliki efek jangka panjang yang tidak diinginkan: mencegah studi dan dengan demikian remediasi bias yang mungkin akan ditemukan. Implikasi dari berbagai efek berbeda tergantung pada apakah penjelasan bias benar atau salah, dengan asumsi itu diterima. Penjelasan Bias salah, jika diterima, akan menyebabkan perubahan yang tidak akan kembali. Informasi penting mencerminkan, benar dan apalagi akan menyajikan informasi yang tidak benar bahwa kelompokkelompok orang yang tidak melakukan telah dilakukan sama. Peneliti, tidak menyadari atau lengah dari ketidaksetaraan tersebut, akan mengabaikan penelitian penyebabnya. kesulitan ekonomi dan sosial akan datang ke tampak kurang berbahaya dan karena itu lebih membenarkan fi mampu. program sosial, tidak lagi dilihat sebagai diperlukan untuk meningkatkan tingkat minoritas pelajar, mungkin dihentikan, dengan konsekuensi serius. Penjelasan Bias benar, jika diterima, akan meninggalkan profesional dan anggota kelompok minoritas dalam posisi yang relatif lebih baik. Kita akan memiliki penelitian berlebihan benar menunjukkan bahwa bias hadir di nilai tes standar. Anehnya, bagaimanapun, keterbatasan memiliki data ini mungkin lebih besar daripada manfaat. Uji Bias akan menjadi kesimpulan yang benar mencapai salah. Temuan bias mengandalkan terutama pada perbedaan rata-rata antara kelompokkelompok. Perbedaan-perbedaan ini akan terdiri sebagian bias dan sebagian konstituen lainnya, yang akan proyek mereka ke atas atau ke bawah, mungkin tergantung pada

kelompok-kelompok tertentu yang terlibat. Dengan demikian, kita akan akurat dalam menyimpulkan bias yang hadir tapi tidak akurat mengenai jumlah bias dan, mungkin, arahnya: yaitu, mana dari kedua kelompok itu disukai. Setiap kation modi fi dibuat akan melakukan terlalu sedikit, atau terlalu banyak, menciptakan bias yang baru dalam arah yang berlawanan. Kehadiran bias harus memungkinkan untuk penjelasan tambahan. Misalnya, bias dan efek Steelean (Steele & Aronson, 1995), di mana takut mengonfirmasi stereotip menghambat kinerja minoritas ‘, mungkin baik mempengaruhi hasil tes. kemungkinan tambahan tersebut, yang kini menerima sedikit perhatian, akan menerima bahkan kurang. Deprivasi ekonomi dan sosial, masalah serius selain masalah pengujian, akan kembali tampil kurang berbahaya dan karena itu lebih membenarkan fi mampu. Upaya untuk meningkatkan nilai masyarakat melalui program-program sosial akan sulit untuk dipertahankan, karena pekerjaan ini mengandaikan bahwa faktor-faktor selain Bias tes adalah penyebab perbedaan skor. Dengan demikian, kepercayaan Amerika ‘di potensi manusia akan dibenarkan, tapi mungkin dengan biaya yang cukup besar untuk individu minoritas. POSSIBLE SOURCE OF BIAS Reynolds, Lowe et al. (1999) telah membagi masalah kedalam 7 kategori, yaitu : 1. Inappropriate content : tes dibuat dari pengalaman yang paling banyak dari mayoritas. Respon / konten yang benar dibuat berdasarkan respon mayoritas tersebut dan menjadi tidak familiar kepada minoritas. 2. Inappropriate standardization samples. Representase minoritas di sampel normal cukup proposional tetapi tidak cukup untuk berpengaruh dalam pengembangan tes. 3. Examiners’ and language bias. Penguji berkulit putih yang berbahasa inggris mengintimidasi peserta berkulit hitam

dan bahkan menurunkan hasil tes

mereka. 4. Inequitable social consequences. Orang yang berasal dari etnis minoritas tidak dirugikan dari awal karena streotipe dan diskriminasi dari masa sebelumnya, efek labeling juga salah satu contoh dari tipe ini.

5. Measurement of different construct. Tes yang dibuat dari budaya yang paling besar mengukur karakteristik berbeda bersama orang yang minoritas. 6. Differential predictive validity. Tes yang standar dapat memprediksi secara akurat orang dari grup mayoritas tetapi tidak dengan minoritas. 7. Qualitatively distinct aptitude and personality. Etnis miyoritas dan minoritas harus dibuat dalam tipe berbeda. Jadi pengembanagn tes harus dibuat berdasarkan definisi berbeda untuk grup miyoritas dan minoritas.

WHAT TEST BIAS IS AND IS NOT Bias and Unfairness Konsep dari tes bias dan ketidakadilan sebenarnya berbeda. Tes mungkin memiliki sedikit bias tetapi orang klinik terkadang menggunakan itu secara tidak adil kepada tester minoritas. Jensen (1980) adalah orang yang pertama mempermasalahkan bahwa keadilan dan bias adalah konsep yang harus dipisahkan. Sebagaimana dicatat oleh Brown et al. (1999), keadilan adalah masalah moral, filosofis, atau hukum yang wajar orang bisa tidak setuju. Sebaliknya, bias itu seperti menggunakan tes dengan dua atau lebih kelompok tertentu. Dengan demikian, Bias dapat diperkirakan melalui statistic atau kuantitas dan bukan prinsip yang ditetapkan melalui perdebatan dan pendapat. Bias and Offensiveness Perbedaan kedua adalah bahwa antara Bias tes dan item offensiveness.. Dalam pengembangan nya , review dari

orang minoritas untuk melihat item-item yang

mungkin dapat membuat satu atau lebih kelompok yang tersinggung. Bagi peneliti, Bias tes adalah penyimpangan dari level performa si penguji. Bias berjalan dengan banyak nama dan memiliki banyak karakteristik, tetapi selalu melibatkan skor yang terlalu rendah atau terlalu tinggi untuk secara akurat mewakili atau memprediksi skill dr si penguji, kemampuan, atau sifat-sifat. Untuk menunjukkan Bias, dibutuhkan juga perkiraan skor.

Penguji tidak memiliki cara untuk memperkirakan bias tersebut. Tetapi merekadapat menyarankan item mana yang mungkin menyinggung, tapi teknik statistic diperlukan untuk menentukan bias tes Culture Fairness, Culture Loading, and Culture Bias Ada tiga konsep yang berbeda, yaitu culture loading dan culture Bias, sering dikaitkan dengan konsep culture fairness. Cultural loading adalah sejauh mana tes atau item khusus untuk suatu budaya tertentu. Sebuah tes dengan culture loading yang baik memiliki potensi bias lebih besar bila diberikan kepada orang-orang dari beragam budaya. Walaupun demikian, sebuah tes pemuatan budaya bias tanpa bias budaya. Reynolds, Lowe, et al. (1999) mengamati, jika tes dikembangkan dalam sebuah budaya, diberikan ke budaya lain akan menjadi masalah untuk verifikasi ilmiahnya. Skor tes mungkin tidak memberikan interpretasi yang sama untuk budaya yang berbeda tanpa bukti bahwa mereka interpretasi akan suara. Test Bias and Social Issues Penulis telah memperkenalkan berbagai kekhawatiran mengenai tes diberikan kepada etnis minoritas (Brown et al., 1999). kekhawatiran lain, Para pendukung tes berpendapat, gagal untuk menawarkan solusi atas perbedaan ras atau etnis (Scarr, 1981), untuk menghadapi kekhawatiran masyarakat atas ras diskriminasi ketika menangani bias tes (Gould, 1995, 1996), untuk menghormati penelitian ahli bahasa budaya dan ahli antropologi (Figueroa, 1991; Helms, 1992), untuk mengatasi khusus yang tidak memadai program pendidikan (Reschly, 1997), dan untuk memadai jumlah Afrika Amerika dalam norming sample (Dent, 1996). PERTANYAAN TERKAIT Uji bias dan etiologi etiologi kondisi berbeda dari pertanyaan tes Bias (review, Reynolds & Kaiser, 1992). pada kenyataannya, kebutuhan untuk etiologi penelitian muncul hanya setelah bukti bahwa perbedaan skor adalah salah satu yang nyata, bukan sebuah artefak bias. penulis menyimpulkan bahwa skor perbedaan sendiri menunjukkan perbedaan genetik, menyiratkan bahwa satu atau lebih kelompok secara genetik rendah. inferensi ini secara

ilmiah tidak lebih untuk dipertahankan dan etchically jauh lebih sedikit daripada gagasan bahwa mencetak perbedaan menunjukkan tes Bias. Jensen (1969) berpendapat bahwa tes mental ukuran, sampai batas tertentu, faktor g intelektual, ditemukan dalam studi genetika perilaku memiliki komponen genetik yang besar. Bias tes yang melibatkan kelompok dan individu   Bias dapat mempengaruhi nilai individu, serta kelompok-kelompok, dan kepribadian dan kemampuan tes. Oleh karena itu, para peneliti dapat dan harus menyelidiki kedua ini sumber bias. sebuah metode statistik menyeluruh disebut model linear umum premist pendekatan dengan memungkinkan kedua kelompok dan individu untuk dianalisis sebagai variabel independen. di samping itu, hal karakteristik, motivasi, dan Variabel nonintelletual lainnya (Reynolds, Lowe, et, al., 1999). Sternberg, 1980, Wechsler, 1975). mengakui analisis meskipun pengodean ulang, kategorisasi, dan expedients serupa. MENJELASKAN PERBEDAAN KELOMPOK Antara penelitian, isu bias budaya berasal sebagian besar dari temuan terdokumentasi dengan baik, sekarang terlihat di lebih dari 100 tahun penelitian, bahwa anggota kelompok etnis yang berbeda memiliki tingkat perbedaan dan pola kinerja pada banyak menonjol tes kemampuan kognitif. kecerdasan telah menghasilkan beberapa yang paling berpengaruh dan provokatif dari temuan ini (Elliot, 1987; Gutkin & Reynold, 1991; Reynolds, Chastain, Kaufirman & Mc.Lean, 1987; Spitz, 1986). negara di seluruh dunia, orang-orang yang berbeda etnis dan ras kelompok, jenis kelamin, tingkat sosial ekonomi, dan demografi lainnya kelompok mendapatkan hasil tes intelektual sistematis yang berbeda. Perbedaan IQ hitam-putih di Amerika Serikat telah mengalami penyelidikan ekstensif selama lebih dari 50 tahun. Jensen (1980), Shuey (1966), Tyler (1965), dan Willerman (1979) telah meninjau sebagian besar penelitian ini. Temuan kadang-kadang agak berbeda dari satu kelompok usia yang lain, namun mereka tidak berubah secara substansial dalam abad terakhir. rata-rata, Blacks berbeda dari Whites sekitar 1,0 standar deviasi, dengan kelompok-kelompok Putih memperoleh lebih tinggi skor. Perbedaan telah relatif

konsisten dalam ukuran untuk beberapa waktu dan di bawah beberapa metode penyelidikan. Sebuah pengecualian adalah pengurangan Hitam-Putih IQ selisih bagian intelijen dari K-ABC sekitar 0,5 standar penyimpangan, meskipun hasil ini kontroversial dan buruk dipahami (lihat Kamphaus & Reynolds, 1987, untuk diskusi). Selain itu, temuan tersebut konsisten hanya untuk Afrika Amerika. Lainnya, yang sangat beragam temuan muncul untuk Afrika asli dan lainnya Hitam populasi (Jensen, 1980). Para peneliti telah diperhitungkan sejumlah demografi variabel, status sosial ekonomi terutama (SES). Ukuran mean perbedaan Hitam-Putih di Amerika Negara kemudian berkurang ke 0,5-0,7 standar deviasi (Jensen, 1980; Kaufman, 1973; Kaufman & Kaufman, 1973; Reynolds & Gutkin, 1981) Tetapi kuat dalam penampilan. kelompok Asia, meskipun kurang diteliti secara menyeluruh dari kelompok hitam, telah secara konsisten dilakukan serta atau lebih baik dari Whites (Pintner 1931; Tyler, 1965; Willerman, 1979). Asia Amerika memperoleh rata skor kemampuan rata-rata (Flynn, 1991; Lynn, 1995;. Neisser et al, 1996; Reynolds, Willson, & Ramsay, 1999). Pencocokan merupakan pertimbangan penting dalam studi etnis perbedaan. Perbedaan antara kelompok mungkin karena tidak untuk menguji Bias ataupun etnis tetapi untuk SES, gizi, dan variabel lain yang mungkin terkait dengan hasil tes. Pencocokan pada variabel-variabel ini kontrol untuk asosiasi mereka. Keterbatasan pencocokan adalah bahwa hasil dalam regresi terhadap mean. responden hitam dengan harga diri yang tinggi, untuk Misalnya, dapat dipilih dari populasi dengan harga diri yang rendah. Ketika diperiksa kemudian, responden ini akan menguji dengan rendah diri, setelah mundur ke mean lebih rendah populasi mereka sendiri. skor tinggi ekstrim mereka dalam hal ini Kasus-yang karena kebetulan. Dokter dan konsumen penelitian juga harus menyadari bahwa kesamaan antara kelompok etnis yang jauh lebih besar daripada perbedaan. Prinsip ini berlaku untuk kecerdasan, kepribadian, dan yang paling karakteristik lainnya, baik psikologis dan fisiologis. Dari perspektif lain, variasi antara anggota dari salah satu kelompok etnis sangat melebihi perbedaan antara kelompok. Kesamaan besar antara kelompok muncul berulang kali dalam analisis statistik sebagai besar, statistic konstanta signifikan dan tumpang tindih yang besar antara yang berbeda rentang kelompok ‘skor.

Beberapa penulis (misalnya, Schoenfeld, 1974) telah membantah apakah perbedaan ras dalam kecerdasan adalah nyata atau bahkan bisa diteliti. Namun demikian, temuan yang sangat handal dari studi untuk belajar, bahkan ketika peserta studi mengidentifikasi mereka sendiri ras. Dengan demikian, adanya perbedaan tersebut telah memperoleh lebar penerimaan. Perbedaan yang nyata dan tidak diragukan lagi kompleks. Tugas yang tersisa untuk menggambarkan mereka secara menyeluruh (Reynolds, Lowe, et al., 1999) dan, lebih sulit, untuk menjelaskan mereka dalam arti kausal (Ramsay, 1998a, 2000). Kedua rendah Skor dari beberapa kelompok dan skor yang lebih tinggi dari orang lain harus menjelaskan, dan belum tentu dengan cara yang sama. Seiring waktu, eksklusif penjelasan genetik dan lingkungan telah kehilangan begitu banyak kredibilitas mereka bahwa mereka bisa nyaris tidak bisa disebut saat ini. Sebagian peneliti yang mengandaikan bahwa mencetak perbedaan nyata sekarang mendukung perspektif interaksionis. Perkembangan ini mencerminkan pergeseran serupa dalam psikologi dan ilmu sosial secara keseluruhan. Namun, ini relatif baru masker konsensus kegigihan halus asumsi sebelumnya bahwa perbedaan skor tes harus memiliki sebuah genetik atau secara lingkungan. Kontribusi relatif gen dan lingkungan masih memprovokasi perdebatan, dengan beberapa penulis tampaknya bertekad membangun didominasi genetik atau dasar didominasi lingkungan. Perspektif interaksionis menggeser fokus perdebatan dari berapa banyak bagaimana genetik dan faktor lingkungan berkontribusi karakteristik. Dalam prakteknya, tidak semua ilmuwan telah membuat pergeseran ini. UJI BIAS BUDAYA SEBAGAI PENJELASAN Bias penjelasan perbedaan skor telah menyebabkan budaya Uji Bias hipotesis (CTBH;. Brown et al, 1999; Reynolds, 1982a, 1982b; Reynolds & Brown, 1984b). Menurut CTBH, perbedaan kinerja rata-rata untuk anggota yang berbeda kelompok etnis tidak mencerminkan perbedaan nyata antara kelompok tetapi artefak dari tes atau dari proses pengukuran. Pendekatan ini menyatakan bahwa tes kemampuan mengandung kesalahan sistematik terjadi sebagai fungsi keanggotaan kelompok atau nominal lainnya variabel yang harus relevan. Artinya, orang-orang yang harus

memperoleh skor yang sama mendapatkan yang tidak sama karena etnis mereka, jenis kelamin, tingkat sosial ekonomi, dan sejenisnya. Untuk SES, Eells, Davis, Havighurst, Herrick, dan Tyler (1951) merangkum logika CTBH sebagai berikut: Jika (a) anak dari tingkat SES yang berbeda memiliki pengalaman yang berbeda jenis dan dengan berbagai jenis bahan, dan jika (b) kecerdasan tes berisi jumlah yang tidak proporsional dari bahan diambil dari pengalaman budaya yang paling akrab bagi highSES anak-anak, maka (c) tinggi SES-anak harus memiliki IQ yang lebih tinggi skor dari anak rendah SES. Sebagai Eells et al. diamati, argumen ini cenderung menyiratkan bahwa perbedaan IQ adalah artefak yang bergantung pada konten Item dan “tidak mencerminkan secara akurat apa Kemampuan penting yang mendasari “(hal. 4) dalam individu. Sejak tahun 1960-an, penjelasan CTBH telah merangsang banyak penelitian, yang pada gilirannya sebagian besar telah membantah penjelasan. ulasan panjang sekarang tersedia (misalnya, Jensen, 1980; Reynolds, 1995, 1998a; Reynolds & Brown, 1984b). Literatur ini menunjukkan bahwa tes yang perkembangannya, standardisasi, dan keandalan adalah suara dan didokumentasikan tidak bias terhadap kelahiran asli, ras Amerika atau etnis minoritas. Studi kadang-kadang menunjukkan bias tetapi biasanya kecil, dan paling sering nikmat minoritas. KESIMPULAN HARRINGTON Harrington (1968a, 1968b), tidak seperti penulis seperti Mercer (1979) dan Helms (1992), menekankan proporsional tapi sejumlah kecil peserta ujian minoritas dalam sampel norma. Peneliti ( Harrington, 1975, 1976) menggunakan enam strain genetika berbeda dari tikus untuk mewakili etnis. Dia kemudian terdiri enam populasi, masingmasing dengan proporsi yang berbeda dari enam strain tikus. Berikutnya, Harrington dibangun enam teks kecerdasan menyerupai Hebb – Williams labirin. labirin ini, mirip dengan Mazes subtes dari skala Wechsler, biasanya digunakan sebagai tes kecerdasan untuk tikus. Harrington beralasan bahwa tes bernorma pada populasi didominasi oleh strain tikus yang diberikan akan menghasilkan rata-rata lebih tinggi skor untuk strain yang. karya Harrington( 1975, 1976) dikurangi skor untuk ujian minoritas, sebuah jalan penting dari penyelidikan. Artifactually skor rendah pada tes kecerdasan dapat menyebabkan tindakan diskriminasi ras, seperti misassignment untuk program

pendidikan atau penolakan palsu kerja. Masalah ini adalah salah satu dari yang paling kasus pengadilan yang melibatkan uji Bias telah diperebutkan ( Reynolds , Lowe , et al . , 1999). PERBEDAAN MEAN DENGAN UJI BIAS Menurut para peneliti, perbedaan kelompok dalam skor rata-rata pada tes kemampuan merupakan bias. Mereka berpendapat bahwa tes tidak ada yang valid, alasannya bahwa kemampuan berbeda antar satu etnis dengan etnis lain. Sebagaimana dicatat oleh Reynolds, lowe, et al (1999) penerimaan posisi baik tidak dapat dipandang dari sudut ilmiah. Kekeliruan Egaliter Jensen (1980, Brown, et al 1999) bahwa ada tiga asumsi yang menghambat studi, yaitu: a) The Egalitarian Fallacy, yakni semua kelompok yang sama dalam karakteristik diukur dengan tes sehingga perbedaan skor harus berasal dari bias. b) The Culture-bound Fallacy, yakni pengulas dapat menilai peminatan budaya melalui inspeksi atau penilaian. c) Standarization Fallacy, yakni tes selalu bias jika di gunakan dengan kelompok yang tidak termasuk dalam jumlah besar dalam sample normal. Sebagai asumsi yang berlawanan pada setiap kelompok. Penelitian telah menunjukkan perbedaan kelompok untuk banyak kemampuan dan bahkan untuk kapasitas sensorik (Reynold, Wilson, et al 1999) kesamaan dan ketidaksetaraan harus ditemukan secara empiris, melalui pengamatan ilmiah Torrance(1980) mengamati bahwa anak berkulit hitam yang kurang di Amerika mendapat skor kreatifitas tinggi dari anak berkulit putih, tingkat kemampuan itu baik sama atau tidak itu dianggap sebagai keliru, karena asumsi kemampuan yang sama adalah yang paling toleran. Asumsi egaliter menyiratkan bahwa kreativitas yang tinggi dari anak-anak berkulit hitam adalah sebuah artefak dari tes. Asumsi kemampuan yang sama adalah yang paling relevan. Para ilmuan tidak pernah menganggap hipotesa nol sebagai bukti, Kemungkinan membuktikan hipotesa nol bisa jadi relevan disini. Bias itu hanya menunjukkan bahwa hanya dua

kelompok berbeda ketika sarana/sampel yang diambil untuk mewakili kinerja mereka. Pembatasan Perbedaan Rata-rata Menunjukkan bahwa kedua kelompok berbeda ketika sarana yang diambil untuk mewakili knerja mereka juga berbeda dan seberapa baik skor tipical analisis menunjukkan bahwa kedua kelompok berbeda dalam vaeriasi skor. Sikap tambahan diperlukan untuk memahami setiap nilai kelompok, skor akan simetris jika skor tinggi lancip secara bertahan,tapi skor rendah akan mengumpul. Sebuah tes dengan sampel besar dapat menghasilkan skor simetris. Bahkan sampel yang besar dapat menghasilkan skor simetris. Bahkan sampel yang besar dapat mencakup sampel yang sangat kecil dalam kelompok, hal itu yang menjadi perbedaan rata-rata untuk sampel itu sendiri. HASIL DARI PENELITIAN BIAS

Jensen review Jensen (1980) salah satu perhatian di bahas dalam review adalah penelitian rasional yang item tes bias berdasarkan konten mereka. Menurut para ilmuan, penilain rasional adalah yang didasarkan pada alasan daripada temuan empiris, seperti dalam penelitian anak berkulit hitam dengan anak berkulit putih CTBH pendukung mengkritik item ini sebagai bias terhadap anak anak berkulit hitam. Miele (1979) juga berpendapat bahwa bias mengarah pada anak berkulit hitam dari pada anak berkulit putih. Hasil penilaian sering tidak empiris secara rasional.

Prediktif dan Validitas Konstruktif Jensen (1980) Sistematik kesalahan dalam memprediksi kesalahan dalam memorediksi variable merupakan ciri-ciri dari orang di berbagai kelompok yang

berbeda. Bias ini terjadi ketika salah satu persamaan regresi tidak benar digunakan untuk dua atau lebih pada kelompok. Kesimpulan yang di capai oleh Jensen : a) Sebagian besar peneliti menunjukkan bahwa tes sama-sama berlaku untuk kelompok-kelompok ini dan b) Perbedaan prediksi yang berlebihan antara peserta ujian kulit hitam dengan peserta ujian kulit putih

Bias Situasional Jensen (1980) mengacu pada pengaruh dalam situasi, tetapi independen dari tes itu sendiri yang menilai tes dalam bias. Jensen menyimpulkan bahwa variable situasional ulasan tiidak mempengaruhi perbedaan kelompok dalam skor. Psychological Association, menyimpulkan tidak ada karakteristik tes membuat kontribusi besar bagi kulit hitam berdasarkan skor kecerdasan.

Review oleh Reynolds, Lowe dan Saenz Validitas Isi Konten validitas adalah sejauh mana isi tes merupakan sampel yang representatifdari perilaku yang akan diukur (Anastasi, 1988). Item dengan Bias konten harus berprilaku berbeda dari satu kelompok ke kelompok untuk orang yang berdiri sama pada karakteristik yang sedang diukur. Isi validitas dengan tes prestasi yang kompleks. Isu validitas isi dengan tes prestasi yang kompleks. Variabel penting untuk di pertimbangkan termasuk paparan instruksi, kemampuan umum dari kelompok dan akurasi serta spesifitas item untuk sampel. (Reynols, lowe, et al. 1999, Schmidt, 1983) Penelitian kecil yang tersedia untuk test kepribadian, tapi variable budaya yang dapat ditemukan untuk mempengaruhi suatu tes. Personality termasuk keyakinan tentang disiplin dan agresi, nilai-nilai yang

berkaitan dengan pendidikan dan pekerjaan dan persepsi tentang keadilan masyarakat terhadap kelompok seseorang. Bias

dapat

menyebabkan

temuan

melalui

penelitian

dengan

pertimbangan konstruk di ukur. Para peneliti menyimpulkan bahwa ada sedikit bukti jelas dari ras atau bias gender. Path Modeling dan Bias Prediktif Keith dan Reynolds telah menyarankan path analysis sebagai cara menilai prediktif bias. Gambar dibawah menunjukkan jalurnya, masing-masing poin menunjukkan sebuah variabel. Intelligent Test Score

Anggota Kelompok

True Ability

Achievement Test score

Achievement Test score

Anggota Kelompok School Achievment

Jalur dari anggota kelompok ke skor tes intelegensi menunjukkan bias. Nilai beta harus kecil. Tidak adanya jalur akan menunjukkan bias nol. Keterbatasan da;am pendekatan ini adalah bahwa tidak adanya kemampuan untuk mengukur. Oleh karena itu, sebuah model jalur tidak dapat menggabungkan kemampuan yang benar kecuali jika diukur dengan tiga atau lebih variabel yang telah ada. Gambar kedua diatas menunjukan tujuan dari model ini yang membuang keterbatasan. Disini terdapat kemampuan yang benar, dan jalur mengarah dari prediksi, Nilai skor yang didapat, sampai dengan kriteria, dan pencapaian di sekolah. Jalur dari anggota kelompok menunjukkan adanya bias. Maka dari itu, nilai beta harus kecil. Dengan tidak adanya jalur ini, maka akan mencerminkan bias nol. HUBUNGAN ANTARA PENGUJI DAN YANG DI UJI Sebuah temuan menemukan bahwa banyak tenaga kerja profesional psikologis menegaskan bahwa banyak penguji berkulit purih menghambat kinerja anggota kelompok minoritas (Sattler, 1988). Didalam 23 studi yang di lakukan oleh Sattler dan Gwynne, ditemukan bahwa kelompok ras penguji (kulit hitam atau kulit putih) dan orang-orang yang diuji dengan kelompok ras yang berbeda dengan penguji, tidak saling berasosiasi secara signifikan. Pertanyaan tentang kemungkinan efek penguji dan yang di uji sudah memiliki beberapa bentuk. Kaum minoritas yang di uji bisa saja mendapatkan pengurangan skor dikarenakan oleh respon yang berbeda dari mereka terhadap penguji. Seorang penguji dari ras yang berbeda bisa saja menciptakan kecemasan atau ketakutan kepada kelompok

minoritas.

Penelitian

hanya

memberikan

sedikit

dukungan

untuk

kemungkinan ini. Penguji berkulit putih mungkin lebih kurang efektif dibandingkan penguji berdarah amerika hispanik ketika sedang menguji anak-anak dan para remaja yang juga berdarah amerika hispanik. Pernyataan ini juga hanya mendapat sedikit dukungan. Gerkin menemukan bahwa etnik penguji maupun kemampuan berbahasa penguji tidak memiliki asosiasi dengan skor tes WPPSI IQs atau Leiter International Performance Scale pada anak-anak usia 4,5 dan 6 tahun. Morales dan George menemukan bahwa anak berdarah hispanik yang menggunakan dua bahasa pada kelas 1 sampai 3

mendapatkan skor WISC-R yang lebih tinggi daripada penguji non-hispanik yang hanya berbahasa menggunakan satu bahasa dengan penguji berdarah hispanik yang berbahasa lebih dari satu, saat menguji anak dengan bahasa spanyol dan inggris. Temuan diatas menunjukkan baha etnis si penguji memiliki hanya sedikit efek pada skor kaum minoritas. Para penguji perlu dilatih dengan baik dan kompeten. HELMS DAN KESETARAAN BUDAYA Menurut Helms (1992), kesetaraan budaya memiliki tujuh bentuk, yaitu 1. Kesetaraan fungsional, dimana nilai tes memiliki arti yang sama dengan grup kebudayaan yang berbeda. 2. Kesetaraan konseptual, bahwa item yang dites memiliki arti yang sama dan pemahaman yang sama dalam kelompok budaya yang berbeda. 3. Kesetaraan linguistik, dimana suatu tes memiliki arti linguistik yang sama dalam setiap kelompok budaya. 4. Kesetaraan psikometrik, Sejauh mana sebuah tes mengukur hal yang sama untuk kelompok yang berbeda. 5. Kesetaraan kondisi tes, bahwa tiap grup sama-sama familiar dengan prosedur didalam tes dan melihat tes tersebut sebagai sarana kemampuan menilai. 6. Kesetaraan kontekstual, dimana kemampuan kognitif dinilai sama dalam konteks yang berbeda-beda pada perilaku seseorang. 7. Kesetaraan sampling, dimana sampel yang dapat diuji pada tiap kelompok budaya tersedia pada pengembangan tes, validasi dan interpretasi. Untuk penelitian yang akan datang, Helms menyarankan beberapa point yaitu 1. Pengembangan pada pengukuran dalam ketergantungan budaya antar ras dan tingkat akulturasi dan asimilasi dalam item tes. 2. Modifikasi pada konten di dalam tes untuk menyertakan item yang mencerminkan diversitas budaya. 3. Pemeriksaan pada respon-respon yang tidak benar. 4. Gabungan dari psikologi kognitif kedalam mode penilaian yang interaktif.

5. Menggunakan teori-teori yang ada untuk memeriksa kriteria konten dalam lingkungan. 6. memisahkan norma-norma pada kelompok ras dalam tes yang sedang dilakukan.

TRANSLASI DAN TES KULTURAL Penggunaan tes pada budaya linguistik yang baru mengaruskan untuk di kembangangkan sejak awal. Adaptasi pada pendidikan dan tes psikologi paling sering terjadi dikarenakan oleh tiga alasan yaitu : 

Untuk memfasilitasi studi komparatif etnis-etnis yang ada.

Untuk memungkinkan seseorang di uji dengan bahasa mereka sendiri.

Untuk mengurangi waktu dan biaya dalam pengembangan tes yang baru.

Tes dalam bidang perbandingan lintas budaya masih relatif baru. Tes dalam bidang ini berfokus pada pemngembangan dan penggunaan pedoman beradaptasi, cara untuk berinterpretasi dan penggunaan data perbandingan lintas budaya dan perbandingan lintas nasional, lalu khususnya prosedur-prosedur untuk menciptakan kesetaraan item. Item pada tes dikatakan setara ketika masing-masing anggota linguistik dan kelompok budaya sama-sama memiliki pendirian pada proses pengukuran dengan memiliki kemungkinan yang sama dengan cara memilih respon item yang benar pada tes. Disain yang dipakai untuk membentuk kesetaraan item terdiri dari dua kategori yaitu judgmental dan statistical. Disain Judgmental berisikan tentang keputusan seseorang maupun suatu kelompok mengenai tingkat pengertian kesetaraan dari sebuah item. Terdapat tiga desain statistikal, tergantung pada karakteristik sampel yang ada. Lalu setelah administrasi dan penilaian, prosedur statistikal dipilih dan di gunakan untuk menilai DIF. Prosedur termasuk faktor analisis, teori respon item, regresi teori, dan teknik Mantek-Haenszel. Jika DIF secara signifikan bersifat statis, analisis tambahan diperlukan untuk menginvestigasi kemungkinan terjadinya bias atau kurangnya kesetaraan pada budaya atau bahasa yang berbeda.

NATURE VS NURTURE Bagian dari emosi seputar kontroversi tes bias berasal dari asosiasi dalam pikiran manusia dengan gagasan yang mengganggu diri sendiri, inferioritas genetik. Mengingat perbedaan yang ada, penjelasan genetik bukan berarti terelakkan. Dengan tidak adanya bias justu memungkinkan penyebab dari lingkungan sekitar. Perdebatan tentang nature vs nurture yang terjadi tidaklah berpengaruh dengan tes bias, tes bias tetap masih bisa berlangsung walaupun perdebatan itu masih belum terpecahkan. KONKLUSI DAN REKOMENDASI Konklusi pada hal-hal diatas adalah bahwa tes bias tidak benar-benar ada. Tes bias itu sebenarnya ada, namun sangat kecil sehingga menimbulkan pertanyaan tentang penting atau tidaknya hal tersebut. Tes bias direkomendasikan untuk terus di periksa secara ketat, dan ketidak telitian harus terus berlangsung, menggunakan teknik yang beragam terbaru. meskipun demikian, semua orang harus berhati-hati dalam melabel bias dalam ketiadaan, atau bertentangan dengan bukti yang reliabel. Diskriminasi merupakan kekhawatiran yang nyata dan menarik. Tes bias bukanlah simber utama diskriminasi. Karena, sumber seharusnya mengidentifikasi dan mengurangi diskriminasi mungkin lebih baik jika di arahkan langsung pada penyebab dalam dunia nyata, daripada dari tes standarisasi. Selain itu, kami mempertanyakan apakah tujuan kesempatan yang sama disajikan jika mungkin bukti diskriminasi yang dihasilkan itu terhapus oleh maksud yang baik dari si penguji. Berita di media mungkin juga bertanggung jawab atas persepsi yang diberikan kepada masyarakat bahwa tes dan penguji semuanya merupakan bias, atau adanya ketidak adilan. Reynolds, Lowe, et al. (1999) menyarankan empat pedoman untuk membantu memastikan penilaian yang adil, yaitu: 1. Menyelidiki kemungkinan rujukan sumber bias. 2. Memeriksa pengembang data pada suatu tes, untuk bukti analisis statistikal pada bias yang sudah terjadi.

3. Melakukan penilaian dengan pengukur yang ada dan paling dapat diandalkan. 4. Menilai beberapa kemampuan dan beberapa metode yang digunakan data akurat yang berasal dari berbagai sumber sebelum membuat keputusan tentang seorang individu. Selain itu, usahakan dokter untuk selalu menggunakan tes yang adil untuk kepentingan peserta ujian, Kami merekomendasikan bahwa konsumen tes mengevaluasi setiap langkah secara terpisah untuk memastikan bahwa hasil yang berkaitan dengan bias itu ada dan memuaskan. Sebuah perspektif filosofis yang muncul dalam literatur bias, sebelum publikasi, Pembuat tes tidak hanya harus mendemonstrasikan konten, isi, dan validitas prediktif, tetapi juga harus membangun konten analisis dalam beberapa bentuk untuk meyakinkan bahwa isi dalam tes yang bersifat ofensif itu tidak ada didalam tes tersebut. Kurangnya ketersediaan pada penemuan untuk tes kepribadian adalah kelemahan yang besar dalam literatur bias. Baru akhir-akhir ini para peneliti memulai untuk merespon pada permasalahan ini. peningkatan dalam penelitian juga dibutuhkan untuk neuropsychological test, untuk tes kemampuan dan prestasi belum di amati, untuk SES dan orang yang diuji yang berasalh dari kelompok minoritas yang di uji dengan penguji majoritas. Hasilnya sudah terduga, akan selalu mengindikasi adanya perbedaan lawan jenis, ras, etnis dan kesamaan dalam kelompok. Pada akhirnya, konsesus yang jelas pada keadilan, dan langkah-langkah yang harus di lalui untuk mendapatkan hal tersebut, sangat dibutuhkan antara orang-orang dengan tujuan kemanusiaan dan oleh orang-orang yang memiliki kebutuhan dalam dunia sains pada tes bias. Akomodasi menuju akhir pembahasan ini adalah untuk meyainkan bahwa setiap orang yang bersangkutan dengan tes yang diberikan merasa puas dan bahwa tes tersebut bukanlah bias. Tes bias dan keadilan adalah domain dalam kebutuhan yang besar terhadap konsensus, dan tujuan ini hanya bisa didapat dengan konsesi di semua sisi.