Klassinen testiteoria

Klassinen testiteoria / Kokeellinen psykologia

Testi on a tieteellinen väline siinä määrin kuin se mittaa, mitä se aikoo, eli se on pätevä, ja se mittaa hyvin, eli se on tarkka tai luotettava. Jos löydämme välineen, jota emme voi luottaa tarjoamiinsa toimenpiteisiin, koska ne vaihtelevat aika ajoin, kun mittaamme samaa kohdetta, sanomme, että se ei ole luotettava. Mittaa väline oikein jotain, sen on oltava tarkka, koska muuten mitataan mitat, mitataan se väärin. Siksi tarkkuus on välttämätön, mutta ei riittävä edellytys. Lisäksi sen on oltava pätevä, eli se, mitä se mittaa tarkasti, on se, mitä sen on tarkoitus mitata, eikä mikään muu.

Saatat myös olla kiinnostunut: Item Response Theory - Sovellukset ja testi

luotettavuus:

Absoluuttinen ja suhteellinen luotettavuus: Voimme käsitellä testin luotettavuuden ongelmaa kahdella eri tavalla, vaikka taustalla ne samaan aikaan.

Luotettavuus mittausten epätarkkuudessa: Kun kohde vastaa testiin, hän saa empiirisen pistemäärän, johon virhe liittyy. Jos virhe ei ollut, aihe saisi todellisen pistemäärän. Testi on epätarkka, koska empiirinen pisteet eivät vastaa todellista todellista pistemäärää. Tämä ero molempien pisteiden välillä on näytteenottovirhe, mittausvirhe. tyypillinen mittausvirhe tulee olemaan mittausvirheiden keskihajonta. tyypillinen mittausvirhe osoittaa testin absoluuttisen tarkkuuden, koska se mahdollistaa arvioidun mittauksen ja sen, joka olisi saatu, jos virhe ei olisi.

Luotettavuus mittausten stabiilisuutena: Testi on luotettavampi, sitä pysyvämpi tai vakaampi tulokset, joita se antaa toistettaessa. Mitä vakaampi tulokset ovat kahdessa tapauksessa, sitä suurempi on niiden välinen korrelaatio. Tätä korrelaatiota kutsutaan luotettavuuskerroin. Tämä ilmaisee meitä, ei virheen määrää, vaan testin johdonmukaisuutta itsensä kanssa ja sen tarjoamien tietojen pysyvyyttä. luotettavuuskerroin ilmaisee testin suhteellisen luotettavuuden.

Luotettavuuskerroin ja luotettavuusindeksi: - Luotettavuuskerroin Testi on testin korrelaatio itsensä kanssa, joka on saatu esimerkiksi kahdella rinnakkaisella muodolla: rxx. - Tarkkuusindeksi on korrelaatio testin empiiristen pisteiden ja sen todellisten pisteiden välillä: rxv Tarkkuusindeksi on aina suurempi kuin luotettavuuskerroin, jotta luotettavuuskertoimen selvittämiseksi nämä kolme klassista menetelmää kannattaa korostaa:

  • Etsi korrelaatio testin ja sen toistamisen välillä: Toistamis- tai testausmenetelmän menetelmä: Se koostuu saman testin soveltamisesta samaan ryhmään kahdessa tilanteessa ja lasketaan näiden kahden pistemäärän välinen korrelaatio. Tämä korrelaatio on luotettavuuskerroin. Tämä menetelmä antaa tavallisesti korkeamman luotettavuustekijän kuin muilla menetelmillä saadut kertoimet, ja se voi olla häiritsevien tekijöiden saastuttama.
  • Etsi korrelaatio testin kahden rinnakkaisen muodon välillä: Rinnakkaisten muotojen menetelmä: Valmistele kaksi saman testin rinnakkaista muotoa, toisin sanoen kaksi vastaavaa lomaketta, jotka antavat saman informaation ja koskevat samaa ryhmää aiheita. Näiden kahden muodon välinen korrelaatio on luotettavuuskerroin. Tällä menetelmällä vältetään toistamasta samaa testiä, jolloin vältetään häiritsevät uudelleenkokeiden luotettavuuden lähteet.
  • Etsi korrelaatio testin kahden rinnakkaisen puoliskon välillä: Kummankin puoliskon menetelmä: Testi jaetaan kahteen vastaavaan puolikkaaseen ja niiden välinen korrelaatio löytyy. Se on edullinen menetelmä, koska se on yksinkertainen ja ohittaa aikaisempien menettelyjen rajoitukset. Voit valita testin parittomat elementit muodostamaan puolet, ja parilliset elementit muodostavat toisen.

Luotettavuuskerroin ja rinnakkaisten testien välinen korrelaatio

luotettavuuskerroin testin osuus osoittaa, että todellinen varianssi on empiirisen varianssin suhteen: gráfico33 Testin luotettavuuskerroin vaihtelee välillä 0 ja 1. Esimerkiksi: jos kahden rinnakkaisen testin välinen korrelaatio on rxx´ = 0,80, tarkoittaa, että 80% testin varianssista johtuu todellisesta mittauksesta ja loput, eli 20% testin varianssista, johtuu virheestä. luotettavuusindeksi testin korrelaatio sen empiiristen pisteiden ja sen todellisten pisteiden luotettavuusindeksin välillä = luotettavuusindeksi on yhtä suuri kuin luotettavuuskertoimen neliöjuuri

Kun testin kaksi rinnakkaista muotoa on kehitetty, varianssianalyysimenetelmää käytetään varianssien homogeenisuuden ja toimenpiteiden välisen eron tarkistamiseksi. Jos varianssit ovat homogeenisia, keinojen välinen ero ei ole merkittävä, ja nämä kaksi muotoa on rakennettu samalla määrällä saman tyyppisiä ja psykologisia sisältöjä, voidaan sanoa, että ne ovat samansuuntaisia. Jos ei, sinun on uudistettava niitä, kunnes ne ovat. Luotettavuuden puute tunnistetaan rxx-arvolla´= 0 4.- Tyypillinen mittausvirhe: Empiirisen ja todellisen pisteen ero on satunnaisvirhe, jota kutsutaan mittausvirheeksi. Mittausvirheiden standardipoikkeamaa kutsutaan tyypilliseksi mittausvirheeksi. tyypillinen mittausvirhe mahdollistaa arvioinnin testin absoluuttisesta luotettavuudesta eli arvioida, kuinka paljon mittausvirhe vaikuttaa pisteeseen.

Luotettavuus ja pituus: Testin pituus viittaa sen elementtien määrään. Luotettavuus riippuu tästä pituudesta. Jos testi koostuu kolmesta osasta, aihe voi kerran saada pistemäärän 1 ja toisessa tai rinnakkain

Yhdestä tilasta toiseen pisteet ovat vaihdelleet yhden pisteen; kolmen pisteen yläpuolella on 33 prosentin vaihtelu, suuri vaihtelu. Jos koehenkilöt saavat tämän tyyppisiä satunnaisia ​​vaihteluja, testin korrelaatio itsensä tai testin kahden rinnakkaisen muodon kanssa pienenee huomattavasti eikä voi olla korkea. Jos testi on paljon pidempi, jos sinulla on esimerkiksi 100 kohdetta, aihe voi saada 70 pistettä kerrallaan ja 67 rinnakkain. Yhdestä toiseen se on muuttanut 3 pistettä; se on suhteellisen pieni varianssi suhteessa kokonaiskokeeseen, erityisesti 3%. Nämä pienet satunnaiset tämän suuruiset muutokset, jotka esiintyvät kohteiden pisteissä, kun ne menevät yhdestä muodosta rinnakkaiseen, ovat suhteellisen merkityksettömiä eivätkä vähene yhtä paljon kuin ennen molempien välistä korrelaatiota.

Luotettavuuskerroin on paljon suurempi kuin edellisessä tapauksessa. Spearman-Brown-yhtälö ilmaisee luotettavuuden ja pituuden välisen suhteen. Testin tarkkuus on nolla, kun pituus on 0, ja se kasvaa pituuden kasvaessa. Vaikka kasvu on suhteellisen pienempi, jonka osan pituus on suurempi. Tämä tarkoittaa, että tarkkuus kasvaa paljon alussa ja suhteellisen vähemmän myöhemmin. Kun pituus pyrkii äärettömyyteen, luotettavuuskerroin pyrkii

Suurentamalla testin pituutta sen tarkkuus kasvaa, koska se lisää todellista varianssia nopeudella, joka on suurempi kuin virheen varianssi. Tämä tarkoittaa, että testin tarkkuus kasvaa, koska virheen aiheuttama varianssin osuus pienenee. Rulonin kaava sekä Flanaganin ja Guttmanin kaava ovat erityisen käyttökelpoisia laskettaessa luotettavuuskerrointa näiden kahden puoliskon menetelmällä. Nämä ovat kaavoja, joita käytetään luotettavuuskertoimen laskemiseen.

Luotettavuus ja johdonmukaisuus: Luotettavuuskerroin löytyy myös toisella tavalla, se on ns alfa-kerroin tai yleistettävyyskerroin tai edustavuus (Cronbach). Tämä alfa-kerroin ilmaisee tarkkuuden, jolla jotkut kohteet mittaavat persoonallisuuden tai käyttäytymisen näkökulmaa. Sitä voidaan tulkita seuraavasti: Kaikkien mahdollisten kohteiden keskimääräisen korrelaation estimointi tietyssä aspektissa. Mitta koestuksen tarkkuudesta sen johdonmukaisuuden tai sisäisen johdonmukaisuuden mukaan (sen elementtien välinen suhde, missä määrin testielementit mittaavat kaikki samat) ja sen pituus. Osoitetaan testin edustavuudesta eli määrästä, jossa se koostuu näytteestä, joka edustaa saman tyyppistä ja psykologista sisältöä sisältävien mahdollisten kohteiden väestöä. alfa-kerroin heijastaa lähinnä kahta tarkkoja käsitteitä testin tarkkuudessa: 1. Sen elementtien välinen yhteys: missä määrin ne kaikki mittaavat samaa asiaa.

Testin pituus: kun näytteen tapauksia lisätään, ja jos järjestelmälliset virheet poistetaan, näyte edustaa väestöä paremmin kuin se on otettu, ja on epätodennäköisempää, että vahingossa tapahtuva virhe on mukana. Jos testin kohteet ovat dikotomeja (kyllä ​​tai ei, 1 tai 0, sopimus tai erimielisyys jne.), Alfa-kertoimen yhtälö yksinkertaistuu, mikä johtaa yhtälöihin Kuder-Richardson (KR20 ja KR21). Tiettyjen kohteiden lukumäärän vuoksi testi on luotettavampi, kun se on homogeenisempi. Alfa-kerroin kertoo meille luotettavuuden, koska se edustaa testin elementtien homogeenisuutta ja johdonmukaisuutta tai sisäistä johdonmukaisuutta.

Standardit ja luotettavuuskriteerit

Koekappaleen mallitilanteen mukaan testin tavoitteena on arvioida mittaus, joka saataisiin, jos kaikkia näytetilan kohteita käytettäisiin. Tämä toimenpide olisi todellinen piste, johon todelliset mittaukset ovat suunnilleen enemmän tai vähemmän. Riippuen siitä, missä määrin kohteiden näyte korreloi todellisten pisteiden kanssa, testi on enemmän tai vähemmän luotettava. Tässä mallissa näytteenottotilan kaikkien kohteiden välisten korrelaatioiden matriisi on keskeinen, ja tämä mallimalli vaatii enemmän suoraan sisäistä johdonmukaisuutta ja siltä osin kuin se saavuttaa sen, epäsuorasti takaa vakauden..

Rinnakkaiskokeiden lineaarinen malli vaatii enemmän pisteiden vakautta ja siinä määrin kuin se saavuttaa vakauden, se suosii epäsuorasti sisäistä johdonmukaisuutta. Jos käytämme testiä yksittäisten diagnoosien ja ennusteiden laatimiseksi, luotettavuuskertoimen tulisi olla 0,90. Ennusteissa ja kollektiivisissa luokituksissa ei ole niin paljon vaatimusta, vaikka se ei ole kätevää päästä pois paljon 0'90: stä 0'80: een.

Joskus tietyissä testeissä, kuten persoonallisuustestissä, on vaikea saavuttaa yli 0,70 kertoimia. Jos rinnakkaisia ​​muotoja tai rinnakkaisia ​​puolia käytetään useamman tai vähemmän suuren aikavälin jälkeen, satunnaiset virheet voivat olla lukuisia kuin alfa-kertoimeen vaikuttavat virheet. Tämä johtuu siitä, että se, mikä vähentää korrelaatiota, ei ole pelkästään testille ominaisia ​​satunnaisvirheitä ja yksittäisiä kertoja, jotka ottavat huomioon alfa-kertoimen, vaan vaikuttavat myös kaikkiin virheisiin, jotka voivat tulla kahdesta eri tilanteesta , joka voi poiketa useista yksityiskohdista. Siksi alfa-kerroin on yleensä suurempi kuin muut kertoimet.

Lukuun ottamatta samaa testiä toistettua kerrointa, koska on todennäköisempää, että ensimmäisen sovelluksen satunnaiset virheet toistetaan toisessa, ja sen sijaan, että niiden välinen korrelaatio vähenisi, lisää sitä. On varmistettava, että toinen sovellus on täysin riippumaton ensimmäisestä sovelluksesta. Jos tämä saavutetaan, tämä on helpoin ja halvin tapa ja suositeltavaa, kun yritämme arvostaa pisteiden vakautta, varsinkin pitkiä aikoja ja monimutkaisia ​​testejä. > Seuraava: Testien voimassaolo

Tämä artikkeli on puhtaasti informatiivinen, online-psykologiassa meillä ei ole kykyä tehdä diagnoosia tai suositella hoitoa. Kutsumme sinut käymään psykologissa käsittelemään tapaustasi.

Jos haluat lukea lisää artikkeleita, jotka ovat samanlaisia Klassinen testiteoria, Suosittelemme, että kirjoitat kokeellisen psykologian luokkaan.