In this study, theobjective was to compare different scale linking methods over the PISA 2012mathematics literacy data. For this purpose, scores obtained from two selectedbooklets were equated using scale linking (mean-mean, mean-sigma,Stocking-Lord, Haebara) and test equating methods (IRT true-score equating, IRTobserved-score equating) based on the item response theory, and resultsobtained from different methods were analyzed. The study was conducted usinganswers given to mathematics tests in booklet-4 and booklet-11. Therefore, thesample consists of 716 students in Turkey; 348 of these participants are thetakers of booklet-4, 368 of them are the takers of booklet-11. In order to equate test forms “the common-itemnonequivalent groups” design was used in this research. In the firststage of data analysis, unidimensionality assumption of the item responsetheory was analysed. Then PARSCALE4.1 was used to estimate item and ability parameters. Generalized partialcredit and two-parameter logistic model were used to estimate parameters.Afterwards STUIRT program was usedfor scale linking for four different methods. In the last steptest scores obtained from different forms were equated by using POLYEQUATEprogram. Equating error obtained from different methods calculated withweighted mean squares error (WMSE) index. Resultsshowed that Stocking-Lord method had the smallest equating errorin true-score equating and Haebara method had the smallest equating error inobserved-score equating. The amount of maximum error has been established thatof the mean-sigma method.
Bu çalışmada farklı ölçekdönüştürme yöntemlerini PISA 2012 matematik okuryazarlığı verileri üzerindekarşılaştırmak amaçlanmıştır. Bu amaçla seçilen iki kitapçıktan elde edilenpuanlar madde tepki kuramına dayalı ölçek dönüştürme (ortalama-ortalama,ortalama-standart sapma, Stocking-Lord, Haebara) ve test eşitleme yöntemleri(MTK gerçek-puan eşitleme, MTK gözlenen-puan eşitleme) kullanılarak eşitlenmişve farklı yöntemlerden elde edilen sonuçlar incelenmiştir. Çalışma, 4 ve 11numaralı kitapçıklardaki matematik testlerine verilen cevaplar kullanılarakyürütülmüştür. Bu nedenle araştırmanın çalışma grubunu Türkiye örnekleminde 4numaralı kitapçığı cevaplayan 348 ve 11 numaralı kitapçığı cevaplayan 368 olmaküzere toplam 716 öğrenci oluşturmaktadır. Çalışmada test eşitleme için “denkolmayan gruplarda ortak madde deseni” kullanılmıştır. Verilerin analizinin ilkaşamasında madde tepki kuramının tek boyutluluk varsayımı test edilmiştir.Ardından PARSCALE 4.1 programı ile madde ve yetenek parametrelerikestirilmiştir. Parametre kestiriminde iki-parametreli lojistik model vegenelleştirilmiş kısmi kredi modeli kullanılmıştır. Daha sonra STUIRT programıile dört farklı yöntem kullanılarak ölçek dönüştürme işlemi yapılmıştır. Sonaşamada ise her iki formdan elde edilen test puanları POLYEQUATE programı ileeşitlenmiştir. Farklı yöntemlerden elde edilen hata miktarları iseağırlıklandırılmış hata kareleri ortalaması (WMSE) ile hesaplanmıştır. Çalışmasonucunda, en az hata miktarına sahip yöntemin gerçek-puan eşitlemedeStocking-Lord, gözlenen-puan eşitlemede ise Haebara yönteminin olduğubulunmuştur. En yüksek eşitleme hatasını ise ortalama-standart sapma yöntemininverdiği tespit edilmiştir.