Published Articles

Joint Diseases & Related Surgery

Vol 28 • No 3 • 2017: 177-181
« Go Back
Intraobserver and interobserver reliability assessment of tibial plateau fracture classification systems
Tibia plato kırıkları sınıflandırma sistemlerinin gözlemcilerin kendi içlerinde ve aralarındaki güvenirliğinin değerlendirilmesi

Anıl Taşkesen1, İsmail Demirkale1, Mustafa Caner Okkaoğlu1, Mahmut Özdemir1, Mustafa Gökhan Bilgili2, Murat Altay1
1Department of Orthopedics and Traumatology, University of Health Sciences, Keçiören Training and Research Hospital, Ankara, Turkey

2Department of Orthopedics and Traumatology, University of Health Sciences, Bakırköy Dr. Sadi Konuk Training and Research Hospital, Istanbul, Turkey

ABSTRACT Objectives: This study aims to assess the intra- and interobserver reliability of commonly used tibial plateau fracture classification systems.
Patients and methods: This retrospective cohort study included computed tomography (CT) and plain radiographic images (lateral and anteroposterior X-rays) of 60 patients (40 males, 20 females; mean age 45.9 years; range 18 to 80 years) who presented to two orthopaedic clinics between January 2011 and January 2015 with unilateral tibial plateau fractures. All plain X-rays (XR) and CT images were evaluated by four observers on two separate occasions, 1.5 months apart. All fractures were classified according to the Arbeitsgemeinschaft für Osteosynthesefragen- Orthopaedic Trauma Association (AO-OTA), Schatzker, Hohl and Moore, Luo and revised Duparc systems. Intraobserver reliability was measured with Cohen’s kappa (?) coefficient and interobserver reliability with Fleiss’ kappa coefficient.
Results: When Schatzker classification was performed, interobserver reliability was in moderate level for (?=0.51) for XR and in substantial level for CT (?=0.61). When AO/OTA classification was used, interobserver reliability was in moderate level for both methods of diagnosis (?XR=0.43 and ?CT=0.54, respectively). In the Hohl and Moore classification, the interobserver reliability was also moderate for both methods of diagnosis (?XR=0.45 and ?CT=0.51, respectively). Revised Duparc classification showed the lowest interobserver reliability ranging from fair to moderate level (?XR=0.27-0.55 and ?CT=0.44-0.61). Interobserver reliability for Luo classification was ?CT=0.47. Intraobserver reliability for CT in Luo classification was in substantial level for observers 1, 2 and 3 (?CT=0.67-0.71) and in perfect level for observer 4 (?CT=0.84). Intraobserver reliability was in substantial level in Schatzker classification and in moderate level at the other classifications.
Conclusion: Among the classification systems compared in this study, Schatzker was the most reliable particularly when CT was used. On the other hand, revised Duparc classification presented the worse reliability results due to its complexity and different morphological subtypes.

Key words: Classification; interobserver variation; reliability; tibial plateau fracture

ÖZ Amaç: Bu çalışmada sıkça kullanılan tibia plato kırıklarının sınıflandırma sistemlerinin gözlemcilerin kendi içlerinde ve aralarındaki güvenirliği değerlendirildi.
Hastalar ve yöntemler: Bu retrospektif kohort çalışmaya iki ortopedi kliniğine Ocak 2011 - Ocak 2015 tarihleri arasında tek taraflı tibia plato kırığı nedeniyle başvuran 60 hastanın (40 erkek, 20 kadın; ort. yaş 45.9 yıl; dağılım 18-80 yıl) bilgisayarlı tomografi (BT) ve düz radyografik görüntüleri (yan ve ön-arka grafiler) dahil edildi. Tüm düz grafiler (XR) ve BT görüntüleri dört gözlemci tarafından 1.5 ay arayla iki farklı zamanda değerlendirildi. Tüm kırıklar Arbeitsgemeinschaft für Osteosynthesefragen-Orthopaedic Trauma Association (AO-OTA), Schatzker, Hohl ve Moore, Luo ve revize edilmiş Duparc sistemlerine göre sınıflandırıldı. Gözlemcilerin kendi içlerindeki güvenirlik Cohen'in kappa (?) katsayısı, gözlemcilerin aralarındaki güvenirlik Fleiss kappa katsayısı ile ölçüldü.
Bulgular: Schatzker sınıflandırması yapıldığında gözlemcilerin aralarındaki güvenilirlik XR için orta düzeyde (?=0.51), BT için tatmin edici düzeyde idi (?=0.61). AO/OTA sınıflandırması kullanıldığında gözlemcilerin aralarındaki güvenilirlik iki tanı yöntemi için de orta düzeyde idi (sırasıyla, ?XR=0.43 ve ?BT=0.54). Hohl ve Moore sınıflandırmasında yine gözlemcilerin aralarındaki güvenirlik iki tanı yöntemi için de orta düzeyde idi (sırasıyla, ?XR=0.45 ve ?BT=0.51). revize edilmiş Duparc sınıflandırması gözlemciler arasında vasat ile orta düzeyde olarak en az güvenirlik gösterdi (sırasıyla, ?XR=0.27-0.55 ve ?BT=0.44-0.61). Luo sınıflandırması için gözlemcilerin aralarındaki güvenirlik ?BT=0.47 idi. Gözlemcilerin kendi içlerindeki güvenirlik BT için Luo sınıflandırmasında 1, 2 ve 3. gözlemciler için tatmin edici düzeyde (?BT=0.67-0.71), 4. gözlemci için mükemmel (?BT=0.84) düzeyde idi. Gözlemcilerin kendi içlerindeki güvenirlik Schatzker sınıflandırmasında tatmin edici düzeyde, diğer sınıflandırmalarda orta düzeyde idi.
Sonuç: Bu çalışmada karşılaştırılan sınıflandırma sistemlerinin arasında özellikle BT kullanıldığında en güvenilir olan Schatzker idi. Revize edilmiş Duparc sınıflandırması ise, kompleksitesi ve farklı morfolojik alt tipleri nedeniyle en kötü güvenirlik sonuçları gösterdi.

Anahtar kelimeler: Sınıflandırma; gözlemcilerin aralarındaki farklılık; güvenirlik; tibia plato kırığı.

Taşkesen A, Demirkale İ, Okkaoğlu M C, Özdemir M, Bilgili M G, Altay M. Intraobserver and interobserver reliability assessment of tibial plateau fracture classification systems. Joint Dis Rel Surg 2017; 28(3):177-181