الثلاثاء , 19 سبتمبر 2017
الرئيسية / الأساتذة / تقييم صدق الإتساق الداخلي

تقييم صدق الإتساق الداخلي

التهافت على استعمال ما يدعى بصدق الاتساق الداخلي Validity of internal consistency (ارتباط الفقرات ببعدها، وارتباط الأبعاد بالاختبار ككل)، ومواطن قصورها.

يكاد لا يخلو بحث من البحوث المنشورة، أو بحث من بحوث الماجستير والدكتوراه من استعمال ما يدعى بصدق الاتساق الداخلي والذي يصنف كإجراء من إجراءات اختبار صدق المفهوم أو الصدق البنائي، أو الصدق التكويني، أو صدق التكوين الفرضي (كثرت المسميات والهم واحد) [Construct Validity]. لكن هل هذا الاستعمال الواسع لهذه الطريقة في تقدير الصدق منبثقة من إدراك عميق للمنطق المبطن لهده الطريقة، أم صادر عن إدراك سطحي وشكلي لحقيقتها، ولا سيما وأن الكتب المدخلية، والكتب الصفراء، وصفحات الفيسبوك (وما أكثر مشايخ الإفتاء في القياس ) تعجّ بأفكار غير دقيقة، يدلي بها أصحابها بلغة باتة جازمة، وغاب عنا أن جل قضايا القياس قضايا اجتهادية وليست حقائق ثابتة؟!!!
السبب في الاستعمال المبالغ فيه لهذه الطريقة لا يكمن في إدراك الأبعاد المنطقية العميقة لصدق الاتساق الداخلي، وإنما تتلخص جل الدواعي والأسباب في جوانب شكلية. منها ما يمارسه الرقم من إغراء على الباحث. فالحصول على جداول لمعاملات الارتباط بين كل فقرة ببعدها، ومعاملات الارتباط بين كل بعد بالاختبار ككل، (ومن الباحثين من يضيف معاملات الارتباط مباشرة بالدرجة الكلية للاختبار أو المقياس)، ويسر الحصول على هذه النتائج الكمية باستعمال SPSS مثلا، ووضعها في متن البحث، ولا سيما في فصل الطريقة، تجعل الباحث يعتقد ضمنيا أن هذه النتائج أو المؤشرات الكمية تقدم براهين موضوعية على توفر الصدق في الأداة المستعملة ما دامت تقوم على بيّنات كمية موضوعية وليست براهين كيفية ذاتية. إذن سهولة الطريقة ويسرها أولا، وسهولة الحصول على النتائج باستعمال أي حزمة إحصائية ( SPSS مثلا) ثانيا، و البرهان الكمي الذي تقدمه هذه الطريقة ثالثا، واستعمال محك الدلالة الإحصائية لمعامل الارتباط للاحتفاظ بالفقرات أو استبعادها رابعا، كل هذه الأسباب جعلت هذه الطريقة تحصل على جائزة جينيس Guinness في كثرة الاستعمال وفي الشهرة أيضا.

ما هي إذن جوانب القصور التي تبعث على القلق والانشغال من استعمال هذه الطريقة؟

أولا ـ لا تدل الدلالة الإحصائية بالضرورة على أن محتوى الفقرة منسجما مع محتوى البعد أو المقياس (ما يقيسه البعد أو المقياس). وكثيرة هي الرسائل التي احتفظ صاحبها بالفقرات الدالة إحصائيا، على الرغم من أن الدلالة النظرية (مغزى) بعض الفقرات لا تنسجم منطقيا وتنظيريا مع البعد أو مع المقياس.

ثانيا ـ يعتمد جل الباحثين تقريبا محك الدلالة الإحصائية وحدها للاحتفاظ بفقرات المقياس، دون مراعاة شدة العلاقة أو قوتها. والأمران (الدلالة الإحصائية وشدة العلاقة) غالبا لا يجتمعان. فمعامل ارتباط قدره 0.30 بين فقرة معينة ببعدها يكون دالا إحصائيا عند مستوى دلالة 0.05 عندما يكون حجم العينة يساوي 40 فردا، والارتباط الذي قدره 0.25 يكون دالا إحصائيا عندما يكون حجم العينة يساوي 60 فردا . ويكفي أن يساوي معامل الارتباط 0.20 فقط ليكون دالا إحصائيا عندما يرتفع حجم العينة إلى 100 فردا .
فما معنى معاملات الارتباط قدرها 0.30 أو 0.25 أو 0.20 ؟ قيم معاملات الارتباط صندوق أسود لا تنصاع إلى القراءة المباشرة، ولذلك يستحسن تحويلها إلى معاملات تحديد بتربيع قيم معاملات الارتباط حتى يسهل تصورها أي قراءتها، ويسهل تبين شدتها. فالارتباط الذي قدره 0.30 يساوي عند تربيعة 0.09 أي 9%، ومعناه أن الفقرة تفسر نسبة مئوية مقدراها تسعة بالمائة من مجمل التباين الذي يحتوي عليه البعد (والذي يستعصي عليه تصور التباين يمكن أن يستبدله بالمعلومات، أي أن الفقرة تمثل تسعة بالمائة من معلومات البعد). والارتباط الذي قدره 0.20 يساوي عند تربيعة 0.04، أي التباين المشترك أو المعلومات المشتركة بين الفقرة والبعد منخفضة جدا بحيث تساوي أربعة بالمائة فقط. أما باقي التباين أو المعلومات التي يحتوي عليها البعد (96%) ، وهو يكاد يكون كل التباين أو المعلومات فلا تمثلها الفقرة، على الرغم من أن هذه الفقرة دالة إحصائيا إذا كان حجم العينة 100 فردا.

رابعا ـ ومن مفارقات هذه الطريقة في تقدير الصدق، أن الارتباطات المرتفعة للفقرات ببعدها قد يتناقض أحيانا مع مدى انسجام الدلالة النظرية للفقرة (مغزى الفقرة ومحتواها) مع الدلالة النظرية للبعد. فقد يكون معامل الارتباط مرتفعا جدا إلا أن محتوى الفقرة لا يلتحم (لا ينسجم مع ) بمحتوى البعد، وقد نجد في المقابل بعض الفقرات غير الدالة إحصائيا (والتي تستبعد من المقياس)، أو ذات الارتباط المنخفض بالبعد، ومع ذلك نجد أن معناها أكثر التحاما بمعنى بالبعد وأكثر انسجاما معه. أسوق مثالا لمقياس استراتيجيات التعامل مع الضغوط مقتطف من رسالة دراسات عليا شاركت في مناقشتها. وسأكتفي بإيراد بعد من أبعاد المقياس وهو بعد إستراتيجية التجنب دون الأبعاد الأخرى التي ينطوي عليها المقياس (إستراتجية التركيز على المشكلة وإستراتيجية التمركز حول الانفعال)، في جدول ارتباطات الفقرات بهذا البعد (بعد إستراتيجية التجنب) الذي أورده الطالب، توجد ثلاث فقرات لم ترتبط ارتباطا دالا ببعد إستراتيجيات التجنب وهي الفقرة23: ” أذهب إلى سهرة أو حفل عند الأصدقاء “؛ والفقرة 40: ” أشاهد فلما “، والفقرة 44: ” إيجاد وسيلة لعدم التفكير في الوضعية لتجنبها “، وبالتالي تم حذف هذه الفقرات من البعد. لنقارن الفقرة رقم 44: ” إيجاد وسيلة لعدم التفكير في الوضعية لتجنبها “ذات الارتباط غير الدال والضعيف ببعدها، بالفقرة رقم 12: ” أتناول أحد أكلاتي المفضلة”والتي ترتبط ارتباطا قويا ببعدها (0.87) وذات الدلالة الإحصائية المرتفعة، وذات شدة مرتفعة، فأي الفقرتين أكثر دلالة على إستراتيجية التجنب: الفقرة رقم 12أم الفقرة رقم 44؟. إنه لمن الواضح والجلي أن الفقرة رقم 44التي تركز على البحث عن وسيلة لصرف الذهن عن التفكير والانشغال بالمشكلة أقوى دلالة على بعد إستراتيجية التجنب من الفقرة رقم 12 التي تتعلق بتناول الأكلة المفضلة، لأن هذا السلوك قد يرتبط وقد لا يرتبط بسلوك التجنب. وإجمالا الفقرات الثلاث غير الدالة تنطوي على محتوى ذي علاقة قوية ببعدها: إستراتيجية التجنب، وحذفها قد يعزز الاتساق ولكن على حساب الصدق ذلك أن إستراتيجية التجنب تحرم من تغطية بعض جوانبها أو معانيها نتيجة لحذف هذه الفقرات.
خامسا ـ إن طريقة صدق الاتساق الداخلي تقدر الصدق عن طريق الاتساق. والاتساق هو أحد الأبعاد للصدق، لكنه غير كاف كحجية على الصدق، بل يحتاج إلى أدلة أخرى للبرهنة على توفر الصدق. لأن المقياس (وليكن مثلا مقياس التوافق) قد يتمتع بتماسك داخلي لفقراته، أي باتساق داخلي عال، غير أن الاختبار لما ربط بمحكين أي اختبارين آخرين على مستوى كاف من الثبات والصدق في مجالهما: اختبار يقيس التوافق العام، واختبار يقيس المجاراة أو الانصياع. علما بأن الباحث يتوقع أن تكون العلاقة قوية بين اختباره وبين مقياس التوافق العام (الصدق التقاربي Convergent Validity)، ويتوقع أن تكون العلاقة ضعيفة في الشدة، أو تكون غير دالة بين اختباره وبين مقياس المجاراة (الصدق التمايزي Discriminant Validity)، لأنه لا يريد أن يتلوث مقياسه بالعبارات التي تقيس المجاراة لاختلافها الدلالي عن الفقرات التي ينبغي أن تقيس التوافق. غير أن النتائج أظهرت أن اختباره يرتبط ارتباطا مرتفعا بمقياس الجأاراة، وارتباطا منخفضا أو غير دال بمقياس التوافق العام. ومعنى ذلك أن مقياسه رغم توافره على اتساق داخلي مرتفع، غير أن الاختبار في جوهره يقيس المجاراة ولا يقيس التوافق. أي لا بد أن تتوفر أدلة أخرى فضلا عن الاتساق لإقامة الدليل على توفر الصدق.
سادسا ـ لا ننسى أن طرق تقدير الثبات تقدمان ثلاثة أنواع من الأدلة: دليل الاستقرار، ودليل التكافؤ ودليل الاتساق. والتكافؤ يقوم في جوهره على فكرة الاتساق، وبالتالي يقدم الثبات دليلين هامين للدلالة على صلاحية المقياس: دليل الاستقرار، ودليل الاتساق. وطرق التجزئة النصفية (جاتمان، سبيرمن-براون)، وطرق الاتساق والتجانس الداخلي للاختبار (كيودرـرتشاردسن، ومعامل ألفا لكرونباخ) تقوم أساسا على تقدير الاتساق الداخلي لمكونات المقياس.
والسؤال الحرج هو: أليس ما يقدمه الثبات باستعمال معامل ألفا لكرونباخ مثلا من دليل على توفر الاتساق الداخلي للمقياس بكاف، ويغنينا عن حجية الاتساق التي تقدمها طريقة صدق الاتساق الداخلي؟
إن معادلة ألفا تقوم أساسا على مدى التغاير Covariances بين فقرات المقياس، وقدّم كرونباخ صيغا عديدة قائمة أساسا على التغاير على الرغم من أن معادلته المتداولة بكثرة تقوم على التباين (تباين فقرات المقياس، وتباين الاختبار ككل). وعند توفر شرط تجانس المقياس أي أن يقيس المقياس بعدا واحدا، وتثبيت طول الاختبار (عدد الفقرات التي يحتوي عليها)، تقدم طريقة ألفا لكرونباخ دليلا أقوى مما تقدمة طريقة صدق الاتساق الداخلي على تجانس المقياس لعدة أسباب منها:
أولا: أنها لا تقوم على الدلالة الإحصائية، فالعبرة بمستوى الثبات الإجمالي (ويقصد بذلك ألا يقل معامل ألفا عن 0.6 في الدراسات الاستطلاعية، وعن 0.7 في الدراسات الأساسية، أو ما يقارب هذين المستويين)، وبالتالي لا نحكم على كفاية معامل ألفا بناء على الدلالة الإحصائية،
والسبب الثاني أنه يقدم مؤشرا كليا على اتساق المقياس (شريطة تجانسه)، أو على مستوى كل بعد (باعتبار البعد يكون متجانسا)، في حين أن طريقة صدق الاتساق الداخلي تفتقر إلى المؤشر العام للاتساق على مستوى المقياس وعلى مستوى البعد.
والسبب الثالث أن معامل ألفا لا يؤدي إلى هدر عدد كبير من الفقرات كما هو الشأن بالنسبة لطريقة صدق الاتساق الداخلي التي غالبا ما يسفر استعمالها عن حذف عدد من العبارات أو الفقرات لافتقارها للدلالة الإحصائية. وعند بتر أعضاء المقياس بحذف العديد من فقراته، فإنه يفتقر إلى التغطية الدلالية النظرية الكافية للمفهوم الذي يهدف الاختبار إلى قياسه. وبهذا نحارب الصدق عن طريق الصدق. وأعتقد أن الصدق يكتفي بما يقدمه له الثبات (معامل ألفا أو أي طريقة أخرى من طرق الثبات) من دليل على الاتساق، أما دليل الاتساق الذي تقدمه طريقة صدق الاتساق الداخلي فتعتبر إضافة لا تقدم جديدا لحجية الاتساق التي قدمها الثبات، بل إضافة غالبا ما تضرّ ببيّنة المقياس أكثر مما تنفعه إذ تؤدي إلى بتر أعضاء المقياس، باستبعاد العديد من فقراته، والإبقاء على الفقرات التي لا تضيف جديدا إلى دلالة المقياس رغم دلالتها الإحصائية.
ومع ذلك يحتاج الصدق إلى أدلة أخرى غير دليل الاتساق، وهذه الأدلة الأخرى تتجاوز إمكانية طرق الثبات، وتتجاوز بكثير إمكانية طريقة صدق الاتساق الداخلي.
خلاصة هذه المعالجة، يجب أن تستعمل طريقة صدق الاتساق الداخلي في أضيق الحدود لأنها لا تضيف دليلا جديدا للصدق إلى دليل الاتساق الذي توفره طرق الثبات ولا سيما معامل ألفا لكرونباخ. أضف إلى ذلك العيوب الجوهرية التي تنطوي عليها طريقة صدق الاتساق الداخلي.
للأسف يحمل جل الباحثين تصورات غير دقيقة للصدق ناهيك عن أساتذة القياس والتخصصات الأخرى، وعن طلاب الدراسات العليا. ينبغي ألا يعزب عن الذهن أن الصدق بخلاف الثبات لا يقوم في الأساس على أدلة كمية (فهي مؤشرات إضافية كمية)، وإنما الأصل فيه أن يقوم على أدلة كيفية، وتأتي الأدلة الكمية كأدلة مكملة، وهذا بخلاف الثبات الذي يقوم أصلا على أدلة كمية. ذلك أن الثبات يعنى أساسا بالأخطاء العشوائية التي يمكن توقع توزعها بدقة. فالثبات أكثر التحاما بالسياق منه بالدلالة الثرية للمفهوم. أما الصدق فيعنى أساسا بالتباين المنتظم الذي لا نريده أن يلتحم بالتباين المنتظم الذي يعكس السمة أو المفهوم. والتباين الأول أو ما يدعى إجمالا بالخطأ المنتطم يشكل مناط الصدق حيث تسعى طرق تقدير الصدق إلى الكشف عنه وتقديره. وبالتالي فالصدق بخلاف الثبات أكثر التحاما بالدلالة النظرية الثرية للمفهوم.
كما ينبغي ألا يعزب عن أذهاننا أيضا أن كون الصدق أكثر التحاما بالدلالة النظرية للمفهوم فهو أكثر تعقيدا من الثبات، وبالتالي يمكن اعتبار الثبات قرينة من القرائن الأخرى التي يحتاجها الصدق، أو بينة من البينات الأخرى التي يتطلبها الصدق، أو دليلا من الأدلة الأخرى التي يقوم عليها الصدق. ومعنى ذلك، فإن الصدق لا يقوم على دليل واحد بل أدلة متنوعة. ولا بد من تنوع الشواهد والقرائن والبينات لإقامة حجية الصدق. والاكتفاء بما يدعى بصدق الاتساق الداخلي اختزال مخل بالدلالة الثرية للصدق من جهة، وتقدير يفتقر إلى الدقة إذ يسبب في الغالب حرمان المقياس من تغطية بعض جوانب المفهوم، مما ينجم عنه خفض للصدق الحقيقي للمقياس رغم توفر الاتساق الداخلي.
ما زال للحديث شجون، ولاسيما فيما يتعلق بالبدائل المختلفة لتقدير الصدق.

المقالة ل  ا. د. محمد تيغزة

عن mekefes

mekefes
استاذ محاضر بقسم علم النفس بجامعة مسيلة استاذ سابق بجامعة ملود معمري تيزي وزو متحصل على الليسانس ارشاد وتوجيه متحصل على الماجستير تكوين وتسيير من جامعة الحاج لخضر باتنة متحصل على دكتوراه علوم من جامعة الحاج لخضر باتنة الاهتمامات العلمية : تقويم الاداء الاداري التربوي، علم النفس الايجابي ، الانماط القيادية الفاعلة في الادارة المدرسية الحديثة ، الرضا الوظيفي ، La chronopsychologie - rythme biologique, cerveau

اترك تعليقاً