أساليب إحصائية

الأربعاء، مارس 02 2011 03: 15

أساليب إحصائية

حجم الخط تصغير الخط زيادة حجم الخط

قيم هذا المقال

(1 صوت)

هناك الكثير من الجدل حول دور الإحصاء في البحث الوبائي حول العلاقات السببية. في علم الأوبئة ، الإحصائيات هي في الأساس مجموعة من الأساليب لتقييم البيانات القائمة على البشر (وكذلك على الحيوانات). على وجه الخصوص ، الإحصاء هو تقنية لتقدير وقياس الظواهر غير المؤكدة. يمكن أن تستفيد جميع التحقيقات العلمية التي تتناول جوانب غير حتمية ومتغيرة للواقع من المنهجية الإحصائية. في علم الأوبئة ، يعتبر التباين جوهريًا لوحدة المراقبة - فالشخص ليس كيانًا حتميًا. بينما سيتم تحسين التصميمات التجريبية من حيث تلبية افتراضات الإحصاء بشكل أفضل من حيث التباين العشوائي ، إلا أن هذا النهج ليس شائعًا لأسباب أخلاقية وعملية. بدلاً من ذلك ، يشارك علم الأوبئة في البحث القائم على الملاحظة والذي ارتبط به على حد سواء العشوائية وغيرها من مصادر التباين.

تهتم النظرية الإحصائية بكيفية التحكم في التباين غير المنظم في البيانات من أجل تقديم استنتاجات صحيحة من الملاحظات التجريبية. تفتقر الإحصائيات إلى أي تفسير للسلوك المتغير للظاهرة المدروسة ، وتفترضها على أنها عشوائية- أي الانحرافات غير المنتظمة عن بعض متوسط حالات الطبيعة (انظر جرينلاند 1990 للاطلاع على نقد لهذه الافتراضات).

يعتمد العلم على التجربة دليل لإثبات ما إذا كانت نماذجها النظرية للأحداث الطبيعية لها أي صلاحية. في الواقع ، تحدد الأساليب المستخدمة من النظرية الإحصائية الدرجة التي تتوافق بها الملاحظات في العالم الحقيقي مع وجهة نظر العلماء ، في شكل نموذج رياضي ، لظاهرة ما. لذلك يجب اختيار الأساليب الإحصائية المبنية على الرياضيات بعناية ؛ هناك الكثير من الأمثلة حول "كيفية الكذب مع الإحصائيات". لذلك ، يجب أن يكون علماء الأوبئة على دراية بمدى ملاءمة التقنيات التي يطبقونها لقياس مخاطر المرض. على وجه الخصوص ، هناك حاجة إلى عناية كبيرة عند تفسير كل من النتائج ذات الدلالة الإحصائية والنتائج غير المهمة من الناحية الإحصائية.

المعنى الأول للكلمة إحصائيات يتعلق بأي كمية موجزة محسوبة على مجموعة من القيم. تُستخدم المؤشرات أو الإحصائيات الوصفية مثل المتوسط الحسابي أو الوسيط أو الوضع على نطاق واسع لتلخيص المعلومات في سلسلة من الملاحظات. تاريخيًا ، تم استخدام هذه الأوصاف الموجزة للأغراض الإدارية من قبل الدول ، وبالتالي تم تسميتها إحصائيات. في علم الأوبئة ، تُستمد الإحصائيات التي يتم مشاهدتها بشكل شائع من المقارنات المتأصلة في طبيعة علم الأوبئة ، والتي تطرح أسئلة مثل: "هل هناك مجموعة سكانية أكثر عرضة للإصابة بالمرض من غيرها؟" عند إجراء مثل هذه المقارنات ، يكون الخطر النسبي مقياسًا شائعًا لقوة الارتباط بين خاصية فردية واحتمال الإصابة بالمرض ، وهو الأكثر شيوعًا في البحث عن المسببات المرضية ؛ يعد الخطر المنسوب أيضًا مقياسًا للارتباط بين الخصائص الفردية وحدوث المرض ، لكنه يؤكد المكاسب من حيث عدد الحالات التي يجنبها التدخل الذي يزيل العامل المعني - يتم تطبيقه في الغالب في الصحة العامة والطب الوقائي.

المعنى الثاني للكلمة إحصائيات يتعلق بجمع التقنيات والنظرية الأساسية للاستدلال الإحصائي. هذا شكل خاص من المنطق الاستقرائي الذي يحدد القواعد للحصول على تعميم صالح من مجموعة معينة من الملاحظات التجريبية. سيكون هذا التعميم صحيحًا بشرط استيفاء بعض الافتراضات. هذه هي الطريقة الثانية التي يمكن أن يخدعنا بها الاستخدام غير المتعلم للإحصاءات: في علم الأوبئة القائم على الملاحظة ، من الصعب للغاية التأكد من الافتراضات التي تنطوي عليها التقنيات الإحصائية. لذلك ، يجب أن يكون تحليل الحساسية والمقدرات القوية مصاحبين لأي تحليل بيانات يتم إجراؤه بشكل صحيح. يجب أن تستند الاستنتاجات النهائية أيضًا إلى المعرفة الشاملة ، ويجب ألا تعتمد حصريًا على نتائج اختبار الفرضيات الإحصائية.

التعريفات

A وحدة إحصائية هو العنصر الذي تتم عليه الملاحظات التجريبية. يمكن أن يكون شخصًا أو عينة بيولوجية أو قطعة من المواد الخام ليتم تحليلها. عادة ما يتم اختيار الوحدات الإحصائية بشكل مستقل من قبل الباحث ، ولكن في بعض الأحيان يمكن إنشاء تصميمات أكثر تعقيدًا. على سبيل المثال ، في الدراسات الطولية ، يتم إجراء سلسلة من القرارات على مجموعة من الأشخاص بمرور الوقت ؛ الوحدات الإحصائية في هذه الدراسة هي مجموعة التحديدات ، التي ليست مستقلة ، ولكنها منظمة من خلال صلات كل منها بكل شخص تتم دراسته. يستحق عدم الاستقلالية أو الارتباط بين الوحدات الإحصائية اهتمامًا خاصًا في التحليل الإحصائي.

A متغير هي خاصية فردية يتم قياسها على وحدة إحصائية معينة. يجب أن يتناقض مع ثابت، وهي خاصية فردية ثابتة - على سبيل المثال ، في دراسة على البشر ، يعتبر وجود رأس أو صدر ثوابت ، بينما يكون جنس عضو واحد في الدراسة متغيرًا.

يتم تقييم المتغيرات باستخدام مختلف موازين القياس. التمييز الأول بين المقياسين النوعي والكمي. توفر المتغيرات النوعية مختلفة أشكال or الفئات. إذا كان لا يمكن ترتيب كل طريقة أو ترتيبها فيما يتعلق بالآخرين - على سبيل المثال ، لون الشعر أو طرائق الجنس - فإننا نشير إلى المتغير على أنه اسمي. إذا كان من الممكن ترتيب الفئات - مثل درجة شدة المرض - يتم استدعاء المتغير ترتيبي. عندما يتكون المتغير من قيمة عددية ، نقول أن المقياس كمي. أ منفصل يشير المقياس إلى أن المتغير يمكن أن يفترض فقط بعض القيم المحددة - على سبيل المثال ، القيم الصحيحة لعدد حالات المرض. أ متواصل مقياس يستخدم لتلك التدابير التي ينتج عنها حقيقي أعداد. يقال أن تكون المقاييس المستمرة الفاصلة المقاييس عندما يكون للقيمة الخالية معنى اصطلاحي بحت. أي أن القيمة الصفرية لا تعني الكمية الصفرية - على سبيل المثال ، درجة الحرارة صفر درجة مئوية لا تعني صفر طاقة حرارية. في هذه الحالة ، تكون الفروق بين القيم فقط منطقية (وهذا هو سبب مصطلح مقياس "الفاصل"). تشير القيمة الفارغة الحقيقية إلى أ نسبة مقياس. بالنسبة لمتغير يتم قياسه على هذا المقياس ، فإن نسب القيم منطقية أيضًا: في الواقع ، تعني النسبة المزدوجة ضعف الكمية. على سبيل المثال ، أن نقول أن درجة حرارة الجسم أكبر بمرتين من حرارة الجسم الثاني ، فهذا يعني أنه يحتوي على ضعف الطاقة الحرارية للجسم الثاني ، بشرط يتم قياس درجة الحرارة على مقياس نسبة (على سبيل المثال ، بدرجات كلفن). تسمى مجموعة القيم المسموح بها لمتغير معين مجال المتغير.

النماذج الإحصائية

تتعامل الإحصائيات مع طريقة التعميم من مجموعة ملاحظات معينة. تسمى هذه المجموعة من القياسات التجريبية أ عينة. من عينة ، نحسب بعض الإحصائيات الوصفية من أجل تلخيص المعلومات التي تم جمعها.

المعلومات الأساسية المطلوبة بشكل عام لتوصيف مجموعة من التدابير تتعلق بميلها المركزي وتغيرها. يعتمد الاختيار بين عدة بدائل على المقياس المستخدم لقياس الظاهرة وعلى الأغراض التي تُحسب الإحصائيات من أجلها. في الجدول 1 ، تم وصف مقاييس مختلفة للاتجاه المركزي والتغير (أو التشتت) وترتبط بمقياس القياس المناسب.

الجدول 1. مؤشرات الاتجاه المركزي والتشتت حسب مقياس القياس

		مقياس القياس
		نوعي		مرور
المؤشرات	تعريف	الاسمي	ترتيبي	الفاصل / النسبة
المتوسط الحسابي	مجموع القيم المرصودة مقسومًا على العدد الإجمالي للملاحظات			x
متوسط	قيمة نقطة الوسط للتوزيع المرصود		x	x
موضة	القيمة الأكثر شيوعًا	x	x	x
الفترة (من ... إلى)	أدنى وأعلى قيم للتوزيع		x	x
التباين	مجموع الفرق التربيعي لكل قيمة من المتوسط مقسومًا على العدد الإجمالي للملاحظات مطروحًا منه 1			x

يتم استدعاء الإحصاء الوصفي المحسوب تقديرات عندما نستخدمها كبديل للكمية المماثلة من السكان التي تم اختيار العينة منها. النظراء السكاني للتقديرات تسمى ثوابت المعلمات. يمكن الحصول على تقديرات للمعامل نفسه باستخدام طرق إحصائية مختلفة. يجب أن يكون التقدير صحيحًا ودقيقًا.

يشير نموذج عينة السكان إلى أنه يمكن ضمان الصلاحية بالطريقة التي يتم بها اختيار العينة من المجتمع. أخذ العينات العشوائية أو الاحتمالية هو الاستراتيجية المعتادة: إذا كان لكل فرد من السكان نفس احتمالية تضمينه في العينة ، فعندئذ ، في المتوسط ، يجب أن تكون العينة ممثلة للسكان ، علاوة على ذلك ، يمكن أن يكون أي انحراف عن توقعاتنا وأوضح بالصدفة. يمكن أيضًا حساب احتمال حدوث انحراف معين عن توقعاتنا ، بشرط إجراء أخذ عينات عشوائية. ينطبق نفس النوع من التفكير على التقديرات المحسوبة لعينتنا فيما يتعلق بمعلمات السكان. نأخذ ، على سبيل المثال ، المتوسط الحسابي من عينتنا كتقدير لمتوسط القيمة للسكان. يُعزى أي اختلاف ، إن وجد ، بين متوسط العينة ومتوسط المجتمع إلى التقلبات العشوائية في عملية اختيار الأعضاء المشمولين في العينة. يمكننا حساب احتمال أي قيمة لهذا الاختلاف ، بشرط اختيار العينة بشكل عشوائي. إذا كان الانحراف بين تقدير العينة ومعامل المجتمع لا يمكن تفسيره بالصدفة ، يُقال أن التقدير هو كذلك انحيازا. يوفر تصميم الملاحظة أو التجربة صحة التقديرات والنموذج الإحصائي الأساسي هو نموذج أخذ العينات العشوائية.

في الطب ، يتم اعتماد نموذج ثانٍ عندما يكون الهدف من الدراسة هو المقارنة بين المجموعات المختلفة. مثال نموذجي هو التجربة السريرية الخاضعة للرقابة: يتم اختيار مجموعة من المرضى ذوي الخصائص المتشابهة على أساس معايير محددة مسبقًا. لا يوجد قلق للتمثيل في هذه المرحلة. يتم تعيين كل مريض مسجل في التجربة من خلال إجراء عشوائي لمجموعة العلاج - التي ستتلقى العلاج القياسي بالإضافة إلى الدواء الجديد المراد تقييمه - أو لمجموعة التحكم - التي تتلقى العلاج القياسي والعلاج الوهمي. في هذا التصميم ، يحل التخصيص العشوائي للمرضى لكل مجموعة محل الاختيار العشوائي لأعضاء العينة. يمكن تقييم تقدير الاختلاف بين المجموعتين إحصائيًا لأنه ، في ظل فرضية عدم فعالية الدواء الجديد ، يمكننا حساب احتمال أي فرق غير صفري.

في علم الأوبئة ، نفتقر إلى إمكانية تجميع مجموعات من الأشخاص المعرضين عشوائياً وغير المعرضين. في هذه الحالة ، لا يزال بإمكاننا استخدام الأساليب الإحصائية ، كما لو تم اختيار المجموعات التي تم تحليلها بشكل عشوائي أو تخصيصها. تعتمد صحة هذا الافتراض بشكل أساسي على تصميم الدراسة. هذه النقطة مهمة بشكل خاص وتؤكد على أهمية تصميم الدراسة الوبائية على التقنيات الإحصائية في البحوث الطبية الحيوية.

الإشارة والضوضاء

على المدى متغير عشوائي يشير إلى متغير يرتبط باحتمالية محددة بكل قيمة يمكن أن يفترضها. النماذج النظرية لتوزيع احتمالية المتغير العشوائي هي النماذج السكانية. يتم تمثيل نظراء العينة من خلال توزيع تردد العينة. هذه طريقة مفيدة للإبلاغ عن مجموعة من البيانات ؛ يتكون من مستوى ديكارتي مع متغير الاهتمام على طول المحور الأفقي والتردد أو التردد النسبي على طول المحور الرأسي. يتيح لنا العرض الرسومي أن نرى بسهولة ما هي (هي) القيمة (القيم) الأكثر شيوعًا وكيف يتركز التوزيع حول قيم مركزية معينة مثل المتوسط الحسابي.

للمتغيرات العشوائية وتوزيعاتها الاحتمالية ، نستخدم المصطلحات المعلمات, يعني القيمة المتوقعة (بدلاً من المتوسط الحسابي) و فرق. تصف هذه النماذج النظرية التباين في ظاهرة معينة. في نظرية المعلومات ، يتم تمثيل الإشارة من خلال الاتجاه المركزي (على سبيل المثال ، متوسط القيمة) ، بينما يتم قياس الضوضاء بمؤشر التشتت (مثل التباين).

لتوضيح الاستدلال الإحصائي ، سنستخدم النموذج ذي الحدين. في الأقسام التالية ، سيتم تقديم مفاهيم تقديرات النقاط وفترات الثقة واختبارات الفرضيات واحتمالية القرارات الخاطئة وقوة الدراسة.

الجدول 2. النتائج المحتملة لتجربة ذات الحدين (نعم = 1 ، لا = 0) واحتمالاتها (ن = 3)

عامل			احتمال
A	B	C
0	0	0
1	0	0
0	1	0
0	0	1
0	1	1
1	0	1
1	1	0
1	1	1

مثال: التوزيع ذي الحدين

في البحوث الطبية الحيوية وعلم الأوبئة ، فإن أهم نموذج للتباين العشوائي هو التوزيع ذي الحدين. وهو يعتمد على حقيقة أن معظم الظواهر تتصرف كمتغير اسمي مع فئتين فقط: على سبيل المثال ، وجود / غياب المرض: حي / ميت ، أو متعافي / مريض. في مثل هذه الظروف ، نحن مهتمون باحتمالية النجاح - أي في حالة الاهتمام (على سبيل المثال ، وجود المرض ، على قيد الحياة أو الشفاء) - والعوامل أو المتغيرات التي يمكن أن تغيره. لنفترض n = 3 عمال ، ونفترض أننا مهتمون باحتمالية الإصابة بضعف بصري (نعم / لا). يمكن أن تكون نتيجة ملاحظتنا النتائج المحتملة في الجدول 2.

الجدول 3. النتائج المحتملة لتجربة ذات الحدين (نعم = 1 ، لا = 0) واحتمالاتها (ن = 3)

عدد النجاحات	احتمال
0
1
2
3

يمكن الحصول على احتمالية أي من مجموعات الأحداث هذه بسهولة من خلال النظر في p ، واحتمال النجاح (الفردي) ، والثابت لكل موضوع ومستقل عن النتائج الأخرى. نظرًا لأننا مهتمون بالعدد الإجمالي للنجاحات وليس في تسلسل مرتب معين ، يمكننا إعادة ترتيب الجدول على النحو التالي (انظر الجدول 3) ، وبشكل عام ، التعبير عن احتمال x النجاحات ص (خ) على النحو التالي:

أين x هو عدد النجاحات والترميز x! يدل على مضروب x، أي، x! = x× (x–1) × (x–2) ... × 1.

عندما ننظر إلى الحدث "كونه / لا يكون مريضًا" ، فإن الاحتمال الفردي ، يشير إلى الحالة التي يُفترض فيها الموضوع ؛ في علم الأوبئة ، يسمى هذا الاحتمال "انتشار". لتقدير p ، نستخدم نسبة العينة:

p = x/n

مع التباين:

في سلسلة افتراضية لانهائية من العينات المنسوخة من نفس الحجم n، سوف نحصل على نسب عينة مختلفة p = x/n, مع الاحتمالات التي قدمتها الصيغة ذات الحدين. القيمة "الحقيقية" لـ يتم تقديرها من خلال كل نسبة عينة ، ويتم تقدير فاصل الثقة لـ p ، أي مجموعة القيم المحتملة لـ p ، بالنظر إلى البيانات المرصودة ومستوى الثقة المحدد مسبقًا (على سبيل المثال 95 ٪) ، يتم تقديرها من التوزيع ذي الحدين مجموعة قيم p التي تعطي احتمالية x أكبر من قيمة محددة مسبقًا (لنقل 2.5٪). لتجربة افتراضية لاحظنا فيها x = 15 نجاحًا في n = 30 تجربة ، الاحتمال المقدر للنجاح هو:

p = س / ن = 15 / 30 = 0.5

الجدول 4. التوزيع ذي الحدين. الاحتمالات لقيم مختلفة من بالنسبة إلى x = 15 نجاحًا في n = 30 تجربة

	احتمال
0.200	0.0002
0.300	0.0116
0.334	0.025
0.400	0.078
0.500	0.144
0.600	0.078
0.666	0.025
0.700	0.0116

فاصل الثقة 95٪ لـ p ، الذي تم الحصول عليه من الجدول 4 ، هو 0.334 - 0.666. يظهر كل إدخال في الجدول احتمالية x = 15 نجاحًا في n = 30 تجربة محسوبة بالصيغة ذات الحدين ؛ على سبيل المثال ، ل = 0.30 ، نحصل عليها من:

في حالة n كبيرة و p بالقرب من 0.5 يمكننا استخدام تقدير تقريبي على أساس التوزيع الغاوسي:

أين z_a _/2 يشير إلى قيمة التوزيع القياسي Gaussian لاحتمالية

P (|z| ³ z_a _/2) = a/2;

1 - كونه هو مستوى الثقة المختار. على سبيل المثال يعتبر ، = 15/30 = 0.5 ؛ n = 30 ومن جدول Gaussian القياسي z_0.025 = 1.96. ينتج عن فاصل الثقة 95٪ مجموعة القيم 0.321 - 0.679 ، التي تم الحصول عليها بالتعويض p = 0.5، n = 30 و z_0.025 = 1.96 في المعادلة أعلاه لتوزيع جاوس. لاحظ أن هذه القيم قريبة من القيم الدقيقة المحسوبة من قبل.

تشتمل الاختبارات الإحصائية للفرضيات على إجراء قرار حول قيمة معلمة السكان. لنفترض ، في المثال السابق ، أننا نريد معالجة الاقتراح القائل بأن هناك مخاطر عالية من ضعف البصر بين العاملين في مصنع معين. ومن ثم فإن الفرضية العلمية التي سيتم اختبارها من خلال ملاحظاتنا التجريبية هي "وجود مخاطر عالية من ضعف البصر بين العاملين في مصنع معين". يوضح الإحصائيون مثل هذه الفرضيات من خلال تزوير الفرضية التكميلية "لا يوجد ارتفاع في مخاطر ضعف البصر". هذا يتبع العرض الرياضي لكل عبث وبدلاً من التحقق من تأكيد ما ، يتم استخدام الدليل التجريبي فقط لتزويره. الفرضية الإحصائية تسمى فرضية العدم. تتضمن الخطوة الثانية تحديد قيمة للمعامل الخاص بتوزيع الاحتمالات المستخدم لنمذجة التباين في الملاحظات. في أمثلةنا ، نظرًا لأن الظاهرة ثنائية (أي وجود / عدم وجود ضعف بصري) ، فإننا نختار التوزيع ذي الحدين مع المعلمة p ، احتمال ضعف البصر. تؤكد الفرضية الصفرية ذلك = 0.25 ، قل. يتم اختيار هذه القيمة من مجموعة المعرفة حول الموضوع والمعرفة المسبقة بالانتشار المعتاد لضعف البصر لدى السكان غير المعرضين (أي غير العاملين). لنفترض أن بياناتنا أنتجت تقديرًا = 0.50 ، من 30 عاملاً تم فحصهم.

هل يمكننا رفض فرضية العدم؟

إذا كانت الإجابة بنعم ، لصالح ماذا البديل فرضية؟

نحدد فرضية بديلة كمرشح إذا كان الدليل يملي رفض الفرضية الصفرية. تنص الفرضيات البديلة غير الاتجاهية (ذات الوجهين) على أن معلمة السكان تختلف عن القيمة المذكورة في الفرضية الصفرية ؛ تنص الفرضيات البديلة الاتجاهية (من جانب واحد) على أن معلمة المحتوى أكبر (أو أقل) من القيمة الخالية.

الجدول 5. التوزيع ذي الحدين. احتمالات النجاح ل = 0.25 في ن = 30 تجربة

X	احتمال	الاحتمال التراكمي
0	0.0002	0.0002
1	0.0018	0.0020
2	0.0086	0.0106
3	0.0269	0.0374
4	0.0604	0.0979
5	0.1047	0.2026
6	0.1455	0.3481
7	0.1662	0.5143
8	0.1593	0.6736
9	0.1298	0.8034
10	0.0909	0.8943
11	0.0551	0.9493
12	0.0291	0.9784
13	0.0134	0.9918
14	0.0054	0.9973
15	0.0019	0.9992
16	0.0006	0.9998
17	0.0002	1.0000
.	.	.
30	0.0000	1.0000

في ظل الفرضية الصفرية ، يمكننا حساب التوزيع الاحتمالي لنتائج مثالنا. يوضح الجدول 5 ، ل = 0.25 و n = 30 ، الاحتمالات (انظر المعادلة (1)) والاحتمالات التراكمية:

من هذا الجدول نحصل على احتمال وجود x ³ 15 عاملاً يعانون من إعاقة بصرية

P(x ³15) = 1 - P(x15) = 1 - 0.9992 = 0.0008

هذا يعني أنه من غير المحتمل للغاية أن نلاحظ 15 عاملاً أو أكثر يعانون من إعاقة بصرية إذا كانوا قد عانوا من انتشار المرض بين السكان غير المعرضين. لذلك ، يمكننا رفض فرضية العدم والتأكيد على أن هناك انتشارًا أعلى لضعف البصر في مجتمع العمال الذين تمت دراستهم.

متى n× ص ³ 5 و n× (1-) ³ 5 ، يمكننا استخدام تقريب غاوسي:

من جدول التوزيع القياسي Gaussian نحصل على:

P(| ض |>2.95) = 0.0008

باتفاق وثيق مع النتائج الدقيقة. من هذا التقريب يمكننا أن نرى أن الهيكل الأساسي للاختبار الإحصائي للفرضية يتكون من نسبة الإشارة إلى الضوضاء. في حالتنا ، الإشارة هي (p-) ، الانحراف الملحوظ عن الفرضية الصفرية ، بينما الضوضاء هي الانحراف المعياري لـ P:

كلما زادت النسبة ، قل احتمال القيمة الخالية.

عند اتخاذ القرارات بشأن الفرضيات الإحصائية ، يمكن أن نتحمل نوعين من الأخطاء: خطأ من النوع الأول ، ورفض الفرضية الصفرية عندما تكون صحيحة ؛ أو خطأ من النوع الثاني ، قبول الفرضية الصفرية عندما تكون خاطئة. مستوى الاحتمال ، أو قيمة ف هو احتمال حدوث خطأ من النوع الأول ، يُشار إليه بالحرف اليوناني أ. يتم حساب هذا من التوزيع الاحتمالي للملاحظات تحت فرضية العدم. من المعتاد التحديد المسبق لمستوى الخطأ a (على سبيل المثال ، 5٪ ، 1٪) ورفض الفرضية الصفرية عندما يكون لنتيجة ملاحظتنا احتمال مساوٍ أو أقل من هذا المستوى الحرج المزعوم.

يُشار إلى احتمال حدوث خطأ من النوع الثاني بالحرف اليوناني β. لحسابها ، نحتاج إلى تحديد ، في الفرضية البديلة ، قيمة α للمعلمة المراد اختبارها (في مثالنا ، قيمة α لـ ). الفرضيات البديلة العامة (تختلف عن ، أكبر من ، أقل من) ليست مفيدة. من الناحية العملية ، فإن قيمة β لمجموعة من الفرضيات البديلة مهمة ، أو مكملها ، والذي يسمى القوة الإحصائية للاختبار. على سبيل المثال ، عند تحديد قيمة الخطأ α عند 5٪ ، من الجدول 5 ، نجد:

P(x ³12) <0.05

تحت فرضية العدم = 0.25. إذا كنا سنراقب على الأقل x = 12 نجاحًا ، فإننا نرفض الفرضية الصفرية. قيم β المقابلة وقوة x = 12 بالجدول 6.

الجدول 6. خطأ وقوة من النوع الثاني لـ x = 12 ، n = 30 ، α = 0.05

	β	الطاقة
0.30	0.9155	0.0845
0.35	0.7802	0.2198
0.40	0.5785	0.4215
0.45	0.3592	0.6408
0.50	0.1808	0.8192
0.55	0.0714	0.9286

في هذه الحالة ، لا يمكن لبياناتنا التمييز بين ما إذا كان أكبر من القيمة الخالية البالغة 0.25 ولكنها أقل من 0.50 ، لأن قوة الدراسة منخفضة جدًا (<80٪) لتلك القيم من <0.50 - أي أن حساسية دراستنا هي 8٪ لـ = 0.3، 22٪ ل = 0.35 ، ... ، 64٪ = 0.45.

الطريقة الوحيدة لتحقيق مستوى أقل أو أعلى من القوة هي زيادة حجم الدراسة. على سبيل المثال ، في الجدول 7 نبلغ عن β والقوة لـ n = 40 ؛ كما هو متوقع ، يجب أن نكون قادرين على اكتشاف قيمة أكبر من 0.40.

الجدول 7. خطأ وقوة من النوع الثاني لـ x = 12 ، n = 40 ، α = 0.05

	β	الطاقة
0.30	0.5772	0.4228
0.35	0.3143	0.6857
0.40	0.1285	0.8715
0.45	0.0386	0.8614
0.50	0.0083	0.9917
0.55	0.0012	0.9988

يعتمد تصميم الدراسة على الفحص الدقيق لمجموعة الفرضيات البديلة التي تستحق الدراسة وضمان قوة الدراسة لتوفير حجم عينة مناسب.

في الأدبيات الوبائية ، تم التأكيد على أهمية توفير تقديرات موثوقة للمخاطر. لذلك ، من المهم الإبلاغ عن فترات الثقة (إما 95٪ أو 90٪) من أ p- قيمة اختبار الفرضية. باتباع نفس النوع من التفكير ، ينبغي إيلاء الاهتمام لتفسير النتائج من الدراسات صغيرة الحجم: بسبب الطاقة المنخفضة ، حتى التأثيرات الوسيطة يمكن أن لا يتم اكتشافها ، ومن ناحية أخرى ، قد لا يتم تكرار التأثيرات الكبيرة في وقت لاحق.

طرق متقدمة

تزايدت درجة تعقيد الأساليب الإحصائية المستخدمة في سياق الطب المهني خلال السنوات القليلة الماضية. يمكن العثور على التطورات الرئيسية في مجال النمذجة الإحصائية. كانت عائلة Nelder و Wedderburn للنماذج غير الغاوسية (النماذج الخطية المعممة) واحدة من المساهمات الأكثر لفتًا للنظر في زيادة المعرفة في مجالات مثل علم الأوبئة المهنية ، حيث تكون متغيرات الاستجابة ذات الصلة ثنائية (على سبيل المثال ، البقاء / الموت) أو التهم (على سبيل المثال ، عدد الحوادث الصناعية).

كانت هذه نقطة البداية للتطبيق المكثف لنماذج الانحدار كبديل لأنواع التحليل الأكثر تقليدية القائمة على جداول الطوارئ (التحليل البسيط والطبقي). تُستخدم الآن بواسون وكوكس والانحدار اللوجستي بشكل روتيني لتحليل الدراسات الطولية ودراسات الحالة والشواهد ، على التوالي. هذه النماذج هي نظير الانحدار الخطي لمتغيرات الاستجابة الفئوية ولها ميزة أنيقة تتمثل في توفير المقياس الوبائي المناسب للارتباط مباشرة. على سبيل المثال ، معاملات انحدار بواسون هي لوغاريتم نسب المعدل ، بينما معاملات الانحدار اللوجستي هي سجل نسب الأرجحية.

أخذ هذا كمعيار ، فقد اتخذت التطورات الإضافية في مجال النمذجة الإحصائية اتجاهين رئيسيين: نماذج للتدابير الفئوية المتكررة والنماذج التي توسع النماذج الخطية المعممة (النماذج المضافة المعممة). في كلتا الحالتين ، تركز الأهداف على زيادة مرونة الأدوات الإحصائية من أجل التعامل مع المشكلات الأكثر تعقيدًا الناشئة عن الواقع. هناك حاجة إلى نماذج القياسات المتكررة في العديد من الدراسات المهنية حيث تكون وحدات التحليل على مستوى فرعي. على سبيل المثال:

يجب أن تأخذ دراسة تأثير ظروف العمل على متلازمة النفق الرسغي في الاعتبار كلتا يدي شخص غير مستقلتين عن بعضهما البعض.
يمكن تقييم تحليل الاتجاهات الزمنية للملوثات البيئية وتأثيرها على أنظمة الجهاز التنفسي للأطفال باستخدام نماذج مرنة للغاية نظرًا لصعوبة الحصول على الشكل الوظيفي الدقيق لعلاقة الجرعة والاستجابة.

شوهد تطور مواز وربما أسرع في سياق إحصائيات بايز. انهار الحاجز العملي لاستخدام طرق بايزي بعد إدخال أساليب الكمبيوتر المكثف. سمحت لنا إجراءات مونت كارلو مثل مخططات أخذ عينات جيبس بتجنب الحاجة إلى التكامل العددي لحساب التوزيعات الخلفية التي تمثل الميزة الأكثر تحديًا لطرق بايز. وجد عدد تطبيقات نماذج بايز في المشكلات الحقيقية والمعقدة مساحة متزايدة في المجلات التطبيقية. على سبيل المثال ، غالبًا ما يتم التعامل مع التحليلات الجغرافية والارتباطات البيئية على مستوى المنطقة الصغيرة ونماذج التنبؤ بالإيدز باستخدام مناهج بايز. يتم الترحيب بهذه التطورات لأنها لا تمثل فقط زيادة في عدد الحلول الإحصائية البديلة التي يمكن استخدامها في تحليل البيانات الوبائية ، ولكن أيضًا لأن نهج بايز يمكن اعتباره استراتيجية أكثر سلامة.

الرجوع

عرض 6145 مرات آخر تعديل يوم الخميس ، 13 أكتوبر 2011 20:24

نشرت في 28. علم الأوبئة والإحصاء