الاحتمالات والإحصاء في تعلم الآلة

المتغيرات العشوائية المنفصلة: المفهوم، القوانين والتوزيعات الاحتمالية

تعلم الآلة بالعربية – المتغيرات العشوائية المنفصلة: المفهوم، القوانين والتوزيعات الاحتمالية

مقدمة

في الجزء الأول من هذه السلسلة، تعرفنا على مفهوم الاحتمالات وكيفية حسابها. الآن، حان الوقت للانتقال إلى مستوى أعمق عبر دراسة المتغيرات العشوائية، وهي حجر الأساس في النماذج الاحتمالية.
سنبدأ بفهم المتغيرات العشوائية المنفصلة، قبل أن نتناول لاحقًا المتغيرات المستمرة. كما سنتعرف على القوانين الأساسية التي تحكم توزيع هذه المتغيرات وبعض التوزيعات الاحتمالية الشهيرة التي تُستخدم على نطاق واسع في تعلم الآلة والإحصاء.

🔹 ما هو المتغير العشوائي؟

المتغير العشوائي هو دالة رياضية تربط كل نتيجة ممكنة في تجربة عشوائية بقيمة عددية (حقيقية). بمعنى آخر، هو تمثيل رقمي لنتائج التجارب الاحتمالية.

🔸 المتغير العشوائي المنفصل

يُقال عن المتغير العشوائي أنه منفصل إذا كانت القيم التي يمكن أن يأخذها منفصلة ومحددة، أي يمكن عدها أو حصرها، حتى لو كانت لا نهائية.

مثال توضيحي:

لنفترض أننا نرمي نردًا سداسي الأوجه، والعدد الذي يظهر على الوجه العلوي هو المتغير العشوائي ب. في هذه الحالة، يمكن للمتغير ب أن يأخذ فقط القيم 1، 2، 3، 4، 5، أو 6، وهي قيم منفصلة ومحددة.

🔹 دالة الكتلة الاحتمالية

تعريف:
دالة الكتلة الاحتمالية هي دالة تعطي احتمالية حدوث كل قيمة منفصلة للمتغير العشوائي.

الصيغة العامة:
ح(ب = أ) هي احتمال أن يأخذ المتغير العشوائي ب القيمة أ.

مثال عملي:

بالعودة إلى مثال النرد، لدينا:
ح(ب = 1) = 1/6
ح(ب = 2) = 1/6
ح(ب = 3) = 1/6
ح(ب = 4) = 1/6
ح(ب = 5) = 1/6
ح(ب = 6) = 1/6

لأن جميع القيم متساوية الاحتمال.

🔹 دالة التوزيع التراكمي

تعريف:
دالة التوزيع التراكمي تمثل الاحتمال التراكمي للمتغير العشوائي، أي احتمالية أن يكون أقل من أو يساوي قيمة معينة.

الصيغة العامة:
ف(ب) = ح(ب ≤ أ)

مثال توضيحي:

إذا أردنا حساب احتمال أن يكون العدد الذي نحصل عليه عند رمي النرد أقل من أو يساوي 3، فنحسب:
ف(3) = ح(ب = 1) + ح(ب = 2) + ح(ب = 3)
= 1/6 + 1/6 + 1/6
= 3/6
= 1/2

🔹 أشهر التوزيعات الاحتمالية للمتغيرات العشوائية المنفصلة

1️⃣ التوزيع ثنائي الحدين

يُستخدم هذا التوزيع عندما تكون لدينا تجربة مكررة لها نتيجتان فقط (نجاح أو فشل)، مع ثبات احتمال النجاح في كل تجربة.

الصيغة الرياضية:

ح(أ = ص) = (ع لـ ص) x ح^ص x (1 – ح)^(ع – ص)

حيث:
🔹 ع هو عدد المحاولات.
🔹 ص هو عدد النجاحات المطلوبة.
🔹 ح هو احتمال النجاح في كل محاولة.
🔹 (ع لـ ص) هو معامل ذو الحدين.

مثال:
إذا كان لدينا امتحان من 5 أسئلة، وكل سؤال له إجابتان فقط (صح/خطأ)، ونسبة الإجابة الصحيحة لكل سؤال هي 70%، فإن احتمال الإجابة الصحيحة لـ 3 أسئلة فقط يمكن حسابه باستخدام هذه الصيغة.

2️⃣ توزيع بواسون

يُستخدم هذا التوزيع عندما نهتم بعدد المرات التي يقع فيها حدث معين في فترة زمنية محددة، بشرط أن يكون الحدث نادرًا ومستقلًا عن الأحداث الأخرى.

الصيغة الرياضية:

ح(أ = ص) = (ث^(-و) x و^ص) / ص!

حيث:
🔹 و هو متوسط عدد الأحداث في فترة زمنية معينة.
🔹 ص هو عدد الأحداث التي نريد حساب احتمالها.
🔹 ث هو الثابت الرياضي 2.71828.

مثال:
إذا كان متوسط عدد السيارات التي تمر عند إشارة مرور معينة هو 10 سيارات في الساعة، فما احتمال أن تمر 12 سيارة خلال ساعة؟

3️⃣ التوزيع الهندسي

يُستخدم هذا التوزيع لحساب عدد المحاولات المطلوبة لتحقيق النجاح الأول في تجربة متكررة.

الصيغة الرياضية:

ح(أ = ص) = ح x (1 – ح)^(ص-1)

مثال:
إذا كنت تلعب كرة السلة، واحتمال تسجيلك هدفًا في كل محاولة هو 30%، فما احتمال أن تسجل هدفك الأول في المحاولة الرابعة؟

4️⃣ التوزيع فوق الهندسي

يُستخدم عند أخذ عينات بدون إرجاع من مجموعة تحتوي على نوعين من العناصر، ونريد معرفة احتمال اختيار عدد معين من النوع الأول.

الصيغة الرياضية:

ح(أ = ص) = (ص لـ د) x ((ج – ص) لـ (م – د)) / (ج لـ م)

مثال:
إذا كان لديك 10 كرات، 4 منها حمراء، و6 زرقاء، وأخذت 3 كرات عشوائيًا، فما احتمال أن تكون 2 منها حمراء؟

🔹 الخلاصة

🔸 المتغيرات العشوائية المنفصلة تأخذ قيمًا منفصلة ومحددة.
🔸 لكل متغير عشوائي دالة كتلة احتمالية ودالة توزيع تراكمي.
🔸 هناك توزيعات احتمالية مشهورة تُستخدم لنمذجة الظواهر العشوائية مثل التوزيع ثنائي الحدين، توزيع بواسون، والتوزيع الهندسي.

📌 هذه التوزيعات أساسية لفهم تعلم الآلة، حيث تُستخدم لنمذجة البيانات وإجراء التحليلات الإحصائية في الذكاء الاصطناعي! 🚀

📝 في المقال القادم، سنتحدث عن المتغيرات العشوائية المستمرة (المنفصلة) وقوانين الاحتمالات المرتبطة بها! 👇
🔗 تعلم الآلة بالعربية – مدخل إلى الاحتمالات: كيف نحسبها بشكل صحيح؟

السابق
مدخل إلى الاحتمالات: كيف نحسبها بشكل صحيح؟
التالي
قوانين الاحتمالات للمتغيرات المتصلة: المفاهيم والتوزيعات الأساسية