1️⃣ مقدمة: لماذا نهتم بالانحدار الخطي؟
عندما نحاول فهم العلاقة بين متغيرين أو أكثر، فإننا نبحث غالبًا عن نموذج رياضي يمكنه تفسير هذه العلاقة بشكل مبسط وعملي. وهنا يأتي دور الانحدار الخطي، الذي يعد من أكثر الأساليب الإحصائية شهرةً واستخدامًا في مجالات تحليل البيانات وتعلم الآلة.
يتيح لنا هذا النموذج التنبؤ بالقيم المستقبلية لمتغير معين بناءً على معلومات موجودة مسبقًا، ويعتمد على افتراض وجود علاقة خطية بين المتغيرات. بمعنى آخر، إذا كان بإمكاننا رسم خط مستقيم يعبر عن البيانات، فهذا يعني أنه يمكننا استخدام الانحدار الخطي للتنبؤ بالقيم الجديدة.
🔥 مثال عملي:
إذا كنت تريد التنبؤ بعدد المشاهدات التي سيحصل عليها مقالك بناءً على عدد الكلمات التي يحتويها، فإن الانحدار الخطي يمكن أن يساعدك في بناء نموذج تقديري لذلك.
2️⃣ المعادلة الأساسية للانحدار الخطي
يتم تعريف معادلة الانحدار الخطي البسيط على النحو التالي:
ص= م∗س + ج
حيث:
- ص هو المتغير التابع (القيمة التي نحاول التنبؤ بها).
- س هو المتغير المستقل (القيمة التي نستخدمها للتنبؤ).
- م هو الميل (المعامل)، الذي يحدد مدى تأثير سسس على ص.
- ج هو المقطع (التقاطع مع المحور y)، وهو القيمة التي يأخذها ص عندما تكون س=0.
3️⃣ كيف يتم حساب معلمات النموذج؟
لحساب م و ج، نستخدم المعادلات التالية:
✅ حساب الميل م:
✅ حساب المقطع ج:
حيث س‾ و ص‾ هما المتوسطات الحسابية لقيم المتغيرين س و ص.
💡 ملاحظة: يتم استخدام هذه القيم لحساب أفضل خط يناسب البيانات باستخدام طريقة المربعات الصغرى، التي تهدف إلى تقليل الفروق بين القيم الحقيقية والقيم المتوقعة.
4️⃣ تطبيق عملي باستخدام بيانات حقيقية
مثال: العلاقة بين ساعات الدراسة والنتائج الدراسية
افترض أن لدينا بيانات لطلاب توضح عدد ساعات الدراسة التي قضوها والاستنتاج الذي حصلوا عليه في الامتحان. نريد معرفة العلاقة بين المتغيرين وبناء نموذج انحدار خطي يساعدنا على التنبؤ بدرجات الطلاب الجدد بناءً على عدد الساعات التي يدرسونها.
🔍 رسم بياني يوضح العلاقة بين المتغيرات
هذا الرسم يوضح العلاقة بين عدد ساعات الدراسة والنتائج المتوقعة.
📊 تفسير الرسم البياني:
- النقاط الزرقاء تمثل البيانات الحقيقية للطلاب.
- الخط الأحمر يمثل خط الانحدار الخطي الذي يحاول وصف العلاقة بين عدد ساعات الدراسة والنتيجة المتوقعة.
- يمكننا استخدام هذا الخط لتوقع درجات الطلاب الجدد بناءً على عدد الساعات التي يدرسونها.
5️⃣ متى يكون الانحدار الخطي غير مناسب؟
✖ العلاقة غير خطية: إذا كانت البيانات تتبع منحنى وليس خطًا مستقيمًا، فإن الانحدار الخطي لن يكون دقيقًا.
✖ وجود نقاط متطرفة: إذا كانت بعض البيانات تحتوي على قيم متطرفة جدًا، فقد تؤثر بشكل كبير على دقة النموذج.
✖ عدم وجود علاقة واضحة بين المتغيرات: إذا لم يكن هناك ارتباط بين المتغير المستقل والمتغير التابع، فإن استخدام الانحدار الخطي سيكون بلا فائدة.
في الدروس القادمة، سنناقش:
✅ كيف نقيس مدى جودة نموذج الانحدار الخطي؟
✅ ما الفرق بين الانحدار الخطي البسيط والانحدار الخطي المتعدد؟
✅ كيف نتعامل مع البيانات التي تحتوي على أكثر من متغير مستقل؟
ابقوا على اطلاع 😁