مرحبا بالجميع 🙋♂️
في بداية هذه السلسلة “تعلم الآلة بالعربية” نشرتُ المقالات الثلاثة السابقة هذا الأسبوع وههي جانب من نتاج عمل أنجزته السنة الماضية ونشرتُه على منصة “دار المترجم”.
لكنني أعدت صياغته بشكل أبسط وأسهل للقراءة لغير المختصين حتى يكون مقدمة “رياضياتية” ضرورية ومهمة للدورة وفي نفس الوقت سهل الهضم مع كأس شاي صحراوي لذيذ 😁
اليوم بحول الله أنشر أول مقال من ضمن 9 مفاهيم أساسية جدا يدور حولها هذا المجال ككل (عدا بعض المفاهيم المرتبطة حصرا بالتعلم العميق سأتطرق لها حين أنتهي من المحور الأول).
إذا، عسل برادك 🫖 أو نسم قهوتك ☕️ وتابع (راها غير 5 دقايق وهانتا ناضي) 👇
“كل شيء يبدأ بخط مستقيم!”
تصوّر أنك تحاول التنبؤ بأسعار المنازل بناءً على مساحتها، أو توقع درجات الحرارة اعتمادًا على الوقت، أو حتى تقدير عدد المشاهدات التي سيحصل عليها مقالك القادم بناءً على عدد الكلمات! في كل هذه الحالات، هناك نمط معين يربط بين المتغيرات، وعملية اكتشاف هذا النمط وتحويله إلى نموذج رياضي هي أساس الانحدار الخطي.
لكن، لماذا يُعد هذا النموذج أحد أهم أدوات تعلم الآلة؟ وكيف يمكنه مساعدتنا على التنبؤ واتخاذ القرارات؟ هذا ما سنكتشفه معًا في هذا المقال، خطوة بخطوة.
🔹 ما هو الانحدار الخطي؟
الانحدار الخطي هو أحد النماذج الرياضية الأكثر استخدامًا في الإحصاء وتعلم الآلة، حيث يقوم بتحديد العلاقة بين متغير مستقل (م) و متغير تابع (ت) عبر تمثيلها بخط مستقيم.
بعبارة أخرى، هو نموذج يهدف إلى إيجاد العلاقة بين مدخلات ومخرجات بحيث يمكننا استخدام هذه العلاقة لاحقًا للتنبؤ بقيم جديدة.
معادلته الأساسية:
م = ميل x ت + ث
يعبر عنها بالحروف اللاتينية هكذا : Y = mx + b
حيث:
- م/y: القيمة المتوقعة (المخرجات).
- ت/x: المتغير المستقل (المدخلات).
- ميل/m: ميل الخط المستقيم، ويحدد مدى تأثير التابع على المستقل.
- ث/b: ثابت يمثل القيمة التي يأخذها المستقل عندما يكون ت = 0.
🔹 لماذا نستخدم الانحدار الخطي؟
لنفترض أنك تدير متجرًا إلكترونيًا وتريد معرفة العلاقة بين عدد الإعلانات التي تنشرها وعدد المبيعات، أو أنك عالم بيانات في شركة أدوية وتسعى لفهم العلاقة بين جرعة دواء وضغط الدم للمريض.
في هذه الحالات، نحتاج إلى نموذج بسيط لكنه قوي، قادر على إعطائنا فكرة واضحة عن كيفية تأثير أحد العوامل على الآخر، وهنا يأتي دور الانحدار الخطي!
🔸 مجالات تطبيق الانحدار الخطي
🔹 التنبؤ بالأسعار: يستخدم في التنبؤ بأسعار العقارات، الأسهم، المنتجات وغيرها بناءً على خصائصها.
🔹 تحليل الاتجاهات: يساعد في تحليل نمو الشركات، ودراسة تأثير عوامل معينة على المبيعات أو أداء الأسواق.
🔹 تحليل البيانات الطبية: يُستخدم لدراسة العلاقة بين المتغيرات الطبية مثل مستوى السكر في الدم وعادات الأكل.
🔹 الاقتصاد والإحصاء: تحليل العلاقة بين البطالة والنمو الاقتصادي، أو تأثير الضرائب على الاستهلاك.
🔹 الفرق بين الانحدار الخطي البسيط والمتعدد؟
🔷 الانحدار الخطي البسيط:
كما رأينا سابقًا، يعتمد على متغير مستقل واحد للتنبؤ بالنتائج، وهو ما يجعل العلاقة بين المتغيرين خطية وسهلة التفسير.
مثال:
- العلاقة بين عدد ساعات المذاكرة و نتيجة الامتحان.
- العلاقة بين عدد الكيلومترات المقطوعة واستهلاك الوقود.
🔷 الانحدار الخطي المتعدد:
عندما يكون لدينا أكثر من متغير مستقل، نحتاج إلى نموذج أكثر تعقيدًا يأخذ جميع العوامل في الاعتبار. هنا تأتي النسخة المتعددة من الانحدار الخطي، حيث تصبح المعادلة كالتالي:
مثال:
- توقع سعر منزل بناءً على مساحته وعدد الغرف وموقعه.
- تقدير نسبة النجاح في الامتحان بناءً على عدد ساعات الدراسة ونوعية الأكل ومستوى النوم.
🔹 التحديات التي يواجهها نموذج الانحدار الخطي
رغم بساطته، إلا أن هناك بعض الحالات التي قد لا يكون فيها الانحدار الخطي هو الخيار المثالي. فيما يلي بعض المشكلات الشائعة:
🔴 عدم خطية البيانات: إذا كانت العلاقة بين المدخلات والمخرجات غير خطية، فإن استخدام نموذج خطي قد يؤدي إلى نتائج ضعيفة.
🔴 التعدد الخطي (Multicollinearity): عندما يكون هناك ارتباط قوي بين المتغيرات المستقلة، فإن النموذج قد يصبح غير مستقر.
🔴 تأثير القيم الشاذة: القيم المتطرفة (Outliers) يمكن أن تؤثر بشكل كبير على النموذج وتغير النتائج بشكل غير متوقع.
🔹 متى يكون الانحدار الخطي مناسبًا؟
✔️ عندما تكون العلاقة بين المتغيرات تقريبًا خطية.
✔️ عندما لا يكون هناك تأثير كبير للقيم الشاذة.
✔️ عندما يكون عدد المتغيرات محدودًا، ولا توجد مشكلة في التعدد الخطي.
أما في الحالات التي تكون فيها العلاقة غير خطية أو هناك تأثيرات معقدة بين المتغيرات، فقد يكون من الأفضل استخدام نماذج أكثر تعقيدًا مثل الانحدار اللوجستي، الأشجار القرار، أو الشبكات العصبية.
🔹 الخلاصة
🔹 الانحدار الخطي هو أحد أبسط وأهم نماذج تعلم الآلة، حيث يساعد في إيجاد العلاقة بين المتغيرات والتنبؤ بالقيم المستقبلية.
🔹 يُستخدم في العديد من المجالات، من الاقتصاد إلى الطب، مرورًا بالتجارة الإلكترونية والتحليل المالي.
🔹 يمكن أن يكون بسيطًا (مع متغير واحد) أو متعددًا (مع عدة متغيرات)، وهو حجر الأساس للعديد من النماذج الأكثر تعقيدًا.في المقال القادم، سنتعمق أكثر بإذن الله ونفهم كيف يتم حساب معاملات النموذج (الميل والتقاطع) باستخدام طريقة المربعات الصغرى (Least Squares Method)، وسنرى كيف يمكننا بناء نموذج انحدار خطي من الصفر!