التصنيف والانحدار الشجري المصنف (CART) -
تم نشر خوارزميات CART لأول مرة بواسطة Leo Breiman في عام 1984. كما يوحي الاسم، تستخدم هذه الخوارزمية في هرمية القرار، وهي أداة شائعة لدعم القرار في التعلم الآلي.
من خلال بناء الهرمية، مما يعني إعطائها مزيدًا من المعلومات للتعلم منها في شكل قواعد أساسية للقرار، يمكن بناء نموذج من خلال بناء كافة الفروع
كلما زاد عدد الفروع الموجودة في هرمية القرار، كان أفضل بحيث يناسب النموذج والغرض منه.
في الأساس، هرمية القرار عبارة عن هيكل بسيط نوعًا ما يتكون من ثلاثة أنواع مختلفة من العناصر: عقدة جذرية واحدة، وهي نقطة البداية بما في ذلك جميع عينات التدريب، وعقد اتخاذ القرار المتعددة، حيث نقسم بياناتنا باستخدام قواعد بسيطة للقرار، وعقد طرفية متعددة، حيث نقوم في النهاية بتعيين الفئات لغرض التصنيف الخاص بنا.
إذا نظرنا إلى الرسم البياني النموذجي، فمن السهل أن نرى أنه من خلال إضافة المزيد من عقد القرار، لا تزيد التعقيد، بل تزيد دقة النموذج.
مزايا أشجار القرار:
بالمقارنة مع خوارزميات التصنيف الأخرى، فإن النموذج سهل الفهم إلى حد ما.
يمكن تصور شجرة القرار للمساعدة في فهمها أو تفسيرها.
لا يمكن فقط معالجة البيانات الرقمية، ولكن أيضًا البيانات الفئوية.
مساوئ هرمية القرار
عرضة للإفراط في التخصيص، مما يعني إنشاء هرمية معقدة للغاية تفشل في تعميم البيانات بشكل صحيح.
استخدام هرمية قرار بسيطة فقط هو عرضة للتغيرات؛
حتى الاختلافات الصغيرة في البيانات يمكن أن تؤدي إلى مختلف هرمية القرار.
يمكن تجنب ذلك باستخدام مجموعات من هرمية القرار، والتي سنلقي نظرة عليها أيضًا في الفصل التالي.
اعتمادًا على كيفية اختيار عقد القرار، يمكن أن تكون البيانات مختارة بسهولة، مما يعني أن فئات معينة تهيمن على هرمية القرار.
للتعمق أكثر في الجزء النظري يمكننا الرجوع الى العديد من المراجع:
https://blogs.fu-berlin.de/reseda/random-forest/
Liaw, A., Wiener, M. (2002): Classification and Regression by randomForest. Forest, 23.
Pal., M. (2003): Random Forest Classifier for Remote Sensing Classification. In: International Journal of Remote Sensing, Volume 26, Issue 1. Pages 217-222.