بسم الله الرحمن الرحيم

014 مقدمة في AutoGluon: الطريقة الجديدة لأتمتة نماذج التعلم الآلي

تاريخ النشر : April 13, 2024

جمع وترتيب : محمود جابر, أخر تعديل بتاريخ 30 إبريل 2024


An educational infographic illustrating the concept of AutoGluon in machine learning. The graphic should depict a simplified workflow of AutoML, highl.webp

مقدمة في AutoGluon: الطريقة الجديدة لأتمتة نماذج التعلم الآلي

ما هو AutoGluon؟

AutoGluon هو إطار عمل قوي يُستخدم لأتمتة معالجة، إنشاء، وتحسين نماذج التعلم الآلي. يعتبر جزءًا من فئة النماذج المعروفة بـ "AutoML"، التي تهدف إلى جعل عملية التعلم الآلي أكثر سهولة وأتمتة.

كيف يعمل AutoGluon؟

في AutoGluon، تبدأ العملية بتحديد هدفك من مجموعة البيانات، مثل التنبؤ بقيمة معينة أو تصنيف البيانات إلى فئات. بعد ذلك، تحدد المدة التي تريد أن يتم تدريب النموذج خلالها. من هنا، يأخذ AutoGluon زمام المبادرة لأتمتة كافة العمليات الأخرى.

مميزات AutoGluon

  1. سهولة الاستخدام: يتميز AutoGluon بسهولة الاستخدام مما يجعله مثاليًا للمبتدئين في مجال البيانات. يمكن للمستخدمين إنشاء نموذج أساسي دون الحاجة لخبرة واسعة في التعلم الآلي.
  2. تجربة متعددة النماذج: يقوم AutoGluon بتجربة عدة نماذج مختلفة خلال فترة التدريب المحددة، مما يوفر فهمًا شاملًا لكيفية أداء كل نموذج مع بياناتك.

الفوائد العملية

  • توفير الوقت: من خلال أتمتة العديد من العمليات المعقدة، يوفر AutoGluon الوقت الذي قد يحتاجه المطورون وعلماء البيانات لبناء وتحسين النماذج يدويًا.
  • مقاييس شاملة: يوفر AutoGluon مقاييس لكل نموذج يتم تجربته، مما يتيح للمستخدمين تقييم أداء كل نموذج بشكل موضوعي واختيار الأنسب لمشكلتهم.

Code Example of AutoGluon

هذا الكود يستخدم مكتبة AutoGluon لتدريب نموذج تعلم آلي على مجموعة بيانات بسيطة. دعنا نقوم بشرح كل جزء من الكود بطريقة مبسطة:

  1. استيراد الحزم اللازمة:
import pandas as pd
from autogluon.tabular import TabularPredictor

يتم استيراد حزمة pandas للتعامل مع البيانات في صورة جداول (DataFrames)، وكذلك يتم استيراد TabularPredictor من autogluon.tabular، وهي أداة مصممة لتسهيل تدريب نماذج التعلم الآلي على بيانات جدولية.

2. إنشاء جدول البيانات:

df = pd.DataFrame(
    [[1, 2, 0], [3, 4, 1], [5, 6, 0], [7, 8, 1]],
    columns=["num", "amount", "target"]
)

يتم إنشاء جدول بيانات DataFrame يحتوي على ثلاثة أعمدة: num, amount, و target. العمود target هو المتغير التابع (الذي نريد تنبؤه)، بينما الأعمدة الأخرى هي متغيرات مستقلة.

3. تكوين وتدريب النموذج:

predictor = TabularPredictor(label="target").fit(
    train_data=df,
    time_limit=60,
    presets="best_quality"
)

يتم إنشاء كائن TabularPredictor مع تحديد العمود target كالمتغير الذي سيتم التنبؤ به. يتم تدريب النموذج باستخدام البيانات في df مع تحديد حد زمني للتدريب (60 ثانية) واختيار الوضعية best_quality لضمان أفضل جودة ممكنة للنموذج النهائي.

4. عرض ملخص النماذج المُنشأة:

# output a summary of created models
predictor.fit_summary()

بعد التدريب، يمكن استخدام هذه الطريقة لعرض ملخص عن النماذج المُنشأة، وهي تقدم معلومات مفيدة حول كيفية بناء النموذج وأدائه.

5. تقييم النموذج:

# evaluate best model from hyperparameter search
performance = predictor.evaluate(df)

يتم تقييم النموذج باستخدام نفس مجموعة البيانات df. هذا يعطي تقييمًا لأداء النموذج، ويمكن استخدام النتائج لفهم مدى جودة النموذج في التنبؤ بالمتغير target.

الخاتمة

AutoGluon يمثل ثورة في مجال التعلم الآلي، حيث يسهل عملية إنشاء وتحسين النماذج. بفضل هذه التقنية، أصبح بإمكان المبتدئين وحتى المحترفين في مجال التعلم الآلي تحقيق نتائج مذهلة بجهد أقل وفي وقت أسرع.

Additional Resources

العودة إلي 005 Algorithms and Tools