Overfitting
جمعه, ۵ مهر ۱۳۹۲، ۰۴:۳۳ ب.ظ
این نوشته گردآوری نوشته های پراکنده پیرامون Overfitting است که با گشت و گذاری در وب به دست آورده ام. لب مطلب این بخش را از مطالبی که آقای دکتر سعید شیری به عنوان محتوای درس دانشگاهی انتشار داده اند گرفته ام.
تعریف:
برای فرضیه ای مثل h روی فضای فرضیه ای H دو نوع خطا وجود دارد.
- خطا روی داده های آموزشی
- errortrain(h)
- خطا روی کل داده های ممکن
- errorD(h)
می گوئیم برای فرضیه h عضو H روی داده های آموزشی Overfitting رخ داده است، اگر فرضیه ای مثل h0 عضو H وجود داشته باشد که :
errortrain(h) < errortrain(h0)
&
errorD(h) > errorD(h0)
یعنی فرضیه ای (یا مدلی) دیگر وجود دارد که در استفاده واقعی و کاربری، از مدل ما بهتر است ولی بر روی داده های آموزشی بهتر نیست.
- ۲ نظر
- ۰۵ مهر ۹۲ ، ۱۶:۳۳