کلمه جو
صفحه اصلی

یادگیری نیمه نظارتی

دانشنامه عمومی

یادگیری نیمه نظارتی دسته ای از روش های یادگیری ماشین است که در آن از داده های بدون برچسب و داده های برچسب دار به صورت هم زمان برای بهبود دقت یادگیری استفاده می شود.
روش های یادگیری نیمه نظارتی را در یک دسته بندی کلی به دسته های زیر می توان تقسیم کرد.
در روش های مولد ابتدا یک مدل پارامتری برای تابع توزیع نقاط (مثلاً توزیع گاوسی) انتخاب می شود که آن را با P ( x | y , θ ) {\displaystyle P(\mathbf {x} |y,\theta )}   نشان می دهیم که در آن θ {\displaystyle \theta }   مدل است. سپس P ( y ) {\displaystyle P(y)}   از روی داده های برچسب دار تخمین زده می شود. احتمال وقوع نقاط با توجه به تابع توزیع هر دسته، بر حسب پارامترهای مدل، به صورت تحلیلی محاسبه می شود. سپس با اعمال قانون بیز می توان تابع توزیع برچسب در هر نقطه را محاسبه کرد. در روش های مولد معمولاً هدف بیشینه کردن این احتمال وقوع یا به طور معادل بیشینه کردن راست نمایی آن ها نسبت به پارامترهای مدل است. از روش های مختلفی می توان برای بهینه کردن پارامترهای مدل نسبت به میزان راست نمایی استفاده کرد.
در مقابل روش های مولد، روش هایی که به طور مستقیم به یادگیری P ( y | x ) {\displaystyle P(y|x)}   می پردازند یا روش های تمایزی هستند. توجیهات نظری وجود دارد که نشان می دهد که روش های مولد نیاز به داده های بیشتری نسبت به روش های تمایزی جهت یادگیری دارند. همچنین در عمل روش های تمایزی موفق تر نشان داده اند؛ بنابراین تحقیقات روی روش های مولد کم رنگ بوده است.


کلمات دیگر: