پردازش زبان طبيعى فارسی

نام دوره : پردازش زبان طبيعى فارسی
نام لاتین دوره : Persian Natural Language Processing
کد دوره : P.M.94.181
مدت زمان : 16 ساعت
هزینه ثبت نام : 3,500,000 ریال

خلاصه دوره :

هدف کلی این دورۀ آموزشی درکنار شناخت مفاهیم، آشنایی عملی با روش‌ها و ابزار مرتبط با پردازش زبان طبیعی با تکیه بر پردازش متون و مدل‌سازی زبان فارسی است. در این دوره مباحثی در حوزه‌های بازیابی و طبقه‌بندی اطّلاعات، مدل زبانی و ابزار قابل استفاده در آنها ارائه شود. همچنین مراحل تولید مدل زبانی ویژۀ زبان فارسی با بهره‌گیری از ابزار SRILM و نحوۀ به‌کارگیری مدل تولیدی در بازشناسی گفتار بیان  می‌شود.

اهداف دوره :

آشنایی با اصول اوّلیه در پردازش متون و زبان
بازیابی و طبقه‌بندی اطّلاعات
آشنایی با مباحث پایه و پیشرفته در مدل‌سازی زبانی
آشنایی با نحوۀ استخراج و استفاده از اطّلاعات متون و کاربرد آن در بازشناسی گفتار
آشنایی عملی با جعبه‌ابزار مدل‌سازی زبانی (SRILM)

مخاطبین دوره :
 1. در سطح دانشگاهی
سر فصل ها :
 1. اهداف پردازش زبان طبيعى (NLP) و مشکلات پیرامون آن
 2. دادگان
 3. مراحل مختلف در بازیابی و طبقه‌بندی اطّلاعات
  1. روش‌ها و معیارهای مناسب در استخراج اطّلاعات
  2. ابزارها
 4. مدل‌سازی زبانی
  1. مدل‌های زبانی احتمالاتی
  2. مدل‌های n-gram
  3. تُنُک (sparse)  بودن دادگان
  4. روش‌های هموارسازی
  5. استخراج اطّلاعات معنایی و موضوعی
 5. آشنایی عملی با ابزار toolkit SRILM و مراحل تولید مدل زبانی با آن
 6. کاربرد مدل زبانی در بازشناسی گفتار فارسی
  1. معرفی دادگان در زبان فارسی و ساخت واژگان
  2. تولید مدل زبانی و ارزیابی
  3. نحوۀ استفاده از مدل زبانی در بازشناسی گفتار
پردازش زبان طبيعى فارسی