پردازش زبان طبيعى فارسی

نام دوره : پردازش زبان طبيعى فارسی
نام لاتین دوره : Persian Natural Language Processing
کد دوره : P.M.94.181
مدت زمان : 16 ساعت
هزینه ثبت نام : 3,500,000 ریال

خلاصه دوره :

هدف کلی این دورۀ آموزشی درکنار شناخت مفاهیم، آشنایی عملی با روش‌ها و ابزار مرتبط با پردازش زبان طبیعی با تکیه بر پردازش متون و مدل‌سازی زبان فارسی است. در این دوره مباحثی در حوزه‌های بازیابی و طبقه‌بندی اطّلاعات، مدل زبانی و ابزار قابل استفاده در آنها ارائه شود. همچنین مراحل تولید مدل زبانی ویژۀ زبان فارسی با بهره‌گیری از ابزار SRILM و نحوۀ به‌کارگیری مدل تولیدی در بازشناسی گفتار بیان  می‌شود.

اهداف دوره :

آشنایی با اصول اوّلیه در پردازش متون و زبان
بازیابی و طبقه‌بندی اطّلاعات
آشنایی با مباحث پایه و پیشرفته در مدل‌سازی زبانی
آشنایی با نحوۀ استخراج و استفاده از اطّلاعات متون و کاربرد آن در بازشناسی گفتار
آشنایی عملی با جعبه‌ابزار مدل‌سازی زبانی (SRILM)

مخاطبین دوره :
  1. در سطح دانشگاهی
سر فصل ها :
  1. اهداف پردازش زبان طبيعى (NLP) و مشکلات پیرامون آن
  2. دادگان
  3. مراحل مختلف در بازیابی و طبقه‌بندی اطّلاعات
    1. روش‌ها و معیارهای مناسب در استخراج اطّلاعات
    2. ابزارها
  4. مدل‌سازی زبانی
    1. مدل‌های زبانی احتمالاتی
    2. مدل‌های n-gram
    3. تُنُک (sparse)  بودن دادگان
    4. روش‌های هموارسازی
    5. استخراج اطّلاعات معنایی و موضوعی
  5. آشنایی عملی با ابزار toolkit SRILM و مراحل تولید مدل زبانی با آن
  6. کاربرد مدل زبانی در بازشناسی گفتار فارسی
    1. معرفی دادگان در زبان فارسی و ساخت واژگان
    2. تولید مدل زبانی و ارزیابی
    3. نحوۀ استفاده از مدل زبانی در بازشناسی گفتار
پردازش زبان طبيعى فارسی