پردازش زبانهای طبیعی
مدرس: | گواهی: رسمی دوزبانه |
ترم: | پیشنیاز: – |
زمان ارائه: | محل برگزاری: کلاس مجازی |
هدف کلی
پردازش زبان طبیعی یکی از شاخههای بسیار مهم در پردازش زبان طبیعی به حساب میآید. هدف این علم ایجاد یک راه تعامل میان انسان و ماشین از طریق زبان طبیعی انسانی است. در این درس بنا داریم با مفاهیم پردازش زبان طبیعی آشنا شده و روشهای پایه در حل مسایل موجود در آن را معرفی کنیم. همچنین تا حدی در مورد روشهای به روز در حل مسائل نیز صحبت خواهیم کرد.
سرفصلها
- معرفی درس و اهداف آن (۱ جلسه)
- معرفی با کلیات درس، سیلابس آن و آنچه در درس پوشش داده میشود
- آشنایی با پردازش زبان طبیعی (۱ جلسه)
- معرفی پردازش زبان طبیعی، تاریخچه مختصر، مسائل مختلف موجود در آن و چالشهای آن
- روشهای پیشپردازش متن (۲ جلسه)
- عبارات منظم، توکنایزر، نرمالسازی، تشخیص ریشه و لما، تشخیص مرز جملات، نحوه محاسبه فاصله با MED
- مدلهای زبانی (۲ جلسه)
- روشهای پایه در مدلسازی زبانی، انگرامها، perplexity، smoothing
- روشهای پایه در دستهبندی مستندات متنی (۳ جلسه)
- مفهوم دستهبندی، نحوه استخراج ویژگی از متن، چند دستهبند ساده، معرفی مدل لاجستیک رگرسیون برای دستهبندی، تعمیم مدل لاجستیک رگرسیون به شبکه عصبی
- روشهای پایه در خوشهبندی مستندات متنی (۲ جلسه)
- مفهوم خوشهبندی و روشهای پایه k-means و mixture models
- بازنمایی کلمات (۴ جلسه)
- آشنایی با روشهای مختلف بازنمایی کلمات: روشهای پایهای، روشهای مبتنی بر جبر خطی، روشهای مبتنی بر شبکه عصبی، چالشهای مختلف در بازنمایی کلمات و راههای حل آنها، بازنماییهای مبتنی بر بافت (معرفی ساده)
- ترجمه ماشینی (۴ جلسه)
- معرفی مدلهای سنتی ترجمه ماشینی، مدلهایIBM، مدلهای مبتنی بر عبارات
- شبکههای عصبی بازگشتی و مدل مبتنی بر توجه (۳ جلسه)
- معرفی ساختار شبکههای عصبی بازگشتی ساده و ساختارهای معروف مثل LSTM و GRU، معرفی مدلهای روز ترجمه ماشینی، معرفی مدل توجه
- مساله تجزیه در پردازش زبان (۳ جلسه)
- آشنایی با انواع تجزیههای معنایی و نحوی
- معرفی مدلهای پایه برای حل مسئله تجزیه
- مسائل کاربردی دیگر در پردازش زبان طبیعی (۳ جلسه)
- معرفی مسایل دیگر در حوزه پردازش زبان طبیعی مانند استخراج اطلاعات، خلاصهسازی، برچسبزنی ادات سخن و …
ارزیابی
- تمرینهای عملی و سمینار پایانی: ۳۰٪
- آزمون میانترم: ۲۰٪
- آزمون پایانی: ۳۰٪
- پروژه پایانی: ۲۰٪
منابع
- Dan Jurafsky and James H. Martin. Speech and Language Processing (3rd ed. Draft), 2023.
- Manning and Schuetze, Foundations of Statistical Natural Language Processing, 1999.
- Yoav Goldberg. A Primer on Neural Network Models for Natural Language Processing, 2015.
- Ian Goodfellow, Yoshua Bengio, and Aaron Courville. Deep Learning, 2016.