Современные методы и средства построения систем информационного поиска. Лекция №4. Коллокации. Андреев Игорь

813

Андреев Игорь рассказывает о коллокации.

  1. Методы подсчёта вероятности: параметрический и непараметрический подходы, стандартные и биноминальные распределения, мультиноминальное и нормальное распределения, аппроксимирование
  2. Байесовский подход к статистике
  3. Определение коллокаций, их признаки
  4. Частотность биграмм
  5. Фильтр по частям речи
  6. Отклонения, гистограммы отклонений
  7. Поиск коллокаций, примеры применения t-критерия
  8. Поиск отличий в словоупотреблении
  9. Критерий Пирсона
  10. ᵪ2-критерий
  11. Критерий отношения правдоподобия
  12. Относительные частоты
  13. Взаимная информация
  14. Разреженность данных
  15. F-мера