Современные методы и средства построения систем информационного поиска. Лекция 13. Выявление спам-сайтов на основе анализа контента страниц. Соловьев Дмитрий

742

Соловьев Дмитрий рассказывает, как анализируя контент, выявлять спам-сайты.

  1. Что мы хотим получить
  2. Зачем?
  3. Методы воздействия на поисковый механизм
  4. Классификация воздействия на поисковый механизм
  5. Простые функции
  6. Карта классов (SOM)
  7. Что делать дальше
  8. Спам или нет?
  9. Причины:
  10. Характеристики сайта
  11. Результаты
  12. Источники данных
  13. Текстовая классификация
  14. Недостатки подхода
  15. Трудные случаи
  16. Результаты текстовой классификации
  17. Добавляем данные
  18. Что получилось?
  19. Классификация запросов