Как автоматически определить тематику сайта?

Содержание

Тематика сайта играет немаловажную роль в создании и продвижении сайта. Есть прибыльные и не менее прибыльные тематики при монетизации или продаже сайта. Правильно выбранная тематика - залог успешного продвижения в поисковых системах (важно выбрать востребованную и денежную тематику при создании сайта для заработка, выбрать доноров для покупки ссылок на тематических сайтах и т.д.).

Определение тематики сайта: кому это нужно?

Начнем с того, что поисковые системы давно научились определять тематику сайта, и это, безусловно, используется ими в ранжировании (мы это увидим ниже). Определять тематичность веб-ресурса важно и для рядовых веб-мастеров, ситуации бывают самые различные:

  • Для покупки тематической ссылочной массы на родственных сайтах;
  • Для создания тематических сателлитов, доров (даже в 2017 году этим еще занимаются);
  • Для построения правильной структуры собственного сайта (определение статьи к нужной категории);
  • Для выработки и моделирования стратегии продвижения сайта (если ваша цель исключительно - монетизация, трафик и т.д.)

Про "конкурентов" и "похожие сайты" мы уже говорили. Там схожесть ресурсов определяется в большей мере по пересечению семантического ядра. Но эти родственные сайты никак не каталогизируются по тематике, мы можем лишь самостоятельно определить, например, при преобладании слов "стоматолог", "стоматология",  что сайт можно отнести к тематике "Здоровье". Впрочем, тематику сайта можно определить и по беглому просмотру главной страницы сайта. На практике, естественно, продвинутому вебмастеру требуется автоматическое определение тематики, поскольку:

  • Иногда требуется пакетная обработка сайтов (никто не будет определять тематику сотни сайтов в ручную);
  • Зачастую бывает сложно определить визуально, к какой именно тематике вообще относится сайт;
  • Оценка тематичности сайта роботом и человеком может отличаться;

Как и где в интернете определить к какой тематической группе относиться тот или иной сайт?

Сервисы для определения тематики сайта

Казалось бы, учитывая востребованность, в интернете можно отыскать множество онлайн-сервисов по определению тематики сайтов. На практике, их можно сосчитать на пальцах одной руки:

ExTheme.ru

exTheme.ru - очень хороший, старый, но практически мертвый онлайн сервис определения тематики сайтов. Определял как тематику текста по ссылке, так и любой текст. Имел api и плагины, брал мзду, но видимо что-то пошло не так, сайт практически в недееспособном состоянии, как и linkfeedator.ru (еще один алгоритм определения тематичности сайтов или один и тот же, в настоящее время вытесненный более пикантной тематикой) - проект того же Бориса Кохова.

http://extheme.ru/demo

Cfilter.ru

cfilter.ru - работающий сервис автоматического определения только русскоязычных страниц, сайтов и текстов (тематика страниц определяется по тексту с использованием оригинального самообучающегося алгоритма). Придумал и реализовал некто Олег, 1986 г.р.

http://cfilter.ru/test/index/

Определение тематики сайта в сервисе cfilter.ruОпределение тематики сайта в сервисе cfilter.ru

Наиболее вероятная тематичность для сайта "seo-zona.ru" по мнению сервиса - "Компьютеры и интернет".

MegaIndex.com

Автоматическое определение тематики текстов и сайтов есть в MegaIndex. Для определения рубрики текстов система использует собственный алгоритм и базу данных, собранные собственным роботом. Анализируется качество контента с точки зрения робота, предлагается три максимально подходящие тематики по совпадению содержимого.

https://ru.megaindex.com/a/tcategories

Тематика сайта в MegaIndexОпределение тематики сайта в MegaIndex

Как видим на примере сайта "seo-zona.ru" c вероятностью почти в 95% робот определил тематику как "Hi-Tech/Безопасность/Защита от спама".

Определение тематики сайта в Яндексе

Яндекс для собственных нужд определяет тематику сайтов. Рубрикация используется из Яндекс-Каталога. Если мы найдем сайт в Яндекс-Каталоге (если он там есть), то сможем узнать тематику

Источник

Комментарии (3):

#110.10.2017 15:48
Хуйня. У меня нейронка под это дело, лохи
Федор25.11.2017 19:38

Из всех проанализированных сервисов работают только три: Мегаиндекс, cfilter, и яндекс (наверное).
Моего сайта нет даже в скрытом каталоге.
Определенная этими сервисами тематика моего сайта вызвала некоторый шок.
Мегаиндекс пишет:
Тематика: Hi-Tech/Интернет/Хостинги
Совпадение: 91.2%
Тематика: Справки/Поиск людей
Совпадение: 91%
Тематика: Hi-Tech/Безопасность/Защита от спама
Совпадение: 90.7%

Особенно : Тематика: Справки/Поиск людей????

Гугл молчит как рыба в пирожке, exTheme вообще какой то поломатый не известно как себя там вести.

Спасибо за обзор.

#215.12.2017 12:40
Кто может помочь в определении тематики 150 тыс сайтов за разумную цену, напишите в telegram @brukenberg