Оптимизация для поисковых систем: особенности морфологии Яндекса

Сегодня мы затронем животрепещущую тему русского языка. А именно – его понимание Яндексом и Google, которое, мягко говоря, отличается от нашего.

Русский язык – один из самых богатых и непонятных в мире. По сложности его можно сравнить разве что с китайским и японским, а по богатству даже пример подобрать довольно сложно.

Очень часто наше интуитивное понимание русского языка идет в разрез с формальными нормами и правилами. Но еще больше проблем возникает при попытке заставить машину разобраться во всех стилистических, лингвистических и прочих филологических тонкостях текста, написанного на русском языке.

В этом выпуске мы постараемся рассказать вам о том, как машинное понимание языка отличается от человеческого, и как это отображается на выдаче.

Итак, начнем с математики. В русском языке присутствует и активно используется (в разных областях) около 3 сотен тысяч слов. Каждое третье слово имеет несколько словоформ, которые различаются сразу по нескольким факторам: род, падеж, число и т.д.

Для примера, любое прилагательное может находиться в краткой форме, двух числах, сравнительной и превосходной степени, в трех родах, в семи падежах, быть одушевленным или нет. В результате получается, что каждой прилагательное может иметь около 129 (!) словоформ. То есть, около 100 слов в русском языке имеют хвост из 129 словоформ.

Чтобы сэкономить место (как в бумажном словаре, так и в электронной памяти), слова формируют в морфологические группы. Для примера, слова «могучий» и «великий» имеют одинаковые окончания в одинаковых словоформах.

Витоге, если на вариант с сохранением всех существующих словоформ нужно около 500 Мб памяти, то на сохранение групп уходит только 10Мб. Цифры, вроде, и не такие уж пугающие, но если вспомнить, что морфология Яндекса формировалась лет 10-12 назад, когда закупка такого количества памяти для всех серверов могла влететь в копеечку, становится понятным «особое» отношение машины к словоформам русского языка.

С тех пор правила русского языка не изменились, количество слов не уменьшилось, а скорее даже выросло, но исправлением существующего положения никто так и не занимался, так как изменение морфологии Яндекса повлекло бы за собой целый каскад проблем.

В следующем выпуске мы с вами поговорим о том, как сложившаяся ситуация отображается на поисковых алгоритмах Яндекса, а значит и на ленте выдачи.

Популярные статьи
Правильное использование низкочастотных запросов
Правильное использование низкочастотных запросов

Плотность ключевых слов в тексте как один из параметров оптимизации сайта под требования поисковых машин
Плотность ключевых слов в тексте как один из параметров оптимизации сайта под требования поисковых машин

Хештеги в социальных сетях. Эффективное использование
Хештеги в социальных сетях. Эффективное использование

Noindex и Nofollow - теперь без них никуда!
Noindex и Nofollow - теперь без них никуда!

Учимся писать без ошибок
Учимся писать без ошибок

Эффективное семантическое ядро сайта: составь и поймай трафик
Эффективное семантическое ядро сайта: составь и поймай трафик

Cоздание сайта на Wordpress
Cоздание сайта на Wordpress

Причины, которые препятствуют индексированию страниц сайта
Причины, которые препятствуют индексированию страниц сайта

Секреты создания мультиязычного сайта
Секреты создания мультиязычного сайта

Как написать SEO-текст: открываем секреты копирайтерам
Как написать SEO-текст: открываем секреты копирайтерам

Какие существуют фильтры поисковых систем
Какие существуют фильтры поисковых систем

Настройка индексации сайтов: пошаговая инструкция
Настройка индексации сайтов: пошаговая инструкция

Как поразить при помощи слова, или кто такой идеальный копирайтер в глазах заказчика
Как поразить при помощи слова, или кто такой идеальный копирайтер в глазах заказчика

Как работает алгоритм Яндекса \
Как работает алгоритм Яндекса \"Минусинск\"

Релевантность информации как один из важнейших показателей для вывода сайта в ТОП
Релевантность информации как один из важнейших показателей для вывода сайта в ТОП

Как улучшить текст на сайте: полезные рекомендации и советы по оптимизации статей
Как улучшить текст на сайте: полезные рекомендации и советы по оптимизации статей

Как пользоваться алгоритмом Google Freshness
Как пользоваться алгоритмом Google Freshness

Преимущества и недостатки покупки старых доменов
Преимущества и недостатки покупки старых доменов

Зачем нужен сниппет
Зачем нужен сниппет

Экспертность текста — залог успешного продвижения!
Экспертность текста — залог успешного продвижения!

Показать еще


Нашли ошибку в тексте?

Выделите фрагмент с ошибкой.
Нажмите







Еженедельная рассылка
лучших материалов LS

Спасибо! Мы записали Вашу почту,
на неё придет письмо со ссылкой для подтверждения.

Похоже, произошла ошибка. Попробуйте
перезагрузить страницу и попробовать снова.