Оптимизация для поисковых систем: особенности морфологии Яндекса

Сегодня мы затронем животрепещущую тему русского языка. А именно – его понимание Яндексом и Google, которое, мягко говоря, отличается от нашего.

Русский язык – один из самых богатых и непонятных в мире. По сложности его можно сравнить разве что с китайским и японским, а по богатству даже пример подобрать довольно сложно.

Очень часто наше интуитивное понимание русского языка идет в разрез с формальными нормами и правилами. Но еще больше проблем возникает при попытке заставить машину разобраться во всех стилистических, лингвистических и прочих филологических тонкостях текста, написанного на русском языке.

В этом выпуске мы постараемся рассказать вам о том, как машинное понимание языка отличается от человеческого, и как это отображается на выдаче.

Итак, начнем с математики. В русском языке присутствует и активно используется (в разных областях) около 3 сотен тысяч слов. Каждое третье слово имеет несколько словоформ, которые различаются сразу по нескольким факторам: род, падеж, число и т.д.

Для примера, любое прилагательное может находиться в краткой форме, двух числах, сравнительной и превосходной степени, в трех родах, в семи падежах, быть одушевленным или нет. В результате получается, что каждой прилагательное может иметь около 129 (!) словоформ. То есть, около 100 слов в русском языке имеют хвост из 129 словоформ.

Чтобы сэкономить место (как в бумажном словаре, так и в электронной памяти), слова формируют в морфологические группы. Для примера, слова «могучий» и «великий» имеют одинаковые окончания в одинаковых словоформах.

Витоге, если на вариант с сохранением всех существующих словоформ нужно около 500 Мб памяти, то на сохранение групп уходит только 10Мб. Цифры, вроде, и не такие уж пугающие, но если вспомнить, что морфология Яндекса формировалась лет 10-12 назад, когда закупка такого количества памяти для всех серверов могла влететь в копеечку, становится понятным «особое» отношение машины к словоформам русского языка.

С тех пор правила русского языка не изменились, количество слов не уменьшилось, а скорее даже выросло, но исправлением существующего положения никто так и не занимался, так как изменение морфологии Яндекса повлекло бы за собой целый каскад проблем.

В следующем выпуске мы с вами поговорим о том, как сложившаяся ситуация отображается на поисковых алгоритмах Яндекса, а значит и на ленте выдачи.

Получите ПОДАРОК – 300 посетителей для раскрутки вашего сайта или видео
С уважением, Настя Чехова

Маркетолог




ПОСМОТРИТЕ ВИДЕО (ЭТО ВАЖНО):



С этой статьей также читают:
Оптимизация для поисковых систем: плюсы и минусыКак добавить сайт в каталог DMOZПродвижение в сети: социальный мир Интернета


Популярные статьи
Cоздание сайта на Wordpress
Cоздание сайта на Wordpress

Какие существуют фильтры поисковых систем
Какие существуют фильтры поисковых систем

Нейронные сети: виды, принцип работы и области применения
Нейронные сети: виды, принцип работы и области применения

Что нужно делать для раскрутки группы в одноклассниках
Что нужно делать для раскрутки группы в одноклассниках

Настройка, продвижение и оптимизация сайта на Opencart
Настройка, продвижение и оптимизация сайта на Opencart

Как улучшить текст на сайте: полезные рекомендации и советы по оптимизации статей
Как улучшить текст на сайте: полезные рекомендации и советы по оптимизации статей

Что такое РСЯ или как получить клиентов за копейки
Что такое РСЯ или как получить клиентов за копейки

Почему так важны социальные сигналы?
Почему так важны социальные сигналы?

Показать еще




 (голосов: 1)


Комментарии:

Нашли ошибку в тексте?

Выделите фрагмент с ошибкой.
Нажмите