Оптимизация для поисковых систем: особенности морфологии Яндекса

Одобрено экспертом
16

Сегодня мы затронем животрепещущую тему русского языка. А именно - его понимание Яндексом и Google, которое, мягко говоря, отличается от нашего.

Русский язык - один из самых богатых и непонятных в мире. По сложности его можно сравнить разве что с китайским и японским, а по богатству даже пример подобрать довольно сложно.

Очень часто наше интуитивное понимание русского языка идет в разрез с формальными нормами и правилами. Но еще больше проблем возникает при попытке заставить машину разобраться во всех стилистических, лингвистических и прочих филологических тонкостях текста, написанного на русском языке.

В этом выпуске мы постараемся рассказать вам о том, как машинное понимание языка отличается от человеческого, и как это отображается на выдаче.

Итак, начнем с математики. В русском языке присутствует и активно используется (в разных областях) около 3 сотен тысяч слов. Каждое третье слово имеет несколько словоформ, которые различаются сразу по нескольким факторам: род, падеж, число и т.д.

Для примера, любое прилагательное может находиться в краткой форме, двух числах, сравнительной и превосходной степени, в трех родах, в семи падежах, быть одушевленным или нет. В результате получается, что каждой прилагательное может иметь около 129 (!) словоформ. То есть, около 100 слов в русском языке имеют хвост из 129 словоформ.

Чтобы сэкономить место (как в бумажном словаре, так и в электронной памяти), слова формируют в морфологические группы. Для примера, слова «могучий» и «великий» имеют одинаковые окончания в одинаковых словоформах.

Витоге, если на вариант с сохранением всех существующих словоформ нужно около 500 Мб памяти, то на сохранение групп уходит только 10Мб. Цифры, вроде, и не такие уж пугающие, но если вспомнить, что морфология Яндекса формировалась лет 10-12 назад, когда закупка такого количества памяти для всех серверов могла влететь в копеечку, становится понятным «особое» отношение машины к словоформам русского языка.

С тех пор правила русского языка не изменились, количество слов не уменьшилось, а скорее даже выросло, но исправлением существующего положения никто так и не занимался, так как изменение морфологии Яндекса повлекло бы за собой целый каскад проблем.

В следующем выпуске мы с вами поговорим о том, как сложившаяся ситуация отображается на поисковых алгоритмах Яндекса, а значит и на ленте выдачи.

Нашли ответ на свой вопрос?
2 893 просмотра
Обсудить
2 минуты на чтение
11.10.2012, 18:42
17.12.2015, 05:35
Поделиться в соц. сетях
Настя Чехова
Настя Чехова
Маркетолог
Написано 11 октября 2012 г. в 18:42
Обновлено 17 декабря 2015 г. в 05:35
Настя Чехова
Настя Чехова
Маркетолог
Стаж 5 лет
2 893 просмотра
Обсудить
2 минуты на чтение
11.10.2012, 18:42
17.12.2015, 05:35
Поделиться в соц. сетях
Комьюнити теперь в Телеграм!
Подпишитесь, чтобы следить за новостями заработка в интернете
@livesurf
Редакция LIVEsurf
Редакция LIVEsurf

LIVEsurf — цифровая платформа для повышения трафика и улучшения поведенческих факторов сайтов. В наших статьях — практические кейсы, рекомендации и данные с реальных проектов. Мы постоянно анализируем тренды digital-маркетинга, чтобы делиться только актуальной и проверенной информацией.

Читайте дальше
Домены Google по странам
Домены Google по странам

Для добавление источников трафика из Google стран которые отсутствуют в выборе источников поискового трафика при добавле…

7 сентября 2020 г.
7 минут на чтение
Работа с документом Google Docs
Google Docs: полное практическое руководство

Google Docs вырос из простой рабочей задачи: сделать документ, который не нужно пересылать туда-сюда после каждой правки…

11 июня 2026 г.
23 минуты на чтение
Как продвигать приложение, чтобы им пользовались во всем мире
Как продвигать приложение, чтобы им пользовались во всем мире

Рынок мобильных приложений интересен тем, что у него нет привязки к географическим границам. Разработчик сделал приложен…

25 ноября 2020 г.
9 минут на чтение
Больше на эту же тему
Маршрут запуска сайта на WordPress
Как создать сайт на WordPress с нуля

Чаще всего новый сайт на WordPress застревает не на самой установке, а на мелких решениях вокруг неё: какой домен взять,…

12 июня 2026 г.
23 минуты на чтение
Автоматический просмотр сайтов через буксы на компьютере
Автосерфинг на буксах: как начать, что проверить и где применять

Автосерфинг на буксах интересует тех, кто хочет запустить автоматический просмотр сайтов и понять, где в этой схеме есть…

4 апреля 2026 г.
21 минута на чтение
Мобильное приложение. Для iOS. Разработка приложений для устройств Apple
Мобильное приложение. Для iOS. Разработка приложений для устройств Apple

Процесс создания приложений для iOS Первый шаг в процессе разработки, это решить - что приложение будет делать, и начать…

30 мая 2021 г.
12 минут на чтение
Популярные статьи
Бесплатная накрутка посещаемости сайта легальным и нелегальным способом
Бесплатная накрутка посещаемости сайта легальным и нелегальным способом

Что это за способы? Трафик для своего сайта можно получать различными способами, в том числе и "не совсем белыми". Но эт…

22 января 2023 г.
8 минут на чтение
Российские издатели игр: где их искать и к кому обращаться?
Российские издатели игр: где их искать и к кому обращаться?

Обращаться к издателю игры приходится чаще. Потому что он имеет опыт, связи и деньги. Но при этом нужно ответственно под…

8 апреля 2021 г.
5 минут на чтение
ВКонтакте запустила сообщения с таймером, а также без уведомлений
ВКонтакте запустила сообщения с таймером, а также без уведомлений

Мобильное приложение ВК продолжает развиваться, получая новые и необычные функции. Последним обновлением разработчики до…

11 июня 2021 г.
2 минуты на чтение
0 комментариев
Пользователи онлайн:
UserUserUserUser
и ещё 16 зарегистрированных и 609 гостей сейчас на LIVEsurf