Оптимизация для поисковых систем: особенности морфологии Яндекса

Одобрено экспертом
16

Сегодня мы затронем животрепещущую тему русского языка. А именно - его понимание Яндексом и Google, которое, мягко говоря, отличается от нашего.

Русский язык - один из самых богатых и непонятных в мире. По сложности его можно сравнить разве что с китайским и японским, а по богатству даже пример подобрать довольно сложно.

Очень часто наше интуитивное понимание русского языка идет в разрез с формальными нормами и правилами. Но еще больше проблем возникает при попытке заставить машину разобраться во всех стилистических, лингвистических и прочих филологических тонкостях текста, написанного на русском языке.

В этом выпуске мы постараемся рассказать вам о том, как машинное понимание языка отличается от человеческого, и как это отображается на выдаче.

Итак, начнем с математики. В русском языке присутствует и активно используется (в разных областях) около 3 сотен тысяч слов. Каждое третье слово имеет несколько словоформ, которые различаются сразу по нескольким факторам: род, падеж, число и т.д.

Для примера, любое прилагательное может находиться в краткой форме, двух числах, сравнительной и превосходной степени, в трех родах, в семи падежах, быть одушевленным или нет. В результате получается, что каждой прилагательное может иметь около 129 (!) словоформ. То есть, около 100 слов в русском языке имеют хвост из 129 словоформ.

Чтобы сэкономить место (как в бумажном словаре, так и в электронной памяти), слова формируют в морфологические группы. Для примера, слова «могучий» и «великий» имеют одинаковые окончания в одинаковых словоформах.

Витоге, если на вариант с сохранением всех существующих словоформ нужно около 500 Мб памяти, то на сохранение групп уходит только 10Мб. Цифры, вроде, и не такие уж пугающие, но если вспомнить, что морфология Яндекса формировалась лет 10-12 назад, когда закупка такого количества памяти для всех серверов могла влететь в копеечку, становится понятным «особое» отношение машины к словоформам русского языка.

С тех пор правила русского языка не изменились, количество слов не уменьшилось, а скорее даже выросло, но исправлением существующего положения никто так и не занимался, так как изменение морфологии Яндекса повлекло бы за собой целый каскад проблем.

В следующем выпуске мы с вами поговорим о том, как сложившаяся ситуация отображается на поисковых алгоритмах Яндекса, а значит и на ленте выдачи.

Нашли ответ на свой вопрос?
2 847 просмотров
Обсудить
2 минуты на чтение
17.12.2015, 05:35
Поделиться в соц. сетях
Настя Чехова
Настя Чехова
Маркетолог
11 октября 2012 г. в 18:42
Настя Чехова
Настя Чехова
Маркетолог
Стаж 5 лет
2 847 просмотров
Обсудить
2 минуты на чтение
17.12.2015, 05:35
Поделиться в соц. сетях
Комьюнити теперь в Телеграм!
Подпишитесь, чтобы следить за новостями заработка в интернете
@livesurf
Редакция LIVEsurf
Редакция LIVEsurf

LIVEsurf — цифровая платформа для повышения трафика и улучшения поведенческих факторов сайтов. В наших статьях — практические кейсы, рекомендации и данные с реальных проектов. Мы постоянно анализируем тренды digital-маркетинга, чтобы делиться только актуальной и проверенной информацией.

Читайте дальше
Домены Google по странам
Домены Google по странам

Для добавление источников трафика из Google стран которые отсутствуют в выборе источников поискового трафика при добавле…

7 сентября 2020 г.
7 минут на чтение
Как продвигать приложение, чтобы им пользовались во всем мире
Как продвигать приложение, чтобы им пользовались во всем мире

Рынок мобильных приложений интересен тем, что у него нет привязки к географическим границам. Разработчик сделал приложен…

25 ноября 2020 г.
9 минут на чтение
Локализация для приложений
Локализация для приложений

Заниматься разработкой мобильных приложений выгодно, потому что рынок их продаж может включать весь мир. Нет практически…

27 октября 2020 г.
7 минут на чтение
Больше на эту же тему
Мобильное приложение. Для iOS. Разработка приложений для устройств Apple
Мобильное приложение. Для iOS. Разработка приложений для устройств Apple

Процесс создания приложений для iOS Первый шаг в процессе разработки, это решить - что приложение будет делать, и начать…

30 мая 2021 г.
12 минут на чтение
Cоздание сайта на Wordpress
Cоздание сайта на Wordpress

Современные реалии таковы, что многим нужен многофункциональный, толковый сайт, но лезть во front-end программирование, …

12 июня 2019 г.
12 минут на чтение
Каким будет рынок мобильных приложений в 2021 году: прогнозы и тренды
Каким будет рынок мобильных приложений в 2021 году: прогнозы и тренды

Наиболее полно описать прошедший 2020 год можно одним словом - пандемия. Охвативший весь мир вирус почти полностью запол…

2 марта 2021 г.
7 минут на чтение
Популярные статьи
полезность текста
Важность полезности текста в современной оптимизации с точки зрения пользователей и поисковых систем

Польза текста - очень важный параметр продвижения сайта, определяющий во многом показатель конверсии: действительно поле…

30 сентября 2016 г.
4 минуты на чтение
Бесплатная накрутка посещаемости сайта легальным и нелегальным способом
Бесплатная накрутка посещаемости сайта легальным и нелегальным способом

Что это за способы? Трафик для своего сайта можно получать различными способами, в том числе и "не совсем белыми". Но эт…

22 января 2023 г.
8 минут на чтение
как защитить контент от воровства
Как защитить уникальный контент на своем сайте от копирования: способы и секреты вебмастеров

Любой вебмастер знает, что качественный контент - залог популярности ресурса и высоких позиций в поисковой выдаче. Казал…

1 сентября 2016 г.
4 минуты на чтение
0 комментариев
Пользователи онлайн:
UserUserUserUser
и ещё 16 зарегистрированных и 609 гостей сейчас на LIVEsurf