Поисковые системы

Яндекс вес в колдунщике

Итак, перечитав практически всего Миныча и ХРНС, конечно поздновато, но заинтересовался переколдовкой и весами слов. Если с попытками измерить накачанность одного сайта через слово, которое на нем не встречается все более менее понятно, то вот разная выдача при изменении веса одного и того же слова ставит меня в тупик. Пример:
http://www.yandex.ru/yandsearch?text...%3A%3A50000%29
- имеем копию нормального топа
Меняем вес слова до очень низкого значения
http://www.yandex.ru/yandsearch?text...2%D5%3A%3A5%29
- имеем какой-то топ ссылок
Может кто подскажет, что это за топ ссылок?
Геннадий0, даю подсказку - выставляя вес термину 5 вы по сути ставите приоритет на текстовое ранжирование, игнорируя ссылочное.
Т.е. топ формируется из документов с определенным количеством пассажей и определенной "тошнотой". Далее - сами.
Сообщение от MiRaj
Геннадий0, даю подсказку - выставляя вес термину 5 вы по сути ставите приоритет на текстовое ранжирование, игнорируя ссылочное.
Т.е. топ формируется из документов с определенным количеством пассажей и определенной "тошнотой". Далее - сами.
Типа пассажи в анкор-листе не пройдут кворум для ссылочного, если низкий вес словам задать?
MiRaj, спасибо! Теоретически да, но .... посмотрите выдачу по второй ссылке, на первом месте сайт, где ключевик упоминается в тексте всего 1 раз и то в исходящей ссылке. Ну как текстовая релевантность этой страницы сайта запросу может быть самой большой из всех проиндексированных страниц? Вторая страница в выдаче - то же самое.
Меня именно это очень сильно смущает.
Сообщение от MiRaj
Геннадий0, даю подсказку - выставляя вес термину 5 вы по сути ставите приоритет на текстовое ранжирование, игнорируя ссылочное.
Т.е. топ формируется из документов с определенным количеством пассажей и определенной "тошнотой". Далее - сами.
Хм, странно. Положим, что ссылочное мы отключаем и серп формируется с приоритетом на текстовую составляющую. Тогда все равно страницы хорошо прокачанные внутренними факторами (где много раз в тексте встречается слово "ПВХ") должны быть релевантнее страниц, где это слово встречается единственный раз и то в тексте ссылки.
Сравните, например, сохраненные копии первых трех сайтов по запросу ПВХ::5000
http://hghltd.yandex.com/yandbtm?url...=2&sg=57&isu=1
http://hghltd.yandex.com/yandbtm?url...=4&sg=65&isu=1
http://hghltd.yandex.com/yandbtm?url...=2&sg=33&isu=1
Сохраненные копии первых трех сайтов по запросу ПВХ::5
http://hghltd.yandex.com/yandbtm?url...=1&sg=-1&isu=1
http://hghltd.yandex.com/yandbtm?url...=1&sg=-1&isu=1
http://hghltd.yandex.com/yandbtm?url...=1&sg=-1&isu=1
Самый простой вывод, который приходит на ум: В зоне ссылок слова имеют другой вес, который вы не можете изменить - вес слов для зоны ссылок. При этом, когда вы занижаете вес слов в текстовой составляющей, начинают рулить слова в текстах ссылок, в которых вес слов становится выше, чем вес слов в тексте.
То есть слова, находящиеся в текстах ссылок, обрабатываются по другому!
З.Ы. Насчет отключения ссылочного MiRaj конечно прав , если бы оно не отключалось, сайты из первого варианта серпа рулили бы и во втором серпе, потому как они естественно больше прокачаны ссылочным. Вот вам и ответ: 1. отключение ссылочного. 2. Другая обработка запроса для слов, которые входят в текст ссылок.
Однако пока остается не понятным, механизм отключения ссылочного... И небольшое противоречие: отключаем ссылочное занижением веса слова и в то же время в текстах ссылок вес слов остается выше, чем вес того же слова в обычном тексте.
По идее, занижая вес запроса-однословника мы должны получать выдачу, в ранжировании которой превалируют статические (не зависящие от запроса) факторы. А именно - стат вес (вИЦ), нормирующее значение контента страницы ("тошнота"), нормирующее значение ссылочного (анкорного) для страницы и т.д.
Чего я не очень наблюдаю.
Примечательно, что на стр. 2, 3 - 40% страниц быстророботные. На на стр. 4, 5 - 30% страниц быстророботные. А на 1-ой и начиная с 6-ой по 10-ю (дальше смотреть не стал) быстророботных нет.
Сообщение от john2007
По идее, занижая вес запроса-однословника мы должны получать выдачу, в ранжировании которой превалируют статические (не зависящие от запроса) факторы. А именно - стат вес (вИЦ), нормирующее значение контента страницы ("тошнота"), нормирующее значение ссылочного (анкорного) для страницы и т.д.
Чего я не очень наблюдаю.
Ага, тошнота у страниц в первом и во втором серпе не очень разница. Думаю не в ней дело.
Еще примечательно, что такая картина только по однословникам (в смысле, что по заниженному весу вылазит внутряк), по двух-, трех-, четырех- словникам позиции сайтов меняются немного, но в топе главные страницы (т.е. ссылочно накаченные).
Сообщение от john2007
Еще примечательно, что такая картина только по однословникам (в смысле, что по заниженному весу вылазит внутряк), по двух-, трех-, четырех- словникам позиции сайтов меняются немного, но в топе главные страницы (т.е. ссылочно накаченные).
Да там не то что внутренние страницы. Там 90% серпа (с выдачей в 50 позиций) - это страницы, у которых слово запроса встречается именно в тексте ссылки на странице и больше нигде.
Сообщение от Nikitoz
Да там не то что внутренние страницы. Там 90% серпа (с выдачей в 50 позиций) - это страницы, у которых слово запроса встречается именно в тексте ссылки на странице и больше нигде.
Не сказал бы так. Смотрю запрос "аудиторские::5", в страницах топ 10 только пару страниц имеют это слово в ссылке, остальные просто в тексте. Вижу, что в моем случае 90% имеют однократное вхождение этого слова в текст.
UPD: ключевик не везде один, и то что он в тексте ссылки скорее следствие того что вы проверяет конкурентные запросы (т.е. заведомо те запросы, которых на странице будет либо много либо один-два в текстах ссылок).
Кстати, я не совсем был прав.
Задавая очень маленький вес слову вы практически говорите яндексу "игнорируй это слово", потому и получаете выдачу сформированную факторами:
1) минимальной текстовой релевантностью (как правило 1 пассаж)
2) тошнотой
3) стат. весом
4) отсутствием влияния ссылок (сл. из пункта 1.)
Кстати, похоже выдача отранжирована по текстовой релевантности от низкой к высокой, поскольку чем дальше, тем больше количество пассажей и за определенной страницей они начинаюют встречаться в тэгах h и далее в тайтле.
Сообщение от MiRaj
Задавая очень маленький вес слову вы практически говорите яндексу "игнорируй это слово"
Если допустить, что компоненты рассчитываются по-разному, например, одно функция по корню, а другое функция по логарифму корня, возможно, подавая разные уровни входных сигналов, на выходе получим разную структуру аддитивной модели.
Сообщение от pro-maker
Если допустить, что компоненты рассчитываются по-разному, например, одно функция по корню, а другое функция по логарифму корня, возможно, подавая разные уровни входных сигналов, на выходе получим разную структуру аддитивной модели.
Вот вы в свое время ворчали на Миныча, что он говорит непонятно, а потом видимо вкурили его теорию вместе со стилем изложения.Можете разьяснить?
Сообщение от Геннадий0
Можете разьяснить?
Это неспортивно. Нужно дать возможность другим участникам топика выдвинуть свои предположения.
Сообщение от pro-maker
Если допустить, что компоненты рассчитываются по-разному, например, одно функция по корню, а другое функция по логарифму корня, возможно, подавая разные уровни входных сигналов, на выходе получим разную структуру аддитивной модели.
вы считаете, что в основе модели лежит не статический набор функций, а функционалы, аргументами которого являются некоторые параметры запроса?
мысль вполне здравая, но какой смысл в этом для пользовательско-ориентированной системы, уровни входных сигналов которых являются величиной статистически постоянной?
Сообщение от MiRaj
вы считаете, что в основе модели лежит не статический набор функций, а функционалы, аргументами которого являются некоторые параметры запроса?
Объясните, зачем нам в местной (для данного топика) модели ранжирования мутирующая запросо-зависимость?
Кстати мною тоже замеченно, что ключевик в описании не очень полезен, много раз видел как сайты с "уникальным названием" по этому ключевику гораздо выше
Сообщение от MiRaj
вы по сути ставите приоритет на текстовое ранжирование, игнорируя ссылочное
-а когда яндекс по умолчанию выставляет вес термина в обычном запросе, он тоже "ставит приоритет на текстовое ранжирование, игнорируя ссылочное"?
Сообщение от Nikitoz
В зоне ссылок слова имеют другой вес, который вы не можете изменить - вес слов для зоны ссылок
Дельное замечание! В анкорной составляющей сидит также и частотная величина, которую мы не можем изменить с помощью оператора ::
Тогда уточняю вопрос
При уменьшении веса в подобном запросе:
1. Усиливается влияние текстовой релевантности на серп.
2. Снижается влияние ссылочной релевантности на серп.
3. Меняются и текстовая и ссылочная релевантность - текстовая релевантность растет, а ссылочная падает, но по разным формулам.
?
P.S. Wolf, вы имеете ввиду, что подобный запрос не затрагивает веса в ссылочной составляющей?
Сообщение от Геннадий0
P.S. Wolf, вы имеете ввиду, что подобный запрос не затрагивает веса в ссылочной составляющей?
В ссылочной используются две частотные характеристики. Одну затрагивает, другую - нет.