Возможно ли определить формулу для стат веса страницы, ставя эксперименты и исследуя серп, например в Яндексе?
Предположение, что нельзя, т.к. в случае если мы сравниваем положение в серпе двух страниц и исключили все факторы кроме стат веса, то не понятно не только насколько, но и как определить, что у одной страницы стат вес больше чем у другой. Стат вес у двух страниц может быть одинаковым, но в серпе все равно одна будет выше другой.
Сообщение от john2007
Возможно ли определить формулу для стат веса страницы, ставя эксперименты и исследуя серп, например в Яндексе?
Вы об этом вопрос задали?
http://forum.searchengines.ru/showthread.php?t=46953
Сообщение от Новичек
Вы об этом вопрос задали?
http://forum.searchengines.ru/showthread.php?t=46953
Ну, конечно, про вИЦ.
Но вопрос остается и предположение остается и аргумент приведенный остается.
Спроси у XTR. Правда, ответ я знаю
Сообщение от The WishMaster
Спроси у XTR. Правда, ответ я знаю
Он же в бане парится, если мне память не изменяет
А личных контактов у меня нет. Может ты тогда ответишь, раз ответ знаешь, хотябы в личку?
Сообщение от john2007
Может ты тогда ответишь, раз ответ знаешь, хотябы в личку?
Да он все равно не скажет. Почитай его топики и увидишь.
Возможно бред. Если бы мне дали такое задание, то поставил бы для 2 сайтов ссылку с одной и той же страницы своего сайта с анкором уникальным для обоих, так чтобы по нему оба находились по ссылке и только по этой. Далее поиск по этому анкору, область поиска два испытуемых сайта.
Сообщение от Priorat
Возможно бред. Если бы мне дали такое задание, то поставил бы для 2 сайтов ссылку с одной и той же страницы своего сайта с анкором уникальным для обоих, так чтобы по нему оба находились по ссылке и только по этой. Далее поиск по этому анкору, область поиска два испытуемых сайта.
И что? Я уже писал, что если один выше другого в серпе, то это не значит, что у одного стат вес больше чем у другого - он может быть одинаковый.
Серп - не формальное явление, отсортированное по весам страниц. Учитываются киворды в ссылающихся ресурсах, авторитетность последних, а так же внутренняя оптимизация под конкретный киворд. При иных обстоятельствах в ТОПе всегда бы находились дорвеи, что и происходит переодически в случаях косяков в алгоритмах расчета релевантности ПС (т.н. "сбоях").
Вряд ли microsoft.ru, разместив гипотетическую статью о "Microsoft Linux", обгонит по слову "linux" в выдаче Яндекса ресурс linux.ru. Хотя априори вес microsoft.ru значительно выше, чем у linux.ru.
Сообщение от john2007
И что? Я уже писал, что если один выше другого в серпе, то это не значит, что у одного стат вес больше чем у другого - он может быть одинаковый.
Вы знаете, в жизни равенства встречаются крайне редко, все больше неравенства.
Сообщение от HoSStiA
Серп - не формальное явление, отсортированное по весам страниц. Учитываются киворды в ссылающихся ресурсах, авторитетность последних, а так же внутренняя оптимизация под конкретный киворд. При иных обстоятельствах в ТОПе всегда бы находились дорвеи, что и происходит переодически в случаях косяков в алгоритмах расчета релевантности ПС (т.н. "сбоях").
Вряд ли microsoft.ru, разместив гипотетическую статью о "Microsoft Linux", обгонит по слову "linux" в выдаче Яндекса ресурс linux.ru. Хотя априори вес microsoft.ru значительно выше, чем у linux.ru.
Я говорю о варианте, когда анкорное и внутряк уравновешены, стало быть СЭРП будет сформирован на основе стат веса. Ну по крайней мере, мне так видится
Priorat, там как будто тошнота акцепторов может повлиять, если я правильно помню изыскания ХРНС и XTR.
Сообщение от john2007
Возможно ли определить формулу для стат веса страницы, ставя эксперименты и исследуя серп, например в Яндексе?
Возможно, если заполучить веб-граф (точнее матрицу соответствия) хотя бы 60-70% документов составляющих базу Яндекса. Т.е. около 1,4 млрд документов, а дальше на ней обкатывать различные формулы, добиваясь максимальной корреляции с выдачей (естественно учитывая поправку на тексты и ссылочное).
P.S. Вообщем, нет ничего невозможного, вопрос в ресурсах.
Сообщение от upyrj
Priorat, там как будто тошнота акцепторов может повлиять, если я правильно помню изыскания ХРНС и XTR.
Честно говоря, не мастер я тошноты. Авторы приведенные Вами безусловно авторитетны, но я не верю в сколь угодно значимое влияния тошноты на результаты выдачи
Priorat, не принципиально, тошнота это, или нет. Важно то, что (imho) будет очень много малоконтролируемого шума. Собственно, см. выше реплику #3 от Новичка и далее по ссылке.
Сообщение от Priorat
Возможно бред. Если бы мне дали такое задание, то поставил бы для 2 сайтов ссылку с одной и той же страницы своего сайта с анкором уникальным для обоих, так чтобы по нему оба находились по ссылке и только по этой. Далее поиск по этому анкору, область поиска два испытуемых сайта.
Обсуждался такой эксперимент здесь, на форуме пару раз, ставились ссылки на насколько ресурсов в т.ч. и яндекс с абракадаброй. В результатах поиска сайты выстроились не по ВИЦ (Яндекс был далеко не на первом месте, ближе к концу списка даже. )
Большинство пришло к мнению, что кроме ВИЦ еще играет не маловажную роль функция от процента ссылок с заданным анкором от общего числа ссылок на сайт.
Добавлено:
Вот нашел ссылку на архивную тему:
эксперимент
Выдача правда теперь новая, поскольку ссылки убрали на сайты, но мнения форумчан можно почитать.
john2007,
Теоретически можно. НО. Для этого надо точно знать алгоритм расчета ВИЦ Яндексом и иметь его базу страниц Рунета
Как кто-то из великих сказал - "Теоретически можно человека передать по телеграфу, но технические трудности, возникающие при этом, делают задачу неразрешимой."
А сравнить 2 ВИЦа наверно можно только очень приблизительно (когда они очень сильно отличаются). В том же эксперименте Кириллина было много вопросов, с тех пор добавилось еще больше. Боюсь, что чистый статвес из серпа не вычленить.
Сообщение от upyrj
Priorat, не принципиально, тошнота это, или нет. Важно то, что (imho) будет очень много малоконтролируемого шума. Собственно, см. выше реплику #3 от Новичка и далее по ссылке.
Так точно.
Влияние шумов можно уменьшить проведением нескольких параллельных экспериментов, аналогичных данному. Дальше сбор и обработка статистики. Если шум гаусовский, то подавление шума происходит по корню квадратному из количества экспериментов. Т.е. для подавления шума в 4 раза нужно провести 16 экспериментов.
Придумать 16 ортогональных запросов для группы исследуемых сайтов, разместить ссылки их на 16 сайтах и т.д.
Оно вам надо? Что это даст? Сопоставимы ли расходы на получение этих данных, с затратами?
Учтите, что в следующий ап вес будет уже другой, и эсперимент придется повторять. А сайты-доноры, скорее всего пропадут, т.к. Яндекс не одобрит подобного эксперимента.
Вот и я про то, что если ссылок на страницу много, то кроме вИЦ еще, например, анкорная составляющая может влиять (если по найден по ссылке искать).
Поэтому для чистоты нужно брать две страницы с одинаковым числом слов. И ставить одно одинаковое слово - абрукадабру в начало каждой страницы.
Делаем на одну страницу, скажем одну ссылку, на другую две (с любыми анкорами). И ищем по абрекадабре. И так далее, ставим разные эксперименты.
Только возникает все тот же вопрос. Если одна страница будет выше другой, вИЦ же при этом все равно может быть одинаковый (т.е. релевантность страниц одинаковая, но ПС все равно одну страницу выше другой поставит), а мы не узнаем.
Пока вижу выход - один и тот же случай проверять раз по 10. И вести статистику если, скажем, страница куда ведет две ссылки всегда выше той куда одна ссылка ведет, значит вторая ссылка дает прирост в вИЦ. Если то одна выше, то другая, значит вИЦ одинаковый.
Еще какие-то методы может кто-то предложить?
john2007,
Можно, но не абсолютный, а т.с. относительный.
Если поставить у себя яндекс сервер, и дать ему на индексацию пачку документов, то результаты будут какраз требуемые. Ведь ссылочного там не будет.
Сообщение от T.R.O.N
john2007,
Можно, но не абсолютный, а т.с. относительный.
Если поставить у себя яндекс сервер, и дать ему на индексацию пачку документов, то результаты будут какраз требуемые. Ведь ссылочного там не будет.
А вИЦ там будет разве?
john2007, конечно. В зависимости от имени папки и уровня вложенности ))
Сообщение от Разработчик
john2007, конечно. В зависимости от имени папки и уровня вложенности ))
Ну, чисто теоретически, для гипертекстовых документов возможно.
Только все равно сомнения берут.
Сообщение от john2007
А вИЦ там будет разве?
Сообщение от john2007
Возможно ли определить формулу для стат веса страницы,
Так что Вы хотите именно????
Сообщение от T.R.O.N
Так что Вы хотите именно????
Определить формулу для статического веса страницы в Яндексе (вИЦ).
------------------------------
ВИЦ - Показатель цитируемости документа, рассчитанный рекурсивно с учетом ВИЦ ссылающихся документов.
Статсческиские факторы - Факторы, учитываемые при ранжировании документа в результатах поиска без учета конкретного запроса.
------------------------------
Т.к. виц зависит от внешних и внутренних факторов, стоит отделить одно от другого. Локальный сервер дает возможность увидить результат ранжирования, без учета всех внешних факторвов.
Хотя какой смысл пытаться посчитать вИЦ, если в каждый момент времени, нет информации о ссылающихся документах.
Да, T.R.O.N. прав, какой смысл просчета чистого веса если любая одна ссылка как из нутри, так и из вне внутрь - может на стлько глобально изменить ВИц, что все расчеты просто зря.
Это получается, как тут уже на форуме писали - про абсолютно упругого коня в вакууме.
Сообщение от T.R.O.N
Т.к. виц зависит от внешних и внутренних факторов, стоит отделить одно от другого. Локальный сервер дает возможность увидить результат ранжирования, без учета всех внешних факторвов.
А внутренний фактор цитируемости документов Яндекс.Сервер учитывает при ранжировании?
john2007, по всей видимости - да
Сообщение от T.R.O.N
Хотя какой смысл пытаться посчитать вИЦ, если в каждый момент времени, нет информации о ссылающихся документах.
Я тоже, например, не знаю как точную информацию об этом получить. Но один авторитетный человек здесь сказал мне, что есть способ получить корректный анкор-файл Яндекса для страницы, но как не говорит.
Сообщение от john2007
способ получить корректный анкор-файл Яндекса для страницы,
я что-то не понял. что такое анкор-файл, и чем корректный отличается от некорректного
Сообщение от john2007
один авторитетный человек здесь сказал мне, что есть способ получить корректный анкор-файл Яндекса для страницы, но как не говорит
И правильно делает.
Сообщение от T.R.O.N
я что-то не понял. что такое анкор-файл, и чем корректный отличается от некорректного
Ну, типа, все ссылки, ведущие на страницу.
Не корректный я сам могу сделать по бэкам в Яндексе.
Сообщение от pro-maker
И правильно делает.
Делает-то он правильно, конечно, если это так и есть
А Вы знаете как получить корректный анкор-файл страницы в Яндексе?
Сообщение от john2007
но ПС все равно одну страницу выше другой поставит), а мы не узнаем.
Ну как предположение:
1. какую раньше найдет та и будет выше.
2. будут прыгать.
Сообщение от john2007
А Вы знаете как получить корректный анкор-файл страницы в Яндексе?
Нет, конечно.
Сообщение от Stripe
Ну как предположение:
1. какую раньше найдет та и будет выше.
2. будут прыгать.
Вариантов много.
Вопрос как в такой ситуации при экспериментах сравнивать чей вИЦ больше (если он может оказаться равным)?
Сообщение от pro-maker
Нет, конечно.
OK
А Вы верите, что можно получить корректный анкор-файл страницы в Яндексе?
Сообщение от john2007
А Вы верите, что можно получить корректный анкор-файл страницы в Яндексе?
Нет, конечно.
john2007, а кроме как спрашивать в лоб на форуме, другие способы поиска информации отсутствуют?
Сообщение от pro-maker
Нет, конечно.
Вот видите, Ваши мнения с авторитетным участником форума уже разошлись!
Сообщение от pro-maker
john2007, а кроме как спрашивать в лоб на форуме, другие способы поиска информации отсутствуют?
Не нашел
А что тривиальный вопрос?
Сообщение от john2007
А что тривиальный вопрос?
Поясните, плз, что имели ввиду.
Сообщение от pro-maker
Поясните, плз, что имели ввиду.
Вопрос топика "Возможно ли просчитать стат вес?"
А Вы не это имели ввиду?
Сообщение от pro-maker
john2007, а кроме как спрашивать в лоб на форуме, другие способы поиска информации отсутствуют?
Сообщение от john2007
Вопрос топика "Возможно ли просчитать стат вес?"
Тогда необходимо еще покопаться в архивах, поскольку пока не предлагаете информацию для равноценного обмена.
Сообщение от pro-maker
Тогда необходимо еще покопаться в архивах, поскольку пока не предлагаете информацию для равноценного обмена.
Я не спрашивал готового решения, я хотел обсудить
Лучше спросите, есть ли от этого практическая польза Или сами знаете, что нет?
Сообщение от sosed
Лучше спросите, есть ли от этого практическая польза Или сами знаете, что нет?
ИМХО есть, конечно. Таже обратная связь по стат весу. Есть она в Яндексе или нет.
Сообщение от pro-maker
Тогда необходимо еще покопаться в архивах
А в архивах я покопался, конечно
Ничего особо ценного там не нашел. Хотя были обсуждения на эту тему.