К постам Опубликовано: 2016-11-15

Вплив на SERP

Як впливає кількість інформації та ентропія на результати пошуку (SERP)? Мене зацікавило це питання. Я провів певні дослідження і ділюся з вами результатами.

Мета дослідження — визначити існування взаємозв'язку між кількістю інформації, ентропією і результатами пошукової видачі Google.

Інформація — це алгоритм побудови системи, що забезпечує відтворення цієї інформації, функціонально пов'язаної з середовищем свого розташування.

Інформаційна ентропія — це міра невизначеності або непередбачуваності інформації. Чим більше відомо про систему, тим менше її ентропія. Важливо ще одне обставина. Втрачаючи інформацію, ми збільшуємо ентропію системи.

У патенті Google я прочитав таку фразу: Ентропія запитів для одного або більше документів може бути перевірена і використана в якості основи для підрахунку очок. Наприклад, якщо конкретний документ з'являється як хіт для несхожих наборів запитів, це може (хоча й не обов'язково ) розглядатися як спам. У цьому випадку пошукова машина оцінює документ відносно нижча.

Є відповідні формули розрахунку ентропії і кількості інформації.

Інформація та ентропія в ТОП30. За результатами досліджень, до третьої сторінки пошукової видачі добираються п'ять відсотків користувачів. На підтвердження цієї тези я отримав відповідь від SEMrush: Ми збираємо дані з Топ 20 результатів, тому що ми вважаємо, що 99% трафіку приходить на сайт з перших 2 сторінок видачі і по-цьому ми збираємо дані з перших двох сторінок.

Mariam Sargsyan, SEMrush Support Specialist грунтуючись на цьому я спарсив інформацію з ТОП30 з десяти довільно відібраних запитам з метою визначити кількість інформації по кожному з них. Отриманий список сторінок я розділив на три групи ТОП10, ТОП20 (з одинадцатой за двадцяту позицію SERP) і ТОП30 (з двадцять першої до тридцяту позицію SERP). Ця інформація по кожному запиту проаналізована в сервісі Ahrefs. Для отримання показника "кількість інформації" використовувалися дані Ahrefs URL Rating.

Кількість інформації в ТОП 10 становить 60 відсотків, в групі результатів з одинадцатой за двадцяту позицію SERP (ТОП двадцять) — 30 відсотків і з двадцять першої до тридцяту позицію SERP (ТОП тридцять) — відповідно 10 відсотків. Ентропія менше всього в ТОП-десять. У ТОП двадцять пошукової видачі ентропія вище, ніж у ТОП десять. Найвища ентропія в третій аналізованої групи запитів в ТОП тридцять.

Перший висновок — створено логічно, що в ТОП десять відображаються результати пошукової видачі, в яких кількість інформації 60 відсотків і вище.

Другий висновок — результати пошукової видачі з ТОП десять і результати відбиті з одинадцатой за двадцяту позицію SERP містять 90 відсотків інформації та природно забезпечують більше 90 відсотків трафіку. Третій висновок — не обов'язково, що Google використовує патент "Link-based spam detection". Ймовірно ентропія запитів використовується в пошуковому алгоритмі Google ідентифікації спаму і впливає на позиції документа (сторінки).