К постам Опубликовано: 2016-12-23

Метрика небезпеки посилань

У статті представлені дані про порогах на значення метрики небезпеки вхідних посилань «Видимість-спамность», вище яких сайт опиняється в небезпечній близькості до фільтру (бану) пошукової системи за неякісні посилання. Показано, що такий метрикою може служити відношення числа «небезпечних» посилаються доменів до «безпечним». Небезпека/неопасность домену визначається на підставі видимості домену в пошуковій видачі і спамности домену. У дуже авторитетних сайтів, не працюють над посиланнями профілем ні прямо, ні побічно, це значення не перевищує двох. Просто авторитетних сайтів, які ведуть так чи інакше піар-компанію в інтернеті, це значення не перевищує шести. Якщо у великої, авторитетної в офлайні компанії це значення перевищує 40, то її сайт потрапляє під фільтр. Чи потрапить сайт під фільтр при значенні цієї метрики, скажімо, від 10 до 40, достеменно поки не відомо (потрібні додаткові дослідження), але сайт буде точно перебувати в зоні ризику. Хоча дана метрика поки є недоисследованной, її значення досить добре узгоджуються зі здоровим глуздом, і вона представляється досить перспективною.

Пропонована метрика – одна з ряду можливих метрик, що показують ступінь небезпеки/неопасности вхідних посилань. Але вона нічого не говорить прямо про корисність наявних вхідних посилань. Тому по завершенні робіт за вичищення посилального профілю від небезпечних посилань, треба приступити до роботи, що в кінцевому рахунку приводить до збільшення корисності беклінків через роботу над брендом, підвищення авторитетності сайту і гостьовий блогінг.

Стаття побудована наступним чином. Спочатку аналізуються кілька апріорі авторитетних, так би мовити, зразково-показових сайтів. Потім аналізуються сайти не таких авторитетних, але цілком респектабельних компаній, про які відомо, що вони не знаходяться під фільтром за використання неякісних посилань. На закінчення розглядається профіль сайту під фільтром за seo-посилання. І різниця в значенні метрики виявляється більшою.

Методика розрахунку метрики небезпеки посилань «видимість-спамность»

Отже, яка була методика розрахунку метрики небезпеки посилань «видимість-спамность»? Вона ґрунтується на ідеях статті – https://devaka.ru/articles/visibility-metric. Я переповім її суть своїми словами. Там йдеться про те, що для оцінки небезпеки домену-донора має сенс враховувати показники, що відображають, по-перше, відношення «світу до домену», а по-друге, «домену до світу». Другі характеризує заспамленность домену зовнішніми посилання; її можна оцінювати сервісом checktrust.ru. Перші характеризують певним чином «авторитет», силу, значимість домену-донора в очах світу і пошукових систем. Ці характеристики традиційно прийнято враховувати через різного роду інтегральні показники «ваги» вхідних посилань (тИЦ, PR, Траст тощо). В аналізованій статті пропонується для цих цілей використовувати нові параметри – кількість ключових слів, за якими сайт знаходиться в ТОПе, і/або видимість сайту в пошуковій видачі. Було показано, що, по-перше, останні два параметри корелюють один з одним, а по-друге, у ряді випадків ці параметри краще, ніж вищенаведені аналоги Трасту. В моєму експерименті використовується видимість сайту і не використовується обсяг ключових слів в ТОПе: цей показник, можливо, я проаналізую в наступний раз.

Таким чином, для оцінки домену-донора я використовую два значення – його видимість в пошуковій видачі (оцінюється сервісом prodvigator.ru) і його заспамленность вихідними посиланнями (оцінюється checktrust-му). Вважаємо, що низька видимість, якщо вона нижче певного умовного порога – 0,08; я його вибирав «на око», в іншому випадку видимість прийнятна. Вважаємо, що заспамленность низька, якщо вона менша 10, в іншому випадку, вона висока. Якщо у домена-донора прийнятна видимість і низька заспамленность, то він безпечний. Якщо у нього низькі видимість і заспамленность, то він – сумнівний. В іншому випадку, він небезпечний. Як бачимо, в небезпечні домени потрапляють домени з високою заспамленностью, але сюди також потрапляють домени з невизначеним заспамленностью, так як checktrust не завжди може визначити заспамленность (а видимість prodvigator визначає завжди). Отже, всі домени-донори виявляються або безпечними, або сумнівними, або небезпечними. В описуваному в цій статті експерименті я розраховую для кожного аналізованого сайту відношення числа всіх його небезпечних доменів-донорів до числа безпечних.

Яке ж прийнятне значення метрики «Видимість-спамность»?

Отже, проаналізуємо посилальні профілі завідомо авторитетних сайтів для того, щоб отримати приблизні, орієнтовні значення метрики, до яких варто прагнути в ході роботи над брендом і сайтом і з якими бан пошукової системи вам майже точно не загрожує.

Почнемо з сайту авторитетного і точно «не заморачивающегося» роботою над посиланнями профілем – сайту Інституту проблем управління РАН. Це велика державна по-хорошому консервативна організація, в SEO як такий вона не зацікавлена, їм не займається і вже точно посилання на біржах не закуповує. Тому всі наявні посилання – природного походження. Подивимося, скільки ж із них виявиться «поганими» з точки зору формального розрахунку вищеописаною метрики.


Рис 1. Значення для ІПУ РАН

Бачимо, що відношення частки небезпечних доменів до нешкідливих досить не велика – 37,39 / 24,86 = 1,5. Показово, що навіть у сайту з такої кришталево чистою репутацією (з точки зору беклинков), число небезпечних доменів (высокоспамных) перевищує число безпечних. Якщо детально проаналізувати дані по доменах, то видно, що частково це наслідок недосконалості метрики і технічних засобів її розрахунку: якщо checktrust не може визначити рівень спамности, ми для підстраховки припускаємо домен небезпечним (а раптом він і правда спамний?). А далі вже потрібно ручний аналіз доменів, розцінених метрикою як небезпечні: якісь дійсно виявляться такими, а які – цілком «добропорядними».

Виходить, що через недосконалість технічних засобів розрахунку число небезпечних доменів виявляється більше, ніж є насправді. Але, незважаючи на це, можна показати, що навіть ця «гіпертрофована» частка дозволяє робити адекватні висновки – висновки, які узгоджуються зі здоровим глуздом.

Так які ж пороги для сайтів, яким нічого не загрожує, з урахуванням поточних недосконалих реалій розрахунку? Ми бачимо, що для дуже авторитетних сайтів таке значення близько півтори навіть з урахуванням того, що посилань на сайт чимало. Яке ж значення для дещо менш авторитетного сайту?


Рис 2. Значення культурологічного сайту

Це дані по сайту одного самобутнього культуролога, у нього є своя аудиторія, досить вузька, але, тим не менш, досить сильно залучена, «намагнічена» на нього. І заслання він, природно, ніякі не закуповує. Подивимося, яку природну посилальну масу формує увагу такої аудиторії. Значення аналізованої метрики для таких посилань 40,63 / 34,38 = 1,18. Бачимо, що і в цьому «лабораторно чистому» число «небезпечних» посилань перевищує число «безпечних». І це знову наслідок недосконалості сервісів та/або алгоритмів, що беруть участь у формуванні метрики. Аналізоване значення невелике, навіть менше, ніж у випадку з більш авторитетним сайтом – це, мабуть, з-за малого числа посилаються доменів на культурологічний сайт. Природно припустити, що зі збільшенням популярності ресурсу (і, відповідно, числа зовнішніх посилань) частка «небезпечних» посилань буде рости з-за великого числа малоавторитетних сайтів, передруковували всі підряд (часто автоматично).

Тепер розглянемо комерційний сайт компанії, що працює в основному в секторі B2B і тому продає в основному через особисті контакти, і в меншій мірі через інтернет. Посилання вони, здається, не закуповували.


Рис 3. Значення для телекомунікаційної компанії

Значення аналізованої метрики для цього сайту – 51,49 / 12,87 = 4. Бачимо, що це вже значно більше, ніж у проаналізованих вище випадках, однак, це значення, як буде показано нижче, – дуже непогане і говорить, про те, що фільтр за seo-посилання не загрожує сайту.

Тепер для контрасту розглянемо інформаційний сайт – devaka.ru.


Рис 4. Значення Devaka.ru

Бачимо, що значення аналізованої метрики одно 58,26 / 14,59 = 3,99. Воно практично співпадає зі значенням для респектабельного комерційного телекомунікаційного сайту. Та виявляється в кілька разів більше, ніж для суперавторитетного сайту. Отримані результати цілком узгоджуються зі здоровим глуздом.

І ще розглянемо аналогічний сайт – Texterra.ru.


Рис. 5. Значення Texterra.ru

Значення аналізованої метрики 50,95/16,22 = 3,14 при числі посилаються доменів, що обчислюються сотнями. Дуже схоже значення.

Тепер розглянемо дані для трьох дуже типових сайтів: всі вони комерційні, різні seo-підрядники коли якісь посилання закуповували на них, але не надто старалися; потім посилальні профілі кимось чистилися (і самі з-за припинення закупівель), можливо, так само не дуже наполегливо. У підсумку маємо звичайні літні сайти із звичайною історією, і вони не під фільтром і не були: одним словом, більшість таких сайтів. Які ж у них будуть значення метрики?




Рис 6. Значення для типових сайтів

Для першого – 42,42 / 13,64 = 3,11 при відносно невеликому числі посилаються доменів. Як ми пам'ятаємо, при більшому числі посилаються доменів це значення було б більше. Для другого сайту – 54,74 / 12,63 = 4,33, тобто цілком порівнянне значення. І нарешті, для третього – 55,36/12,50 = 4,43. Сайти всі різні, підібрані випадково, але значення метрики виявляються дуже схожими. Число посилаються доменів обчислюється десятками – до сотні, одним словом.

На завершення розглянемо дані сайту під фільтром.


Рис 7. Значення для сайту під фільтром

Для нього – 69,89/1,71 = 40,87. Бачимо, що таке значення метрики разюче відрізняється від усіх розглянутих вище: більше на цілий порядок. І знову отримані метрикою результати узгоджуються зі здоровим глуздом: посилальний профіль такої якості точно «зажене» сайт під фільтр.

З аналізу тих сайтів, які залишилися за рамками розгляду цієї статті, видно, що і поки не дуже авторитетні сайти зі значенням метрики близько 10 не потрапляють під фільтр за seo-посилання, але вже точно знаходяться в зоні ризику. Діапазон значень метрики «видимість-спамность» від 10 до 40 поки ще не достатньо вивчений, і при переході через яке саме значення, фільтр неминучий, поки сказати складно, але вже ясно, що в цей діапазон краще не потрапляти.

Висновки

Отже, що ж ми отримали?

  • Для всіх досліджених сайтів число небезпечних посилань перевищує число безпечних. Часто це «внутрішній технічний дефект» метрики.
  • Якщо значення менше двох, і число посилаються доменів вимірюється сотнями, сайт дуже авторитетний.
  • Якщо значення менше 5, і число посилаються доменів вимірюється сотнями, сайт авторитетний, значущий для індустрії.
  • Якщо значення менше 5, і число посилаються доменів перевищує сотню – сайт типовий середнячок, і фільтр йому не загрожує.
  • Якщо значення менше 10, і число посилаються доменів не перевищує сотню – сайту, мабуть, не загрожує фільтр в найближчому майбутньому, але вычищением та/або посиленням посилального профілю треба обов'язково зайнятися.
  • Якщо значення більше 10 – сайт однозначно в зоні ризику: він або вже під фільтром, або він йому загрожує з високою ймовірністю. У цьому випадку тотальне вычищение посилального профілю – завдання номер один.
  • Здорово б мати сервіс, який розраховував би ці значення автоматично.
  • При зростанні брендовості проекту, мабуть, відношення числа небезпечних доменів до нешкідливих може зростати, це нормально і природно.
  • Методика має деякі недоліки, але в цілому вона видає адекватні результати.