Google объясняет причины, по которым сканирование не индексируется через @sejournal, @martinibuster

Google объясняет причины, по которым сканирование не индексируется через @sejournal, @martinibuster

Как опытный веб-мастер, я столкнулся с изрядной долей просканированных, но не проиндексированных ошибок в Google Search Console. Эта ошибка может озадачивать и расстраивать владельцев веб-сайтов, поскольку она указывает на то, что страница была просканирована Google, но не добавлена ​​в индекс поисковой системы.


В мае 2024 года во время интервью на конференции SERP Conf в Болгарии Гэри Иллис из Google объяснил несколько потенциальных причин проблемы, связанной с тем, что страницы сканируются, но не индексируются. Понимание этих причин может помочь в решении этой проблемы.

Интервью состоялось в мае, но его видео привлекло относительно мало внимания и не получило широкого просмотра. Мне об этом стало известно исключительно благодаря недавнему отказу Олеси Коробки (@Giridja) от интервью в Facebook.

Так что, хотя интервью состоялось в мае, информация по-прежнему актуальна и полезна.

Причина сканирования: в настоящее время не проиндексировано

«Недавно Google обнаружил и просканировал веб-страницу, но ее еще не добавили в индекс поисковой системы».

«Может ли страница, которая была просканирована поисковыми системами, но не проиндексирована, быть связана с тем, что ее содержимое слишком похоже на материал, который уже был проиндексирован?»

Значит, Google предполагает, что уже есть достаточно других вещей, а ваши вещи недостаточно уникальны?»

Согласно документации Google Search Console, это обоснованный вопрос о том, почему Google может просканировать веб-страницу, но решить не индексировать ее.

По мнению Гэри Иллиеса, одно из возможных объяснений заключается в том, что ваш веб-сайт может конкурировать с аналогичным контентом. Однако важно отметить, что могут быть и дополнительные факторы, способствующие возникновению этой проблемы.

«Да, это одна из возможных интерпретаций. «Сканировано, но не проиндексировано» означает, что страницы были исследованы поисковыми системами, но еще не попали в индекс поисковой системы. Было бы идеально разделить эту категорию на более мелкие группы, но сделать это сложно из-за внутренней организации данных.»

При обработке веб-страниц для индексирования существуют различные возможности, включая задачу выявления и исключения дублированного контента. Во время этого процесса мы сканируем страницу, чтобы определить, существует ли ее контент или очень ли он похож на существующую запись в нашей базе данных. Если это так, мы предпочитаем не добавлять новую страницу, поскольку предыдущая имеет более сильные индикаторы (лучшие сигналы).

Но да, но это может быть несколько вещей».

Общее качество сайта может повлиять на индексацию

Позже Гэри дал дополнительное объяснение тому, почему Google может сканировать веб-сайт, но отказаться от его индексации, подразумевая потенциальные проблемы с качеством сайта.

Качество вашего веб-сайта существенно влияет на количество URL-адресов, которые Google сканирует, но не индексирует. Большое количество таких URL-адресов может указывать на более серьезные проблемы с качеством.

Как опытный веб-мастер, я заметил значительный сдвиг в том, как поисковые системы индексируют URL-адреса веб-сайтов с февраля. Похоже, что по необъяснимым причинам эти системы взяли на себя задачу индексировать необычно большое количество URL-адресов сайта на основании предполагаемого изменения его характера или содержания.

Другие причины сканирования и неиндексации

Как эксперт по SEO, я хотел бы поделиться одним из возможных объяснений Гэри относительно того, почему URL-адреса могут сканироваться Google, но не индексироваться. Возможно, взгляд Google на ваш веб-сайт изменился или возникла техническая проблема.

Одним из возможных объяснений увеличения числа может быть то, что Google пересмотрела свою оценку сайта на основе новой информации.

Кроме того, возможно, на веб-сайте произошла ошибка, в результате которой одна и та же страница отображается по всем URL-адресам сайта. Это потенциально может объяснить, почему их число увеличивается.

Так что да, всего может быть много».

Вынос

Как опытный веб-мастер, я бы предложил перефразировать это так: «Гэри предложил ценную информацию о потенциальных причинах, по которым веб-страница не может быть проиндексирована Google после сканирования».

  • Контент аналогичен контенту, уже ранжированному на страницах результатов поисковых систем (SERP).
  • Точно такой же контент существует на другом сайте, который имеет лучшие сигналы.
  • Общие проблемы с качеством сайта
  • Технические неисправности

Иллиес не предоставил дальнейших объяснений о том, что другой сайт имеет более высокие сигналы, но я полагаю, что он имел в виду ситуации, когда один веб-сайт распространяет свой контент на другом сайте, а Google предпочитает ранжировать принимающий сайт, а не первоначального издателя.

Посмотрите, как Гэри отвечает на этот вопрос на 9-й минуте записанного интервью:

Смотрите также

2024-07-04 16:45