Google мародерствует в черных дырах с помощью кластеризации и страниц ошибок

Как опытный специалист по цифровому маркетингу с более чем десятилетним опытом работы за плечами, я не могу не почувствовать смесь веселья и беспокойства, услышав о «мародирующих черных дырах» Google. Это похоже на бесконечную игру в «ударь крота», где, как только вы думаете, что устранили одну проблему, всплывает другая.


В связи с текущим обсуждением кластеризации и нормализации поиска Google Аллан Скотт из Google представил концепцию, которую он назвал «блуждающими темными дырами» в поиске Google. По сути, когда процесс кластеризации Google обнаруживает некоторые страницы с ошибками, они могут попасть в своего рода виртуальную яму в поиске Google.

В увлекательной беседе во время подкаста Search Off The Record мне выпала честь узнать мнение Аллана Скотта, члена команды Google Search, который специализируется на решении проблем дублирования в нашей поисковой системе. Интервью провели Мартин Сплитт и Джон Мюллер, также из Google.

Аллан пояснил, что некоторые «мародирующие черные дыры» возникают из-за неудачной связи между «страницами ошибок и кластеризацией». По сути, он заявил: «В некоторых случаях страницам ошибок непреднамеренно присваивается контрольная сумма, как и любой другой странице. Поскольку эти страницы затем группируются на основе своих контрольных сумм, они имеют тенденцию объединяться вместе, что может привести к слипанию страниц ошибок друг с другом. это имеет смысл на данный момент?

Мартин Сплитт из Google объяснил это так: «Он имел в виду ситуации, когда на сайте есть около 20 продуктов, которые больше не доступны, и вместо страницы с ошибкой отображается сообщение «товар недоступен». Эта страница по-прежнему возвращает HTTP 200, но на самом деле ее содержимое такое же, как и раньше, поэтому контрольная сумма остается неизменной. Это может привести к странным ситуациям.

Похоже, что Google считает эти страницы ошибок идентичными, поскольку они имеют одинаковые контрольные суммы.

Как опытный веб-мастер, я бы сказал это так: контрольная сумма — это компактный фрагмент информации, сгенерированный из большого фрагмента цифровых данных. Его основная роль — помочь выявить любые ошибки, которые могли возникнуть во время передачи или хранения данных. Хотя контрольные суммы отлично подходят для обеспечения целостности данных, они не проверяют подлинность самих данных.

Для Аллана заявление Мартина послужило иллюстрацией. Он подтвердил: «Действительно, это точное отражение моей точки зрения. На самом деле, в таком случае веб-мастер может не сильно беспокоиться, потому что, если эти продукты будут удалены навсегда, они предпочитают, чтобы они исчезли, поэтому это не является серьезной проблемой. Однако если они временно отсутствуют, это вызывает беспокойство, поскольку они, скорее всего, не появятся снова, поскольку сканеры не любят дубликаты. По сути, они думают: «Эта страница является дубликатом». .’ Вот почему он функционирует как черная дыра.

Эта информация потенциально может быть поглощена черной дырой, а это значит, что она больше не будет доступна или не замечена поисковыми алгоритмами Google в течение некоторого времени, хотя возможно, что она может появиться снова позже.

Аллан отметил, что только те элементы, которые находятся ближе всего к началу группы, вероятно, появятся снова.

Аллан, кажется, обеспокоен этой проблемой, поскольку он упомянул, что сайты с временными ошибками, такие как тот, который вы описали, для него в некотором роде похожи на намеренно созданные временные ошибки. Он объяснил, что это означает, что один раз из тысячи ваша система сообщит им об ошибке. Это может привести к появлению огромного количества мертвых страниц или к тому, что он назвал «мародерствующей черной дырой». Что еще хуже, он также обслуживает множество зависимостей JavaScript, заключил он.

Вот еще разговоры Аллана и Мартина по этому поводу:

Аллан:

Если их не удастся загрузить, это может привести к поломке вашего рендеринга, и в этом случае мы посмотрим на вашу страницу и подумаем, что она сломана. Фактическая надежность вашей страницы после прохождения этих этапов не обязательно будет очень высокой. Нам приходится сильно беспокоиться о том, чтобы такие мародерствующие скопления черных дыр не захватили территорию, потому что все просто выбрасывается.
в них, например, были сайты социальных сетей, где я просматривал, ну, вы знаете, самые известные профили, и под ними была просто куча страниц, некоторые из них сами по себе были довольно известными и просто не принадлежали к этому кластеру. .

Мартин:

Ох, боже. Хорошо. Ага. Я видел нечто подобное, когда кто-то проводил A/B-тестирование новой версии своего веб-сайта, а затем некоторые ссылки ломались с сообщениями об ошибках, потому что API изменился, и вызовы больше не работали, или что-то в этом роде. И тогда, примерно в 10% случаев, вы получите сообщение об ошибке практически для всего их контента. Да, думаю, выбраться из этого было непросто.

Джон Мюллер рассказал о случаях, когда это может быть проблемой с CDN:

Я также видел кое-что похожее на это: если перед сайтом есть какая-то CDN, CDN выполняет какое-то обнаружение ботов или обнаружение DDoS, а затем выдает что-то вроде: » О, похоже, ты бот», а Googlebot отвечает: «Да, я бот». Но тогда все эти страницы, я думаю, в конечном итоге будут сгруппированы вместе и, вероятно, на нескольких сайтах, верно?

Аллан подтвердил это и сказал, что Гэри Иллис из Google работал над этим здесь и там:

В принципе да. На самом деле Гэри кое-что разъяснил нам по этому вопросу. Знаете, мы сталкиваемся с такими случаями и стараемся привлечь поставщиков подобных услуг к сотрудничеству с нами или хотя бы к работе с Гэри. Я не знаю, что он с ними делает. Он отвечает за это. Но не все из них столь отзывчивы. Так что об этом следует знать.

Аллан сообщил, что лучший способ предотвратить попадание вашего сайта в тупиковые зоны Google, часто называемые «черными дырами», — это отправка соответствующих кодов ответа HTTP. Это означает, что если страница не найдена или доступ запрещен, используйте 404 или 403 соответственно. Для временных проблем используйте 503. Помните, что только страницы с кодом состояния 200 будут кластеризованы и потенциально могут оказаться в черной дыре.

Другой вариант, который сказал Аллан, был:

Другой вариант: если вы используете JavaScript foo, в этом случае вы не сможете отправить нам HTTP-код. Возможно, для этого уже слишком поздно. Что вы можете там сделать, так это попытаться обработать фактическое сообщение об ошибке, что-то, что очень заметно является ошибкой, например, вы знаете, вы можете буквально просто сказать, вы знаете, 503 — мы столкнулись с ошибкой сервера или 403 — вы не были авторизован для просмотра или 404 — мы не смогли найти правильный файл. Любая из этих вещей сработает. Знаете, вам даже не нужно использовать HTTP-код. Очевидно, вы могли бы просто сказать что-нибудь. Итак, у нас есть система, которая должна обнаруживать страницы с ошибками, и мы хотим улучшить ее отзыв по сравнению с тем, что она делает сейчас, чтобы попытаться решить некоторые из этих плохих рендерингов и этих ошибок, связанных с типами страниц, обслуживаемых ботами. Но в то же время, как правило, безопаснее взять все в свои руки и постараться убедиться, что Google как можно лучше понимает ваши намерения.

Они продолжают и говорят об этом, и все начинается где-то на 16:22 минуте — вот вставленное видео:

Смотрите также

2024-12-06 16:45

Разница в поиске Google между кластеризацией и канонизацией

Как опытный специалист по цифровому маркетингу с многолетним опытом за плечами, я не могу не оценить глубину знаний, которыми поделились Джон Мюллер из Google, Аллан Скотт и Мартин Сплитт в этом интервью Search Off The Record. Всегда полезно получать информацию непосредственно из источника, и их обсуждение кластеризации и канонизации в Google Search не стало исключением.


Джон Мюллер из Google объяснил разницу между кластеризацией и канонизацией в поиске Google. Он сказал: «Кластеризация — это, по сути, отбор страниц, которые, по нашему мнению, одинаковы. А затем канонизация этих страниц — какая из них является лучшей». Джон сказал это на 3:03 минуте интервью.

В примечательном разговоре в интервью Search Off The Record принял участие Аллан Скотт, член команды Google Search, специализирующийся на дублированном контенте в Google Search. Дискуссию вели Мартин Сплитт и Джон Мюллер из Google.

В начале видео Аллан пояснил, что когда люди думают о канонизации, они часто представляют ее как одну загадочную коробку, творящую всю свою магию. Однако объяснить, почему что-то может быть неправильным, может быть непросто. Вместо этого он призывает зрителей рассматривать канонизацию как всего лишь один шаг в этом процессе. Представьте себе, что у вас есть несколько URL-адресов и вы хотите знать, какой из них предпочтительнее; однако есть и другие важные шаги, которые могут быть даже более важными. Первым из них является кластеризация.

Проще говоря, Аллан объяснил, что когда люди обращаются к ним с опасениями по поводу канонизации, его команда обычно отвечает: «Похоже, это проблема кластеризации, поскольку эти две страницы не должны принадлежать к одной и той же группе. для меня проблема канонизации, это означает, что эти две страницы действительно сгруппированы вместе, но этого не должно быть. Это может привести к тому, что мы выберем неправильную страницу в качестве канонической. Худший сценарий — это когда произойдет захват — мы имеем дело. с этими быстро, потому что они могут вызвать серьезные проблемы.

Джон Мюллер объяснил это так: «По сути, кластеризация предполагает группировку веб-страниц, которые кажутся нам идентичными. С другой стороны, канонизация определяет, какая из этих сгруппированных страниц является лучшей или наиболее подходящей». Аллан согласился, сказав: «Абсолютно, ты попал в точку!

«Алан привел иллюстрацию, заявив, что rel=»canonical» служит своего рода объединяющим элементом, пересекающим эти границы. По сути, rel=»canonical» изначально пытается сгруппировать две страницы в один кластер. Удастся ли это или нет, неизвестно. , но если две веб-страницы находятся в одном кластере и между ними есть ссылка rel=»canonical», это также служит сигналом для выбора канонической версии.’

Это началось примерно в начале этого видео, если вы хотите его послушать:

Смотрите также

2024-12-06 15:44

Новая политика и сертификация Google Рекламы в сфере знакомств и общения

Как опытный веб-мастер с более чем десятилетним стажем работы в постоянно меняющемся цифровом мире, я видел свою долю обновлений и корректировок политики от таких технологических гигантов, как Google. Последний набор правил Google Рекламы для служб знакомств и дружеских отношений, вступающий в силу 4 марта 2025 года, не является исключением.


С 4 марта 2025 года Google вводит обновленные правила в отношении рекламы, касающейся знакомств и дружеских отношений. Чтобы показывать такую ​​рекламу через Google Ads, рекламодателям сначала необходимо пройти процедуру сертификации в Google.

Вы можете найти новую политику знакомств и общения здесь, она очень подробная. Короче говоря, некоторые виды рекламы знакомств и дружеских отношений (в том числе объявления о сватовстве, супружеских отношениях и содействии свиданиям) разрешены, если они соответствуют приведенным ниже правилам, не допускают пользователей младше 18 лет и рекламодатель получил соответствующую сертификацию Google Реклама. Реклама знакомств и дружеских отношений может быть ограничена в зависимости от категории объявления, возраста пользователя, местных законов, настроек безопасного поиска пользователя и поисковых запросов пользователя с сексуальным контентом.

Google запрещает рекламу знакомств и/или дружеских отношений, которая:

  • Пропагандируйте знакомства несовершеннолетних.
  • На целевых страницах размещаются изображения или текст, не отражающие пользователей, которым продается услуга.
  • Пропагандируйте оплачиваемые дружеские отношения, свидания или сексуальные действия.
  • Пропагандируйте эксплуататорские знакомства.
  • Продвигайте супругов, заказывающих по почте.
  • Пропаганда мошеннических служб знакомств

Google планирует ограничить рекламу, связанную с конкретными услугами знакомств или дружеских отношений, рекламу, содержащую откровенный контент, и веб-сайты, которые отображают откровенный материал при первом доступе (не ограничиваясь следующими примерами):

  • Сайты знакомств, интрижек и свингеров.
  • Услуги по знакомству или измене
  • Сексуальные фетиш-знакомства
  • Приложения для прямых трансляций или чатов, в которых присутствует нагота, частичная нагота или контент сексуального характера.
  • Эротический контент в объявлениях или на целевых страницах, например изображения человека в нижнем белье или нижнем белье, а также человека топлесс или без груди в приватной обстановке.

Кроме того, важно отметить, что рекламу знакомств и дружеских отношений запрещено показывать в таких странах, как Алжир, Бахрейн, Бангладеш, Шри-Ланка, Палестина, Ирак, Иордания, Кувейт, Ливан, Ливия, Марокко, Оман, Непал, Пакистан. , Катар, Саудовская Аравия, ОАЭ, Тунис, Египет или Йемен.

Пройти процедуру сертификации можно здесь. Чтобы рекламировать продукты, услуги или контент для знакомств и общения, вы должны пройти сертификацию Google. Право на получение сертификации зависит от вашего соответствия требованиям Google и от углубленной проверки, которая может включать проверку существующих объявлений, целевой страницы и контента после входа в систему.

Здесь можно найти гораздо больше подробностей об этой новой политике.

Смотрите также

2024-12-05 16:43

Кнопки поиска Google для: Результаты персонализированы – попробуйте без персонализации

Как специалист по цифровому маркетингу с более чем двадцатилетним опытом работы, я считаю, что недавнее дополнение Google, позволяющее отображать, персонализированы или нет результаты поиска, является освежающим шагом на пути к прозрачности. Как будто они наконец-то признались, что заглядывали в историю моего браузера!


В основе результатов поиска Google появилась новая функция — кнопка, указывающая, настраиваются ли результаты в соответствии с вашими предпочтениями или нет. Он также предоставляет вам возможность отключить персонализацию.

Google мог бы перефразировать его так: «Ваши результаты настроены — попробуйте нефильтрованные результаты», и после того, как вы нажмете, он изменится на «Ваши результаты не персонализированы». Таким образом, пользователь понимает, что без персонализации его результаты поиска будут другими.

Вот как выглядит надпись «Результаты не персонализированы».

Похоже, что Google интегрировал новую функцию, поскольку все больше пользователей наблюдают за персонализированными результатами поиска Google. Цель – обеспечить прозрачность, четко указав, когда результаты поиска настраиваются на основе индивидуальных данных пользователя, а когда нет.

В течение примерно десяти лет добавление параметра PWS=0 в запросы приводило к обезличенным результатам поиска в Google.

Советы по шляпе:

Эй, Rustybrick, тебе это кажется чем-то свежим и незнакомым? Давно я не сталкивался с чем-то подобным. Я проверил это в режиме приватного просмотра!

» Сандип (@itsmesande3p), 5 декабря 2024 г.

@rustybrick Когда были представлены эти сообщения?
К вашему сведению: параметр pws=0 отключает персонализацию.

» Кеничи Сузукид'<<é’æ¨è¬ä’ (@suzukik) 5 декабря 2024 г.

Неясно, добавлена ​​ли эта функция недавно, но мне она кажется новой, поскольку Google, похоже, представляет персонализированные результаты поиска. Я наткнулся на опцию «Деактивировать персонализацию», которая позволяет мне отключить этот параметр персонализации.

Это недавнее изменение? @rustybrick @glenngabe

» Виджей Чаухан ð» (@VijayChauhanSEO) 5 декабря 2024 г.

Смотрите также

2024-12-05 16:44

Google Ads протестирует новые предложения/стимулы для агентств и рекламодателей

Как опытный специалист в области цифрового маркетинга с более чем двадцатилетним опытом работы за плечами, я должен сказать, что недавний шаг Google по тестированию новых предложений для агентств и рекламодателей давно назрел и заслуживает высокой оценки. Текущие стимулы для агентств слишком долго находились в застое, и приятно видеть, что Google предпринимает шаги для решения этой проблемы.


Google экспериментирует с новыми преимуществами для рекламных компаний и специалистов по маркетингу, стремясь получить эффективное вознаграждение для агентств, которые успешно привлекают новых рекламодателей в Google Ads. Эту информацию предоставила Джинни Марвин, представитель Google Ads, после ее ответа на критические замечания о том, что стимулы агентства менее привлекательны, чем стимулы, которые Google Ads предоставляет непосредственно рекламодателям.

Это появилось на X, где Рубен Д. Рок написал:

Почему Google Partners не предлагает кредит в размере 500 долларов США, хотя клиенты могут напрямую подписаться на Google Рекламу и получить кредит в размере 3000 долларов США прямо сейчас?

Похоже, это препятствие для показа рекламы через агентство.

Джинни Марвин, представитель Google Рекламы, ответила:

Спасибо за ваш отзыв. Он помогает информировать о будущих преимуществах и обновлениях. Мы постоянно тестируем новые предложения для агентств и рекламодателей. В настоящее время команда тестирует ряд значений для новых клиентов на ограниченных рынках в зависимости от рекламного бюджета. Они также изучают, какой опыт использования такого формата предложений будет наиболее эффективным для агентств.

Вот эти посты:

Ценим ваш ценный вклад! Это помогает нам формировать будущие преимущества и улучшения. Наша команда постоянно экспериментирует с различными предложениями, ориентированными на агентства и рекламодателей. В настоящее время команда тестирует различные варианты ценообразования для новых клиентов в отдельных регионах в зависимости от их рекламного бюджета. Кроме того, они расследуют…

» AdsLiaison (@adsliaison) 3 декабря 2024 г.

Мы все их понимаем, вот один, который я получил некоторое время назад:

В октябре мы получили несколько тысяч кредитов. Определенно лучшее агентство, которое я когда-либо видел.

— Менахем Ани – Google Реклама (@MenachemAni), 5 декабря 2024 г.

Смотрите также

2024-12-05 16:44