Для любого сайта крайне важно иметь перенаправления для поддержания его работы, однако управление ими может стать весьма сложным, особенно когда специалисты по SEO сталкиваются с сайтами, имеющими миллионы отдельных страниц.
📊 Сделай правильный выбор!
ФинБолт подскажет, когда покупать и когда продавать для максимальной выгоды!
Примеры ситуаций, когда может потребоваться реализация перенаправлений в масштабе:
- На сайте электронной коммерции представлено большое количество товаров, которые больше не продаются.
- Устаревшие страницы новостных изданий больше не актуальны или имеют историческую ценность.
- Перечисление директорий, содержащих устаревшие записи.
- Сайты вакансий, где публикации истекают.
Почему перенаправление в масштабе является важным?
Это может помочь улучшить пользовательский опыт, укрепить ранжирование и сэкономить бюджет на обход сайта.
Вы могли бы подумать о использовании тега «noindex», но имейте в виду, что он фактически не предотвращает поиск Google этих страниц. Вместо этого он нецелесообразно расходует ваш бюджет на сканирование из-за увеличения количества страниц, так как Google все равно тратит ресурсы на эти страницы, хотя они и не будут индексироваться.
Просмотр устаревшей ссылки может вызывать неудобства для пользователя. Например, если пользователь попадет на объявление о старой вакансии, было бы полезнее перенаправить его к актуальной открытой позиции, наиболее соответствующей критериям поиска.
На сайте Search Engine Journal мы часто сталкиваемся с неработающими ссылками, которые приписываются чат-ботам на основе искусственного интеллекта из-за их склонности создавать URL, не существующие в реальности. Это явление называется ‘галлюцинациями’.
Вместо использования Google Analytics 4, Google Search Console и иногда журналов сервера для поиска и перенаправления страниц с кодом состояния 404 на наиболее схожий контент, соответствующий названию статьи, мы можем сказать: Мы полагаемся на отчеты из Google Analytics 4, Google Search Console и иногда наших серверных логов, чтобы выявлять поврежденные ссылки (страницы 404) и автоматически перенаправлять их на самый подходящий релевантный контент, основываясь на уникальном идентификаторе каждого URL в статье (article slug).
Когда чатботы приводят нас на несуществующие веб-страницы (ошибки 404), или пользователи сталкиваются с неработающими ссылками, это приводит к неудовлетворительному взаимодействию пользователя.


Подготовьте кандидатов на перенаправление
Для начала ознакомьтесь со следующим руководством по настройке векторной базы данных Pinecone. В нашем конкретном примере мы использовали «primary_category», вместо «category», в качестве ключа метаданных.
Как опытный вебмастер, позвольте объяснить, как мы выполняем эту задачу. Предполагается, что все ваши статьи аккуратно размещены в базе данных «article-index-vertex», готовые к использованию!
Пожалуйста, укажите ваши URL-адреса перенаправления в формате CSV (Разделенные запятыми значения), подобном приведенному примеру. Это может включать статьи, которые вы решили удалить, или ошибки 404, найденные в отчетах вашей Search Console или Google Analytics 4.

Данные ‘primary_category’ являются дополнительной информацией, связанной со статьями в системе Pinecone, которая была добавлена при их первоначальном создании. Эта информация позволяет группировать связанные статьи вместе, что повышает точность результатов поиска.
Если заголовок не предоставлен (например, в случае URL с ошибкой 404), скрипт будет извлекать слова из slug непосредственно из URL и использовать их вместо входных данных.
Создание переадресации с использованием Google Vertex AI
Получите ваши учетные данные службы Google API и сохраните их под названием «config.json». Далее перенесите скрипт и пример файла в ту же директорию внутри JupyterLab. После этого запустите скрипт.
В предстоящей демонстрации будут показаны всего пять примеров записей, и вы заметите новый документ под названием «redirect_map.csv», содержащий предложенные перенаправления.
После проверки кода на отсутствие ошибок вы можете изменить значение булевого параметра TEST_MODE с False на True и затем выполнить скрипт для всех ваших URL.

Если программа приостанавливается и затем возобновляет работу, она продолжит с того места, где остановилась ранее. Кроме того, она проверяет каждый обнаруженный редирект против файла в формате CSV.
Эта предосторожность не дает вам выбрать URL базы данных из сокращенного списка. Использование одного из этих URL может вызвать бесконечный цикл перенаправления.
Для наших примеров URL вывод показан ниже.

С этой картой перенаправлений у нас есть все необходимое для внедрения ее в наш инструмент перенаправления внутри системы управления контентом (CMS). И вуаля, вот и всё!
Вы успешно связали старую статью от 2013 года «YouTube прекращает использование видеоответов с 12 сентября» с более актуальной статьей за 2022 год «YouTube внедряет функцию из TikTok — возможность отвечать на комментарии через видео.»
По запросу ‘/what-is-eat/’ было найдено точное совпадение с запросом ‘/google-eat/what-does-it-mean/’, что является абсолютно верным соответствием.
Качество обусловлено не только мощью модели языка Google Vertex, но и тщательно подобранными настройками.
Если я выбираю ‘RETIRVALL_DOCUMENT’ как тип задачи для создания векторных эмбеддингов запроса из отображаемой статьи новостей YouTube, это соответствует статье ‘YouTube расширяет посты сообщества среди большего числа создателей’, но этот вариант не является настолько точным сопоставлением по сравнению с другими опциями.
Результаты поиска ‘/what-is-eat/’ соответствуют статье ‘/переосмысление-eAAT-для-увеличения-продаж-и-видимости-в-поиске/545790/’, но более эффективным вариантом может быть ‘Google’s EAT: Что это такое?’ вместо.
Для нахождения перенаправленных соответствий среди недавно опубликованных статей используйте дополнительный фильтр метаданных под названием ‘publish_year’ при запросе данных в базе данных Pinecone, предполагая, что вы включили это поле метаданных в записи базы данных. Эта дополнительная информация делает процесс поиска более точным и эффективным, что я настоятельно рекомендую включить для лучших результатов.
В коде это переменная PUBLIISH_YEAR_FILTER.
Если ваши данные включают метаданные `publish_year`, вы можете организовать эти годы в массив. Таким образом, система будет извлекать только те статьи, которые были опубликованы в указанные годы.
Генерировать перенаправления с использованием текстовых эмбеддингов от OpenAI
Давайте сравним результаты, используя модель «text-embedding-ada-002» от OpenAI и для сравнения также используем Google Vertex AI. Нашей целью является выявление возможных различий в их выводах.
Просто создайте новый файл Notebook в той же директории, скопируйте и вставьте этот код, а затем выполните его.
Хотя качество вывода может показаться приемлемым, оно не совсем соответствует высоким стандартам результатов, которые обычно можно увидеть от Google Vertex AI.
Ниже в таблице вы можете увидеть разницу в качестве вывода.
Адрес сайта (URL) | Vertex Google | OpenAI |
/что-есть/ | /гугл-еат/что-это/ | /5-вещей-которые-вы-можете-сделать-прямо-сейчас-чтобы-улучшить-свой-результат-в-Google-поисках/ |
/местный SEO для адвокатов/ | /seopravoi/chto-takoe-pravoe-seo/ | /legal-seo-conference-exclusively-for-lawyers-spa/528149/ |
В плане поисковой оптимизации (SEO) модель от Google Vertex AI стоит в три раза дороже модели от OpenAI. Однако я предпочитаю использовать Vertex из-за его уникальных преимуществ.
Повышенный стандарт результатов заметно выше. Хотя это может означать более высокую стоимость за единицу обработанного текста, вы получите вознаграждение в виде исключительного качества вывода, что снижает необходимость в тщательной проверке и валидации результатов – тем самым экономя драгоценное время.
По моему опыту, обработка 20 000 URL с использованием Google Vertex AI стоит около $0,04.
Как специалист по цифровому маркетингу, я понимаю, что работа с множеством URL-адресов может показаться дорогостоящей на первый взгляд, но уверяю вас: это удивительно доступно. Не волнуйтесь о затратах при выполнении задач связанных лишь с несколькими тысячами URL.
При обработке миллиона URL-адресов прогнозируемая стоимость составит около двух долларов.
Если вы ищете бесплатное решение, используйте модели BERT и LLaMA от Hugging Face для создания векторных представлений без оплаты за каждый вызов API.
Для эффективного использования этих моделей для запросов, основанных на генерации векторов из BERT или Llama, необходимо предварительно обработать статьи, создав векторные эмбеддинги в векторной базе данных вроде Pinecone (или любой другой подходящей альтернативы). Этот процесс требует значительных вычислительных ресурсов, поскольку необходима работа с моделями.
Подводя итог, ИИ — ваш мощный союзник.
Искусственный интеллект позволяет масштабировать ваши усилия в области поисковой оптимизации или маркетинга и автоматизировать самые трудоемкие задачи.
Вместо того чтобы заменить ваши знания, оно призвано расширить ваши возможности и предоставить вам инструменты для более эффективного решения задач. Это делает процесс обучения не только приятным, но и увлекательным!
1. Становление мастером этих инструментов крайне важно для достижения успеха. Я рад поделиться своими мыслями по этой теме, чтобы направлять новичков и вдохновлять их энтузиазм.
2. Знание эффективного использования этих инструментов жизненно необходимо для достижения ваших целей. Моё увлечение написанием на эту тему происходит от желания поддерживать начинающих в обучении и находить вдохновение.
3. Обладание навыками работы с этими инструментами является ключом к успеху. Мне нравится выражать свои мысли по этому вопросу, надеясь, что это поможет новичкам развить свои способности и будет мотивировать их учиться дальше.
4. Освоение мастерства этих инструментов критически важно для выполнения ваших задач. Мой энтузиазм в обсуждении данной темы связан с желанием помочь начинающим понять концепции и почувствовать вдохновение.
5. Приобретение экспертизы в работе с этими инструментами необходимо для успеха. Мне доставляет удовольствие делиться своими взглядами по этой теме, стремясь поддержать начинающих на их пути к обучению и зажечь их страсть.
Двигаясь дальше с этой последовательностью, давайте углубимся в процесс создания пользовательского плагина WordPress с использованием Google Vertex AI для установления внутренних ссылок.
Смотрите также
- Топ-7 самых эмоционально захватывающих рекламных роликов Олимпийских игр (кампании P&G побеждают)
- Списки соответствия клиентов Google Ads будут иметь срок действия 540 дней
- Google рассказал, когда следует распределять нагрузку между поддоменами или другими доменами
- Поиск, который продает: соединение точек между рейтингами и результатами.
- Акции VKCO. ВК: прогноз акций.
- Хватит фокусироваться на Google, настало время сосредоточиться на видимости
- Google делится советами по улучшению SEO с помощью внутренних ссылок
- Как WooCommerce планирует стимулировать разработчиков и продавцов
- OpenAI запускает SearchGPT: прототип поиска на базе искусственного интеллекта
- 5 автоматизированных рабочих процессов на основе искусственного интеллекта для масштабирования корпоративного SEO
2025-05-30 16:11