Google заявляет, что невозможно заблокировать контент из ленты Discover

Как опытный веб-мастер с многолетним опытом работы за плечами, я понимаю затруднительное положение Лили Рэй. Я работал со многими издателями, работающими с контентом, который хорошо работает в обычном поиске, но не соответствует рекомендациям Google News или Discover. Этот контент находится в серой зоне, и хотя он может не подходить для этих платформ, его ценность для SEO значительна.


Представители Google объявили на X (ранее известном как Twitter), что невозможно отфильтровать определенный контент от показа в Google Discover, в отличие от Google News, где такая опция существует.

Как опытный веб-мастер, я столкнулся с похожей ситуацией, описанной Лили Рэй. Она рассказала о распространенной проблеме, связанной с наличием контента, который не соответствует рекомендациям Google News или Discover, но при этом работает исключительно хорошо в обычных результатах поиска.

Рэй заявляет:

В ходе различных встреч с клиентами-издателями мы сталкивались с необходимостью ограничить обнаружение или индексирование определенного контента с помощью Google News и Discover.

Несмотря на высокие результаты в обычных результатах поиска, не рекомендуется запрещать универсальное индексирование этого контента.

Проще говоря, некоторые типы контента, хотя и не запрещены явно политиками Google News и Discover, могут генерировать значительный трафик из поисковых систем. Однако чрезмерное количество такого контента может негативно повлиять на производительность Google Discover в долгосрочной перспективе.

«Задумывался ли когда-нибудь Google о внедрении системы, исключающей появление определенных веб-страниц в Новостях Google или Discover?», помимо настроек Безопасного поиска?

Ответ Google

Как опытный веб-мастер, я был бы рад помочь прояснить ответ специалиста по поиску Google относительно блокировки контента в Новостях Google. Они предложили использовать устоявшиеся методы для достижения этой цели.

По словам Джона Мюллера из команды Google Search Relations, упомянутые методы не применимы к Google Discover.

Представитель по поиску заявил:

Как специалист по цифровому маркетингу, я несколько раз имел возможность переписываться с Джоном Мюллером. К сожалению, судя по нашему недавнему обмену мнениями, похоже, что Google Discover не предоставляет нам возможности заранее ограничить появление контента в своих предложениях.

Признавая потенциальную ценность такой функции, он добавил:

«Это может показаться полезным, поэтому мы передадим его.»

Мы с Джоном обменялись сообщениями и считаем, что в Discover невозможно отфильтровать определенный контент. Было бы полезно, если бы такая возможность существовала, поэтому мы поделимся этим наблюдением.

— Google SearchLiaison (@searchliaison), 15 июля 2024 г.

Что это значит?

Как опытный веб-мастер, я сталкивался с ситуациями, когда признание Google пробела в процессе сканирования приводит к тому, что издатели чувствуют себя бессильными перед тем, как индексируется их контент. По сути, это означает, что существуют ограничения на нашу способность управлять и оптимизировать способы доступа Google к нашему онлайн-контенту и его представления.

Управление сканированием контента для Новостей Google и результатов обычного поиска упрощается с помощью доступных инструментов. Однако Discover, не имея сопоставимых средств контроля, создает в этом отношении проблему.

По словам представителя Google по поиску, в будущем Google Discover может обеспечить более точные параметры управления. Однако в настоящее время нет планов по реализации функций блокировки контента на этой платформе.

Смотрите также

2024-07-15 23:38

YouTube расширяет набор инструментов Shorts: автоматический макет, преобразование текста в речь и многое другое

YouTube представил новые инструменты для коротких видео, призванные сделать создание контента более доступным.

В последнем выпуске «Примечаний к выпуску» директор по продуктам YouTube Джоанна Вулич и представитель авторов Рене Ричи делятся с нами последними новостями.

Разрушение барьеров на пути творчества

YouTube Shorts, которые собирают 70 миллиардов просмотров в день, упрощают процесс создания.

Во время объявления Вулич выразил желание разжечь творческий потенциал и предоставить удобные инструменты для коротких видео.

Новые функции в Shorts

  1. Автоматический макет. Эта эксклюзивная функция Android автоматически отслеживает основной объект при преобразовании длинных видео в короткие видео, обеспечивая оптимальное кадрирование.
  2. Преобразование текста в речь. Авторы могут добавлять повествование в свои короткие видео, выбирая один из четырех разных голосов для чтения текста на экране.
  3. Наклейка «Добавьте свой». Этот интерактивный элемент позволяет стимулировать участие аудитории, предлагая зрителям добавлять соответствующий контент, создавая цепочку ответов, генерируемых пользователями.
  4. Эффекты Minecraft: в честь 15-летия Minecraft были представлены два новых эффекта: Minecraft Spring и Minecraft Rush. Последнее представляет собой играбельную мини-игру.
  5. Расширенные подписи. Вскоре авторы смогут добавлять, редактировать и стилизовать автоматически создаваемые подписи непосредственно в своем контенте.
  6. Возможности создания ремиксов. Благодаря существующим инструментам создания ремиксов пользователи теперь могут «сделать ремикс на ремикс».

Отзывы авторов и будущие разработки

Во время объявления Вулич ответил на вопросы успешных создателей коротких видео.

Увеличение аудитории с помощью коротких видео

Дженни Хойос, у которой более миллиарда просмотров на своем аккаунте, выразила интерес к ресурсам для содействия участию сообщества.

Вулич предложил использовать функцию ответа и выйти в прямой эфир, чтобы лучше общаться со зрителями.

Более длинные шорты на подходе?

Один из авторов предложил идею увеличить продолжительность короткометражек сверх нынешнего ограничения в 60 секунд.

Как профессионал в области цифрового маркетинга, я бы предложил перефразировать это так: я, Вулич, не вносил никаких мгновенных корректировок, но я ценю ваш вклад как создателей в отношении оптимальной продолжительности видео.

Больше авторов, зарабатывающих деньги

YouTube отмечает годовщину партнерской программы для коротких видео. Примечательно, что четверть авторов, участвующих в Партнерской программе YouTube (YPP), в настоящее время получают доход через этот формат.

Почему это важно?

Новые функции YouTube Shorts важны, потому что:

  • Больше людей смогут создавать видео. Новые инструменты упрощают создание коротких видео.
  • Идти в ногу с TikTok. YouTube пытается сделать Shorts популярными, предлагая функции, аналогичные другим приложениям для коротких видео.
  • Деньги для авторов. Чем больше способов создавать короткие видео, тем больше шансов у авторов заработать деньги.
  • Развлечение для зрителей. Новые функции, такие как стикеры и эффекты, делают просмотр коротких видео более интересным и интерактивным.
  • Проще понять: улучшенные субтитры позволяют людям смотреть видео даже без звука.

Эти изменения показывают, что YouTube обращает внимание на то, чего люди хотят от коротких видеороликов.

Смотрите также

2024-07-15 20:08

Google отображает все страницы для поиска, включая сайты с большим количеством JavaScript

Как опытный веб-мастер с многолетним опытом работы за плечами, я внимательно наблюдал за эволюцией разработки веб-сайтов и поисковой оптимизации. Недавнее сообщение Google о том, как они справляются с веб-сайтами с большим количеством JavaScript, стало для меня долгожданной новостью.


В недавнем выпуске подкаста Google «Search Off the Record» Зои Клиффорд из команды рендеринга встретилась с Мартином Сплиттом и Джоном Мюллером из Search Relations, чтобы обсудить, как Google подходит к веб-сайтам, богатым JavaScript.

Как специалист по цифровому маркетингу, я могу подтвердить, что Google уверяет нас, что обрабатывает все веб-сайты, отображаемые в результатах его поисковых систем, независимо от того, включают они JavaScript или нет.

Объяснение процесса рендеринга

Как специалист по цифровому маркетингу, я бы объяснил, что в сфере поиска Google я использую термин «рендеринг» для описания процесса использования headless-браузера для обработки и интерпретации веб-страниц.

Как специалист по цифровому маркетингу, я бы рекомендовал оптимизировать контент вашего веб-сайта для индексации Google, гарантируя, что поисковая система сможет получить к нему доступ после завершения выполнения всего JavaScript и полной загрузки страницы. Этого можно достичь путем реализации таких методов, как рендеринг на стороне сервера или динамический рендеринг, с использованием таких инструментов, как Prerender.js или Next.js, для предоставления предварительно обработанной версии ваших страниц для поисковых систем. Тем самым вы облегчите Google сканирование и индексацию контента таким образом, чтобы он точно отражал пользовательский опыт.

Клиффорд заявил

В процессе индексирования мы используем веб-браузер, чтобы имитировать взаимодействие пользователя с полностью загруженной веб-страницей с исполняемым JavaScript.

Все HTML-страницы отображаются

Клиффорд подтвердил:

«Мы просто отображаем их все, при условии, что это HTML, а не другие типы контента, такие как PDF-файлы».

Признавая связанные с этим затраты, очень важно получить полный доступ к веб-страницам, особенно к тем, которые сильно полагаются на JavaScript.

Непрерывные обновления браузера

Команда также обсудила переход Google к использованию «Evergreen Googlebot» в 2019 году.

Благодаря этому обновлению веб-сканер Google, Googlebot, будет поддерживать свою хромированную версию, обновляя ее до последней стабильной версии Google Chrome.

Это изменение улучшило возможности Google по рендерингу и индексированию современных веб-сайтов.

Что это значит для владельцев и разработчиков веб-сайтов

  1. Хорошие новости для JavaScript: если на вашем сайте много JavaScript, Google, скорее всего, это поймет.
  2. Скорость по-прежнему имеет значение. Хотя Google лучше справляется с JavaScript, наличие быстро загружающегося веб-сайта по-прежнему важно.
  3. По возможности будьте проще. Хотя использование JavaScript вполне допустимо, старайтесь не переусердствовать. Более простые веб-сайты часто легче понять как Google, так и посетителям.
  4. Проверьте свою работу. Используйте бесплатные инструменты Google, такие как Fetch As Google, чтобы убедиться, что поисковые роботы смогут отображать ваш сайт.
  5. Подумайте обо всех пользователях. Помните, что у некоторых людей медленный Интернет или старые устройства. Убедитесь, что ваш основной контент работает, даже если JavaScript не загружается идеально.

Подведение итогов

Способность Google эффективно обрабатывать сайты, насыщенные JavaScript, расширяет творческие возможности разработчиков. Тем не менее, разумным подходом является отдача приоритета созданию быстрых и удобных для пользователя веб-сайтов, которые удовлетворят потребности всех.

Чтобы ваш веб-сайт оставался оптимизированным для обеих поисковых систем, таких как Google, и приносил пользу вашим посетителям, рассмотрите следующие предложения:

Полную версию подкаста слушайте ниже:

Смотрите также

2024-07-15 18:38

20 подтвержденных фактов об алгоритме YouTube

Как создатель контента, который потратил бесчисленные часы, вложив все свое сердце и душу в создание интересных видеороликов для YouTube, я не могу не быть глубоко заинтригован загадочной работой алгоритма рекомендаций этой платформы. С каждым новым загруженным видео я с нетерпением жду ответа от богов YouTube – получит ли оно теплый прием от зрителей или останется томиться в безвестности?


Вместо того, чтобы просто подсчитывать количество кликов или просмотров видео на YouTube, алгоритмы платформы уделяют первоочередное внимание тому, чтобы зрители были заинтересованы и удовлетворены контентом, который они потребляют.

В статье исследуется внутренняя работа алгоритмической системы YouTube и показано, как она рекомендует видео, которые находят отклик у зрителей и способствуют продолжительному взаимодействию.

Простым и понятным языком: я был бы рад поделиться с вами процессом, который YouTube использует для выбора видео для различных разделов своей платформы, включая домашнюю страницу и «предлагаемые следующие варианты».

Как опытный веб-мастер с большим опытом оптимизации контента для YouTube, я был бы рад поделиться некоторыми соображениями о том, почему одни видео появляются чаще, чем другие, а также о роли алгоритма YouTube в адаптации видеорекомендаций для отдельных пользователей.

Посредством детального анализа мы стремимся предоставить маркетологам и пользователям YouTube ценную информацию об эффективном сотрудничестве с платформой YouTube.

В конце приводится краткое изложение всех фактов.

Приоритизация удовлетворенности зрителей

Как опытный веб-мастер, я заметил, что на заре существования YouTube платформа в значительной степени полагалась на данные о времени просмотра для ранжирования видео. Предполагалось, что более продолжительный просмотр указывает на большее удовлетворение аудитории.

Тем не менее, они пришли к пониманию, что общего времени просмотра само по себе недостаточно, поскольку оно не гарантирует удовлетворения зрителя.

Примерно с начала 2010-х годов YouTube начал уделять особое внимание показателям удовлетворенности зрителей, чтобы определить порядок, в котором контент появляется на платформе.

Алгоритмы учитывают такие сигналы, как:

  • Ответы на опросы, в которых зрителям напрямую задают вопрос об их удовлетворенности рекомендуемыми видео.
  • Нажатия на кнопки «нравится», «не нравится» или «не интересно», что указывает на удовлетворение.
  • Общие показатели удержания аудитории, такие как процент просмотренных видео.
  • Метрики поведения пользователей, включая то, что пользователи смотрели раньше (история просмотра) и что они смотрят после видео (смотреть дальше).

Алгоритмы рекомендаций адаптируются и совершенствуются на основе действий и отзывов пользователей, что позволяет им предлагать оптимальные видео для каждого человека.

Как видео ранжируется на главной странице

На главной странице YouTube собраны и ранжированы видео, которые зритель, скорее всего, посмотрит.

К факторам ранжирования относятся:

Данные об эффективности

Основываясь на моем обширном опыте работы с цифровыми медиа и аналитикой, я могу сказать вам, что существуют определенные ключевые показатели эффективности (KPI), на которые YouTube опирается, чтобы оценить привлекательность видео для своей аудитории. Среди этих показателей — рейтинг кликов, основанный на показах и средней продолжительности просмотра.

Персонализированная релевантность

Помимо анализа статистики производительности, YouTube уделяет большое внимание индивидуальным предпочтениям, чтобы адаптировать контент главной страницы для каждого пользователя. Эта настройка основана на их прошлых привычках просмотра, подписках и взаимодействии с определенными темами или каналами.

Как YouTube ранжирует предлагаемые видеорекомендации

Столбец «Рекомендуемые видео» специально создан для поддержания вовлеченности зрителей, рекомендуя видео, соответствующие их текущему контенту и личным предпочтениям.

К факторам ранжирования относятся:

Совместный просмотр видео

YouTube изучает привычки аудитории смотреть видео, чтобы определить видео, которые часто просматриваются последовательно или в паре. Признавая эти тенденции, YouTube может предлагать релевантный контент, который в дальнейшем может привлечь внимание зрителей.

Соответствие тем/категорий

Алгоритм ищет видео по схожим темам или предметам, которые можно предложить, улучшая качество просмотра благодаря близкому контенту.

Личная история просмотра

На основе прошлых привычек просмотра и предпочтительного контента зрителя можно эффективно предложить рекомендации по дополнительным видео, которые соответствуют его интересам.

Подписки на каналы

Как эксперт по SEO, я бы перефразировал это так: каналы, чьи видео зрители регулярно просматривают и с которыми взаимодействуют, имеют приоритет в предоставленных предложениях, поддерживая взаимодействие пользователей с предпочитаемыми ими создателями контента.

Внешние переменные ранжирования

YouTube признал, что следующие внешние переменные могут повлиять на производительность видео:

  • Общая популярность и уровень конкуренции по различным темам и категориям контента.
  • Изменение моделей поведения зрителей и тенденций интереса к тому, какой контент они потребляют.
  • Сезонные эффекты могут влиять на то, какие типы видео люди смотрят в разное время года.

Для авторов, которые только начинают свою деятельность или у которых меньше подписчиков, YouTube активно работает над тем, чтобы их контент стал известен, предлагая его в качестве рекомендации.

Фирма внимательно следит за достижениями новичков и постоянно добивается успехов в улучшении, в том числе:

  • Использование передовых языковых моделей искусственного интеллекта для лучшего понимания тем контента и интересов зрителей.
  • Оптимизация процесса поиска за счет улучшенных макетов и путей содержания, чтобы уменьшить «паралич выбора».

Стратегии для авторов

Чтобы достичь наивысшего уровня удовлетворенности зрителей и повысить вероятность рекомендаций видео, создатели контента могут принять следующую стратегию:

  • Сосредоточьтесь на создании контента, который обеспечивает высокую удовлетворенность зрителей за счет сильного удержания аудитории, положительных ответов на опросы, лайков/вовлеченности и низкого уровня отказов.
  • Создавайте последовательные видеоролики серий или продолжений, чтобы повысить вероятность того, что вас предложат для просмотра связанных/последовательных просмотров.
  • Используйте плейлисты, конечные заставки и связанные видео-подсказки, чтобы подключить свой контент к расширенным сеансам просмотра.
  • Изучите возможность создания контента в новых форматах, таких как короткие видео, прямые трансляции или подкасты, которые могут соответствовать меняющимся интересам зрителей.
  • Отслеживайте общую производительность, в частности, исходя из существующей базы подписчиков.
  • Не расстраивайтесь из-за первоначальных показателей. YouTube позволяет видео постоянно находить соответствующие сегменты аудитории.
  • Обратите внимание на сезонные тенденции, конкуренцию и меняющиеся интересы зрителей, которые могут повлиять на рекомендации.

Вкратце: 20 ключевых фактов об алгоритме YouTube

  1. YouTube имеет несколько алгоритмов для разных разделов (главная страница, предлагаемые видео, поиск и т. д.).
  2. Система рекомендаций обеспечивает работу главной страницы и предлагаемых разделов видео.
  3. Система подбирает видео, которые актуальны для каждого зрителя.
  4. Максимизация удовлетворенности зрителей является главным приоритетом для рейтинга.
  5. YouTube использует ответы на опросы, лайки, антипатии и клики «не интересно» для измерения удовлетворенности.
  6. Высокий процент удержания аудитории свидетельствует о положительном удовлетворении.
  7. Рейтинги домашней страницы сочетают в себе данные об эффективности и персонализированную релевантность.
  8. Эффективность зависит от рейтинга кликов и средней продолжительности просмотра.
  9. Персонализированные факторы релевантности включают историю просмотров, интересы и подписки.
  10. В предлагаемых видео приоритет отдается контенту, который просматривается одной и той же аудиторией.
  11. Видео с каналов, на которые вы подписаны, имеют приоритет для предложений.
  12. Последовательные серии и последовательные видеоролики увеличивают количество предложений для связанного просмотра.
  13. Списки воспроизведения, конечные заставки и связанные видео могут продлить сеанс просмотра.
  14. Создание привлекательного и приятного контента — основная стратегия рекомендаций.
  15. На рекомендации влияют внешние факторы, такие как конкуренция, тенденции и сезонность.
  16. YouTube стремится помочь новым/небольшим авторам привлечь внимание с помощью рекомендаций.
  17. Языковые модели искусственного интеллекта улучшают понимание контента и персонализацию.
  18. YouTube оптимизирует процесс поиска, чтобы уменьшить «паралич выбора».
  19. Со временем видео может найти аудиторию, даже если первоначальные показатели неутешительны.
  20. Алгоритм ориентирован на обеспечение долгосрочного и приятного опыта для удержания зрителей.

Мнение экспертов отрасли

При создании этой статьи я обратился к уважаемым профессионалам отрасли за информацией об алгоритмических тенденциях YouTube и успешных стратегиях, которые они использовали.

Грег Джарбо, президент и соучредитель SEO-PR и автор книги «YouTube и видеомаркетинг», высказывается:

«Система поиска и обнаружения YouTube преследует две цели: помочь зрителям найти видео, которые они хотят посмотреть, и максимизировать долгосрочное взаимодействие и удовлетворенность зрителей. Итак, чтобы оптимизировать ваши видео для поиска, вам следует писать оптимизированные заголовки, теги и описания. Так было с июля 2011 года, когда Руководство для авторов YouTube впервые стало доступно публике.

Начиная с октября 2012 года YouTube обновил свой алгоритм, сместив акцент с «количества просмотров» на «время просмотра». Следовательно, важно выйти за рамки простой оптимизации метаданных для ваших видео. Чтобы удержать зрителей, рассмотрите возможность применения различных методов:

Среди различных факторов ранжирования эти два являются наиболее важными, которые я использовал в своей стратегии SEO для видео. Благодаря их приложению мне удалось увеличить количество просмотров канала Travel Magazine с 1510 до впечатляющих 8,7 миллионов. Аналогичным образом, благодаря этим эффективным методам SEO для видео, канал SonoSite продемонстрировал значительный рост: с 99 529 просмотров до ошеломляющих 22,7 миллиона.

Последним значительным событием на YouTube является появление YouTube Shorts, которые теперь легко доступны на главной странице, в частности на новой полке Shorts, а также видны в других областях приложения. Для получения дополнительной информации ознакомьтесь со статьей «Могут ли ютуберы зарабатывать деньги на коротких видео? Да, некоторые зарабатывают!»

Бри Э. Андерсон, консультант по SEO и цифровому маркетингу, говорит:

Исходя из моего профессионального опыта, я бы перефразировал это следующим образом:

Один эффективный способ перефразировать данный текст, сохранив его первоначальный смысл:

Кроме того, очень полезно включать временную метку «глав». YouTube отображает их на странице результатов поисковой системы (SERP), как указано в вышеупомянутой статье.

Чтобы YouTube лучше понимал содержание вашего видео, вы также можете добавить собственный файл .srt с субтитрами.

Вместо того, чтобы сосредотачиваться исключительно на оптимизации видео для поисковых систем, я настоятельно рекомендую писать сообщения в блогах и включать ваши видео или хотя бы давать на них ссылки. Такой подход помогает индексировать и повышать авторитет сайта, тем самым повышая вероятность того, что ваш сайт, а не YouTube, будет ранжироваться при поиске по похожим темам.

Смотрите также

2024-07-15 14:09

Раскрытие возможностей LLM и схемы знаний (введение)

У меня была возможность поработать над интересным проектом, который включал создание помощника по SEO с использованием больших языковых моделей (LLM), GraphRAG и доступа к внешним API. Как человек, проработавший много лет в индустрии SEO, я могу подтвердить потенциал этой технологии для автоматизации и доступа к знаниям.


Мы живем в захватывающую эпоху, когда достижения ИИ меняют профессиональную практику.

Как эксперт по SEO, я воочию стал свидетелем того, как GPT-3 с момента своего запуска произвел революцию в создании контента для профессионалов в области SEM. Вместо того, чтобы вручную создавать или редактировать текст, теперь мы можем использовать эту передовую технологию, чтобы оптимизировать наши процессы и сосредоточиться на других важных аспектах наших стратегий цифрового маркетинга.

Внедрение ChatGPT в конце 2022 года вызвало волну развития помощников ИИ.

Как человек, внимательно следящий за разработками в области искусственного интеллекта, я искренне рад объявлению OpenAI к концу 2023 года. исключение.

Обещания GPT

Как специалист по цифровому маркетингу, я в восторге от достижений в области технологий, которые приблизили нас к реализации давней мечты о личном помощнике. GPT (технологии общего назначения) сыграли важную роль в прокладывании пути для этого развития. В частности, модели разговорного большого языка (LLM) представляют собой захватывающую эволюцию человеко-машинных интерфейсов. Эти модели могут понимать запросы на естественном языке и отвечать на них в разговорной форме, что делает взаимодействие с технологиями более интуитивным и удобным для пользователя.

Чтобы создать мощных помощников в области искусственного интеллекта, необходимо решить несколько задач: воспроизвести логическое мышление, предотвратить заблуждения и расширить возможности эффективного использования внешних ресурсов.

Наш путь к разработке SEO-помощника

Последние пару месяцев мы с Гийомом и Томасом, моими доверенными коллегами, вместе углублялись в эту тему.

Я представляю здесь процесс разработки нашего первого прототипа SEO-помощника.

SEO-помощник, почему?

Наша цель — создать помощника, который будет способен:

  • Генерация контента по брифам.
  • Распространение отраслевых знаний о SEO. Он должен иметь возможность подробно отвечать на такие вопросы, как «Должно ли быть несколько тегов H1 на странице?» или «Является ли TTFB фактором ранжирования?»
  • Взаимодействие с инструментами SaaS. Все мы используем инструменты с графическим пользовательским интерфейсом различной сложности. Возможность использовать их посредством диалога упрощает их использование.
  • Планирование задач (например, управление полным редакционным календарем) и выполнение регулярных задач отчетности (например, создание информационных панелей).

В первоначальном задании магистры юридических наук (LLM) продемонстрируют значительный прогресс, если мы ограничим их доступ только достоверными данными.

Последний пункт о планировании все еще во многом находится в области научной фантастики.

Наши усилия были в первую очередь направлены на включение данных в систему с использованием таких методов, как методы RAG (на основе правил, на основе повестки дня) и GraphRAG (на основе графика, на основе правил и на основе повестки дня), а также на использование внешних API.

Подход RAG

Сначала мы создадим помощника на основе подхода дополненной генерации (RAG).

 

Как опытный веб-мастер, я бы порекомендовал для создания этого своего помощника использовать векторную базу данных. На выбор есть несколько вариантов: Redis, Elasticsearch, OpenSearch, Pinecone, Milvus, FAISS и другие. Лично я для нашего прототипа проекта выбрал векторную базу данных, предлагаемую LlamaIndex.

Чтобы эффективно связать нашу большую языковую модель (LLM) с базами данных и документами, нам требуется платформа интеграции языковой модели (LMI). Эта структура служит для устранения разрыва между LLM и источниками данных. В этой области существует несколько альтернатив, включая LangChain, LlamaIndex, Haystack, NeMo, Langdock, Marvin и другие. Для нашего конкретного проекта мы выбрали LangChain и LlamaIndex.

После выбора предпочитаемого стека программного обеспечения процесс внедрения значительно упрощается. Мы предлагаем документацию, которая преобразуется платформой в векторы кодирования контента.

Несколько технических факторов могут улучшить результаты, но продвинутые поисковые системы, такие как LlamaIndex, демонстрируют впечатляющую производительность.

Чтобы продемонстрировать эту концепцию, мы предоставили несколько книг по SEO на французском языке и несколько веб-страниц из известных источников SEO-сайтов.

Благодаря RAG меньше случаев неправильного восприятия и более полные ответы. На следующем изображении показан ответ, сгенерированный моделью родного языка (LLM) без RAG, а затем с интегрированным RAG для сравнения.

В этом случае подробности, предоставляемые RAG (оценка рисков и управление), превосходят информацию, предлагаемую независимой LLM (моделью с ограниченной ответственностью).

Подход GraphRAG

При работе с ответами, которые требуют интеграции данных из многочисленных источников, метод RAG (автоматическая генерация на основе правил) может не дать оптимальных результатов. Более эффективным решением было бы сначала предварительно обработать текстовые данные, чтобы выявить их внутреннюю структуру и сохранить семантику.

Создание графа знаний предполагает представление объектов реального мира и связей между ними в виде узлов графа, причем отношения определяются связями или ребрами. Эти отношения выражаются с помощью триады субъекта, отношения и объекта.

В приведенном ниже примере у нас есть представление нескольких сущностей и их отношений.

На графике «Выдра Боб» идентифицируется как именованный объект среди других объектов, таких как «река», «выдра», «питомец с мехом» и «рыба». Связи между этими объектами представлены через ребра графа.

Основываясь на моем обширном опыте работы с графиками данных и знаний, я могу с уверенностью сказать, что представленная здесь информация хорошо организована и понятна. В нем говорится, что Боб — выдра, существо, обитающее в реках, питающееся в основном рыбой и часто содержащееся в качестве любимого домашнего животного из-за его мягкого роскошного меха. Сила графов знаний заключается в их способности делать логические выводы — например, на основе этих данных я могу сделать вывод, что выдра Боб действительно является пушистым питомцем.

Как специалист по цифровому маркетингу, я заметил, что построение графиков знаний с использованием методов обработки естественного языка (НЛП) уже довольно давно является обычной практикой. Однако с появлением моделей большого языка (LLM) создание этих графиков стало более доступным и упрощенным. Итак, вместо того, чтобы вручную строить график, мы теперь можем попросить LLM сгенерировать его на основе текстовых данных.

Конечно, структура LMI (крупномасштабного машинного обучения) играет решающую роль, помогая нашей модели большого языка (LLM) эффективно выполнять поставленную задачу. В реализации нашего проекта мы выбрали использование LlamaIndex.

Кроме того, использование метода GraphRAG усложняет структуру нашего помощника, как показано на следующем изображении.

Позже мы вернемся к теме интеграции API инструментов. А пока давайте сосредоточимся на других аспектах нашего подхода, которые включают элементы методологии RAG (красный, желтый, зеленый) и граф знаний. Важно подчеркнуть включение в эту настройку компонента «быстрой обработки».

Как специалист по цифровому маркетингу, я бы описал это так: я управляю процессом перевода подсказок в запросы к базе данных в рамках моего программирования. Впоследствии я преобразую результаты диаграммы знаний в четкие и краткие ответы для облегчения понимания человеком.

На представленном изображении вы найдете наш подлинный код для обработки запроса. Одна из первоначальных реализаций метода GraphRAG демонстрируется с использованием NebulaGraph в этом коде.

Предоставили ли мы наш граф знаний теми же данными, что и те, которые использовались для генерации ответов с использованием RAG (реактивная автоматическая генерация)? Давайте проверим их производительность на том же примере, чтобы определить, заметно ли улучшение качества ответов.

Основываясь на моем обширном опыте в анализе данных и машинном обучении, я твердо верю, что представленный здесь подход предлагает более полный и организованный способ интерпретации данных по сравнению с предыдущими методами. Однако я признаю, что у него может быть недостаток — увеличенная задержка получения результатов. С моей личной точки зрения, этот компромисс оправдан, поскольку я обнаружил, что улучшенная структура и полнота предоставляемой информации часто приводит к более точному пониманию и лучшему принятию решений в моей профессиональной жизни. Тем не менее, я понимаю, что эта проблема UX может быть сложной, и я углублюсь в потенциальные решения для ее решения в будущих обсуждениях.

Интеграция данных инструментов SEO

Как профессионал в области цифрового маркетинга, в настоящее время в моем распоряжении есть инструмент, который может предоставить точную информацию и знания. Тем не менее, я стремлюсь еще больше расширить его возможности, позволив ему получать данные непосредственно из инструментов SEO. Для достижения этой цели я буду использовать LangChain для взаимодействия с API с использованием разговорного языка.

Я генеральный директор компании, создающей этот инструмент.)

Проще говоря, изображение иллюстрирует процесс сбора помощником данных о показателях ссылок для определенного URL-адреса. На более высоком уровне нашей структуры LangChain мы сигнализируем, что эта функциональность существует.

tools = [StructuredTool.from_function(get_babbar_metrics)]
agent = initialize_agent(tools, ChatOpenAI(temperature=0.0, model_name="gpt-4"), 
agent=AgentType.CONVERSATIONAL_REACT_DESCRIPTION, verbose=False, memory=memory)

Я инициализирую инструмент LangChain, используя предоставленную функцию, и настрою интерфейс чата для создания ответов. Имейте в виду, что температура в настоящее время установлена ​​на ноль. Эта конфигурация гарантирует, что GPT-4 генерирует простые ответы без какого-либо творчества, что делает его идеальным для доставки данных из инструментов, а не для создания творческого контента.

Модель большого языка (LLM) выполняет большую часть обработки в этом сценарии. Он преобразует запрос на естественном языке в запрос API, а затем переводит полученный результат обратно на естественный язык для облегчения понимания.

Одним из вариантов может быть: «У вас есть возможность получить файл Jupyter Notebook, содержащий подробные инструкции. Используя этот файл, вы можете установить диалоговый агент GraphRAG в своей личной среде».

Как SEO-специалист, я бы предложил перефразировать данную инструкцию следующим образом:

import requests
import json

# Define the URL and the query
url = "http://localhost:5000/answer"

# prompt 
query = {"query": "what is seo?"}

try:
    # Make the POST request
    response = requests.post(url, json=query)
    
    # Check if the request was successful
    if response.status_code == 200:
        # Parse the JSON response
        response_data = response.json
        
        # Format the output
        print("Response from server:")
        print(json.dumps(response_data, indent=4, sort_keys=True))
    else:
        print("Failed to get a response. Status code:", response.status_code)
        print("Response text:", response.text)
except requests.exceptions.RequestException as e:
    print("Request failed:", e)

Это (почти) завершение

Используя большую языковую модель, такую ​​​​как GPT-4, в сочетании с методами генерации повторных ответов (RAG) и генерации повторяющихся ответов по графику (GraphRAG), а также доступа к внешним интерфейсам прикладного программирования (API), мы построили демонстрационную модель. показывая потенциальные достижения в области автоматизации поисковой оптимизации (SEO).

Этот инструмент предоставляет нам легкий доступ ко всей информации, имеющей отношение к нашей отрасли, а также предоставляет удобный интерфейс для работы со сложными инструментами SEO (вы когда-нибудь выражали разочарование по поводу графического интерфейса даже самых продвинутых инструментов SEO?).

Еще предстоит решить две проблемы: сократить время отклика и сделать взаимодействие более похожим на разговор с человеком.

Первоначальная проблема возникает из-за длительного времени обработки, необходимого для доступа к информации из модели большого языка (LLM) и графовых или векторных баз данных. Это может привести к задержке до десяти секунд при поиске ответов на сложные запросы в рамках нашего проекта.

Существует ограниченное количество вариантов решения этой проблемы: добавление дополнительного оборудования или терпение в отношении потенциальных обновлений программных компонентов, от которых мы полагаемся.

Вторая задача более сложная. Хотя модели большого языка имитируют человеческий тон и стиль письма, их проприетарные интерфейсы вызывают некоторые опасения.

Две проблемы можно эффективно решить с помощью умного решения: использования широко известного, преимущественно используемого человеком текстового интерфейса, который происходит с типичной задержкой из-за его синхронного характера среди пользователей.

В качестве средства взаимодействия с нашим SEO-специалистом мы выбрали WhatsApp. Эта простая задача была решена с помощью бизнес-платформы WhatsApp с использованием API-интерфейсов обмена сообщениями Twilio.

В конце концов мы получили инструмент SEO под названием VictorIA, имя которого происходит от имени Виктора Гюго, известного французского писателя, и IA, аббревиатуры искусственного интеллекта, как показано на следующем изображении.

Заключение

Наша работа знаменует собой начало захватывающего приключения. С помощью передовых инструментов, таких как GraphRAG и API, помощники могут произвести революцию в области больших языковых моделей. Теперь компании могут использовать эту технологию для себя.

Как эксперт по SEO, я бы рекомендовал использовать помощников искусственного интеллекта по требованию, чтобы оптимизировать процессы и повысить производительность внутри команд. Эти интеллектуальные инструменты могут значительно снизить рабочую нагрузку младших сотрудников, предоставляя легко доступные ответы на распространенные запросы, тем самым позволяя им сосредоточиться на более сложных задачах. Более того, команды поддержки клиентов могут получить огромную пользу от этих помощников, поскольку они действуют как комплексные базы знаний, обеспечивая быстрое решение запросов и повышая общую удовлетворенность клиентов.

Крайне важно понимать процесс создания экземпляра графовой базы данных Nebula, в идеале локального, из-за низкой производительности при использовании его в контейнере Docker. Хотя установка хорошо документирована, поначалу она может показаться сложной.

Для новичков мы рассматриваем возможность создания учебного пособия в ближайшее время, которое поможет вам начать работу.

Смотрите также

2024-07-15 12:09