Архитектура YouTube: от клика до глобального стриминга

Иван Корнев·25.04.2026·5 мин

YouTube работает благодаря связке двухступенчатых нейросетей для рекомендаций, распределённой файловой системы Colossus для хранения данных и глобальной сети доставки контента (CDN). Платформа обрабатывает более 500 часов видео в минуту, используя адаптивный битрейт и машинное обучение, чтобы мгновенно подбирать контент под интересы каждого из 2,7 млрд пользователей.

Коротко о главном: Рекомендации строятся не на «просмотрах», а на времени удержания внимания (Watch Time) и удовлетворённости пользователя. Хранение обеспечивается репликацией данных в дата-центрах по всему миру, а доставка — через кэширующие серверы провайдеров.

Механика рекомендаций: двухэтапный воронка

Система рекомендаций YouTube — это не один алгоритм, а конвейер, который отсеивает миллионы видео, оставляя лишь несколько десятков релевантных для конкретной ленты. Процесс делится на два этапа: генерация кандидатов и ранжирование.

1. Генерация кандидатов (Candidate Generation)

На этом этапе система быстро сужает поиск с миллионов видео до нескольких сотен потенциально интересных роликов. Используются два основных подхода:

  • Коллаборативная фильтрация: Анализ поведения похожих пользователей. Если группа людей с вашим профилем просмотров смотрела видео А, а затем видео Б, система предложит видео Б и вам.
  • Поиск по сходству (Embeddings): Каждому видео и пользователю присваивается вектор в многомерном пространстве. Система ищет видео, векторы которых находятся близко к вектору ваших интересов.

2. Ранжирование (Ranking)

Отобранные кандидаты проходят через глубокую нейронную сеть (DNN), которая оценивает вероятность того, что вы посмотрите видео до конца, поставите лайк или прокомментируете.

Ключевые сигналы ранжирования:

  • Watch Time (Время просмотра): Самый весомый фактор. Алгоритм предпочитает видео, которые досматривают, а не те, на которые просто кликнули.
  • Удовлетворённость (Satisfaction): Определяется через опросы («Понравилось ли видео?»), лайки и отсутствие действий «Не рекомендовать».
  • Персональный контекст: История просмотров, время суток, устройство (смартфон или ТВ) и локация.

Для авторов: Алгоритм оптимизируется под долгосрочную удовлетворённость зрителя. Кликбейт, снижающий время просмотра, наказывается системой понижением охватов в будущих рекомендациях.

Хранение и обработка видео: от загрузки до экрана

Каждую минуту на YouTube загружается около 500 часов контента. Чтобы этот объём данных был доступен мгновенно в любой точке мира, используется сложная цепочка обработки.

Транскодирование и кодеки

Сразу после загрузки исходный файл проходит транскодирование. Видео конвертируется в множество форматов и разрешений (от 144p до 8K).

  • Кодеки: YouTube активно использует собственные разработки — VP9 и AV1. Кодек AV1 обеспечивает сжатие на 30–50% эффективнее старого H.264 при том же качестве, экономя трафик пользователей и нагрузку на серверы.
  • Адаптивный стриминг (DASH): Видео разбивается на небольшие сегменты (чанки) по несколько секунд. Плеер на устройстве пользователя сам выбирает качество следующего чанка в зависимости от текущей скорости интернета. Это позволяет менять качество «на лету» без остановки воспроизведения.

Файловая система Colossus

Все данные хранятся в распределённой файловой системе Google Colossus (преемник GFS).

  • Репликация: Каждое видео копируется минимум в три разных дата-центра. Если один центр выходит из строя (например, из-за стихийного бедствия), трафик автоматически перенаправляется на другие копии.
  • Холодное и горячее хранение: Популярные видео хранятся на быстрых SSD-накопителях («горячий» слой). Редко просматриваемый архив перемещается на более медленные и дешёвые носители («холодный» слой), но остаётся доступным по запросу.

Инфраструктура доставки: как видео попадает к вам

Даже идеально сжатое видео будет тормозить, если сервер находится далеко. Решением служит глобальная инфраструктура Google.

Google Global Cache (GGC)

Это ключевой элемент доставки контента. Google устанавливает свои серверы прямо в дата-центрах интернет-провайдеров по всему миру.

  • Принцип работы: Если видео популярно в вашем регионе, его копия сохраняется на сервере GGC внутри сети вашего провайдера.
  • Результат: Данные идут не через океан из США, а от ближайшего узла связи. Это снижает задержку (latency) и разгружает магистральные каналы интернета. Более 90% трафика YouTube обслуживается через такие локальные кэши.

Оркестрация нагрузкой (Borg и Kubernetes)

Управление миллионами серверных процессов осуществляется системой Borg (предшественник Kubernetes).

  • Она динамически распределяет вычислительные ресурсы. Во время пиковых нагрузок (например, трансляция крупного спортивного события) система автоматически выделяет больше мощностей для обработки видеопотока и рекомендаций, масштабируя контейнеры за секунды.
Компонент инфраструктурыНазначениеМасштаб воздействия
Google Global CacheЛокальное кэширование контента у провайдеровСнижение задержки до минимума
Colossus FSНадёжное хранение петабайтов данныхГарантия доступности 24/7
AV1/VP9 КодекиЭффективное сжатие видеоЭкономия трафика пользователя
Borg/KubernetesУправление серверными мощностямиМгновенное масштабирование при пиках

Частые заблуждения о работе платформы

  • «Алгоритм наказывает за пропуск дней публикаций». Нет, частота загрузки не является прямым фактором ранжирования. Важнее качество и удержание аудитории конкретного ролика.
  • «Теги решают всё». Теги помогают системе понять контекст (особенно для новых каналов), но их вес в рекомендациях минимален по сравнению с CTR (кликабельностью) и временем просмотра.
  • «Видео удаляется мгновенно». При удалении видео пользователем оно стирается из индекса поиска сразу, но физические копии могут оставаться на резервных носителях некоторое время согласно политикам безопасности данных.

FAQ

Почему качество видео падает при быстром перемотке? При перемотке плеер запрашивает новый сегмент видео. Если скорость интернета нестабильна, алгоритм адаптивного битрейта временно снижает качество, чтобы избежать буферизации (остановки воспроизведения).

Как YouTube понимает, что видео нарушает правила, до проверки модератором? Система Content ID и автоматические фильтры используют хэши (цифровые отпечатки) файлов и анализ аудиодорожек. Нейросети также распознают визуальные паттерны (насилие, запрещённая символика) и ключевые слова в метаданных, блокируя или ограничивая монетизацию таких роликов автоматически.

Можно ли «обмануть» алгоритм рекомендаций? Накрутка просмотров или боты легко выявляются системой аномалий. Такие действия приводят к теневому бану канала — видео перестаёт попадать в рекомендации, даже если статистика выглядит красиво. Единственный рабочий способ роста — улучшение удержания внимания и кликабельности превью.