M
MercyNews
Home
Back
Масштабирование PostgreSQL для обслуживания 800 миллионов пользователей ChatGPT
Технологии

Масштабирование PostgreSQL для обслуживания 800 миллионов пользователей ChatGPT

Hacker News1d ago
3 мин чтения
📋

Ключевые факты

  • База данных PostgreSQL от OpenAI теперь обслуживает более 800 миллионов ежемесячных активных пользователей ChatGPT, обрабатывая петабайты данных.
  • Изначальная архитектура базы данных представляла собой один экземпляр PostgreSQL, который стал недостаточным по мере экспоненциального роста числа пользователей.
  • Для управления потоком одновременных подключений от миллионов пользователей была внедрена пулинг соединений с использованием PgBouncer.
  • Многорегиональное развертывание с репликами для чтения обеспечивает низкую задержку доступа для глобальной пользовательской базы и высокую доступность.
  • Система обрабатывает миллиарды взаимодействий ежедневно, что требует сложных стратегий оптимизации записи и управления соединениями.

Краткое резюме

OpenAI раскрыла сложную инженерию, стоящую за масштабированием своей инфраструктуры базы данных PostgreSQL для поддержки взрывного роста ChatGPT. С пользовательской базой, превышающей 800 миллионов ежемесячных активных пользователей, компания столкнулась с беспрецедентными вызовами в работе с базой данных, которые потребовали полного пересмотра архитектуры.

Путь от простой настройки базы данных к глобально распределенной, высокостойкой системе включал решение проблем управления соединениями, согласованности данных и узких мест производительности. Этот глубокий анализ раскрывает, как OpenAI превратила один экземпляр базы данных в мощную систему, способную обрабатывать миллиарды взаимодействий ежедневно.

Вызов масштабирования

Изначальная архитектура для бэкенда ChatGPT полагалась на простую настройку PostgreSQL, которая быстро стала недостаточной по мере стремительного роста числа пользователей. Основное узкое место возникло в управлении соединениями, где тысячи одновременных пользователей перегружали ограничения базы данных на количество соединений, что приводило к задержкам и нестабильности.

По мере роста системы команда выявила несколько критических проблемных точек, требующих немедленного внимания:

  • Штормы соединений от миллионов одновременных пользовательских запросов
  • Нагрузки с интенсивной записью от истории чатов и пользовательских данных
  • Обеспечение чтения с низкой задержкой для глобальных пользователей
  • Поддержание согласованности данных между регионами

Чистый объем данных, генерируемых 800 миллионами пользователей, потребовал фундаментального пересмотра того, как данные хранятся, доступны и реплицируются. Традиционные одноранговые базы данных больше не были жизнеспособны для такого масштаба.

"Переход к архитектуре с репликами для чтения был необходим для поддержания производительности по мере экспоненциального роста нашей пользовательской базы."

— Инженерная команда OpenAI

Эволюция архитектуры

Решение OpenAI включало многоуровневый подход к архитектуре базы данных. Команда внедрила пулинг соединений с использованием PgBouncer для эффективного управления потоком входящих соединений, снизив нагрузку на основной сервер базы данных.

Для масштабирования чтения они развернули сеть реплик для чтения в нескольких регионах. Это позволило системе распределять запросы на чтение от основного узла записи, значительно улучшив время отклика для пользователей по всему миру.

Переход к архитектуре с репликами для чтения был необходим для поддержания производительности по мере экспоненциального роста нашей пользовательской базы.

Кроме того, команда оптимизировала производительность записи путем пакетной обработки операций и тонкой настройки конфигурации базы данных. Они также внедрили мультиплексирование соединений для обработки высокой параллельности без исчерпания ресурсов базы данных.

Глобальная устойчивость

С глобальной пользовательской базой высокая доступность стала обязательным требованием. OpenAI реализовала стратегию многорегионального развертывания, гарантируя, что в случае сбоя в одном регионе трафик может быть перенаправлен на здоровые реплики с минимальными перебоями.

Система теперь включает:

  • Автоматизированные механизмы переключения для основных узлов базы данных
  • Географически реплицированные реплики для чтения с низкой задержкой
  • Непрерывный мониторинг и оповещения о состоянии базы данных
  • Протоколы резервного копирования и восстановления для сценариев катастроф

Эти меры гарантируют, что ChatGPT остается доступным даже во время сбоев инфраструктуры, что является критическим требованием для сервиса, используемого сотнями миллионов ежедневно.

Ключевые технологии

Технологический стек, обеспечивающий этот огромный масштаб, представляет собой сочетание инструментов с открытым исходным кодом и собственной инженерии. PostgreSQL остается основной базой данных, но она дополнена несколькими вспомогательными технологиями:

  • PgBouncer для пулинга и управления соединениями
  • Реплики для чтения для распределения нагрузки на чтение
  • Собственное ПО промежуточного слоя для интеллектуальной маршрутизации запросов
  • Системы мониторинга для получения оперативной информации о производительности

OpenAI также разработала собственные инструменты для решения конкретных задач, таких как управление штормами соединений и оптимизация нагрузок с интенсивной записью. Этот гибридный подход позволяет использовать стабильность программного обеспечения с открытым исходным кодом, одновременно решая уникальные требования масштабирования.

Взгляд в будущее

Масштабирование PostgreSQL для поддержки 800 миллионов пользователей ChatGPT представляет собой значительную веху в инженерии баз данных. Решения, внедренные OpenAI, предоставляют дорожную карту для других организаций, сталкивающихся с аналогичными вызовами масштабирования.

По мере роста числа пользователей архитектура потребует дальнейшего усовершенствования. Будущие усилия могут быть сосредоточены на шардинге, передовых стратегиях кэширования и еще более детальном региональном развертывании. Путь масштабирования PostgreSQL еще далек от завершения, но текущая система служит свидетельством того, что возможно при тщательном планировании и инновационной инженерии.

Часто задаваемые вопросы

С каким основным вызовом столкнулась OpenAI при работе с PostgreSQL?

Основной вызов заключался в управлении нагрузкой на соединения от более чем 800 миллионов ежемесячных пользователей, что перегрузило изначальную одноранговую настройку базы данных. Это привело к проблемам с задержками и потребовало полного пересмотра архитектуры.

Как OpenAI масштабировала PostgreSQL для ChatGPT?

OpenAI внедрила пулинг соединений с помощью PgBouncer, развернула реплики для чтения в нескольких регионах и оптимизировала производительность записи. Они также построили многорегиональную архитектуру для высокой доступности и устойчивости.

Почему это усилие по масштабированию значимо?

Оно демонстрирует, как традиционная реляционная база данных, такая как PostgreSQL, может быть масштабирована для поддержки одного из крупнейших сервисов ИИ в мире. Решения предоставляют дорожную карту для других компаний, сталкивающихся с аналогичными вызовами огромного роста.

Continue scrolling for more

ИИ преобразует математические исследования и доказательства
Technology

ИИ преобразует математические исследования и доказательства

Искусственный интеллект перешел из статуса непостоянного обещания в реальность, преобразуя математические исследования. Модели машинного обучения теперь генерируют оригинальные теоремы.

Just now
4 min
352
Read Article
Глава Nvidia Дженсен Хуан посетит Китай на фоне замедления продаж чипов для ИИ
Technology

Глава Nvidia Дженсен Хуан посетит Китай на фоне замедления продаж чипов для ИИ

Глава Nvidia Дженсен Хуан посетит Китай до Нового года по лунному календарю на фоне замедления продаж чипов для ИИ. Поездка рассматривается как стратегический шаг для навигации в сложных рыночных условиях.

1d
5 min
1
Read Article
Инноватор создал свет, реагирующий на радиоволны
Technology

Инноватор создал свет, реагирующий на радиоволны

Новый DIY-проект создает светильник, который визуально реагирует на окружающие радиоволны, превращая невидимые сигналы в видимый свет. Устройство предлагает осязаемую визуализацию невидимого электромагнитного спектра вокруг нас.

1d
5 min
1
Read Article
Gboard представляет новый ярлык для автоматического переключения после апострофа
Technology

Gboard представляет новый ярлык для автоматического переключения после апострофа

Gboard для Android представляет новый ярлык «автоматическое переключение после апострофа» для повышения эффективности ввода текста. Функция автоматически возвращает клавиатуру к основному набору символов после ввода апострофа.

1d
5 min
1
Read Article
TikTok завершает историческое разделение своего приложения в США
Politics

TikTok завершает историческое разделение своего приложения в США

Социальный гигант завершил историческое соглашение о разделении своих американских операций от глобальной сети, разрешив высокозначимое политическое и экономическое противостояние.

1d
5 min
1
Read Article
США завершили выход из ВОЗ: что это означает
Politics

США завершили выход из ВОЗ: что это означает

США официально завершили выход из ВОЗ, что знаменует собой значительный сдвиг в глобальной политике здравоохранения и может повлиять на международное сотрудничество и финансирование.

1d
5 min
1
Read Article
Бизнес API OpenAI превысил $1 миллиард ежемесячной выручки
Technology

Бизнес API OpenAI превысил $1 миллиард ежемесячной выручки

Бизнес API OpenAI превысил $1 миллиард ежемесячной выручки, по данным генерального директора Сэма Олтмана. Это знаменует стратегический сдвиг за рамки подписок на ChatGPT для покрытия затрат на инфраструктуру.

1d
5 min
9
Read Article
Revolut отказывается от слияния с банком в США в пользу получения лицензии
Economics

Revolut отказывается от слияния с банком в США в пользу получения лицензии

Revolut отказывается от плана слияния с банком в США, предпочитая получить независимую банковскую лицензию напрямую у регуляторов.

1d
5 min
8
Read Article
Запуск спутникового интернета «Заря» отложен
Technology

Запуск спутникового интернета «Заря» отложен

Запуск первого отечественного спутникового интернет-созвездия «Заря» отложен на 2026 год из-за производственных задержек. Проект, поддерживаемый 100 млрд рублей государственного финансирования, сталкивается с вопросами коммерческой жизнеспособности.

1d
5 min
7
Read Article
Салман Рушди: Мастер литературного избытка
Culture

Салман Рушди: Мастер литературного избытка

От Бомбея до мирового признания: Салман Рушди исследует столкновение культур, силу воображения и вечную борьбу между иронией и буквальностью.

1d
5 min
7
Read Article
🎉

You're all caught up!

Check back later for more stories

На главную