«Яндекс» решил опубликовать исходный код ClickHouse — распределенной системы управления базами данных, разработанной для сервиса веб-аналитики «Яндекс.Метрика», сообщили в компании.
Технология не ограничивается аналитикой сайтов и приложений и может быть использована в телекоммуникациях, рекламе, онлайн-торговле, для обработки данных мониторинга и телеметрии, а также для решения задач информационной безопасности, рассчитывают в «Яндексе».
ClickHouse хранит и быстро обрабатывает большие объемы информации для создания аналитических отчетов. Система масштабируется и позволяет хранить записи о триллионах событий.
Как поясняют в компании, система опробована на задачах «высоконагруженных сервисов» «Яндекса»: ClickHouse применяется не только в «Метрике», где используется для хранения всех данных для отчетов, но и в «Маркете», «Почте», «Директе», «Вебмастере», для бизнес-аналитики и в мониторинге инфраструктуры.
Интерес к ClickHouse уже проявила «Почта России», использующая для разных типов задач инструменты на основе открытых технологий — так, для хранения данных применяются Hadoop, Cassandra и PostgreSQL. «Почта России» планирует использовать ClickHouse как один из компонентов разработки и формирования онлайн-отчетности.