Общая сумма призового фонда конкурса составляет 300 тыс. руб. Помимо трех мест и призов за наиболее качественные модели, предусмотрены специальные призы. Для выполнения конкурсных задач участникам предоставляются ретроспективные данные о кредитном поведении клиентов банка. С целью соблюдения положений действующего российского законодательства о защите персональных данных, все данные предоставляются в обезличенном виде.
Массив данных, представляющий собой кредитные истории, агрегируется из различных источников. Уникальность задачи заключается в том, что эти данные могут быть или неполными (могут не содержать информацию о части выданных кредитов) или противоречивыми (могут содержать различные значения атрибутов по одному и тому же кредиту или иметь другие коллизии). В отличие от многих других конкурсов по анализу данных, участникам предлагается работать с «сырыми» данными. Итоговый результат во многом определяется эффективностью предложенных способов их предобработки и формирования на их базе предикторов.
Условия конкурса позволяют использовать для моделирования любое ПО, включая open source.