Подобную систему так или иначе будут разворачивать на сервер примерно такой конфигурации -
https://www.hetzner.com/dedicated-rootserver/ex62-nvmeОперационная система должна увидеть 16 потоков (8 ядер) и хотя-бы 64 GB RAM.
А дисковая подсистема - SSD / SSD NVME.
При таком сервере REST API достаточно быстрое и на запросы типа "получить карточку клиента по id" или "получить карточку клиента по номеру телефона" или "получить баланс бонусов по номеру телефона" сможет выдавать около 100-200 ответов в секунду.
Чтобы получить большую производительность нужно сделать ряд ухищрений (не обязательно все сразу).
1. Для нужных запросов в API сделать кеширующую прокладку на Redis / Aerospike / подобной базе. Основная идея в том, что из реляционной SQL-базы OneBox складывает данные в очень быстрое key-value хранилище, к которому запросы летят уже по бинарному протоколу и очень очень быстро.
2. выделить много ядер базе данных. Для этого вероятно прийдется использовать сервер типа
https://www.hetzner.com/dedicated-rootserver/ax101 или
https://www.hetzner.com/dedicated-rootserver/ax161 или вынести базу на отдельный сервер/кластер (нужен будет 10GB LINK между серверами).
Если сделать пункт 1 и пункт 2 одновременно - то я могу смело гарантировать 200 000 запросов в секунду практически для любого api endpoint'a. У меня есть Hi-Load проект который отдает 4 000 000 запросов в секунду.
Конечно, настройка этой инфраструктуры стоит денег, так как это не входит в базовый функционал OneBox.