Стоимость владения распределенными файловыми системами может быть достаточной низкой, но производительности может быть недостаточно в тех случаях, когда уровень корпоративной нагрузки преодолевает определенную отметку. Именно поэтому сегодня многие инженерные мозги всего мира думают над тем, как можно изменить распределенные файловые системы. Так, ученые из Массачусетского института технологий занимались решением этой проблемы с помощью SSD-накопителей, которые подключаются к системам с особой конфигурацией BlueDBM. Как говорят разработчики, BlueDBM позволяют работать с очень большими массивами данных, причем здесь все данные могут быть доступны почти мгновенно. Об этом сообщают эксперты раздела "Hi-tech" издания для инвесторов "Биржевой лидер".
Как утверждают разработчики, одной из наиболее интересных сфер применения таких систем хранения на сегодняшний день являются данные по эмуляции физических процессов в масштабах всей Вселенной, когда в системах хранения располагаются массивы информации размером в десятки экзабайт.
В Массачусетском институте технологий утверждают, что их разработка является «интерфейсом реального времени» для доступа к гигантским объемам данных, предназначенных для сложнейшей обработки и анализа. Согласно словам разработчиков, в созданной ими системе использованы чипы field-programmable gate arrays (FPGA), располагающиеся между системами хранения и хост-компьютером, работая в своей собственной сети. На практике это дает возможность во много раз сократить временные задержки непосредственно при обращении к данным, а также освободить сеть от каких-либо сторонних запросов и устранить ограничения на масштабируемость системы хранения.
Как это работает?
Секрет достижения такой производительности кроется в комбинации контроллеров хранения на чипах FPGA с PCIe-модулями для хранения данных. Это все подключается к гигабитной сети с минимально возможной задержкой передачи данных, которая имеет поддержку технологии SERDES. Как сказано в сообщении, в новой системе каждый конкретный узел, который хранит какие-либо данные, оказывается полностью независимым от своих соседей, что позволяет избавиться от уменьшения производительности. Более того, тут работа контроллеров выделяется в отдельную сеть, что, в свою очередь, позволяет еще больше повысить скорость работы данной системы.