Сегодня для хранения данных используется две основные технологии: NAS (сетевой накопитель) и SAN (сеть хранения данных). Несмотря на общее сходство, эти технологии различны по выполняемым функциям и помогают решить различные задачи. Понимание того, что каждая технология собой представляет, поможет понять, где она может быть эффективно использована.
NAS – фактически, это множество жестких дисков, имеющих сетевой интерфейс, так называемая файловая система хранения. Поэтому, любое устройство, подключенное к NAS, видит не жесткий диск, а установленную файловую систему. Объемы жестких дисков NAS рассматриваются пользователями сети, как общие сетевые ресурсы. Доступ к данным, которые хранятся на NAS, предоставляется на уровне файлов. Соответственно, разрешение доступа для пользователей сети строится на том же принципе, что и доступ к другим общим сетевым ресурсам. Обычные протоколы, используемые сетевыми системами хранения, включают в себя NFS, SMB/CIFS и AFP. Есть особый случай протоколов файловых систем хранения, такие как FTP и HTTP, которые тоже поддерживаются. Таким образом, NAS – усовершенствованная файловая система, которая поддерживает несколько сетевых файловых систем и дополнительные службы. Обычно NAS оперирует на базе Ethernet, используя TCP/IP.
Основные особенности NAS:
• NAS удобно для тех устройств, когда нам нужно распространить файловые данные между несколькими клиентами по сети.
• В NAS для распространения файлов используется NFS в системах Unix, CIFS и Windows.
• Клиенты NAS могут получить доступ к файлам из любой точки организации.
Среди достоинств этого вида хранения данных следует отметить легкость развертывания системы и использования, а также относительно низкую стоимость реализации. Один из наиболее весомых недостатков – это низкая производительность.
SAN значительно отличается от технологии, описанной выше. SAN представляет собой отдельную сетевую инфраструктуру, которая используется для обмена информации между хранилищами и клиентами, а не как набор устройств для хранения данных.
Также различна и организация доступа к хранилищу данных. Сеть хранения оперирует данным на блочном уровне, а не на файловом, как это делает NAS. Операционная система компьютеров клиентов рассматривает жесткий диск SAN, как локальный, где все процессы открыты для пользователя. Операции, совершаемые на SAN ресурсах и на локальном диске, абсолютно идентичны.
Очевидно, что SAN ужесточает требования к пропускной способности в сети. Как правило, Сеть Хранения Данных основывается на FC (семейство протоколов для высокоскоростной передачи данных) или на оборудовании Gigabit Ethernet. FC протоколы или сетевая версия SCSI – iSCSI используется для передачи данных.
Управление логическим томами, такое как, например, Linux LVM, Solaris ZFS или Windows Dynamic Disks осуществляется на внешней системе хранения с клиентского устройства. Очень важный момент то, что файловая система создается и управляется клиентским устройством, а не самой системой хранения.
Хранилище SAN может быть организовано или на аппаратном, или на программном обеспечении, созданном на базе постоянного сервера с множеством жестких дисков. Для этого на сервер должно быть установлено специальное ПО. Сети SAN способны использовать любые устройства для хранения данных, включая ленточные библиотеки для создания резервных копий.
SAN гораздо дороже и сложнее в использовании по сравнению с NAS, но они имеют и преимущества:
• Главное и безоговорочное преимущество – это высокая производительность. Оптимизация трафика обеспечена на уровне создания инфраструктуры корпоративной сети. В основном, SAN реализуют как отдельный сетевой сегмент. Это позволяет не только разгрузить главные коммуникации, но и обезопасить данные от несанкционированного доступа. Более того, доступ к данным, основанный на блочном уровне, значительно оптимизирует производительность многих ресурсоемких устройств, включая базу данных, видеообработку и так далее.
• Масштабируемость. SAN позволяет создавать огромное, географически отдаленное объединение устройств для хранения данных. Процесс перераспределения сети хранения доступен для пользователей. Несколько SAN, находящихся в разных частях Света, могут легко объединяться одной сетью, таким образом, серверы могут входить в хранилище, находясь очень далеко от истинного места нахождения определенного ресурса. Благодаря этому SAN часто используется для виртуализации.
• Надежность. Структура SAN позволяет использовать несколько резервных опций, как, например, зеркальное отображение и репликация данных между удаленными серверами. Сеть может быть организована таким образом, что, если один или несколько узлов разрушены, то администрация мгновенно переносится к главному узлу, таким образом, устраняя потерю данных. Для создания HA сетей используют SAN.
• Безопасность. Структура SAN практически исключает несанкционированный доступ к данным неавторизированными пользователями.
Единственный, но весьма условный недостаток SAN это относительно высокая (по сравнению с NAS) стоимость реализации и эксплуатации. Для управления этой сложной структурой нужен высококвалифицированный персонал. Но, тем не менее, на стадии оценивания высокой стоимости создания хранилища очень важно принять во внимание то, что при расширении, относительная цена за эксплуатацию NAS возрастает, а SAN - падает.
На основе вышеуказанных характеристик, могут быть сделаны следующие выводы:
• Решения проблемы хранения, основанные на NAS, удовлетворяют потребности и запросы небольших компаний, где не используется программное обеспечение высокой производительности. В этом случае, основной критерий выбора заключается в низкой стоимости и легкости эксплуатации.
• Выбор падает на SAN, когда основополагающим критерием выбора является надежность, отказоустойчивость и высокая производительность. Большинство функций сложно осуществимы для устройств NAS, поэтому использование SAN становимся стандартным для HA.
Единственное, что не может быть реализовано при помощи SAN, это файловый сервер, в который не могут получить доступа клиенты, которые используют различные платформы и операционные системы. Легче это сделать при помощи NAS. Для таких индивидуальных случаев созданы системы-гибриды (unified storage), которые позволяют получить доступ к данным, находящимся и на файловом, и на блочном уровне.