NetApp выпустила новое поколение флэш-систем хранения All Flash FAS
02 августа 2015 г. | Категория: Теория и практика SDDC, Виртуализация вычислений, Конвергентные и гиперконвергентные системы, Программно-определяемые сети, Программно-определяемые системы хранения, Программно-определяемый ЦОД
Первому коммерческому накопителю с произвольным доступом к файлам (Random Access File), вошедшему в историю как "Модель IBM 350" (Рис. 1), исполнилось почти 60 лет. Он был создан специально для компьютера с соответствующим названием RAMAC 305 (Random Access Memory Accounting System). Ну а возраст самого первого экспериментального HDD, имевшего диаметр без малого метр (Рис. 2), еще больше.
Оба сохранились, сегодня и тот, и другой демонстрируются в экспозиции Музея компьютерной истории в Маунтин-Вью. Внешне они ничуть не похожи на современные винчестеры, за минувшие десятилетия в конструкциях дисков реализовано немыслимое количество физических, инженерных и программных новаций, их емкость и скорость обмена данными возросли на 6-7 порядков, а об удельной стоимости хранения вообще говорить не стоит.
И, тем не менее, изначальный принцип записи фрагментов данных – блоков на концентрические треки остался неизменным, за 60 с лишним лет ничего принципиально нового, на поверхности вращающегося диска размещаются "кусочки ленты" с возможностью чтения/записи по отдельности каждого, а для чтения и записи применяются пусть и серьезно усовершенствованные, но те же по сути головки с механическим перемещением. Современные диски HDD достигли невероятного уровня технического совершенство, они воплотили огромное количество научных и инженерных решений, но с появлением флэш, мемристоров и других видов твердотельной памяти с прямым доступом оказалась ненужной большая часть всех этих изощрений, компенсирующих врожденные недостатки HDD. Работа с новой памятью логически проще, однако ее широкому внедрению мешает многое: есть определенная инерция, еще долго будет иметь значение фактор более высокой стоимости такой памяти и, что существеннее всего, есть несметный багаж унаследованного ПО, адаптированного к особенностям HDD. Поэтому внедрение SDD будет происходить постепенно, по нескольким альтернативным путям.
Из нескольких путей самый радикальный и логически простой предполагает подключение карт Solid State Card (SSC) в форм-факторе PCIe по одноименному интерфейсу непосредственно к серверам и СХД. Это самый быстрый способ, но он применим для ограниченного числа приложений. Поэтому широкое распространение получают твердотельные накопители Solid State Drive (SSD), выпускаемые в тех же форм-факторах, что и HDD — 5,25, 3,5, 2,5 и 1,8 дюйма, эмулирующие HDD. Прямая замена HDD на SDD в существующих СХД вполне допустима, однако она не позволяет в полной мере использовать реализовать потенциал флэш, поэтому остается несколько вариантов создания новых СХД. На данный момент по экономическим соображениям в количественном отношении будут преобладать гибридные СХД, сочетающие в себе лучшие качества обоих видов накопителей и HDD, и SDD, их производство растет со скоростью 8-10% в год.
Параллельно, по мере снижения цены флэш-памяти все большую массовость приобретают массивы All-Flash Arrays (AFA), построенные исключительно на SDD, этот сегмент рынка пока меньше гибридного, но растет в несколько раз быстрее. И здесь тоже есть свои варианты. Ряд компаний, главным образом стартапы, и те кто их купил, например EMC с системой XtremIO, создают принципиально новые решения класса AFA с нуля (built from the ground up). Те же крупные вендоры, чьи проверенные временем массивы сохраняют потенциал для модернизации, доводят свои существующие продукты путем модернизации ПО и железа до уровня AFA. Они создают системы, которые называют оптимизированными под SDD (flash optimizing storage systems). Можно привести в качестве примера HP с 3PAR StoreServ.
Преимущество массивов AFA, относящихся к built from the ground up, по сравнению с optimizing storage systems состоит в том, что их заново написанные операционные системы лучше используют физические возможности флэш, это очевидно и не вызывает возражений. Но не менее очевидно и другое обстоятельство, из-за короткого периода существования built from the ground up им не хватает ряда средств для управления данными корпоративного уровня (advanced data management features), разработанных за десятилетия для HDD. Серьезные унаследованные приложения используют эти наработки, без них эффективность работы СХД снижается и эффективность SDD сводится к нулю. Из сказанного следует, что нельзя в лоб сравнивать описанные выше два типа систем, на данный момент у каждого из них есть свои преимущества и перед пользователем стоит проблема выбора той СХД, которая точнее соответствует его требованиям. Для тех, кому важна в чистом виде скорость работы больше подходят built from the ground up, если же критичны еще и требования корпоративного уровня, то предпочтительнее optimizing storage systems, сочетающие зрелые программные платформы с высокой надежностью и стабильностью, с более высокой, свойственно AFA скоростью работы.
Компания NetApp, как один из лидеров рынка СХД, в своей производственной программе сочетает оба подхода, рассчитывая на широкий круг потребителей. Она разрабатывает качественно новую и весьма перспективную систему AFA FlashRay, работающую под операционной системой MARS, и одновременно развивает существующие накопители, работающие под операционной системой Data ONTAP, доводя их до уровня AFA. В июне 2015 года она запустила новую линейку продуктов All Flash FAS (AFF), которые имеют характеристики ни чуть не уступающие натуральным AFA, но плюс к тому они сохраняют полную совместимость с предшественниками, что является результатом серьезной оптимизации ОС Data ONTAP, служащей для полного использования преимуществ SDD.
Продуктовое семейство NetApp FAS прошло чрезвычайно долгий по нынешним представлениям эволюционный путь, следствием которого стало по признанию всех аналитиков второе место среди поставщиков СХД. ОС Data ONTAP является основополагающим компонентом всего семейства и служит надежной платформой для широкого круга корпоративных приложений. NetApp осуществляет непрерывный процесс развития и совершенствования ONTAP, расширяет функциональность ОС. Движение по направлению к flash optimizing storage systems стало очередным совершенно естественным шагом в этом направлении.
СХД серии All Flash FAS (AFF) отличаются прежде всего тем, что работают под управлением ОС Data ONTAP, дополненной новым функциональным набором FlashEssentials. Название FlashEssentials можно перевести как "все необходимое для флэш". Набор FlashEssentials вобрал в себя все инновации и оптимизации, необходимые для поддержки флэш в кластерной ОС Clustered Data ONTAP. Таким образом, включение FlashEssentials в состав Data ONTAP способствует использованию преимуществ флэш как носителя и одновременно сохраняет преемственность с существующими корпоративными приложениями. На это сочетание качеств следует обратить особое внимание.
ОС Data ONTAP известна с середины девяностых, она не только зарекомендовала себя как наиболее среди ОС, предназначенных для СХД, но со временем оказалось, что Data ONTAP обладает существенным резервом для развития и модернизации, в частности при появлении флэш стало ясно, что ее файловая система WAFL удачно соответствует свойствам флэш как носителя данных и может с успехом использоваться в будущем. Аббревиатуру WAFL (Write Anywhere File Layout), что можно перевести как "схема размещения файлов с произвольным местом записи". Свобода в выборе места записи поддерживается специальной таблицей иерархического размещения файлов.
В начале двухтысячных годов стало ясно, что идеи, заложенные в WAFL, можно распространить не только на файловую систему, а гораздо шире. Например NetApp использует WAFL для совместного хранения блочных данных в традиционных файлерах NAS. Совмещение блочного и файлового хранения достигается методами управления и адресации данных в WAFL. В последующем эти идеи были реализованы Sun Microsystems в файловой системе ZFS (Zettabyte File System), сегодня существует проект OpenZFS. В 2015 году настал черед применения WAFL в приложении к флэш.
В Data ONTAP FlashEssentials инкапсулирован функционал, позволяющий с максимально возможной степенью использовать производительность SSD и одновременно повысить срок эксплуатации SSD как носителя.
В Clustered Data ONTAP 8.3.1 вместе с FlashEssentials вошли некоторые из решений, заимствованных из создаваемой в рамках проекта FlashRay операционной системы Mars.
Реализованы две поточные технологии, сокращающие почти на порядок использование пространства хранения. Первая –поточная компрессия (Inline Compression) обеспечивает сжатие данных по ходу записи, вторая – непрерывная дедупликация (Always On Deduplication Inlin), в таком случае процедура дедупликации срабатывает очень часто, примерно один раз в минуту. Для дальнейшей минимизации использования пространства могут быть использованы известные фирменные технологии NetApp Snapshot и NetApp FlexClone.
Объединение записываемых блоков (coalesce I/O transactions) служит для увеличения быстродействия флэш-памяти и продления срока службы флэша. Технология coalesce I/O transactions сводится к постановке в очередь команд записи, она использует то обстоятельство, что обычно обращения к памяти носят локальный характер, изменения вносятся в одну и ту же область в короткий промежуток времени. Сращивание данных (coalescing) заметно, в некоторых случаях на порядок повышает скорость обмена с флэш и продевает срок жизни за счет сокращения числа числа циклов стирания и записи (Program-erase (PE) cycles).
Флэш позволят читать данные произвольным образом, реализуя недетерминированный доступ к данным (random read I/O), поэтому можно перестроить потоки ввода/вывода и отказаться от функций WAFL при чтении.
Технология Read Fast Path to Storage минует уровень RAID. Все, что относится random read I/O написано заново. Три этапа эволюции потока данных показаны на рис. 3.
Рис. 3 Эволюции потоков данных
Распараллеливание обработки данных, снижающее задержки
Принятая недавно стратегия NetApp Data Fabric обеспечивает миграцию данных на HDD различных уровней, расположенных на собственных ЦОДах пользователей и в облаке.
Семейство массивов NetApp All Flash FAS состоит из четырех моделей AFF8080 EX, AFF8060, AFF8040 и AFF8020 с довольно близкими характеристиками. Все они могут объединяться в кластерную конфигурацию NAS scale-out по 10-Гбитному Ehernet с числом узлов от 1 до 24 и разделением внутри на надежные пары (HA Pair), используя для активную связь между контролерами (Active-Active Dual Controller). Каждая пара может комплектоваться до 240 устройствами SSD, что дает 384 Тбайт сырой емкости и 1564 Тбайт эффективной емкости с учетом компрессии и дедупликации. Основные различия в емкости внутренней памяти, старшая модель имеет 256 Гбайт основной памяти и 32 Гбайт памяти NVRAM, младшие системы имеют меньший объем.
О преимуществах AFF8080 говорят следующие цифры:
- Работа СУБД ускоряется от 4 до 12 раз.
- Следующая из этого консолидация серверов позволяет на сократить на 50% затраты на лицензии на ПО.
- Технологии дедупликации и компрессии сокращают затраты на накопители SSD в 5-10 раз.
Рис 4. All Flash FAS в качестве хранилища верхнего уровня в глобальном кластере
Еще одно преимущество All Flash FAS заключается в готовности к работе в среде Data Fabric. Под управлением ОС Сlustered Data ONTAP СХД All Flash FAS можно использовать в качестве хранилища верхнего уровня в большей по размеру системе хранения, включающей локальные СХД на дисках HDD и облачные СХД. В таком случае вся масса корпоративных данных может быть размещена оптимальным образом в соответствие с потребностям и в процессе эксплуатации данные могут бесперебойно перемещаться по уровня. В такой среде скорость обмена может достигать 4 миллионов операций в секунду (IOPS), а размер кластера может быть доведен до 4,6 Пбайт.
Массив AFF8080 EX был испытан на СУБД Microsoft SQL и Oracle Database, о чем есть детальные отчеты:
Целью испытаний было измерение производительности AFF8080 EX на обеих СУБД, оценка улучшение использования CPU при переходе на AFF8080 EX с тем, чтобы сделать вывод возможности сокращения числа серверов и вложений средств в серверы, оценка результатов консолидации СУБД и, как следствие уменьшения используемого числа ядер CPU сокращение затрат на лицензирование.
Испытания проводились на СУБД Oracle Database 12c OLTP, они показали, что при переходе с аналогичного оборудования на AFF8080 EX пиковая производительность увеличивается с 118 тыс. IOPS до 316 тыс. IOPS, задержка на чтении сокращается до 1 ms, а эффективность использования пространства хранения возрастает в 22 раза. Эффективность использования CPU возросла в 7,5 раз. Замена традиционных СХД на AFF8080 EX в сочетании с консолидацией СУБД и, как следствие сокращением затрат на лицензирование, обеспечивает увеличение ROI на 90%.
Microsoft SQL Server Для Microsoft SQL Server 2014 OLTP переход на AFF8080 EX обеспечил рост пиковой производительности с 7 до 322 тыс. IOPS, сокращение задержки чтения до 1 ms и уменьшение используемого пространства хранения в 17 раз. Эффективность использования CPU выросла в 4 раз. Замена традиционных СХД на AFF8080 EX в сочетании с консолидацией СУБД и, как следствие сокращением затрат на лицензирование, обеспечивает увеличение ROI на те же 90%.
Если учесть, что веденные усовершенствования позволили расширить лицензирование до 7 лет, то можно сказать, что AFF8080 EX представляют собой экономически обоснованную альтернативу традиционным СХД, имеющую заведомо более высокие показатели производительности.
Автор: Леонид Черняк
Теги: NetApp, All Flash, SDS, СХД
|
Чтобы оставить свой отзыв, вам необходимо авторизоваться или зарегистрироваться
Комментариев: 0