Микросхемы Huawei для массивов All-Flash
23 октября 2017 г. | Категория: Теория и практика SDDC, Программно-определяемые системы хранения
Многих интересует вопрос, почему компания Huawei решила разрабатывать собственные микросхемы для своих СХД? Avago приобрела LSI, Cavium приобрела QLogic, а Broadcom приобрела Brocade, чтобы получить технические возможности их микросхем. Так почему компания Huawei, вопреки ожиданиям, решила разрабатывать собственные микросхемы вместо того, чтобы просто приобрести компанию-производителя микросхем? Какие виды микросхем для СХД компания Huawei разрабатывает самостоятельно? Как эти микросхемы будут усовершенствоваться в будущем? В этой статье рассмотрены общие направления, которые взяла и которых намерена придерживаться компания Huawei.
Стимул для разработки собственных микросхем
Деятельность предприятий во всем мире сопровождается большими потоками информации, а это означает, что хранилища данных должны быть очень производительны и высокоэффективны. Технология All-Flash способствует цифровым трансформациям в силу врожденной производительности, придающей новые силы критически важным сервисам.
Флеш-память быстро развивается, ведь количественные параметры накопителей данных становятся качественными, (быстродействие накопителей 3D XPoint в 1000 раз превышает таковое у NAND). Основным требованием для развития носителей информации и приложений, таких как AR/VR, является более низкая задержка в сети. Стабильный период удваивания производительности процессоров равный 18 месяцам согласно закону Мура, теперь расширяется по мере замедления роста производительности процессора (увеличивается разрыв между вычислительной мощностью и возможностями обработки). Несбалансированность разработок в сферах накопителей данных, сетевых интерфейсов и процессоров диктует необходимость изменения технологий хранения.
Отвечая на вызовы революции в технологиях хранения данных, компания Huawei предложила для новых решений взять All-IP в качестве основы, а All-Cloud и All-Flash в качестве движущей силы. Это позволит оптимизированным микросхемам, сетевому оборудованию и вертикальной интеграции в приложениях сыграть дополнительную роль для оправдания ожиданий пользователей услуг. Вертикальная интеграция позволит максимально использовать ресурсы, чтобы обеспечить клиентам более высокую производительность продукта.
Инновации в технологии самостоятельно разработанных микросхем
В 2016 году компания Huawei выпустила новое поколение СХД OceanStor Dorado V3 на базе флеш-памяти, отличающихся производительностью до 4 миллионов IOPS при сохранении стабильной задержки в 0,5 мс. Новые массивы Dorado способны в полной мере использовать эффективность флеш-памяти, чтобы удовлетворить требования к обработке для критически важных сервисов в условиях высокой нагрузки. Huawei осуществила комплексную оптимизацию своих микросхем, включая клиентские микросхемы обработки протоколов, микросхемы ускорения обработки операций ввода-вывода и микросхемы управления SSD-накопителями, с целью ориентировать их на использование в платформах хранения данных на базе флеш-памяти. Данная оптимизация позволит на 200% повысить производительность сквозной передачи.
1. Микросхемы обработки протоколов
1.1. Интеграция нескольких протоколов на плате Huawei SmartIO, сокращение количества соединительных кабелей, упрощение создания сетей и снижение TCO
На платах SmartIO используются микросхемы производства компании Huawei, выполняющие обработку таких протоколов, как 8G/16G FC, 10G FCoE, 10GE и iWARP. Клиенты могут комбинировать трафик данных IP и FC на одной интерфейсной микросхеме.
Возможности конвергенции на уровне сети обеспечивают использование 10GE для поддержки протоколов FCoE/iSCSI/iWARP/CIFS/NFS без замены каких-либо физических компонентов. В сети стандарта FC 10GE или 8/16 ГБ потребуется замена только компонентов оптического модуля (без замены плат, с поддержкой преобразования любого протокола). При этом количество необходимых кабелей уменьшится на треть, а количество физических компонентов на интерфейсных платах – на 75%, что в свою очередь минимизирует требуемые инвестиции.
1.2 Технология RDMA снижает задержки каналов связи на 60%
Удалённый прямой доступ к памяти (Remote Direct Memory Access, RDMA) – функция, которая позволяет компьютеру напрямую передавать данные в память другого компьютера по сети без влияния на работу операционной системы. Это значит, что для завершения данной операции возможности обработки компьютеров не используются, пространство шины освобождается, и циклы процессора сокращаются, таким образом повышая производительность системы приложений. Микросхемы обработки протоколов хранения производства Huawei поддерживают на аппаратном уровне RDMA, передачу данных и коммутацию между несколькими контроллерами памяти посредством RDMA, в результате чего задержка канала сокращается на 60% и более, а также значительно повышается эффективность обработки в условиях высокой нагрузки на услуги и одновременного доступа. Во время тестирования на скорости 10GE при одновременном доступе 8 станций с размером блока ввода-вывода 8 кбайт, массив OceanStor Dorado V3 показал следующие результаты:
I/O 8 КБ
|
TCP/IP
более 10GE
|
iWARP
более 10GE
|
Задержка
|
115 мкс
|
42 мкс
|
1.3 Снижение перегрузки в глобальной сети (WAN) с оптимизацией параметров для увеличения пропускной способности при выполнении удаленной репликации в сложных сетевых сценариях
Оптимизация WAN направлена на уменьшение объема данных, передаваемых по таким сетям, путем применения различных технических подходов. Передача данных оптимизирована и использование ресурсов полосы пропускания увеличено. Оптимизацию можно реализовать с одной стороны или с двух сторон (при односторонней оптимизации используется функция управления трафиком и технология оптимизации TCP, в то время как при двусторонней оптимизации используется кэш и технологии сжатия).
Микросхемы обработки протоколов хранения данных компании Huawei имеют встроенные функции контроля трафика QoS и предотвращения перегрузки TCP. В сложных сетевых сценариях (например, в случае подключения многочисленных вычислительных и коммуникационных сетей удаленно через LAN или MAN или даже через большой географический район) охватываемая область может варьироваться от нескольких десятков до нескольких сотен километров при подключении объектов связи в разных городах. Информация, собранная в режиме реального времени, о задержке времени оборота (RTT) сетевых пакетов, коэффициенте потери пакетов, ECN и других характеристиках в сочетании с различными алгоритмами предотвращения перегрузки TCP используется для настройки стратегий приема и передачи, включая повторную передачу, окно буфера приема/передачи и интеллектуальный контроль трафика. Настройка стратегий дает возможность предотвратить перегрузку определенных каналов, а также выполнить сброс вручную и динамически, в результате чего сетевые платы смогут работать быстрее, чем обычно. Ускорение работы повышает производительность на 65–400% в сложных сетях WAN.
2. Микросхема ускорения процесса обработки ввода-вывода
В эпоху облачных сервисов объемы данных растут быстрее, чем ожидалось, а также увеличивается количество дублированной информации. Дублированные данные, как правило, имеют ограниченную ценность для организаций. Они занимают большое пространство в системах хранения, увеличивают расходы на электроэнергию и охлаждение, а также могут снижать производительность доступа. Это приводит к нерациональному использованию ограниченных ИТ-ресурсов. Организациям требуется быстрый доступ к своим данным и способы, которые позволят сократить объем дублированных данных.
Для решения этой проблемы в отрасли широко применяются технологии дедупликации и сжатия. Однако эти функции потребляют много ресурсов ЦП из-за выполнения многочисленных алгоритмов определения, сжатия и восстановления характерных фрагментов данных. Использование этих функций приводит к снижению качества обслуживания. Кроме того, клиенты замечают отсутствие изменения объема зарезервированного пространства для хранения их данных, а также отсутствие экономии денежных средств относительно стартовых инвестиций. Также недостатком является уменьшение срока службы SSD в зависимости от количества записанных данных.
Микросхемы ускорения процесса обработки ввода-вывода производства Huawei имеют интегрированные механизмы алгоритмов сжатия и восстановления данных, которые снимают с процессоров задачи, потребляющие большое количество вычислительных ресурсов, уменьшая их загрузку. В ходе тестирования с большим количеством последовательных операций ввода-вывода, занятое на процессорах пространство памяти уменьшилось на 24,6%, IOPS увеличилось на 342,4%, а задержка сократилась на 77,4%.
3. Микросхемы управления твердотельными накопителями (SSD)
В SSD-накопителях компании Huawei используется новое поколение собственных микросхем управления с процессорами Cortex-A9. Эти микросхемы поддерживают оперативную память DDR4 и до 18 каналов флеш-памяти NAND. Аппаратная технология FTL (Flash Translation Layer) позволяет ускорить процесс обработки ввода-вывода и обеспечивает ведущий в отрасли показатель 200 000 IOPS.
Справочные данные по производительности для твердотельных накопителей производства Huawei
3.1 Аппаратная технология FTL сокращает время задержки на 20% по сравнению со средними показателями в отрасли при небольшой загрузке системы
Утилита FTL является неотъемлемой частью структуры SSD. Она предназначена для установления соответствия между LBA пользователя и физической страницей в SSD. Когда пользователь считывает и записывает данные, FTL передает адрес LBA. После того, как SSD получает адрес, запрашивается таблица FTL для чтения данных с соответствующей физической страницы адреса LBA. Для сравнения, когда данные считываются с обычных SSD, встроенное программное обеспечение управления находит соответствующий физический адрес LBA, а затем считывает данные из флеш-памяти и передает их на хост. При записи данных таблица соответствия FTL обновляется после того, как программное обеспечение завершит запись. SSD-накопители производства Huawei обеспечивают ускорение управления таблицами FTL на аппаратном уровне. Все операции чтения и записи в FTL выполняются аппаратным обеспечением, что сокращает количество программных операций и задержку ввода-вывода. При небольшой загруженности системы задержка сокращается до 40 мкс (на 20% ниже среднего показателя в отрасли).
|
|
Схема управления FTL Программное обеспечение)
|
Схема управления FTL Аппаратное обеспечение)
|
3.2. Технология FlashLink обеспечивает предсказуемую задержку в 0,5 мс во всем флеш-массиве
Технология FlashLink была реализована в ходе разработок твердотельных накопителей и операционной системы компании Huawei. Она обеспечивает вертикальную оптимизацию управления между аппаратным и программным обеспечением, а также стабильность задержки в 0,5 мс во всей системе хранения данных OceanStor Dorado V3 на базе флеш-памяти.
Техническая диаграмма FlashLink
При классификации наиболее востребованных («горячих») данных и менее востребованных («холодных») данных информация записывается в разные разделы. Собственные операционные системы хранения данных обладают функцией определения «температуры» данных и маркировки при доступе к ним на SSD-накопителях. Микросхемы управления SSD-накопителями направляют данные по определенному пути хранения в соответствии с метками «горячие»/«холодные», тем самым уменьшая объем данных, которые необходимо перемещать при удалении, и предотвращая увеличение объема записи примерно на 40%, а задержку – на 20%.
Функция планирования приоритетов ввода-вывода предоставляет множество возможностей для обеспечения низкой и стабильной задержки. Операционная система производства Huawei определяет уровень приоритета ввода-вывода. Например, хост определяет, что приоритет запроса на чтение данных выше, чем приоритет запроса на очистку кэша. Приоритет запроса на очистку выше, чем запроса на асинхронную репликацию фоновых копий. Приоритет ввода-вывода передается на SSD вместе с запросами на чтение и запись. Далее микросхема управления SSD-накопителями обрабатывает операции ввода-вывода в соответствии с приоритетами, тем самым обеспечивая комплексное управление приоритетами ввода-вывода. Приоритетным услугам гарантируется первоочередная обработка при чтении и записи данных.
Заключение
Компания Huawei намерена и далее инвестировать средства в разработку своих собственных микросхем, которые позволят организациям взять под контроль потоки рабочей информации и добиться цифровой трансформации.
Микросхемы обработки протоколов, в которых реализована концепция «All-IP», участвуют в процессах на стороне клиента и на стороне сервера, в коммутации, репликации и сети со схемой «активный-активный», обеспечивая, при этом, низкую задержку всей конструкции. Микросхемы ускорения процесса обработки ввода-вывода, в которых используется подход SOC, обеспечивают функции ускорения хранения и передачи данных в сочетании с постоянной оптимизацией возможностей вычисления, хранения и пропускной способности сети. Микросхемы управления, оптимизированные для SSD, ориентированы на эволюцию к полной реализации преимуществ носителей нового поколения.
Компания Huawei пытается изо всех сил устранить нестабильность показателей работы процессоров, накопителей и сети за счет непрерывных инноваций и вертикальной оптимизации аппаратных и программных микросхем (чипов). Узнайте, какие продукты и решения компании Huawei помогут обеспечить стабильность и высокую производительность вашего оборудования. Продукты Huawei – правильный выбор для достижения успеха в бизнесе!
Теги: Huawei, SSD
|
Комментариев: 0