«Тяжелые» ИТ: Как запустить производство серверного оборудования в России
Санкции перекроили рынок серверного оборудования в России. По данным Минэкономразвития, отечественное производство компьютеров, электроники и оптики показали рост на 1,7% в прошлом году - и это на фоне общего спада в промышленности.
Насколько сложно запустить сегодня производство «железа» в стране и что для этого надо, рассказывает Алексей Гранкин, генеральный директор компании GAGAR>N, отечественного разработчика и производителя серверного оборудования.
Четыре года назад производство серверного оборудования представлялось достаточно сложной и инвестиционно емкой областью. В отличие от более доступных ниш в ИТ, таких как разработка софта, интеграция, консалтинг или поддержка корпоративных приложений, в производство «железа» бизнес вкладывался всегда неохотно.
Глобальные вендоры оборудования играли ведущую роль практически по всем направлениям - от компонентной базы в микроэлектронике до выпуска серверов, СХД и сетевых решений. Казалось, что в этом направлении не стоит рассчитывать на прибыльный бизнес - слишком глубоко отставание от мировых брендов и слишком велик порог входа в отрасль.
Однако мы решили запустить свое собственное производство серверов в России - практически с нуля и в короткие сроки мы должны были выйти на показатель 10 000 серверов в год.
Уже тогда было очевидно, что интерес российских крупных корпораций к отечественным решениям приобретает все более четкие очертания. Поэтому мы решили рискнуть.
Оглядываясь назад, можно выделить несколько правильных решений, которые мы приняли на старте, - именно благодаря им получилось создать качественный продукт в принципиально новой для российской экономики нише. Однако не обошлось и без сложностей на каждом этапе.
1. Опора на глобальные стандарты
Мы сразу приняли решение работать по международному стандарту OCP — Open Compute Project. Он подразумевает свободный обмен информацией и опытом в сфере разработки программного и аппаратного обеспечения, а также физического проектирования серверного оборудования между участниками глобального OCP-сообщества.
OCP - своего рода окно в мир международных технологий, обеспечивающее доступ к базе для разработки продуктов. Отталкиваясь от этой концепции, можно совершенствоваться в любом направлении до уровня, который позволяют ваши возможности.
Что это дало?
Серверное оборудование — сложная ресурсо- и интеллектоемкая сфера с высоким порогом вхождения. Его производство требует значительных капиталовложений и человеческих ресурсов на дефицитном рынке. Плюс сам продукт крайне непрост в разработке. Подход OCP ускоряет и упрощает процесс входа на рынок.
Также мы планировали экспортировать какую-то часть своих продуктов, то есть ориентировались не только на российский рынок. Поэтому и запускали производство оборудования по мировым стандартам качества.
Какие были сложности?
Стандарт OCP подразумевает поддержку глобального OCP-сообщества. Но это не означает быстрый и беспроблемный запуск производства.
Да, действительно, стандарт определяет принципы разработки продукта: исходная документация включает схемотехнику, чертежи механики, список компонентов.
Однако прорабатывать логику и готовить конструкторскую и технологическую документацию для запуска линий монтажа и пайки придется самостоятельно с учетом возможностей производства в России. Именно так мы и поступили после того, как выбрали в качестве базы серверную платформу Tioga Pass.
2. Собственная разработка полного цикла
Ряд российских ODM-производителей берут готовые блоки и производят железо в Китае под свои требования. Такой подход всегда казался на российском рынке оптимальным. Однако мы приняли нестандартное решение, что у нас будет полный цикл собственной разработки - идея и дизайн печатных плат и корпуса, разработка встроенного софта, схемотехники, конструкторской и технологической документации.
Для достижения этой цели мы, прежде всего, сфокусировались на собственной сильной команде специалистов, в частности, разработчиков.
На старте команда разработки состояла из 20 человек, сейчас же мы выросли больше, чем в 3 раза. Поиск и привлечение специалистов в команду, их обучение — эти задачи мы определили для себя как ключевые.
Успех сложного производства напрямую зависит от людей, которые им занимаются. Например, в разработке и выпуске серверов востребованы специалисты-топологи с максимально продвинутыми компетенциями. При этом таких сотрудников должно быть достаточно много для масштабирования производства.
Далее, акцент был сделан на передовых инструментах разработки. Для ускорения процессов разработки и выпуска продукции мы адаптировали под свою специфику специальные САПР-инструменты в самых продвинутых версиях, поддерживающих режим одновременной совместной работы множества топологов.
Наконец, еще один ключевой момент - непрерывное обучение команды.
Специалистов, которые умеют работать с такими САПР, на рынке практически нет. Мало быть отличным техническим специалистом, нужно понимать все тонкости режима коллективной работы в САПР: когда нельзя заходить на определенные участки, касаться некоторых компонентов. Также нужно знать принятые правила наименования дорожек и так далее.
Мы обучаем таких специалистов буквально «на лету» и прокачиваем себя в этом направлении до состояния, когда можно говорить о создании собственной методологии коллективной работы топологов.
Что это дало?
Мы досконально знаем, что производим, и можем быстро реагировать на запросы рынка. Например, реализовывать новые функции, исправлять ошибки, подстраиваться под российскую специфику производства и изменения на рынке компонентов.
Представим ситуацию: перестает продаваться какой-то компонент продукта. Если бы дизайн компонентов у нас был только импортный, нам бы пришлось ехать на фабрику в Китай или Тайвань и решать вопрос о внесении изменений там.
Но поскольку компонентная база находится под нашим контролем и управлением, задача решается иначе: вызываем специалиста из производственного блока, вносим необходимые изменения в дизайн в зависимости от наличия или отсутствия какого-либо компонента и запускаем скорректированный процесс.
3. Системный софт в своих руках
На любом «железе» есть базовый уровень ПО – системный софт, различные BIOS-подобные программные слои, управляющие основными возможностями оборудования.
На наших серверах изначально использовались стандартные продукты от глобальных вендоров. Однако, во-первых, мы понимали риски полной зависимости от одного вендора, а, во-вторых, предвидели возникновение задач по кастомизации продуктов на этом уровне под требования клиентов.
Поэтому решили разработать собственные программные инструменты этого класса.
Первый самостоятельный релиз удалось подготовить примерно за 12 месяцев. В результате мы освободились от зависимости от глобального лидера в сегменте системного ПО для серверов.
Что это дало?
Например, если сейчас мы вносим доработки в BMC по запросу оперативно, то при сохранении решения от глобального вендора пришлось бы ждать новый релиз около года. И не факт, что конечный результат соответствовал бы ожиданиям. Наличие своих программистов с нужными компетенциями дает возможность самостоятельно и оперативно реагировать на запросы рынка и стимулировать изменения.
Какие были сложности?
Создание системного серверного ПО оказалось не таким простым, как ожидалось. Хотя значительная часть кода UEFI (BIOS) и BMC была общедоступна, базовой функциональности для развития инфраструктуры было недостаточно. Значительный объем кода команде разработчиков пришлось создавать самостоятельно.
Более того, серверное ПО включало в себя не только два упомянутых инструмента, но и несколько конфигурационных прошивок для специализированных микросхем, отвечающих за работу аппаратного интерфейса. Эти прошивки также необходимо было улучшить.
4. Собственные стенды и тестовые лаборатории
Тестирование - важный процесс производства серверного оборудования. Тесты подтверждают, что на производственной линии не было допущено ошибок, все спаяно и отпечатано верно, а оборудование даст нужный результат при эксплуатации.
Тестирование проводится на стендах – специальных инструментах для серийных проверочных испытаний изделия.
Для проверки плат, используемых в наших серверах, проводится порядка 100 различных тестов. Это длительный процесс: на единицу продукции уходит время, сопоставимое со сроками производства единицы продукта.
От качества и скорости тестирования зависит экономическая модель производства: если выпущенную партию можно проверить быстро, надежно отсеивая брак, то себестоимость готовых изделий будет ниже. Это важно для конкуренции.
Поэтому стенд должен быть надежным, производительным. Исходя из важности этой части производственного процесса, мы самостоятельно проектируем и выпускаем тестовые стенды, соответствующих нашим производственным целям.
Что это дало?
Тщательный подход к тестированию позволяет производить надежное и качественное устройство без ошибок в эксплуатации на стороне клиента.
Серверы - крайне сложное с технической точки зрения изделие, за счет глубокой функциональной проработки тестовых стендов мы серьезно расширяем и углубляем стадию тестирования. Такой подход снижает влияние человеческого фактора и сокращает количество возможных ошибок.
Какие были сложности?
Перед началом работы мы недооценили роль качественных стендов при переходе к выпуску промышленных партий продукции. Первые реализации стендов не были рассчитаны на большие партии изделий, которые нужно было выпустить в строго установленные сроки.
Пришлось переосмыслить роль этой составляющей и запустить отдельный проект по разработке стендов в необходимой нам конфигурации, которые гарантировали выявление брака.
Также был разработан специальный софт для сбора данных о тестировании — это позволяет мониторить работу стендов, даже если они находятся на удаленных площадках.
5. Собственный сервисный центр: четыре линии сервисной поддержки на территории РФ
Запуск собственного сервисного центра компании с четырьмя линиями поддержки стал одним из наиболее грамотных стратегических шагов компании.
Мы даже предположить не могли, какой задел на будущее создает наличие собственной лаборатории OCP и сервисной поддержки с возможностью привлечения разработчиков оборудования и ПО в рамках 4-й линии поддержки.
Все линии поддержки находятся в России. Кроме того, при необходимости наши специалисты могут максимально быстро выехать на объект для разрешения проблем.
Наша сервисная политика построена по образцу брендов А-класса. То есть на уровне, привычном для глобальных вендоров - лидеров рынка, когда поддержка дается напрямую от производителя.
Что это дало?
Доступность службы поддержки имеет решающее значение, поскольку она позволяет не только быстро реагировать на запросы клиентов, но и получать от них обратную связь для доработки наших продуктов.
Какие были сложности?
Запускать собственную поддержку пришлось в условиях недостатка ресурсов. Создание целого отдела с четырьмя линиями поддержки требует значительных затрат с точки зрения персонала, технологий и инфраструктуры.
Во-первых, людей нужно обучать — а это отдельный дорогостоящий проект. Во-вторых, важно на регулярной основе отслеживать качество обработки обращения. Работа такой сложной структуры должна быть полностью прозрачной.
Извлеченные уроки
Опыт показывает, что собственное серверное оборудование в России производить можно и нужно. Важно постоянно учиться, опираться на глобальный успешный опыт, иметь возможность не требовать возврата инвестиций в первый же год и стараться как можно меньше зависеть от других участников рынка.
Так, сервер «GAGAR>N Оракул Gen1», созданный на базе открытой архитектуры OCP Tioga Pass, недавно получил сертификат OCP Accepted, что позволяет включить его в маркетплейс глобального OCP-сообщества.
Фактически, собственное производство оборудования в России - современный тренд, активное развитие которого полностью оправдывает все сопутствующие риски.