Платформа резидента «Сколково» поможет собрать данные для обучения искусственного интеллекта

786

Компания «Наносемантика», ведущий разработчик технологий искусственного интеллекта (ИИ) и резидент Кластера информационных технологий Фонда «Сколково», запустила сервис NLab Marker. С его помощью данные преобразуются в информацию, понятную нейронным сетям.

NLab Marker – это промышленная платформа, готовая к внедрению и эксплуатации на задачах с большими объемами данных, которые нуждаются в специальной ручной обработке: разметке и подготовке специалистами обучающих примеров для алгоритмов машинного обучения. NLab Marker позволяет выделять объекты на видео, расшифровывать аудиозаписи, размечать медицинские снимки. Сервис максимально сокращает время работы специалистов по подготовке данных (разметчиков) и количество ошибок при формировании набора обучающих данных (датасета).

Станислав Ашманов, генеральный директор компании «Наносемантика»: «Машинное обучение невозможно без обучающих данных – примеров, по которым алгоритмы учатся. Мы, как разработчики алгоритмов ИИ, знаем, насколько важны качественно размеченные данные. Наша команда разработала платформу NLab Marker для себя. Но теперь мы готовы предложить этот продукт рынку, так как видим спрос на промышленные платформы разметки данных, которые позволяют гибко реализовывать любые задачи по разметке и самостоятельно администрировать этот процесс компаниям с сильным отделом Data Science».

Ошибки в датасете критически влияют на качество обучения нейронной сети. Например, обученная нейросеть для видеоаналитики будет пропускать брак на производственной линии или неверно переносить персональные данные из заполненной анкеты в МФЦ. В NLab Marker внедрена система автоматической проверки работы разметчиков на примерах-ловушках (ханипотах). Также контролируются время и объём выполненных заданий. Кроме того, в NLab Marker встроены различные модули для работы с текстом и аудио. Например, модуль для дикторов позволяет им записывать аудио для синтеза речи, а модуль категоризации дает возможность присвоить категорию определенному тексту.

В отличие от аналогов, NLab Marker гарантирует высокую точность подготовки данных, контроль качества на всех этапах процесса разметки и защиту персональных данных, поскольку платформу можно развернуть в защищенном контуре заказчика. Также NLab Marker позволяет вычистить из готового датасета персональные данные, чтобы они не попали в открытый доступ.

Источник: пресс-релиз компании

Комментировать могут только авторизованные пользователи.
Предлагаем Вам в систему или зарегистрироваться.

Предметная область
Отрасль
Управление (роль)
Мы используем файлы cookie в аналитических целях и для того, чтобы обеспечить вам наилучшие впечатления от работы с нашим сайтом. Заходя на сайт, вы соглашаетесь с Политикой использования файлов cookie.