Какие виды искусственного интеллекта применяют в российских компаниях
Автор: Дмитрий Романов – основатель Университета искусственного интеллекта.
По данным IDC Russia, объем внедрения технологических решений на основе искусственного интеллекта в российских компаниях в 2020 году вырос на 22,4%. И по прогнозам аналитиков он продолжит расти с каждым годом. Читайте о том, какие именно системы ИИ востребованы бизнес-средой в России уже сегодня и какие задачи они помогают решать.
Мы 5 лет занимаемся образованием разработчиков по искусственному интеллекту, через нас прошли тысячи программистов и сотни компаний. Мы работаем с компаниями от многомиллиардных российских брендов до микробизнесов и малых стартапов. Речь пойдет о проектах по искусственному интеллекту именно в российских компаниях, потому что передовые проекты, которые внедряет Google, Microsoft или Илон Маск с OpenAI, и то, что внедряет условное производство фанеры в России, — совершенно разные миры.
На рынке искусственного интеллекта нет консолидации, практически нет доминирующих тем, на которые приходится хотя бы 20% проектов по искусственному интеллекту. Примеры, которые я приведу в статье, — в подавляющем большинстве случаев либо проекты, которые мы внедряли, либо проекты, которые мы разрабатываем в данный момент. В меньшем числе случаев это будут проекты, обсуждаемые с компаниями в режиме консультаций, но не внедрённые непосредственно нами.
Компьютерное зрение
Классификация изображений
Это одна из простых, но распространенных тем. Есть изображение и ограниченное число классов, задача — определить, к какому классу относится это изображение. Например, квадрокоптер летит над лесом и снимает видео, а искусственный интеллект классифицирует тип деревьев — ели, сосны, лиственницы, березы.
Другой пример: надо классифицировать 100 тысяч уникальных монет. Создать для нумизматической компании мобильное приложение, в котором по фотографии монеты нейронная сеть определяет, что это за редкая монета и какого она года.
Еще пример: простое российское производство фанеры, малый бизнес. Есть 5 степеней качества березового шпона, из которого изготавливается фанера. Обычно степень качества определяют рабочие, но они часто ошибаются. Нейронная сеть же работает по фотографии: под камеру на стенде кладется лист шпона, и она с высокой точностью определяет качество.
Другие примеры: определение наличия глаукомы по фотографии радужки глаза, определение пневмонии по снимку КТ, распознавание лиц людей на проходной производственной компании по видео или по фотографии.
Object detection или обнаружение объектов
Это одна из доминирующих тем среди всех проектов. Возможно, вы видели, как прямоугольником обводится человек, машина или какой-то другой объект на фотографии (чаще всего, конечно, это люди).
Примеры проектов:
- обнаружение по видео с квадрокоптера плавающих людей, тонущих людей, плавсредств, акул или нефтяных пятен;
- обнаружение на стройке людей без касок и жилетов;
- определение количества людей, которые зашли в кафе;
- обнаружение неубранных столиков в фудкортах или фастфуд-ресторанах.
Сегментация изображений
Сегментация изображений – это задача обвести по контуру объект на изображении. Например, Zoom умеет удалять задний фон и оставлять человека, обведенного по контуру. Также сегментация применяется в проектах, о которых я рассказывал в предыдущем пункте. Например, обвести на КТ-снимке очаг пневмонии, на фотографиях леса с квадрокоптера сделать сегментацию леса по контуру — вот здесь у нас еловый лес, здесь опушка, здесь река, здесь березовый лес. Компьютерное зрение занимает чуть большую долю проектов, чем остальные типы AI-задач.
Текстовые задачи
В английском языке это называется NLP – natural language processing, обработка естественного языка. Текстовых задач на российском рынке мы встречаем меньше, чем остальных, хотя на мировом рынке NLP занимает вторую позицию после компьютерного зрения. Текстовые задачи делятся на несколько типов.
Например, у нас во внутренней ERP-системе ремонта автомобилей есть обратная связь от каждого ремонтника по каждому автомобилю, и надо классифицировать этот текст и определить, о чем идет речь — о неисправности двигателя, о необходимости заказа деталей, о поломке в электронике или о том, что машина в отличном состоянии.
Другой пример — проект, который мы внедряем у себя, по оценке качества рекламы в Telegram-канале. Нейронная сеть по последним 10-ти постам может определить, будет ли реклама в данном Telegram-канале эффективна для нас.
Еще пример: определять тип звонка в колл-центр компании. Нейронная сеть распознает речь и классифицирует звонки по тексту на клиентские вопросы, рекламации, звонки по ошибке, спам или шутки.
Распознавание текста на картинке
Это проекты на пересечении компьютерного зрения и обработки текстов — OCR (optical character recognition), оптическое распознавание символов. Это частый тип задач, особенно в юридической, банковской и подобных сферах. Типовые задачи — распознавание данных паспорта, СНИЛС, ПТС, СТС, фотографий документов ИП или распознавание чеков. Еще одна часто встречающаяся задача — распознавание показаний весов, когда товар кладется на весы и надо, чтобы камера визуально распознала результат взвешивания в цифрах.
Работа с табличными данными
Табличные данные – это Excel-файлы с числами. Есть несколько типов задач с табличными данными для искусственного интеллекта.
Классификация на основании табличных данных
Например, есть анкетные данные, которые заполнены категориально — да/нет, 0/1. Например, это данные о пациенте, и на их основании надо определить, какова вероятность пяти типовых сердечных заболеваний.
Оценка на основании табличных данных
Это часто встречающиеся задачи, когда на выходе нужен не номер класса, а число. Например, оценка стоимости недвижимости по описанию. Причем это смешанная задача — текст плюс табличные данные, потому что для определения итоговой цены учитываются и параметры объекта недвижимости, и описание из текста объявления. Технология применяется для коммерческой, жилой, вторичной и других видов недвижимости.
Другой пример: эффективность рекламы на телевидении. Есть табличные данные о том, в какой период вышла реклама, на каком канале, в каком регионе и программы какой тематики шли перед рекламой. С помощью нейронной сети по этим табличным данным предсказываем, сколько звонков поступит после рекламы.
Еще пример: назначение медицинского препарата. Есть данные анализа крови пациента, на их основании нейронная сеть должна так подобрать объем назначаемого лекарства, чтобы через месяц анализы у пациента максимально улучшились.
Временные ряды
Работа с временными рядами в целом похожа на работу с табличными данными, но отличие в том, что данные упорядочены по времени, а основная задача – предсказание, прогнозирование. Например, есть временной ряд инцидентов на заводах компании, и надо спрогнозировать количество инцидентов на квартал вперед. Также прогнозируется нагрузка на серверы компании, количество переходов на сайт компании, количество поломок оборудования — есть временной ряд количества его поломок по неделям (если компания крупная), и мы хотим на 4 недели вперед предсказать объем поломок оборудования.
Прогнозирование временных рядов часто применяется для предсказания цен на товар, который продает компания, либо на сырье, которое она использует.
Есть также классификация временных рядов — например, по данным с датчиков во время бурения нефтяной скважины определить вероятность того, что там есть нефть, или по датчикам со станка определить, что он близок к неисправности и скоро сломается.
Оптимизационные задачи
Оптимизационные задачи решаются генетическими алгоритмами. Частая задача — подбор оптимальных настроек оборудования. Например, на химическом производстве под разный поступивший материал нужно по-разному настроить оборудование. Изначально это делают эксперты, а с помощью генетических алгоритмов можно настроить автоматический подбор параметров оборудования, которое оптимально проведет работу с данными типами сырья.
Другой пример — оптимизация загрузки склада: как правильно расставить товары, чтобы максимально ускорить загрузку прибывающих фур.
Еще пример: оптимизация загрузки лифта в шахте. В шахте добывается сырье, и генетический алгоритм оптимизирует график перевозки людей и сырья так, чтобы максимально эффективно использовать лифт и увеличить объем добычи.
Рекомендательные системы
Рекомендательные системы набирают большую популярность среди digital-компаний. Например, рекомендательная система для киберспортивного портала делает так, чтобы пользователю показывались действительно интересные ему стримы. Или рекомендательная система для интернет-магазина одежды показывает пользователю ровно ту одежду, которую он наверняка купит.
Резюме
Это основные категории AI задач среди сотен проектов, за которыми к нам обращаются компании. Для подобных проектов компания нанимает разработчиков, инициирует разработку, далее идет сбор датасета, полгода разработки. Внедрение AI — это практически всегда уникальный проект. Конечно, есть и более редкие темы — например, недавно появившиеся нейросети вроде Stable Diffusion, Midjourney или DALL-E 2, которые умеют рисовать изображения.
Спектр задач гораздо шире (например, разные чат-боты, распознавание речи), но в российских компаниях мы этих проектов практически не встречаем. Их либо нет, либо задачи решаются типовыми сервисами по подписке без создания уникального проекта по искусственному интеллекту. Но, в целом, российский рынок искусственного интеллекта пока слабо покрыт сервисами, для огромного процента задач нужна именно индивидуальная разработка.
Надеюсь, вам было полезно, и какие-то из названных мной направлений разработки AI подойдут вашей компании. В любом случае пришло время размышлять о применении искусственного интеллекта в компании, потому что в 2023-м году 99% компаний российского рынка, включая малый бизнес, смогут найти для себя выгодное и рентабельное применение искусственного интеллекта, которое значительно продвинет их вперед.