РБК Pro —  
информационный сервис для предпринимателей и управленцев. Первый месяц — бесплатно
РБК Pro
— сервис для вашего бизнеса. Зарегистрируйтесь и получите доступ ко всем материалам. Первые 30 дней бесплатно.

Рост на глазах: как запустить стартап в области компьютерного зрения

Инновации Цифровизация Статьи РБК
Алексей Мяков, директор подразделения компьютерного зрения в Internet of Things Group (IOTG) компании Intel, рассказывает, как новейшая технология превращается в бизнес, в том числе в России
Фото:Gregor Fischer / DPA / ТАСС
Фото: Gregor Fischer / DPA / ТАСС

По прогнозам Илона Маска, полноценный искусственный интеллект будет создан к 2040 году. Но уже сейчас компьютер решает массу задач быстрее и лучше, чем человек, в частности извлекает информацию из изображений разного типа. Это область технологий, получившая название компьютерного зрения.

Глаза и мозг

Если искусственный интеллект создается с оглядкой на нервную систему и мышление человека, то компьютерное зрение пытается имитировать, как человек видит.

Мы не просто воспринимаем объект глазами, но и анализируем мозгом: определяем цвет, форму, проводим ассоциации с уже известными нам объектами. Алгоритмы компьютерного зрения работают точно так же: они фиксируют объект в объективе камеры, а затем идентифицируют и анализируют в соответствии с заданными характеристиками и правилами. Для этого нужно заранее обучить компьютер на большом количестве специально подготовленных изображений — чтобы знал, что конкретно ему нужно увидеть.

Долгое время применение компьютерного зрения для решения практических задач сдерживали технологические сложности — большая ресурсоемкость и высокие затраты на внедрение. В последние два-три года ситуация стала резко меняться: видеосенсоры и камеры дешевеют и встраиваются во всевозможные устройства, вычислительные мощности растут, алгоритмы совершенствуются.

Аналитики прогнозируют взрывной рост рынка решений в области компьютерного зрения: по оценкам исследовательского агентства Tractica, к 2025 году его объем достигнет $26,2 млрд.

Увидеть нишу

Системы видеонаблюдения используются в самых разных сферах бизнеса и экономики. Но данные, которые фиксируют камеры, в 90–95% случаев никак не интерпретируются. Их анализ мог бы повысить эффективность той или иной области. Вот какие задачи можно решать с помощью компьютерного зрения.

1. Биометрия. С помощью компьютерного зрения можно считывать разные биометрические параметры — лицо, радужную оболочку глаз, отпечатки пальцев.

Технология распознавания лиц считается самой популярной и совершенствуется быстрее всего. «Умная» система позволяет автоматически получать из видеопотока не отдельные кадры, а события — такой-то человек был там-то в такое-то время — и сопоставлять их друг с другом. Технологию активно внедряют как госструктуры, чтобы обеспечить общественную безопасность, так и коммерческие организации.

Например, в школе программирования, запущенной Сбербанком в 2018 году, тестируется система контроля доступа людей в помещение, разработанная компанией VisionLabs. Камеры на входе работают как FaceID, и посетители проходят через турникет, не доставая пропуск из кармана. В ретейле и банкинге такие системы позволят вам расплачиваться в магазинах без наличных и банковских карт, подтверждая транзакцию лишь взглядом в камеру.

2. Медицина. Искусственный интеллект не хуже докторов может справиться с анализом медицинских данных и постановкой диагноза. Это доказывают соревнования, неоднократно проводимые в последние годы в Китае, где явный дефицит квалифицированного медперсонала.

Например, во время конкурса в Пекине в 2018 году компьютер и врачи изучали снимки 225 пациентов с подозрением на опухоль головного мозга. Машина поставила верный диагноз в 87% случаев за 15 минут, в то время как команда докторов из лучших клиник страны — в 66% за 30 минут.

Технологии компьютерного зрения имеют в этом процессе критическое значение: чем быстрее и точнее производится обработка рентгеновских снимков, КТ, МРТ, УЗИ и других изображений, тем выше вероятность, что удастся своевременно с необходимой точностью распознать отклонение от нормы.

В России тоже начинают появляться стартапы в этой нише. Компания Botkin.AI занимается повторным анализом результатов разного рода медицинских исследований, загруженных в архивы учреждений. Во время пилотной обкатки платформы на Ямале, например, обработано 600 снимков компьютерных томографий и в 49 случаях заподозрены признаки рака легких на ранних стадиях. В половине из них диагноз подтвердился. Сейчас идет речь о внедрении сервиса в федеральном масштабе.

3. Автономные системы вождения. В основе функционирования беспилотных автомобилей лежит целый комплекс интеллектуальных систем. Но именно компьютерное зрение служит ключевой технологией. Оно позволяет автономной машине распознать встречные и соседние объекты, оценить расстояние до них, предсказать вероятность и не допустить возникновения критической ситуации.