Компьютерное зрение — это область искусственного интеллекта, которая связана с анализом изображений и видео. Нейронные сети активно используют эту технологию, чтобы создавать компьютерных роботов и чат-ботов. Это продукты крупнейших ИТ-компаний мира — Amazon, Apple, Яндекс, Google и других. Задача специалиста по компьютерному зрению — научить алгоритмы уверенно ориентироваться в окружающем мире и свести к минимуму системные ошибки в коде.
Мы сделали подборку онлайн-курсов по компьютерному зрению. На занятиях вы узнаете все о нейронах и нейронных сетях, построите свою первую нейронную сеть. Вы освоите современные техники, методы, подходы, архитектуры и алгоритмы в этой области и сможете решать реальные индустриальные задачи.
С помощью специальных инструментов вы научитесь:
- классифицировать изображения и сегментировать их;
- определять и отслеживать объекты на видео;
- обрабатывать и анализировать трехмерные сцены;
- распознавать лица и людей по силуэту;
- генерировать и реконструировать изображения.
Содержание
Skillbox
Сайт: https://engineering.skillbox.ru/computer_vision
Телефон: +7 800 222‒65‒21
Стоимость: 5 940 р. в месяц
Специалист по компьютерному зрению дронов и нейросетям
Через 8 месяцев обучения вы сможете писать код для роботов на Python, чтобы учить машины видеть и анализировать данные предметов вокруг — от тостера до складской руки-манипулятора. С этим навыком вы сможете решать индустриальные задачи: учить дроны рисовать карты и сканировать состояние полей, делать системы безопасности на производстве и много чего ещё!
Программа курса:
- Python для инженеров
- Основы разработки на Python
- Расширенные возможности Python
- Символьные и численные расчёты
- Визуализация данных
- Обработка и первичный анализ да
- Взаимодействие с операционной системой и оборудованием
Как проходит обучение:
- Теория
- Практическое задание
- Работа над ошибками
- Финальная работа
OTUS
Компьютерное зрение
Курс позволит овладеть практическими навыками решения задач Computer Vision. Вы узнаете как применять современные методы Deep Learning, а также классические алгоритмы, для решения задач связанных с обработкой, анализом и генерацией изображений, видео и трехмерных сцен, а также научитесь обучать, тестировать и оптимизировать модели нейронных сетей для решения этих задач, что откроет вам новые карьерные горизонты в области Computer Vision.
Необходимые знания:
- Базовое знакомство с Python
- Базовые знания линейной алгебры (матрицы, векторы, градиентный спуск)
- Базовые навыки работы с ML (pandas, sklearn, линейная регрессия, логистическая регрессия)
Что даст курс:
Вы освоите современные техники, методы, подходы, архитектуры и алгоритмы в области Computer Vision и сможете решать индустриальные задачи, используя полученные навыки. По ходу курса вы будете создавать и обучать модели нейронных сетей для решения таких задач как:
- Классификация и сегментация изображений
- Детекция и отслеживание объектов на видео
- Обработки и анализа трехмерных сцен
- Распознавание лиц и людей по силуэту
- Генерация и реконструкция изображений
- Описание действий, происходящих на видео
- Оптимизация и ускорение работы нейросетей
- Развертывание моделей в продакшн
Бауманский учебный центр «Специалист»
Сайт: https://www.specialist.ru/course/pyml2
Телефон: 7 (495) 232-32-16
Стоимость: 39 990 р. за курс
Нейронные сети. Компьютерное зрение и чтение
Нейронные сети — прочно закрепившаяся современная технология обработки контента. На сегодняшний день многие компьютерные IT корпорации используют эту технологию для создания компьютерных роботов, чат-ботов. Наиболее известные из них Alexa (Amazon), Siri (Apple), Алиса(Yandex), O’key Google, Google Translate (Google) созданы именно с использованием данной технологии.
В данном курсе будет рассмотрен ряд нейронных сетей реализованных средствами Python с использованием библиотеки Tensorflow, а именно PyTorch, разработанной в 2017 году. Данные алгоритмы составляют базу для решения задач по компьютерному зрению и чтению, но не исчерпывают ее, поскольку область эта непрерывно развивается и совершенствуется.
Программа курса:
- Введение в курс
- Введение в нейронные сети
- Что такое PyTorch?
- Зачем использовать тензоры?
- Технические требования
- Облачные возможности
- Что такое тензоры
- Операции с тензорами
- Практикум по теме
Вы научитесь:
- взаимодействовать с тензорами в Python
- познакомитесь с основами PyTorch
- углубите свои знания по Python
- познакомитесь с обработкой изображений средствами нейронных сетей и Python
- познакомитесь с обработкой речи и текста
Академия Высоких Технологий
Компьютерное зрение. Базовый уровень.
Курс основан на решении задач беспилотного автомобиля по детектированию
и распознаванию пешеходов, светофоров, дорожных знаков и разметки. Для отработки задач автономного движения на практике используется образовательный учебный беспилотный автомобиль АЙКАР и испытательные полигоны АЙКАР Стенд. Ключевая задача Айкара – двигаться по своей полосе дорожного полотна, соблюдая правила дорожного движения и корректно реагируя на внешние элементы: дорожные знаки, сигналы светофора и приближение пешеходов.
Язык программирования: Python
В ходе курса Вам предстоит писать программы на языке Python. Для этого необходимо установить Python, среду разработки и подключить библиотеку OpenCV. На нашем сайте представлены подробные инструкции по установке необходимого ПО. В некоторых уроках курса вам предстоит работать с кодом в Google Colab. Мы записали поясняющее видео о том, что это и как начать им пользоваться.
Как правило, уроки начинаются с теоретической части. Бывает такое, что Вы смотрите теоретическую часть и ничего не понимаете. Это не повод бросать занятие! Не волнуйтесь: все сложные моменты теории подробно разбираются в практической части урока.
Stepik
Нейронные сети и компьютерное зрение
Этот курс – победитель премии «Stepik Awards 2019». Авторы курса – эксперты Samsung AI Center, занимающиеся задачами машинного зрения – передают свой практический опыт и интуитивное понимание принципов работы нейронных сетей для компьютерного зрения. А еще курс является частью трека по искусственному интеллекту социально-образовательной программы для вузов «IT Академия Samsung», которая стартовала в 2019 году в МГУ и ЮФУ.
Программа курса:
- Нейрон и нейронная сеть
- Строим первую нейронную сеть
- Задачи, решаемые при помощи нейронных сетей
- Методы оптимизации
- Свёрточные нейронные сети
- Регуляризация и нормализация
- Метод максимального правдоподобия и большой финал
Открытое образование
В рамках онлайн-курса от НИУ ВШЭ слушатели познакомятся со всеми основными задачами, возникающими в компьютерном зрении. Научатся работать с изображениями как классическими методами, так и с помощью глубокого обучения. Помимо обработки отдельно взятых изображений, курс затрагивает восстановление и работу с 3D объектами. Полученные знания будут подкреплены практикой на языке Python.
Онлайн-курс охватывает основные задачи компьютерного зрения. В рамках курса слушатели дистанционно научатся программно обрабатывать изображения, поймут, на чем основаны все фоторедакторы. Затем они познакомятся с глубинным обучением для основных задач, возникающих в зрении, а именно классификации, сегментации и детекции. В дополнение к задаче с учителем, слушатели познакомятся с генеративными моделями. Кроме того, в рамках курса слушатели узнают о поведении нейронных сетей для задачи зрения, и о признаках, что они порождают, научатся с ними работать.
Программа курса:
- Азы работы с изображениями.
- Границы и признаки.
- Задача классификации.
- Задачи переноса стиля и поиска изображений по содержанию.
- Детекция объектов.
- Сегментация изображений.
- Генеративно-состязательные модели.
- Геометрия камеры.
- Оценка глубины.
- 3D графика в компьютерном зрении.
- Сегментация и детекция в облаках точек.
Результаты обучения:
- Обработка изображений алгоритмами классического зрения;
- Классификация изображений;
- Работа с признаками нейронных сетей;
- Детекция на изображениях и облаках точек;
- Сегментация изображений и облаков точек;
- Восстановление глубины.
PyMagic
Easy Computer Vision — курс для начинающих
Преподаватели погрузят вас в область Compuer Vision. Вы познакомитесь с современными подходами к
решению популярных задач CV с использованием актуальных софтверных инструментариев и современных
вычислительных ресурсов, на практике реализуете классификацию изображений, детектирование объектов,
сегментацию сцены и другие задачи из области
Программа курса:
- Введение в компьютерное зрение. Знакомство с природой изображения
- Развитие методов классификации изображений. Общие принципы построения и функционирован
- Детектирование объектов
- Сегментирование сцены
- Глубокие нейросетевые модели для классификации изображений. Эволюция сверточных кодиров
- Коррекция цветовой гаммы изображения. Цветовые фильтры
- Трекинг объектов в видеопотоке
Что входит в тариф:
- 8 видео-лекций (длительность ~4560 мин)
- 8 видео-семинаров (длительность ~3060 мин)
- 8 практических заданий на решение актуальных задач CV современными методами
- Мастер-классы с практическими примерами новейших технологий в Computer Vision от приглашенных экспертов из области
- Поддержка кураторов в чате Discord
- Доступ к материалам 1 год
- Сертификат об окончании
- Список дополнительных материалов
- Комьюнити. Доступ к чату с практикующими специалистами
Лекции МГУ имени М. В. Ломоносова
Компьютерное зрение
Лекция 1. Понятие о компьютерном зрении. Цветовые модели.
Понятие о компьютерном зрении Марра Алгоритм поиска лиц Viola-Jones Глубинное обучение Цифровое изображение Камера обскура Перспективные искажения Современная камера Свет и цвет Восприятие цвета Модели цвета Закон аддитивности Грассмана Модель CIE RGB Нелинейность яркости Модель sRGB Модель HSV Первые цветные фотографии Особенности человеческого зрения Тональная и цветовая коррекция изображения Оценка параметров цветокоррекции
Лекция 2. Сопоставление изображений.
Совмещение изображений Построение панорамы Перспективная проекция 3D преобразование изображений Гомография Цилиндрические и сферические координаты Прямое выравнивание и метрики Пирамида изображений Особенности объекта Детектор Харриса Инвариантность Детектора Харриса Поиск пятен (блобов) Многомасштабный детектор блобов Дескрипторы Оценка ориентации градиента RANSAC Функции качества M-SAC Алгоритм сопоставления изображений
Лекция 3. Классификация и поиск похожих изображений.
Классификация изображений и атрибуты объектов Создание коллекций Кластеризация «Мешок слов» Локальные бинарные шаблоны Метод «визуальных слов» Поиск похожих изображений
Лекция 4. Введение в сверточные нейросети.
Модель Маккалока-Питтса Градиентный метод обучения Задание нейросети Линейный персептрон Обучение персептрона Проблемы обучения нейросетей Нейросети для обработки изображений Сверточные сети Переобучение
Лекция 5. Развитие нейросетевых методов.
Визуализация работы нейросети UMAP — визуализация Нейросетевые признаки Дообучение AlexNet Spatial Pyramid Pooling VGG архитектура Архитектура Inception Проблема глубины нейросети Residual net DenseNet Нейросетевые признаки для поиска похожих изображений Полносвязные и сверточные дескрипторы Triplet-loss
Cischoo
Сайт: https://www.cischool.ru/catalog/machinelearning/kompyuternoe-zrenie/
Телефон: +7 (495) 648-35-00
Стоимость: не указана
Компьютерное зрение
Вы освоите принципы машинного обучения в области компьютерного зрения и сможете решать индустриальные задачи, используя открытые датасеты.
По ходу курса вы обучите нейросети для решения задач:
- классификации и сегментации изображений
- детекции объектов на изображениях
- отслеживания объектов на видео
- обработки трехмерных сцен
- порождения изображений и атаки на обученные модели нейронных сетей
- научитесь пользоваться основными фреймворками для создания нейросетей: PyTorch, TensorFlow и Keras.
Программа курса:
- Компьютерное зрение: задачи, инструменты и программа курса
- Сверточные нейронные сети. Операции свертки, транспонированной свертки, пуллинг
- Эволюция сверточных сетей: AlexNet- >EfficientNet
- Подготовка и аугментация данных
- OpenCV. Классические подходы
- Стандартные датасеты и модели в PyTorch на примере Fine-tuning
- Object detection 1. Постановка задачи, метрики, данные, R-CNN
- TensorRT и инференс на сервере
Получаемые знания и навыки:
- Будете работать с открытыми датасетами для различных задач Computer Vision
- Разберетесь в принципах работы и вариантах сверточных и пулинг-слоев, в том числе, специфических для задач детекции и сегментации объектов.
- Научитесь применять механизм внимания в сверточных сетях.
- Узнаете, какие идеи лежат в основе современных сверточных сетей (MobileNet, ResNet, EfficientNet, etc.)
- Разберетесь в DL-подходах к детекции объектов — изучите семейство R-CNN, реалтайм-детекторы: YOLO, SSD. А также реализуете детектор объектов самостоятельно.
- Научитесь решать задачу Deep Metric Learning с помощью сиамских сетей. Узнаете, что такое triplet loss, angular loss.
- Получите опыт в решении задачи сегментации изображений: U-Net, DeepLab.
- Научитесь применять fine tuning, transfer learning и собирать собственные датасеты для задач object detection и Image segmentation, metric learning.
Robotdreams
Сайт: https://robotdreams.cc/course/318-computer-vision
Телефон: +380 731 727 407
Стоимость: не указана
Computer vision
На курсе вы получите систематизированные знания в области machine learning и deep learning, научитесь строить и тренировать нейронные сети с помощью TensorFlow и Keras и писать программы для обработки изображений и видео. В результате сможете добавлять фичи с использованием Computer Vision в свой проект.
Задача специалиста по компьютерному зрению – научить алгоритмы уверенно ориентироваться в окружающем мире и свести к минимуму системные баги. Задача robot_dreams – помочь разобраться в инструментах и подходах, применяемых для реализации CV-проектов.
Вы начнете обучение с пиксельных операций и создания программ обработки цифровых фото. Затем научитесь проводить базовые манипуляции с изображением и видео: фильтрация и выделение границ, кодирование и компрессия, классификация, детекция, трекинг и сегментация. А после — строить и тренировать нейронные сети.
Deepschool
Прокачайтесь в Computer Vision
В первом проекте вы создадите сервис классификации спутниковых снимков. Вам предстоит обучить нейросеть и обернуть ее инференс в web-сервис. Ваше решение будет состоять из двух частей: моделинг классификации и разработка сервиса. В первой части вы обучите нейросеть на выбранном фреймворке, настроите логирование экспериментов и версионирование моделей. Все так, будто вы работаете в крупной команде. Во второй части вы напишите сервис, добавите к нему тесты, обернете в докер, настроите CI и автоматизируете деплой на сервер.
В этом проекте вы также будете учить нейросети и деплоить сервис. Но данных теперь не будет. Вам предстоит собрать их на платформе Толока, создав реальные проекты для реальных людей. Помимо этого в сервисе теперь будет несколько нейросетей, связанных в единый пайплайн распознавания текста. Вам надо учесть это при планировании архитектуры. Также в отличие от первого проекта, вам следует добавить мониторинг в свое приложение. Вы можете выбрать как решать задачу: через сегментацию и постобработку результата, через детекцию или без сетей вовсе (только классический CV, только хардкор!) –– или сделайте все 3 решения, мы дадим ревью на каждое из них!
ЦФТ
Computer Vision
ШИФТ — это проект ЦФТ для тех, кто хочет развиваться в ИТ и финтехе. Здесь ты за 2-3 месяца получишь комплексные знания в рамках выбранного направления от экспертов ЦФТ. Цель проекта – твой профессиональный рост и оптимальная интеграция в команду ЦФТ. Участие в проекте бесплатное, поскольку организаторы нацелены на подготовку будущих специалистов. Если ты хочешь работать с нейронными сетями и у тебя есть базовые знания, но тебе пока не хватает нужных скиллов, преподаватели помогут сделать первый шаг.
За время участия в проекте ты:
- получишь действительно полезные теоретические материалы и закрепишь их на практике
- создашь собственную CV-модель
- превратишь CV-модель в рабочий сервис
- в конце обучения защитишь свой проект
Содержание курса:
- Обзор инструментов: Gitlab, IDE, linter
- Работа с sql подобными базами
- Обработка данных
- Классика CV
- Схемы кроссвалидаций
- Задачи Computer vision
- Метрики CV
- Обзор инструментов, пайплайна
- Продвинутая Классификация
- Attention и архитектуры трансформеров в CV
- Сегментация
- Детекция: multishot, single shot
- Как искать лица, поиск соседей, arcface
- OCR: CRNN, трансформеры, CTC loss, beam search, LM-ки для OCR