Форма обучения:
дистанционная
Стоимость самостоятельного обучения:
бесплатно
Доступ:
свободный
Документ об окончании:
 
Уровень:
Для всех
Длительность:
19:27:00
Студентов:
427
Выпускников:
54
Курс предусматривает ознакомление с основными задачами, моделями и методами создания мультимедийных приложений с акцентом на задачи компьютерного зрения и машинного обучения.
Лекционная часть курса расширяет кругозор слушателей в части алгоритмов решения ряда ключевых задач предметной области, лабораторный практикум иллюстрирует теоретический материал, формирует навыки решения практических задач. Отличительной особенностью курса является ориентация на практическое применение. Для этого авторами подготовлены подробные текстовые описания не только лекционной части, но и лабораторных работ, иллюстрирующих применение библиотек OpenCV и IPP для решения задач компьютерного зрения. Материалы лабораторного практикума включают коды программ, процесс пошаговой разработки которых описан в методических указаниях.
 

План занятий

Занятие
Заголовок <<
Дата изучения
Лекция 1
36 минут
Основные цветовые модели, представление изображения, базовые операции над изображениями
В лекции дается определение компьютерного зрения, рассматриваются области его применения. Рассматриваются вопросы формирования изображений. Приведена классификация изображений, а также описаны основные методы обработки изображений. Приводится характеристика основных цветовых пространств.
Оглавление
    -
    Лекция 2
    55 минут
    Введение в машинное обучение
    В лекции рассматриваются основные задачи машинного обучения, приведены основные методы решения этих задач.
    Оглавление
      -
      Лекция 3
      58 минут
      Детекторы и дескрипторы ключевых точек. Алгоритмы классификации изображений. Задача детектирования объектов на изображениях и методы её решения
      В лекции приводятся описание детекторов особых точек, дескрипторов особых точек, методах классификации изображений, методов детектирования объектов.
      Оглавление
        -
        Лекция 4
        1 час 31 минута
        Отслеживание движения и алгоритмы сопровождения ключевых точек
        В лекции приводится краткая характеристика различных случаев движения в задачах компьютерного зрения. Приведена классификация задач в зависимости от типов движения. Описаны основные методы, применяемые для решения приведенных задач.
        Оглавление
          -
          Лекция 5
          1 час 1 минута
          Проективная геометрия в компьютерном зрении
          В лекции приводятся основные приложения проективной геометрии в компьютерном зрении. Дается описание проективной модели камеры, модели искажения линз. Приведено применение описанной модели для задач определения позы объекта, калибрации камеры. Приведено описание подхода к восстановлению трехмерной сцены по данным двух камер.
          Оглавление
            -
            Тест 5
            24 минуты
            -
            Лекция 6
            36 минут
            Начало работы с библиотекой OpenCV
            В лекции приводятся: обзор библиотеки OpenCV, описание программ на C/C++ и Python.
            Оглавление
              -
              Лекция 7
              16 минут
              Введение в библиотеку IPP
              В лекции приводится подробное описание структуры библиотеки IPP, модели ее использования. Описываются основные типы данных и функций, даны примеры работы с ними. Приведен пример создания приложения в среде MICROSOFT VISUAL STUDIO 2010.
              Оглавление
                -
                Тест 7
                24 минуты
                -
                Сборка и установка библиотеки OpenCV. Использование библиотеки в среде Microsoft Visual Studio
                В работе предлагается описание возможных способов сборки и установки библиотеки OpenCV. Приводится последовательность действий, которые необходимо выполнить для настройки среды Microsoft Visual Studio при разработке приложений с использованием функций библиотеки. Далее рассматриваются некоторые элементарные операции обработки изображений, решается задача выделения контуров объекта и разрабатывается приложение с целью освоения этих элементарных операций. Описываются некоторые операции работы с видеоданными, рассматривается задача видеодетектирования лиц с использованием классификатора Хаара. Разрабатывается приложение, которое демонстрирует применение некоторых функций работы с видео, а также реализации указанного детектора, входящей в состав библиотеки OpenCV.
                Оглавление
                  -
                  Машинное обучение
                  В работе приводится краткое описание некоторых алгоритмов классификации и кластеризации. Приводятся и описываются интерфейсы структур и классов, прототипы функций библиотеки OpenCV, реализующих рассматриваемые алгоритмы. Предлагаются примеры программ, демонстрирующие использование данных классов и функций. Приводятся результаты работы алгоритмов на модельных задачах. Разрабатывается структура приложений, для решения задач классификации и кластеризации.
                  Оглавление
                    -
                    Классификация изображений с использованием bag-of-words методов
                    В работе предлагается описание основных шагов bag-of-words подхода для классификации изображений. Рассматриваются прототипы функций библиотеки OpenCV, необходимые для реализации данных шагов, с описанием назначения входных параметров. Предлагаются примеры подпрограмм, демонстрирующие использование каждой функции. Разрабатывается приложение, содержащее реализацию bag-of-words подхода для классификации двух категорий изображений. Проводится вычислительный эксперимент на наборе данных, применяемом на практике. Рассматривается зависимость результатов применения подхода от используемых параметров.
                    Оглавление
                      -
                      Сборка и установка Intel® Integrated Performance Primitives. Использование библиотеки в среде Microsoft® Visual Studio
                      В работе предлагается описание процедуры установки библиотеки Intel® IPP в составе пакета Intel® Parallel Studio XE 2013. Приводится последовательность действий, которые необходимо выполнить для настройки среды Microsoft Visual Studio при разработке приложений с использованием функций библиотеки. Далее рассматривается задача медианной фильтрации изображения. Предлагается решение на базе библиотек OpenCV и Intel® IPP. Вводится задача определения прямых линий на изображении, описывается схема решения с использованием преобразования Хафа. Предлагается программные реализации на базе библиотек OpenCV и Intel® IPP.
                      Оглавление
                        -
                        Сравнение производительности некоторых алгоритмов в библиотеках OpenCV и IPP
                        Работа построена следующим образом: в начале демонстрируется процесс разработки программного приложения, позволяющего единообразно организовать запуск экспериментов по сравнению производительности. Далее поясняется, как можно выполнить сравнение для алгоритмов медианной фильтрации, эрозии, дилатации, построения гистограммы. Приводятся результаты первых прикидочных экспериментов, даются рекомендации и задания для самостоятельной проработки.
                        Оглавление
                          -
                          Оптимизация и распараллеливание вычислений в задаче детектирования объектов на изображениях с использованием алгоритма Latent SVM
                          В работе рассматривается задача детектирования объектов разных классов на изображениях. Приводится содержательная и математическая постановка задачи. Выполнение работы предполагает, что исходным материалом является последовательная реализация алгоритма Latent SVM и тестовое приложение, которое осуществляет поиск объектов некоторого заданного класса на изображении (модель класса объектов и изображение являются параметрами командной строки приложения). Также предоставляется документация, содержащая описание основных структур данных и функций. Одной из базовых операций алгоритма Latent SVM является операция вычисления сверток. Последовательная реализация предусматривает возможность вычисления сверток с использованием прямого алгоритма и с использованием быстрого двумерного преобразования Фурье (БПФ). Поэтому выделяется два направления оптимизации и распараллеливания, связанные с соответствующими реализациями. В процессе выполнения лабораторной работы предлагается определить "горячие" точки программы – функции, в которых программа проводит наибольшее время. На первом этапе необходимо оптимизировать наиболее трудоемкие функции. Затем выполнить их распараллеливание и оценить эффективность разработанных параллельных реализаций. На втором этапе предлагается выполнить распараллеливание оптимизированной последовательной версии на более высоком уровне с точки зрения схемы работы алгоритма.
                          Оглавление
                            -
                            Детектирование пешеходов
                            В работе приводится краткое описание алгоритма вычисления HOG-признаков и детектора пешеходов, основанного на методе бегущего окна, использующего HOG-признаки и машину опорных векторов в качестве классификатора. Приводятся и описываются интерфейсы классов библиотеки OpenCV, реализующих рассматриваемые алгоритмы. Приводится описание схемы самостоятельного обучения классификаторов для решения задачи детектирования. Приводится описание интерфейса класса, реализующего алгоритм детектирования LatentSVM. Предлагаются примеры программ, демонстрирующие использование рассмотренных классов.
                            Оглавление
                              -
                              1 час 40 минут
                              -
                              Андрей Терёхин
                              Андрей Терёхин

                              Нахожу в тесте вопросы, которые в принципе не освещаются в лекции. Нужно гуглить на других ресурсах, чтобы решить тест, или же он всё же должен испытывать знания, полученные в ходе лекции?

                              Демянчик Иван
                              Демянчик Иван

                              В главе 14 мы видим понятие фильтра, но не могу разобраться, чем он является в теории и практике.

                              " Искомый объект можно описать с помощью фильтра F= \lbrace f_{x',y'},x' \in \lbrace0, ...,w_f \rbrace , y' \in \lbrace 0,...,h_f \rbrace \rbrace "