Анализ изображений и видео 2, весна 2015: Сегментация...

61
Анализ изображений и видео -2 Наталья Васильева, Артамонов Алексей [email protected] [email protected] HP Labs Russia Yandex 16 февраля 2015, Computer Science Center Лекция 2: Классификация изображений и распознавание объектов

Upload: cs-center

Post on 18-Jul-2015

75 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Анализ изображений и видео 2, весна 2015: Сегментация изображений

Анализ изображений и видео - 2

Наталья Васильева, Артамонов Алексей

[email protected] [email protected] Labs Russia Yandex

16 февраля 2015, Computer Science Center

Лекция 2: Классификация изображений и

распознавание объектов

Page 2: Анализ изображений и видео 2, весна 2015: Сегментация изображений

2 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Классификация, кластеризация

Зачем сравнивать изображения?

Обучающее множество:

изображения и метки класса

Модель

классификатора

Обучение классификатора:

сопоставление

особенностей изображений

меткам классов

Обучение

Тестирование

Тестовое

изображение

Сопоставление

тестового изображения

модели

классификатора

Предсказанные

классификатором

классы:

– open outdoor

Page 3: Анализ изображений и видео 2, весна 2015: Сегментация изображений

3 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Обнаружение объектов

Зачем сравнивать изображения?

Page 4: Анализ изображений и видео 2, весна 2015: Сегментация изображений

4 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Мы бы хотели...

Зачем сравнивать изображения?

• чтобы компьютер «понимал» семантику сцены на изображении

• автоматически распознавать что и где изображено

• категоризировать и идентифицировать объекты, определять их свойства и

отношения

Slide credit: M. Everingham

Page 5: Анализ изображений и видео 2, весна 2015: Сегментация изображений

5 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Разные уровни обобщения

Что считать похожими объектами?

• Один и тот же объект в разные

моменты времени

(слежение/tracking)

• Один и тот же объект в разных

позах, в разных условиях, с

разным фоном (распознавание

лиц)

• Разные объекты одной категории

(обнаружение объектов/object

detection)

Page 6: Анализ изображений и видео 2, весна 2015: Сегментация изображений

6 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Разные уровни локализации

Что есть распознанный объект?

• Объект (сцена) присутствует на

изображении

классификация, категоризация

изображений (image classification)

• Известно местоположение объекта,

объект выделен на изображении

обнаружение, выделение,

локализация объекта (object detection,

localization)

• Известны пиксели, принадлежащие

объекту

объектная сегментация (object

segmentation)

Slide credit: M. Everingham

Page 7: Анализ изображений и видео 2, весна 2015: Сегментация изображений

7 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Стул Найдем стул на этом изображении Корреляция с шаблоном

Насколько сложна задача выделения объекта?

Slide credit: А. Torralba

Page 8: Анализ изображений и видео 2, весна 2015: Сегментация изображений

8 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Найдем стул на этом изображении

Простое сопоставление шаблонов

не решает задачу

Насколько сложна задача выделения объекта?

Slide credit: А. Torralba

Page 9: Анализ изображений и видео 2, весна 2015: Сегментация изображений

9 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Сложности: разные ракурсы/позы объекта

Slide credit: M. Everingham

Page 10: Анализ изображений и видео 2, весна 2015: Сегментация изображений

10 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Сложности: разный масштаб

Slide credit: M. Everingham

Page 11: Анализ изображений и видео 2, весна 2015: Сегментация изображений

11 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Сложности: изменение освещения

Slide credit: M. Everingham

Page 12: Анализ изображений и видео 2, весна 2015: Сегментация изображений

12 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Сложности: фон

Slide credit: M. Everingham

Page 13: Анализ изображений и видео 2, весна 2015: Сегментация изображений

13 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Cложности: перекрытия

Slide credit: M. Everingham

Page 14: Анализ изображений и видео 2, весна 2015: Сегментация изображений

14 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Сложности: деформируемые объекты

Slide credit: M. Everingham

Page 15: Анализ изображений и видео 2, весна 2015: Сегментация изображений

15 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Сложности: внутривидовые различия

Slide credit: M. Everingham

Page 16: Анализ изображений и видео 2, весна 2015: Сегментация изображений

16 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Как выделить общие свойства свойства объектов из одной категории?

Определить «с потолка» абстрактную модель непросто

Проще обучить модель на примерах

Slide credit: M. Everingham

Page 17: Анализ изображений и видео 2, весна 2015: Сегментация изображений

17 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Общая схема решения

Использование классификатора:

• Представление изображения или его

фрагмента в виде вектора признаков:

• Обучение классификатора

• Классификация векторов признаков

Извлечение

признаков

Классификато

рмашина/не машина

f( )

Page 18: Анализ изображений и видео 2, весна 2015: Сегментация изображений

18 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Какие признаки использовать?

Какие свойства объектов являются

ключевыми?

Зависят ли ключевые свойства и

признаки от категории?

Как достичь необходимой

инвариантности?

Slide credit: M. Everingham

Page 19: Анализ изображений и видео 2, весна 2015: Сегментация изображений

19 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Какие признаки использовать?

0

500

1000

1500

2000

2500

0 50 100 150 200 250

Page 20: Анализ изображений и видео 2, весна 2015: Сегментация изображений

20 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Какие признаки использовать?

Page 21: Анализ изображений и видео 2, весна 2015: Сегментация изображений

21 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Как обучить классификатор?

Как построить разделяющую

поверхность?

Как добиться необходимого уровня

обощения модели классификатора?

Как учесть дополнительные

априорные знания?

Slide credit: M. Everingham

Page 22: Анализ изображений и видео 2, весна 2015: Сегментация изображений

22 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Различные варианты разметки обучающего множества

Slide credit: M. Everingham

Page 23: Анализ изображений и видео 2, весна 2015: Сегментация изображений

23 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Модели: Generative vs. Discriminative

Page 24: Анализ изображений и видео 2, весна 2015: Сегментация изображений

24 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Модели: Generative vs. Discriminative

0 10 20 30 40 50 60 700

0.05

0.1

x = data

• Generative model

0 10 20 30 40 50 60 700

0.5

1

x = data

• Discriminative model

0 10 20 30 40 50 60 70 80

-1

1

x = data

• Classification function

Slide credit: А. Torralba

Page 25: Анализ изображений и видео 2, весна 2015: Сегментация изображений

25 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Discriminative methods

106 examples

Nearest neighbor

Shakhnarovich, Viola, Darrell 2003

Berg, Berg, Malik 2005

Neural networks

LeCun, Bottou, Bengio, Haffner 1998

Rowley, Baluja, Kanade 1998

Support Vector Machines and Kernels Conditional Random Fields

McCallum, Freitag, Pereira 2000

Kumar, Hebert 2003

Guyon, Vapnik

Heisele, Serre, Poggio, 2001

Slide credit: А. Torralba

Page 26: Анализ изображений и видео 2, весна 2015: Сегментация изображений

26 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Классификация для разных подзадач и типов объектов

• Определение категории сцены/объекта

Подход: классификация признаков изображения (глобальных

или локальных) без выделения и анализа отдельных

объектов/частей

• Выделение объектов

Подход: классификация локальных признаков фрагментов

изображения (скользящее окно)

• Объекты как множество составляющих их частей

Подход: классификация локальных признаков

составляющих частей объектов с учетом их взаимного

расположения

Page 27: Анализ изображений и видео 2, весна 2015: Сегментация изображений

27 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Определение категории объекта

• Объект (сцена) присутствует на

изображении

классификация, категоризация

изображений (image

classification)

Page 28: Анализ изображений и видео 2, весна 2015: Сегментация изображений

28 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Определение категории: пример

Slide credit: M. Everingham

Page 29: Анализ изображений и видео 2, весна 2015: Сегментация изображений

29 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 30: Анализ изображений и видео 2, весна 2015: Сегментация изображений

30 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 31: Анализ изображений и видео 2, весна 2015: Сегментация изображений

31 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 32: Анализ изображений и видео 2, весна 2015: Сегментация изображений

32 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 33: Анализ изображений и видео 2, весна 2015: Сегментация изображений

33 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 34: Анализ изображений и видео 2, весна 2015: Сегментация изображений

34 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 35: Анализ изображений и видео 2, весна 2015: Сегментация изображений

35 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 36: Анализ изображений и видео 2, весна 2015: Сегментация изображений

36 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 37: Анализ изображений и видео 2, весна 2015: Сегментация изображений

37 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 38: Анализ изображений и видео 2, весна 2015: Сегментация изображений

38 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

[pp=[p

Slide credit: M. Everingham

Page 39: Анализ изображений и видео 2, весна 2015: Сегментация изображений

39 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Выделение объекта

• Известно местоположение объекта,

объект выделен на изображении

обнаружение, выделение,

локализация объекта (object

detection, localization)

Page 40: Анализ изображений и видео 2, весна 2015: Сегментация изображений

40 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Использование классификатора

Набор фрагментов

… и принимается решение относительно категории каждого фрагмента

(«монитор» или «не монитор»).

Decision

boundary

Монитор

Фон

В пространстве

признаков

Где мониторы?

Изображение разбивается на фрагменты (возможно пересекающиеся)

Slide credit: А. Torralba

Page 41: Анализ изображений и видео 2, весна 2015: Сегментация изображений

41 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Использование скользящего окна

Полный перебор всех позиций и размеров окна!

Page 42: Анализ изображений и видео 2, весна 2015: Сегментация изображений

42 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Использование скользящего окна

Полный перебор всех позиций и размеров окна!

Page 43: Анализ изображений и видео 2, весна 2015: Сегментация изображений

43 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Использование скользящего окна

Полный перебор всех позиций и размеров окна!

Page 44: Анализ изображений и видео 2, весна 2015: Сегментация изображений

44 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 45: Анализ изображений и видео 2, весна 2015: Сегментация изображений

45 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Добавим информацию о пространственном расположении в модель «мешка слов»

Slide credit: M. Everingham

Page 46: Анализ изображений и видео 2, весна 2015: Сегментация изображений

46 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Добавим информацию о пространственном расположении в модель «мешка слов»

Slide credit: M. Everingham

Page 47: Анализ изображений и видео 2, весна 2015: Сегментация изображений

47 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Можно использовать пирамиду

Slide credit: M. Everingham

Page 48: Анализ изображений и видео 2, весна 2015: Сегментация изображений

48 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 49: Анализ изображений и видео 2, весна 2015: Сегментация изображений

49 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 50: Анализ изображений и видео 2, весна 2015: Сегментация изображений

50 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 51: Анализ изображений и видео 2, весна 2015: Сегментация изображений

51 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Добавление искусственных положительных примеров в выборку

Jittering

Отображения, повороты, сдвиги, изменение масштаба, добавление шума

Page 52: Анализ изображений и видео 2, весна 2015: Сегментация изображений

52 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 53: Анализ изображений и видео 2, весна 2015: Сегментация изображений

53 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Детектор Violo-Jones

• «Быстрые», «простые» признаки объектов

• Интегральные изображения, свертка с прибиженным базисом Хаара

• Использование адаптивного бустинга (AdaBoost) для выбора наиболее

информаитвных признаков

• Использование каскада классификаторов для быстрой отбраковки не-

объектов

Основные идеи:

Page 54: Анализ изображений и видео 2, весна 2015: Сегментация изображений

54 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

2 3

Slide credit: M. Everingham

Page 55: Анализ изображений и видео 2, весна 2015: Сегментация изображений

55 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Everingham

Page 56: Анализ изображений и видео 2, весна 2015: Сегментация изображений

56 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Part arrangement models

• Объекты, как набор составных частей

• Вероятностная модель присутствия объекта на изображении:

P(Object|Image)

• Вероятность наличия объекта зависит от:

• Вероятности наличия необходимых частей объекта «в нужных местах»:

P(part k is at [xk,yk]|Image)

• Вероятности «правильного» расположения частей относительно друг

друга

P(part 1 is at [x1,y1]|Image) && P(part 2 is at [x2,y2]|Image) && …

Page 57: Анализ изображений и видео 2, весна 2015: Сегментация изображений

57 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Part arrangement models

• Голосование

• Ограничение на углы

• Использование Марковских случайных полей

Page 58: Анализ изображений и видео 2, весна 2015: Сегментация изображений

58 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Irani

Page 59: Анализ изображений и видео 2, весна 2015: Сегментация изображений

59 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Irani

Page 60: Анализ изображений и видео 2, весна 2015: Сегментация изображений

60 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Slide credit: M. Irani

Page 61: Анализ изображений и видео 2, весна 2015: Сегментация изображений

61 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Заключение

• Определение категории и выделение объектов решается при

помощи классификации

• Определение категории: классификация локальных

(глобальных) признаков с использованием машинного обучения

• Выделение объекта – использование скользящего окна

• Проблемы

• Репрезентативность обучающей выборки

• Bootstrapping and jittering

• Скорость работы

• Каскады классификаторов

• Зависимость от контекста