visual recognition: the big picture jitendra malik university of california at berkeley

Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Upload: maximilian-berry

Post on 02-Jan-2016

222 views

Category:

Documents

0 download

Report

Download

Tags:

Embed Size (px):

TRANSCRIPT

Visual Recognition:The Big Picture

Jitendra MalikUniversity of California at

Berkeley

The more you look, the more you see!

Page 3: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

PASCAL Visual Object Challenge

Page 4: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

We want to locate the objectOrig. Image Segmentation Orig. Image Segmentation

Page 5: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

The Visually Tagged Human Project

And we want to detect and label parts..

Page 6: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Computer Vision GroupUC Berkeley

Categorization at Multiple Levels

TigerGrass

Water

Sand

outdoorwildlife

Tiger

tail

eye

legs

head

back

shadow

mouth

Page 7: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Page 8: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Examples of Actions• Movement and posture change

– run, walk, crawl, jump, hop, swim, skate, sit, stand, kneel, lie, dance (various), …

• Object manipulation– pick, carry, hold, lift, throw, catch, push, pull, write, type, touch, hit,

press, stroke, shake, stir, turn, eat, drink, cut, stab, kick, point, drive, bike, insert, extract, juggle, play musical instrument (various)…

• Conversational gesture– point, …

• Sign Language

Page 9: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Computer Vision GroupUniversity of California Berkeley

We need to identify

• Objects

• Agents

• Relationships among objects with objects, objects with agents, agents with agents …

• Events and Actions

Page 10: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Computer Vision GroupUC Berkeley

Taxonomy and Partonomy

• Taxonomy: E.g. Cats are in the order Felidae which in turn is in the class Mammalia– Recognition can be at multiple levels of categorization, or be identification at

the level of specific individuals , as in faces.

• Partonomy: Objects have parts, they have subparts and so on. The human body contains the head, which in turn contains the eyes.

• These notions apply equally well to scenes and to activities.

• Psychologists have argued that there is a “basic-level” at which categorization is fastest (Eleanor Rosch et al).

• In a partonomy each level contributes useful information for recognition.

Page 11: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Visual Processing Areas

Page 12: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Macaque Visual Areas

Page 13: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Computer Vision GroupUC Berkeley

Object Detection can be very fast

• On a task of judging animal vs no animal, humans can make mostly correct saccades in 150 ms (Kirchner & Thorpe, 2006)

– Comparable to synaptic delay in the retina, LGN, V1, V2, V4, IT pathway.

– Doesn’t rule out feed back but shows feed forward only is very powerful

• Detection and categorization are practically simultaneous (Grill-Spector & Kanwisher, 2005)

Page 14: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Hubel and Wiesel (1962) discovered orientation sensitive neurons in V1

Page 15: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

These cells respond to edges and bars ..

Page 16: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Page 17: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Computer Vision GroupUC Berkeley

Orientation based features were inspired by V1 (SIFT, GIST, HOG, GB etc)

Page 18: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Computer Vision GroupUC Berkeley

Attneave’s Cat (1954)Line drawings convey most of the information

Page 19: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Rolls et al (2000)

Page 20: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Page 21: Visual Recognition: The Big Picture Jitendra Malik University of California at Berkeley

Convolutional Neural Networks (LeCun et al)

Cross Modal Distillation for Supervision Transferjhoffman/papers/Gupta_CVPR16.pdf · Saurabh Gupta Judy Hoffman Jitendra Malik University of California, Berkeley fsgupta, jhoffman,

Recognizing objects and actions - courses.csail.mit.edu · 2005-03-03 · Recognizing objects and actions in images and video Jitendra Malik U.C. Berkeley. ... Object Recognition

Computer Vision Group University of California Berkeley On Visual Recognition Jitendra Malik UC Berkeley

Classification using intersection kernel SVMs is efficient Joint work with Subhransu Maji and Alex Berg (CVPR08) Jitendra Malik UC Berkeley

Computer Vision Group University of California Berkeley Matching Shapes Serge Belongie *, Jitendra Malik and Jan Puzicha U.C. Berkeley * Present address:

Computer Vision Group University of California Berkeley Estimating Human Body Configurations using Shape Context Matching Greg Mori and Jitendra Malik

Iterative Instance Segmentation...Iterative Instance Segmentation Ke Li UC Berkeley [email protected] Bharath Hariharan Facebook AI Research [email protected] Jitendra Malik UC

Perceptual Organization and Recognition of Indoor Scenes ......Saurabh Gupta, Pablo Arbelaez, and Jitendra Malik´ University of California, Berkeley - Berkeley, CA 94720 {sgupta,

Andrea Frome, Yoram Singer, Fei Sha, Jitendra Malik

Cross Modal Distillation for Supervision ... - Saurabh Gupta · Saurabh Gupta Judy Hoffman Jitendra Malik University of California, Berkeley fsgupta, jhoffman, [email protected]

Computer Vision Group University of California Berkeley Visual Grouping and Object Recognition Jitendra Malik * U.C. Berkeley * with S. Belongie, C. Fowlkes,

Fundamentals of Image Formation Lecture 2 Jitendra Malik

Recognition using Regions - EECS at UC Berkeley€¦ · Recognition using Regions ⁄ Chunhui Gu, Joseph J. Lim, Pablo Arbel´aez, Jitendra Malik University of California at Berkeley

A Database of Human Segmented Natural Images and Two Applications David Martin, Charless Fowlkes, Doron Tal, Jitendra Malik UC Berkeley {dmartin,fowlkes,doron,malik}@eecs.berkeley.edu

Front-end computations in human vision Jitendra Malik U.C. Berkeley References: DeValois & DeValois,Hubel, Palmer, Spillman &Werner, Wandell Jitendra Malik

Computer Vision Group University of California Berkeley 1 Learning Scale-Invariant Contour Completion Xiaofeng Ren, Charless Fowlkes and Jitendra Malik

Shape Matching and Object Recognition using Low Distortion Correspondence Alexander C. Berg, Tamara L. Berg, Jitendra Malik U.C. Berkeley

Professor Jitendra Malik - EECS at UC Berkeleymalik/malik-cv-full.pdf · Professor Jitendra Malik Arthur J. Chick Professor, Department of EECS University of California at Berkeley,

Christoph Feichtenhofer Haoqi Fan Jitendra Malik Kaiming ... · Christoph Feichtenhofer Haoqi Fan Jitendra Malik Kaiming He Facebook AI Research (FAIR) Abstract We present SlowFast

Learning Category-Specific Mesh Reconstruction from Image ... · Angjoo Kanazawa ∗, Shubham Tulsiani , Alexei A. Efros, Jitendra Malik University of California, Berkeley {kanazawa,shubhtuls,efros,malik}@eecs.berkeley.edu

Visual Grouping and Recognition Jitendra Malik University of California at Berkeley Jitendra Malik University of California at Berkeley

Christoph Feichtenhofer Haoqi Fan Jitendra Malik Kaiming He … · 2019-10-30 · SlowFast Networks for Video Recognition Christoph Feichtenhofer Haoqi Fan Jitendra Malik Kaiming

1 Ecological Statistics and Perceptual Organization Charless Fowlkes work with David Martin and Jitendra Malik at University of California at Berkeley

Efficient Spatiotemporal Grouping Using the Nyström Method Charless Fowlkes, U.C. Berkeley Serge Belongie, U.C. San Diego Jitendra Malik, U.C. Berkeley

Computer Vision Group University of California Berkeley Shape Matching and Object Recognition using Shape Contexts Jitendra Malik U.C. Berkeley (joint

Computer Vision Group University of California Berkeley Recognizing Objects in Adversarial Clutter: Breaking a Visual CAPTCHA Greg Mori and Jitendra Malik

Detection, Segmentation and Fine-grained Localization Bharath Hariharan, Pablo Arbeláez, Ross Girshick and Jitendra Malik UC Berkeley

Viewpoints and Keypoints - cv-foundation.org...Shubham Tulsiani and Jitendra Malik University of California, Berkeley - Berkeley, CA 94720 fshubhtuls,[email protected] Abstract

Towards Human Level AI Jitendra Malik U.C. Berkeley Jitendra Malik U.C. Berkeley

Computer Vision Group UC Berkeley How should we combine high level and low level knowledge? Jitendra Malik UC Berkeley Recognition using regions is joint

Classification using intersection kernel SVMs is efficient Joint work with Subhransu Maji and Alex Berg Jitendra Malik UC Berkeley

Introduction to Artifical Intelligence Jitendra Malik U.C. Berkeley Jitendra Malik U.C. Berkeley

1 Contours and Junctions in Natural Images Jitendra Malik University of California at Berkeley (with Jianbo Shi, Thomas Leung, Serge Belongie, Charless

Computational Vision Jitendra Malik University of California at Berkeley Jitendra Malik University of California at Berkeley

ADS lab NCKU1 Michael Maire, Pablo Arbelaez, Charless Fowlkes, and Jitendra Malik university of California, Berkeley – Berkeley university of California,

visual recognition: the big picture jitendra malik university of california at berkeley

Documents

object manipulationpick

agents events

level of specific individuals

fastest eleanor rosch

useful information

human project

human body

label parts