SEMANTIC PARSING OF OBJECTS IN VIDEO

The invention provides an improved method to detect semantic attributes of human body in computer vision. In detecting semantic attributes of human body in computer vision, the invention maintains a list of semantic attributes, each of which corresponds to a human body part. A computer module then a...

Full description

Saved in:
Bibliographic Details
Main Authors VAQUERO, DANIEL, BROWN, LISA, MARIE, FERIS, ROGERIO, SCHMIDT, HAMPAPUR, ARUN
Format Patent
LanguageEnglish
French
Published 21.02.2013
Subjects
Online AccessGet full text

Cover

Loading…
Abstract The invention provides an improved method to detect semantic attributes of human body in computer vision. In detecting semantic attributes of human body in computer vision, the invention maintains a list of semantic attributes, each of which corresponds to a human body part. A computer module then analyzes segments of a frame of a digital video to detect each semantic attribute by finding a most likely attribute for each segment. A threshold is applied to select candidate segments of the frame for further analysis. The candidate segments of the frame then go through geometric and resolution context analysis by applying the physical structure principles of a human body and by analyzing increasingly higher resolution versions of the image to verify the existence and accuracy of parts and attributes. A computer module computes a resolution context score for a lower resolution version of the image based on a weighted average score computed for a higher resolution version of the image by evaluating appearance features, geometric features, and resolution context features when available on the higher resolution version of the image. Finally, an optimal configuration step is performed via dynamic programming to select an optimal output with both semantic attributes and spatial positions of human body parts on the frame. L'invention porte sur un procédé amélioré pour détecter des attributs sémantiques de corps humain en vision par ordinateur. Dans la détection d'attributs sémantiques de corps humain en vision par ordinateur, l'invention maintient une liste d'attributs sémantiques, qui correspondent chacun à une partie du corps humain. Un module informatique analyse ensuite des segments d'une image d'une vidéo numérique afin de détecter chaque attribut sémantique par obtention d'un attribut le plus probable pour chaque segment. Un seuil est appliqué afin de sélectionner des segments candidats de l'image pour une analyse supplémentaire. Les segments candidats de l'image sont ensuite soumis à une analyse géométrique et de contexte de résolution par application des principes de structure physique d'un corps humain et par analyse de versions à résolution de plus en plus haute de l'image afin de vérifier l'existence et la précision de parties et d'attributs. Un module informatique calcule un score de contexte de résolution pour une version à plus basse résolution de l'image sur la base d'un score moyen pondéré calculé pour une version à plus haute résolution de l'image par évaluation de caractéristiques d'apparence, de caractéristiques géométriques et de caractéristiques de contexte de résolution lorsqu'elles sont disponibles sur la version à plus haute résolution de l'image. Enfin, une étape de configuration optimale est exécutée par l'intermédiaire d'une programmation dynamique afin de sélectionner une sortie optimale comprenant des attributs sémantiques et des positions spatiales de parties du corps humain sur l'image.
AbstractList The invention provides an improved method to detect semantic attributes of human body in computer vision. In detecting semantic attributes of human body in computer vision, the invention maintains a list of semantic attributes, each of which corresponds to a human body part. A computer module then analyzes segments of a frame of a digital video to detect each semantic attribute by finding a most likely attribute for each segment. A threshold is applied to select candidate segments of the frame for further analysis. The candidate segments of the frame then go through geometric and resolution context analysis by applying the physical structure principles of a human body and by analyzing increasingly higher resolution versions of the image to verify the existence and accuracy of parts and attributes. A computer module computes a resolution context score for a lower resolution version of the image based on a weighted average score computed for a higher resolution version of the image by evaluating appearance features, geometric features, and resolution context features when available on the higher resolution version of the image. Finally, an optimal configuration step is performed via dynamic programming to select an optimal output with both semantic attributes and spatial positions of human body parts on the frame. L'invention porte sur un procédé amélioré pour détecter des attributs sémantiques de corps humain en vision par ordinateur. Dans la détection d'attributs sémantiques de corps humain en vision par ordinateur, l'invention maintient une liste d'attributs sémantiques, qui correspondent chacun à une partie du corps humain. Un module informatique analyse ensuite des segments d'une image d'une vidéo numérique afin de détecter chaque attribut sémantique par obtention d'un attribut le plus probable pour chaque segment. Un seuil est appliqué afin de sélectionner des segments candidats de l'image pour une analyse supplémentaire. Les segments candidats de l'image sont ensuite soumis à une analyse géométrique et de contexte de résolution par application des principes de structure physique d'un corps humain et par analyse de versions à résolution de plus en plus haute de l'image afin de vérifier l'existence et la précision de parties et d'attributs. Un module informatique calcule un score de contexte de résolution pour une version à plus basse résolution de l'image sur la base d'un score moyen pondéré calculé pour une version à plus haute résolution de l'image par évaluation de caractéristiques d'apparence, de caractéristiques géométriques et de caractéristiques de contexte de résolution lorsqu'elles sont disponibles sur la version à plus haute résolution de l'image. Enfin, une étape de configuration optimale est exécutée par l'intermédiaire d'une programmation dynamique afin de sélectionner une sortie optimale comprenant des attributs sémantiques et des positions spatiales de parties du corps humain sur l'image.
Author BROWN, LISA, MARIE
FERIS, ROGERIO, SCHMIDT
HAMPAPUR, ARUN
VAQUERO, DANIEL
Author_xml – fullname: VAQUERO, DANIEL
– fullname: BROWN, LISA, MARIE
– fullname: FERIS, ROGERIO, SCHMIDT
– fullname: HAMPAPUR, ARUN
BookMark eNrjYmDJy89L5WRQCXb1dfQL8XRWCHAMCvb0c1fwd1Pwd_JydQ4JVvD0UwjzdHH152FgTUvMKU7lhdLcDMpuriHOHrqpBfnxqcUFicmpeakl8eH-RgaGQGRsbmjoaGxMnCoA2AwlVg
ContentType Patent
DBID EVB
DatabaseName esp@cenet
DatabaseTitleList
Database_xml – sequence: 1
  dbid: EVB
  name: esp@cenet
  url: http://worldwide.espacenet.com/singleLineSearch?locale=en_EP
  sourceTypes: Open Access Repository
DeliveryMethod fulltext_linktorsrc
Discipline Medicine
Chemistry
Sciences
Physics
DocumentTitleAlternate ANALYSE SÉMANTIQUE D'OBJETS DANS UNE VIDÉO
ExternalDocumentID WO2012013711A3
GroupedDBID EVB
ID FETCH-epo_espacenet_WO2012013711A33
IEDL.DBID EVB
IngestDate Fri Jul 19 12:47:42 EDT 2024
IsOpenAccess true
IsPeerReviewed false
IsScholarly false
Language English
French
LinkModel DirectLink
MergedId FETCHMERGED-epo_espacenet_WO2012013711A33
Notes Application Number: WO2011EP62925
OpenAccessLink https://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20130221&DB=EPODOC&CC=WO&NR=2012013711A3
ParticipantIDs epo_espacenet_WO2012013711A3
PublicationCentury 2000
PublicationDate 20130221
PublicationDateYYYYMMDD 2013-02-21
PublicationDate_xml – month: 02
  year: 2013
  text: 20130221
  day: 21
PublicationDecade 2010
PublicationYear 2013
RelatedCompanies INTERNATIONAL BUSINESS MACHINES CORPORATION
BROWN, LISA, MARIE
FERIS, ROGERIO, SCHMIDT
HAMPAPUR, ARUN
VAQUERO, DANIEL
IBM UNITED KINGDOM LIMITED
RelatedCompanies_xml – name: FERIS, ROGERIO, SCHMIDT
– name: INTERNATIONAL BUSINESS MACHINES CORPORATION
– name: HAMPAPUR, ARUN
– name: VAQUERO, DANIEL
– name: IBM UNITED KINGDOM LIMITED
– name: BROWN, LISA, MARIE
Score 2.88601
Snippet The invention provides an improved method to detect semantic attributes of human body in computer vision. In detecting semantic attributes of human body in...
SourceID epo
SourceType Open Access Repository
SubjectTerms CALCULATING
COMPUTING
COUNTING
PHYSICS
Title SEMANTIC PARSING OF OBJECTS IN VIDEO
URI https://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20130221&DB=EPODOC&locale=&CC=WO&NR=2012013711A3
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwfV1ZS8NAEB5qPd80WjyqBCx5CyabTdI-FElz2Ag5aGLtW9nNAYKkxUT8-26WVvvU1x2Yvfh2ZnYugEHJ7jXXDFXOS9OQMdWoTAnCspLTLGPYIiNeXT8Ijekbfl3oiw58bnNheJ3QH14ckSEqY3hv-Hu9_v_EcnhsZf1EP9jQ6tlLx460sY5bLxxSJWcyduPIiWzJtpndJoWzltaSTVW1tAM4bBXpttK-O5-0eSnrXaHincNRzPhVzQV0ikqAU3vbe02Ak2Dj8hbgmMdoZjUb3OCwvoRB4gZWmPq2GFuzxA9fxMgTI966JBH9UJz7jhtdwaPnpvZUZhMv__a5fI92V6n1oFutquIaxBxjqheEgQVleJhjUuZEJ0NlZDLlhijmDfT3cbrdT76DM8R7PCAZqX3oNl_fxT2TtA194Af0C6V_fEA
link.rule.ids 230,309,786,891,25594,76903
linkProvider European Patent Office
linkToHtml http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwfV1LT8JAEJ4gPvCmqPGB2kTSWyNtFwoHYqAPqdJuQytyI7ttSUxMIbbGv-90A8qJ60wy-8q3s7PzAmgu8FwTvaMqycLoKITrXOFMI0or4XGM2GI9UV3f8zujN_Iya88q8LnJhRF1Qn9EcUREVIx4L8R9vfr_xLJEbGX-yD-QtHxyor4lr63j0gunqbI17NsBtagpmybabbI_KXkl21DVgb4H-wYahcJYmg7LvJTVtlJxTuAgQHlZcQqVNKtDzdz0XqvDkbd2edfhUMRoxjkS1zjMz6AZ2t7Aj1xTCgaT0PWfJepIVLQuCSXXl6auZdNzeHDsyBwpOPD8b53zd7o9S_0CqtkySy9BSgjh7ZQhWLSYdBPCFglrs26rZ-DjhrWMK2jsknS9m30PtVHkjedj13-9gWNN9HvQFE1tQLX4-k5vUesW_E5s1i-Z8X8q
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Apatent&rft.title=SEMANTIC+PARSING+OF+OBJECTS+IN+VIDEO&rft.inventor=VAQUERO%2C+DANIEL&rft.inventor=BROWN%2C+LISA%2C+MARIE&rft.inventor=FERIS%2C+ROGERIO%2C+SCHMIDT&rft.inventor=HAMPAPUR%2C+ARUN&rft.date=2013-02-21&rft.externalDBID=A3&rft.externalDocID=WO2012013711A3