Search Results - "Veeriah, Vivek" :: K.UTB vyhledávací portál

Differential Recurrent Neural Networks for Action Recognition

by Veeriah, Vivek, Naifan Zhuang, Guo-Jun Qi
Published in 2015 IEEE International Conference on Computer Vision (ICCV) (01.12.2015)

Get full text

Conference Proceeding Journal Article

Loading…

Crossprop: Learning Representations by Stochastic Meta-Gradient Descent in Neural Networks

by Veeriah, Vivek, Zhang, Shangtong, Sutton, Richard S.
Published in Machine Learning and Knowledge Discovery in Databases

Get full text

Book Chapter

Loading…

AugInsert: Learning Robust Visual-Force Policies via Data Augmentation for Object Assembly Tasks

by Diaz, Ryan, Imdieke, Adam, Veeriah, Vivek, Desingh, Karthik
Year of Publication 19.10.2024

Get full text

Journal Article

Loading…

Learning Retrospective Knowledge with Reverse Reinforcement Learning

by Zhang, Shangtong, Veeriah, Vivek, Whiteson, Shimon
Year of Publication 09.07.2020

Get full text

Journal Article

Loading…

GrASP: Gradient-Based Affordance Selection for Planning

by Veeriah, Vivek, Zheng, Zeyu, Lewis, Richard, Singh, Satinder
Year of Publication 07.02.2022

Get full text

Journal Article

Loading…

ReLOAD: Reinforcement Learning with Optimistic Ascent-Descent for Last-Iterate Convergence in Constrained MDPs

by Moskovitz, Ted, O'Donoghue, Brendan, Veeriah, Vivek, Flennerhag, Sebastian, Singh, Satinder, Zahavy, Tom
Year of Publication 02.02.2023

Get full text

Journal Article

Loading…

Learning State Representations from Random Deep Action-conditional Predictions

by Zheng, Zeyu, Veeriah, Vivek, Vuorio, Risto, Lewis, Richard, Singh, Satinder
Year of Publication 09.02.2021

Get full text

Journal Article

Loading…

Diversifying AI: Towards Creative Chess with AlphaZero

by Zahavy, Tom, Veeriah, Vivek, Hou, Shaobo, Waugh, Kevin, Lai, Matthew, Leurent, Edouard, Tomasev, Nenad, Schut, Lisa, Hassabis, Demis, Singh, Satinder
Year of Publication 17.08.2023

Get full text

Journal Article

Loading…

AugInsert: Learning Robust Visual-Force Policies via Data Augmentation for Object Assembly Tasks

by Diaz, Ryan, Imdieke, Adam, Veeriah, Vivek, Desingh, Karthik
Published in arXiv.org (19.10.2024)

Get full text

Paper

Loading…

Many-Goals Reinforcement Learning

by Veeriah, Vivek, Oh, Junhyuk, Singh, Satinder
Year of Publication 22.06.2018

Get full text

Journal Article

Loading…

How Should an Agent Practice?

by Rajendran, Janarthanan, Lewis, Richard, Veeriah, Vivek, Lee, Honglak, Singh, Satinder
Year of Publication 15.12.2019

Get full text

Journal Article

Loading…

Learning Representations by Stochastic Meta-Gradient Descent in Neural Networks

by Veeriah, Vivek, Zhang, Shangtong, Sutton, Richard S
Year of Publication 08.12.2016

Get full text

Journal Article

Loading…

Learning Retrospective Knowledge with Reverse Reinforcement Learning

by Zhang, Shangtong, Veeriah, Vivek, Whiteson, Shimon
Published in arXiv.org (01.11.2020)

Get full text

Paper

Loading…

Discovery of Options via Meta-Learned Subgoals

by Veeriah, Vivek, Zahavy, Tom, Hessel, Matteo, Xu, Zhongwen, Oh, Junhyuk, Kemaev, Iurii, van Hasselt, Hado, Silver, David, Singh, Satinder
Year of Publication 12.02.2021

Get full text

Journal Article

Loading…

GrASP: Gradient-Based Affordance Selection for Planning

by Veeriah, Vivek, Zheng, Zeyu, Lewis, Richard, Singh, Satinder
Published in arXiv.org (08.02.2022)

Get full text

Paper

Loading…

METHODS AND SYSTEMS FOR CONSTRAINED REINFORCEMENT LEARNING

by Moskovitz, Theodore Harris, Baveja, Satinder Singh, Flennerhag, Johan Sebastian, O'Donoghue, Brendan Timothy, Zahavy, Tom Ben Zion, Jeya Veeraiah, Vivek Veeriah
Year of Publication 08.08.2024

Get full text

Patent

Loading…

Diversifying AI: Towards Creative Chess with AlphaZero

by Zahavy, Tom, Veeriah, Vivek, Hou, Shaobo, Waugh, Kevin, Lai, Matthew, Leurent, Edouard, Tomasev, Nenad, Schut, Lisa, Hassabis, Demis, Singh, Satinder
Published in arXiv.org (31.07.2024)

Get full text

Paper

Loading…

Learning State Representations from Random Deep Action-conditional Predictions

by Zheng, Zeyu, Veeriah, Vivek, Vuorio, Risto, Lewis, Richard, Singh, Satinder
Published in arXiv.org (05.11.2021)

Get full text

Paper

Loading…

A Self-Tuning Actor-Critic Algorithm

by Zahavy, Tom, Xu, Zhongwen, Veeriah, Vivek, Hessel, Matteo, Oh, Junhyuk, van Hasselt, Hado, Silver, David, Singh, Satinder
Year of Publication 28.02.2020

Get full text

Journal Article

Loading…

Learning Feature Relevance Through Step Size Adaptation in Temporal-Difference Learning

by Kearney, Alex, Veeriah, Vivek, Travnik, Jaden, Pilarski, Patrick M, Sutton, Richard S
Year of Publication 07.03.2019

Get full text

Journal Article

Refine Results

Format

Subject Area

Topic

Language

Year of Publication

Database