Search Results - "Bhojanapalli, Srinadh" :: K.UTB vyhledávací portál

Understanding Robustness of Transformers for Image Classification

by Bhojanapalli, Srinadh, Chakrabarti, Ayan, Glasner, Daniel, Li, Daliang, Unterthiner, Thomas, Veit, Andreas
Published in 2021 IEEE/CVF International Conference on Computer Vision (ICCV) (01.10.2021)

Get full text

Conference Proceeding

Loading…

Provable compressed sensing quantum state tomography via non-convex methods

by Kyrillidis, Anastasios, Kalev, Amir, Park, Dohyung, Bhojanapalli, Srinadh, Caramanis, Constantine, Sanghavi, Sujay
Published in npj quantum information (01.08.2018)

Get full text

Journal Article

Loading…

Implicit Regularization in Matrix Factorization

by Gunasekar, Suriya, Woodworth, Blake, Bhojanapalli, Srinadh, Neyshabur, Behnam, Srebro, Nathan
Published in 2018 Information Theory and Applications Workshop (ITA) (01.02.2018)

Get full text

Conference Proceeding

Loading…

Arithmetic Transformers Can Length-Generalize in Both Operand Length and Count

by Cho, Hanseul, Cha, Jaeyoung, Bhojanapalli, Srinadh, Yun, Chulhee
Year of Publication 21.10.2024

Get full text

Journal Article

Loading…

Mimetic Initialization Helps State Space Models Learn to Recall

by Trockman, Asher, Harutyunyan, Hrayr, Kolter, J. Zico, Kumar, Sanjiv, Bhojanapalli, Srinadh
Year of Publication 14.10.2024

Get full text

Journal Article

Loading…

On the Adversarial Robustness of Mixture of Experts

by Puigcerver, Joan, Jenatton, Rodolphe, Riquelme, Carlos, Awasthi, Pranjal, Bhojanapalli, Srinadh
Year of Publication 18.10.2022

Get full text

Journal Article

Loading…

Position Coupling: Improving Length Generalization of Arithmetic Transformers Using Task Structure

by Cho, Hanseul, Cha, Jaeyoung, Awasthi, Pranjal, Bhojanapalli, Srinadh, Gupta, Anupam, Yun, Chulhee
Year of Publication 31.05.2024

Get full text

Journal Article

Loading…

Treeformer: Dense Gradient Trees for Efficient Attention Computation

by Madaan, Lovish, Bhojanapalli, Srinadh, Jain, Himanshu, Jain, Prateek
Year of Publication 18.08.2022

Get full text

Journal Article

Loading…

Efficient Language Model Architectures for Differentially Private Federated Learning

by Ro, Jae Hun, Bhojanapalli, Srinadh, Xu, Zheng, Zhang, Yanxiang, Suresh, Ananda Theertha
Year of Publication 12.03.2024

Get full text

Journal Article

Loading…

HiRE: High Recall Approximate Top-$k$ Estimation for Efficient LLM Inference

by L, Yashas Samaga B, Yerram, Varun, You, Chong, Bhojanapalli, Srinadh, Kumar, Sanjiv, Jain, Prateek, Netrapalli, Praneeth
Year of Publication 14.02.2024

Get full text

Journal Article

Loading…

Dual-Encoders for Extreme Multi-Label Classification

by Gupta, Nilesh, Khatri, Devvrit, Rawat, Ankit S, Bhojanapalli, Srinadh, Jain, Prateek, Dhillon, Inderjit
Year of Publication 16.10.2023

Get full text

Journal Article

Loading…

$Depth Dependence of $\mu$P Learning Rates in ReLU MLPs$

Depth Dependence of $\mu$P Learning Rates in ReLU MLPs

by Jelassi, Samy, Hanin, Boris, Ji, Ziwei, Reddi, Sashank J, Bhojanapalli, Srinadh, Kumar, Sanjiv
Year of Publication 12.05.2023

Get full text

Journal Article

Loading…

Teacher's pet: understanding and mitigating biases in distillation

by Lukasik, Michal, Bhojanapalli, Srinadh, Menon, Aditya Krishna, Kumar, Sanjiv
Year of Publication 19.06.2021

Get full text

Journal Article

Loading…

On student-teacher deviations in distillation: does it pay to disobey?

by Nagarajan, Vaishnavh, Menon, Aditya Krishna, Bhojanapalli, Srinadh, Mobahi, Hossein, Kumar, Sanjiv
Year of Publication 30.01.2023

Get full text

Journal Article

Loading…

Functional Interpolation for Relative Positions Improves Long Context Transformers

by Li, Shanda, You, Chong, Guruganesh, Guru, Ainslie, Joshua, Ontanon, Santiago, Zaheer, Manzil, Sanghai, Sumit, Yang, Yiming, Kumar, Sanjiv, Bhojanapalli, Srinadh
Year of Publication 06.10.2023

Get full text

Journal Article