GRADIENT DESCENT PROVABLY OPTIMIZES OVER-PARAMETERIZED NEURAL NETWORKS

less than 1 minute read

Published: September 17, 2019

this work: two layer fc + ReLU able to achieve a globally optimal at linear rate using GD

Human Object Interaction

2 minute read

Published: June 18, 2022

3 minute read

Published: September 24, 2021

5 minute read

Published: September 22, 2021

2 minute read

Published: September 21, 2021