U Jºc|ã@shUddlmZmZmZddlZddlmmZddlm Z gZ eeed<ej jGdd„deƒƒZdS)é)ÚListÚOptionalÚDictN)ÚTensorÚ__all__c@sZeZdZdeeeeeeeeeedœ dd„Zeeedœdd „Z eeed œdd„Z d S)Ú_FunctionalSGDç{®Gáz„?çF) ÚparamsÚlrÚmomentumÚ dampeningÚweight_decayÚnesterovÚmaximizeÚforeachÚ_allow_empty_param_listc Csl||||dœ|_||_||_||_tj ttjtt tjffi¡|_ t|ƒdkr^| s^tdƒ‚d|i|_ dS)N)rrr rrz%optimizer got an empty parameter listr )ÚdefaultsrrrÚtorchÚjitZannotaterrÚstrÚstateÚlenÚ ValueErrorÚparam_group) Úselfr rrr rrrrr©rúJ/tmp/pip-unpacked-wheel-gikjz4vx/torch/distributed/optim/functional_sgd.pyÚ__init__s ü$z_FunctionalSGD.__init__)ÚparamÚgradc Csö|jd}|jd}|jd}|jd}|g}g}g} d} |dk r–| |¡|jrVd} ||jkrji|j|<|j|}d|krˆ| d¡n| |d¡t ¡,tj|| ||||||j|j | |j d W5QRX|j|}|d }|dk rò||d<dS)z` Similar to self.step, but operates on a single parameter and its gradient. rrr rFNTÚmomentum_buffer©rrrr rrÚhas_sparse_gradrr)rÚappendÚ is_sparserrÚno_gradÚFÚsgdrrr) rrr rrr rr Úmomentum_buffer_listÚgradsr#rr!rrrÚ step_param2sH õ z_FunctionalSGD.step_param)Ú gradientscCsh|jd}g}g}g}|jd}|jd}|jd}|jd} t|ƒt|ƒkrttddt|ƒ›dd t|ƒ›ƒ‚d } t||ƒD]n\}}|dk r‚| |¡| |¡|jr°d} ||jkrÄi|j|<|j|} d| krâ| d¡q‚| | d¡q‚t ¡,t j||||||| |j|j | |jd W5QRXt|ƒD].\}}|j|} ||}|dk r4|| d<q4dS)Nr rrrr zEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: FTr!r")rrrrÚzipr$r%rrr&r'r(rrrÚ enumerate)rr,r Zparams_with_gradr*r)rrrr r#rZgradientrÚiÚpr!rrrÚstepas^ ÿþÿ ö z_FunctionalSGD.stepN)rr r r FFFF)Ú__name__Ú __module__Ú__qualname__rrÚfloatÚboolrrr+r1rrrrrs*öö/r)ÚtypingrrrrZtorch.optim._functionalZoptimZ_functionalr'rrrÚ__annotations__rÚscriptÚobjectrrrrrÚs