U JºcÞã@slUddlmZmZmZmZddlZddlmmZ ddlm Z gZeee d<ejjGdd„deƒƒZdS)é)ÚListÚDictÚOptionalÚTupleN)ÚTensorÚ__all__c@sdeZdZdeeeeeefeeeeeeedœ dd„Zee ed œd d„Z ee edœd d„ZdS)Ú_FunctionalAdamçü©ñÒMbP?©gÍÌÌÌÌÌì?g+‡ÙÎ÷ï?ç:Œ0âŽyE>çF) ÚparamsÚlrÚbetasÚepsÚweight_decayÚamsgradÚmaximizeÚforeachÚfusedÚ_allow_empty_param_listcCsd|kstd |¡ƒ‚d|ks,td |¡ƒ‚d|dkrDdksXntd |d¡ƒ‚d|dkrpdks„ntd |d¡ƒ‚d|ksštd |¡ƒ‚|||d|d|d œ|_||_||_||_| |_tj t tjt ttjffi¡|_ t|ƒdkr| stdƒ‚d|i|_dS) NrzInvalid learning rate: {}zInvalid epsilon value: {}rgð?z%Invalid beta parameter at index 0: {}éz%Invalid beta parameter at index 1: {}zInvalid weight_decay value: {})rrÚbeta1Úbeta2rz%optimizer got an empty parameter listr )Ú ValueErrorÚformatÚdefaultsrrrrÚtorchÚjitZannotaterrÚstrÚstateÚlenÚparam_group)Úselfr rrrrrrrrr©r$úK/tmp/pip-unpacked-wheel-gikjz4vx/torch/distributed/optim/functional_adam.pyÚ__init__s0 û$z_FunctionalAdam.__init__)ÚparamÚgradcCsZ|g}g}g}g}g}g}g} |dk r:| |¡| |¡||jkr¨i|j|<|j|} t d¡| d<tj|tjd| d<tj|tjd| d<|jr¨tj|tjd| d<|j|} | | d¡| | d¡|jrâ| | d¡| | d¡t ¡Xtj |||||| |j|j |jd|jd |jd |jd|jd|j|j ddd W5QRXdS)zo Similar to step, but operates on a single parameter and optionally a gradient tensor. NrÚstep©Z memory_formatÚexp_avgÚ exp_avg_sqÚmax_exp_avg_sqrrrrr©rrrrrrrrrZ grad_scaleZ found_inf)Úappendr rÚtensorÚ zeros_likeÚpreserve_formatrÚno_gradÚFÚadamrrrr)r#r'r(r Úparams_with_gradÚgradsÚexp_avgsÚexp_avg_sqsÚmax_exp_avg_sqsÚstate_stepsr r$r$r%Ú step_param@sV ðz_FunctionalAdam.step_param)Ú gradientscCs°|jd}g}g}g}g}g}g}t|ƒt|ƒkrXtddt|ƒ›ddt|ƒ›ƒ‚t|jd|ƒD]Ü\} } | dk rh| | ¡| | ¡| |jkrúi|j| <|j| }t d¡|d<tj| tj d|d <tj| tj d|d <|j rútj| tj d|d<|j| }| |d ¡| |d ¡|j r6| |d¡| |d¡qht ¡Xtj |||||||j |j|jd|jd |jd|jd|jd|j|jdddW5QRXdS)Nr zEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: rr)r*r+r,r-rrrrrr.)r"r!rÚzipr/r rr0r1r2rr3r4r5rrrr)r#r=r r6r7r8r9r:r;r'Zgradientr r$r$r%r)ssh ÿþÿ ðz_FunctionalAdam.stepN) r r rrFFFFF)Ú__name__Ú __module__Ú__qualname__rrÚfloatrÚboolr&rr<r)r$r$r$r%rs.õ õ,3r)ÚtypingrrrrrZtorch.optim._functionalZoptimZ_functionalr4rrrÚ__annotations__rÚscriptÚobjectrr$r$r$r%Ús