U Jºcãã@sôUddlmZmZddlmZmZmZmZddlZddl m Zddlm Z Gdd„deƒZdaeeed<eddœd d „Zejeejeefdœdd „Zejeejdœdd„Zejeeeejejdœdd„Zejeejeejfdœdd„ZdS)é)ÚABCÚabstractmethod)ÚAnyÚListÚOptionalÚTupleN)Ú_create_chunk_sharded_tensorc@s–eZdZdZeejeejee fdœdd„ƒZ eeje ejdœdd„ƒZeejeeee jejdœd d „ƒZeejeejeejfdœdd„ƒZd S)ÚFSDPExtensionszä This enables some customizable hooks to enable composability with tensor parallelism. To activate these hooks, use :func:`_set_fsdp_extensions` to set a custom :class:`FSDPExtensions` that implements the hooks. ©ÚtensorÚreturncCsdS)z6E.g. converting ``DistributedTensor`` to local tensor.N©©Úselfrr r úK/tmp/pip-unpacked-wheel-gikjz4vx/torch/distributed/fsdp/_fsdp_extensions.pyÚpre_flatten_transformsz$FSDPExtensions.pre_flatten_transform©rÚparam_extensionrcCsdS)z6E.g. converting local tensor to ``DistributedTensor``.Nr )rrrr r rÚpost_unflatten_transformsz'FSDPExtensions.post_unflatten_transform©rÚrankÚ world_sizeÚnum_devices_per_nodeÚpgrcCsdS)z6Shards a tensor to chunks and returns the local chunk.Nr )rrrrrrr r rÚchunk_tensor"s zFSDPExtensions.chunk_tensorcCsdS)z£ This is to be called before loading a *sharded* model state dict and should return the tensor and list of shards from which to load data. Nr rr r rÚpre_load_state_dict_transform.s z,FSDPExtensions.pre_load_state_dict_transformN)Ú__name__Ú __module__Ú__qualname__Ú__doc__rÚtorchÚTensorrrrrrÚintÚdistÚProcessGrouprrrr r r rr s,ýüùýr Ú_extensions)Ú flattenerrcCs|adS©N)r%)r&r r rÚ_set_fsdp_extensions=sr(r cCs.tdk r&t |¡\}}|dk r&||fS|dfSr')r%r)rZ new_tensorÚ extensionr r rÚ_ext_pre_flatten_transformBs r*rcCs tdk r|dk rt ||¡S|Sr')r%r)rrr r rÚ_ext_post_unflatten_transformLsr+rcCs"tdk rtjnt}||||||ƒSr')r%rr)rrrrrZchunk_tensor_fnr r rÚ_ext_chunk_tensorUs ÿýûr,cCs"tdk rt |¡S| ¡}||fSr')r%rZlocal_shards)rZshardsr r rÚ"_ext_pre_load_state_dict_transformjs r-)ÚabcrrÚtypingrrrrr Ztorch.distributedZdistributedr#Z#torch.distributed.fsdp._shard_utilsrr r%Ú__annotations__r(r!r*r+r"r$r,r-r r r rÚs20þý úþ