tensorflow源碼解析之framework-allocator

標簽：

機器學習

1. 核心概念

allocator给出的只是内存分配器的接口，没有给出具体实现。allocator_registry用单例模式实现了一个全局的内存分配器注册类，负责管理和注册所有的内存分配器。

2. allocator

2.1 Allocator

Allocator是一个内存分配器的接口类，它规定了一个内存分配器需要具有哪些API。具体看代码：

class Allocator {public:    virtual void* AllocateRaw(size_t alignment, size_t num_bytes) = 0;    virtual void DeallocateRaw(void* ptr) = 0;    T* Allocate(size_t num_elements);    T* Allocate(size_t num_elements, const AllocationAttributes& allocation_attr);    void Deallocate(T* ptr, size_t num_elements);    virtual bool TracksAllocationSizes();    virtual bool ShouldAllocateEmptyTensors();    virtual size_t RequestedSize(void* ptr);    virtual size_t AllocatedSize(void* ptr);    virtual int64 AllocationId(void* ptr);//本次内存分配的编号
    virtual size_t AllocatedSizeSlow(void* ptr);    virtual void GetStats(AllocatorStats* stats);
}

另外，Allocator除了提供申请内存的接口之外，还提供了为申请好的内存调用默认构造和析构函数的接口。如果在申请的时候指定了对象的类型，就可以选择调用对象所属类的构造和析构方法。Allocator提供了针对三种常用类的构造方法，分别是String，ResourceHandle,Variant。

class Allocator {public:    //...private:    void RunCtor(T* p, size_t n);    virtual void RunStringCtor(string* p, size_t n);    virtual void RunStringDtor(string* p, size_t n);    virtual void RunResourceCtor(ResourceHandle* p, size_t n);    virtual void RunResourceDtor(ResourceHandle* p, size_t n);    virtual void RunVariantCtor(Variant* p, size_t n);    virtual void RunVariantDtor(Variant* p, size_t n);
}

2.2 AllocatorAttributes

不同的设备分配内存的方法并不相同，那是不是各设备只需要实现自身的内存分配器就可以了呢？如果在计算中每个设备只需要用到自己的内存，当然是没有问题的，但在TF中，有些情况下为了效率，GPU也需要用到CPU内存，比如，为了使用DMA给某些设备传送数据，我们仍然需要申请CPU内存。因此，当我们向一个设备索要内存分配器时，需要给它提供一些信息，告诉设备我们想要申请哪种类型的内存，这些信息就存储在AllocatorAttributes类中。

struct AllocatorAttributes {    void set_on_host(bool v);    bool on_host() const;    void set_nic_compatible(bool v);    bool nic_compatible() const;    void set_gpu_compatible(bool v);    bool gpu_compatible() const;    void set_track_sizes(bool v);    bool track_sizes() const;    void Merge(AllocatorAttributes other);    bool IsEqualOrLessRestrictiveThan(const AllocatorAttributes& other);
    uint32 value = 0;//这个数值的高8位被保留为设备相关的设置。各设备的实现可以根据需要自行解析，为这些设备实现的操作也需要正确的解析它}

2.3 AllocationAttributes

AllocatorAttributes很容易与另外一个类混淆，那就是AllocationAttributes。后者是为内存分配器的某一次具体的内存分配准备信息的，而前者是为向设备索要合适的内存分配器提供给设备的，使用时机完全不一样。

class AllocationAttributes {    bool no_retry_on_failure = false; //如果首次内存分配失败了，不再尝试。
    bool allocation_will_be_logged = false;//本次内存分配是否会被记录}

2.4 AllocatorWrapper

有时候我们想对某个内存分配器进行封装，以便在某个API上实现定制化。这时就需要用到AllocatorWrapper类，它本质上就是对Allocator类的直接封装。

2.5 AllocatorStats

为了对某个内存分配器已分配的内存进行统计，TF还设计了一个结构，AllocatorStats。

struct AllocatorStats {    int64 num_allocs;//内存分配次数
    int64 bytes_in_use;//分配的内存中，当前正在使用的大小
    int64 max_bytes_in_use;//使用中的内存大小的峰值
    int64 max_alloc_size;//最大的单次内存分配大小
    int64 bytes_limit;//当前内存分配器能分配的最大内存量，如果申请内存大小超过这个阈值，返回0
    //...}

3. allocator_registry

3.1 AllocatorRegistry

先看一下，注册器内部是怎样存储内存分配器的：

class AllocatorRegistry {    //...private:    std::vector<AllocatorRegistryEntry> allocators_;    //...}

其实就是把内存分配器存储在一个向量里，但并不是直接存储内存分配器本身，而是对它的一个封装，我们看下这个封装的结构：

typedef struct {    string name;    int priority;
    Allocator* allocator;
} AllocatorRegistryEntry;

除了内存分配器之外，这个entry里还存放了内存分配器的名称和优先级。当我们向AllocatorRegistry请求一个内存分配器时，它返回的是具有最高优先级的分配器，如果多个分配器有相同的优先级，就返回其中的一个。

原文出处：https://www.cnblogs.com/jicanghai/p/9535808.html

點擊查看更多內容

為 TA 點贊

若覺得本文不錯，就分享一下吧！

評論

評論

共同學習，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優(yōu)質文章

正在加載中

暮色呼如

手記
篇

粉絲

87

獲贊與收藏

311

關注作者，訂閱最新文章

閱讀免費教程

后端通用面試教程

41個小節(jié) 32194 359

網絡編程入門教程

20個小節(jié) 13289 250

Pandas 入門教程

25個小節(jié) 19880 373

推薦

評論

收藏

共同學習，寫下你的評論



感謝您的支持，我會繼續(xù)努力的～

掃碼打賞，你說多少就多少

贊賞金額會直接到老師賬戶

支付方式

打開微信掃一掃，即可進行掃碼打賞哦

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優(yōu)惠券免費領

立即參與放棄機會

點擊
抽獎

慕課手記新用戶專享福利

恭喜你，你的運氣太好了，居然抽中了 100個積分！

恭喜你，抽中了價值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標、機械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優(yōu)惠券
在等著你去兌換了噢

作者：

免費贈送

兌換碼：1111222211 復制

優(yōu)惠券可用于購買實戰(zhàn)課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學習，選課去


第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空