第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

如何用SSE4.2和AVX指令編譯TensorFlow?

如何用SSE4.2和AVX指令編譯TensorFlow?

如何用SSE4.2和AVX指令編譯TensorFlow?這是運(yùn)行腳本以檢查TensorFlow是否工作的消息:I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcublas.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcudnn.so.5 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcufft.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcuda.so.1 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcurand.so.8.0 locally W tensorflow/core/platform/cpu_feature_guard.cc:95] The TensorFlow library wasn't compiled to use SSE4.2 instructions, but these are available on your machine and could speed up CPU computations. W tensorflow/core/platform/cpu_feature_guard.cc:95] The TensorFlow library wasn't compiled to use AVX instructions, but these are available on your machine and could speed up CPU computations. I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:910] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero我注意到它提到了SSE4.2和AVX,1)什么是SSE4.2和AVX?2)這些SSE4.2和AVX如何改進(jìn)TensorFlow任務(wù)的CPU計(jì)算。3)如何利用這兩個(gè)庫進(jìn)行TensorFlow編譯?
查看完整描述

3 回答

?
絕地?zé)o雙

TA貢獻(xiàn)1946條經(jīng)驗(yàn) 獲得超4個(gè)贊

讓我們先來解釋一下你為什么一開始就看到這些警告?.


很可能您還沒有從源代碼中安裝tf,而是使用了如下所示的pip install tensorflow..這意味著您安裝了預(yù)先構(gòu)建(由其他人構(gòu)建的)二進(jìn)制文件,這些二進(jìn)制文件沒有針對(duì)您的體系結(jié)構(gòu)進(jìn)行優(yōu)化。這些警告正好告訴您:您的體系結(jié)構(gòu)上有可用的東西,但是不會(huì)使用它,因?yàn)槎M(jìn)制文件不是用它編譯的。這是文獻(xiàn)資料.

TensorFlow在啟動(dòng)時(shí)檢查它是否已使用CPU上可用的優(yōu)化進(jìn)行編譯。如果不包括優(yōu)化,TensorFlow將發(fā)出警告,例如不包括AVX、AVX 2和FMA指令。

好消息是很可能你只是想用TF來學(xué)習(xí)/實(shí)驗(yàn),這樣一切都會(huì)正常工作,你就不用擔(dān)心了。


什么是SSE4.2和AVX?

維基百科對(duì)SSE4.2AVX..這種知識(shí)不一定要善于機(jī)器學(xué)習(xí).你可以把它們看作是一組額外的東西指令計(jì)算機(jī)對(duì)單個(gè)指令使用多個(gè)數(shù)據(jù)點(diǎn)來執(zhí)行可以自然并行化的操作(例如,添加兩個(gè)數(shù)組)。

SSE和AVX都是對(duì)SIMD(單指令、多個(gè)數(shù)據(jù)),這是

弗林分類學(xué)中的一類并行計(jì)算機(jī)。它描述了具有多個(gè)處理元素的計(jì)算機(jī),這些處理元素同時(shí)對(duì)多個(gè)數(shù)據(jù)點(diǎn)執(zhí)行相同的操作。因此,這類機(jī)器利用數(shù)據(jù)級(jí)的并行性,而不是并發(fā)性:有同時(shí)(并行)計(jì)算,但在給定時(shí)刻只有一個(gè)進(jìn)程(指令)。

這足以回答你的下一個(gè)問題。


這些SSE4.2和AVX如何改進(jìn)TF任務(wù)的CPU計(jì)算

它們?cè)试S更有效地計(jì)算各種向量(矩陣/張量)運(yùn)算。你可以讀到更多這些幻燈片


如何使用這兩個(gè)庫使TensorFlow編譯?

您需要使用這些指令編譯的二進(jìn)制文件。最簡單的方法就是自己編譯..正如Mike和Yaroslav建議的那樣,您可以使用以下Bazel命令

bazel build -c opt --copt=-mavx --copt=-mavx2 --copt=-mfma --copt=-mfpmath=both --copt=-msse4.2 --config=cuda -k //tensorflow/tools/pip_package:build_pip_package


查看完整回答
反對(duì) 回復(fù) 2019-06-25
  • 3 回答
  • 0 關(guān)注
  • 2007 瀏覽

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)