第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

似乎達(dá)到了CUDA限制,但這有什么限制?

似乎達(dá)到了CUDA限制,但這有什么限制?

似乎達(dá)到了CUDA限制,但這有什么限制?我有一個(gè)CUDA程序似乎在某種資源的某種限制,但我無法弄清楚該資源是什么。這是內(nèi)核函數(shù):__global__ void DoCheck(float2* points, int* segmentToPolylineIndexMap,                          int segmentCount, int* output){     int segmentIndex = threadIdx.x + blockIdx.x * blockDim.x;     int pointCount = segmentCount + 1;     if(segmentIndex >= segmentCount)         return;     int polylineIndex = segmentToPolylineIndexMap[segmentIndex];     int result = 0;     if(polylineIndex >= 0)     {         float2 p1 = points[segmentIndex];         float2 p2 = points[segmentIndex+1];         float2 A = p2;         float2 a;         a.x = p2.x - p1.x;         a.y = p2.y - p1.y;         for(int i = segmentIndex+2; i < segmentCount; i++)         {             int currentPolylineIndex = segmentToPolylineIndexMap[i];             // if not a different segment within out polyline and             // not a fake segment             bool isLegit = (currentPolylineIndex != polylineIndex &&                  currentPolylineIndex >= 0);                   float2 p3 = points[i];             float2 p4 = points[i+1];             float2 B = p4;             float2 b;             b.x = p4.x - p3.x;             b.y = p4.y - p3.y;             float2 c;             c.x = B.x - A.x;             c.y = B.y - A.y;             float2 b_perp;             b_perp.x = -b.y;             b_perp.y = b.x;             float numerator = dot(b_perp, c);             float denominator = dot(b_perp, a);             bool isParallel = (denominator == 0.0);     output[segmentIndex] = result;}參數(shù)的大如下:devicePoints = 22,464 float2s = 179,712字節(jié)deviceSegmentsToPolylineIndexMap = 22,463 ints = 89,852字節(jié)numSegments = 1 int = 4個(gè)字節(jié)deviceOutput = 22,463 ints = 89,852字節(jié)當(dāng)我執(zhí)行這個(gè)內(nèi)核時(shí),它會(huì)崩潰視頻卡??雌饋砦艺谶_(dá)到某種限制,因?yàn)槿绻沂褂肈oCheck<<<300, 32>>>(...);它來執(zhí)行內(nèi)核,它就可以工作。需要明確的是,參數(shù)是相同的,只是塊數(shù)不同。知道為什么一個(gè)人崩潰了視頻驅(qū)動(dòng)程序,而另一個(gè)沒有?失敗的那個(gè)似乎仍然在卡的數(shù)量限制內(nèi)。更新 有關(guān)我的系統(tǒng)配置的更多信息:視頻卡:nVidia 8800GTCUDA版本:1.1操作系統(tǒng):Windows Server 2008 R2我也嘗試在具有以下配置的筆記本電腦上,但得到了相同的結(jié)果:視頻卡:nVidia Quadro FX 880MCUDA版本:1.2操作系統(tǒng):Windows 7 64位
查看完整描述

1 回答

?
繁星點(diǎn)點(diǎn)滴滴

TA貢獻(xiàn)1803條經(jīng)驗(yàn) 獲得超3個(gè)贊

正在耗盡的資源是時(shí)間。在所有當(dāng)前的CUDA平臺(tái)上,顯示驅(qū)動(dòng)程序都包含一個(gè)看門狗定時(shí)器,可以殺死任何需要幾秒鐘才能執(zhí)行的內(nèi)核。在運(yùn)行顯示器的卡上運(yùn)行代碼受此限制。

在您使用的WDDM Windows平臺(tái)上,有三種可能的解決方案/解決方案:

  1. 獲取Telsa卡并使用TCC驅(qū)動(dòng)程序,完全消除了這個(gè)問題

  2. 嘗試修改注冊(cè)表設(shè)置以增加計(jì)時(shí)器限制(google for TdrDelay注冊(cè)表項(xiàng)以獲取更多信息,但我不是Windows用戶,并且不能比這更具體)

  3. 修改您的內(nèi)核代碼以“重入”并在幾個(gè)內(nèi)核啟動(dòng)而不是一個(gè)內(nèi)核啟動(dòng)中處理數(shù)據(jù)并行工作負(fù)載。內(nèi)核啟動(dòng)開銷并不是那么大,并且通過幾個(gè)內(nèi)核運(yùn)行處理工作負(fù)載通常很容易實(shí)現(xiàn),具體取決于您使用的算法。


查看完整回答
反對(duì) 回復(fù) 2019-08-14
  • 1 回答
  • 0 關(guān)注
  • 769 瀏覽

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)