第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

在 Numba 中,如何在面向 CUDA 時(shí)將數(shù)組復(fù)制到常量?jī)?nèi)存中?

在 Numba 中,如何在面向 CUDA 時(shí)將數(shù)組復(fù)制到常量?jī)?nèi)存中?

我有一個(gè)示例代碼來(lái)說(shuō)明這個(gè)問(wèn)題:import numpy as npfrom numba import cuda, typesimport configsdef main():    arr = np.empty(0, dtype=np.uint8)    stream = cuda.stream()    d_arr = cuda.to_device(arr, stream=stream)    kernel[configs.BLOCK_COUNT, configs.THREAD_COUNT, stream](d_arr)@cuda.jit(types.void(    types.Array(types.uint8, 1, 'C'),), debug=configs.CUDA_DEBUG)def kernel(d_arr):    arr = cuda.const.array_like(d_arr)if __name__ == "__main__":    main()當(dāng)我用 cuda-memcheck 運(yùn)行這段代碼時(shí),我得到:numba.errors.ConstantInferenceError: Failed in nopython mode pipeline (step: nopython rewrites)Constant inference not possible for: arg(0, name=d_arr)這似乎表明我傳入的數(shù)組不是常量,因此無(wú)法將其復(fù)制到常量?jī)?nèi)存中——是這樣嗎?如果是這樣,我如何將作為輸入提供給內(nèi)核的數(shù)組復(fù)制到常量?jī)?nèi)存?
查看完整描述

1 回答

?
守著一只汪

TA貢獻(xiàn)1872條經(jīng)驗(yàn) 獲得超4個(gè)贊

您不會(huì)使用作為輸入提供給內(nèi)核的數(shù)組復(fù)制到常量數(shù)組。該類型的輸入數(shù)組已在設(shè)備中,設(shè)備代碼無(wú)法寫(xiě)入常量?jī)?nèi)存。


常量?jī)?nèi)存只能從主機(jī)代碼寫(xiě)入,并且常量語(yǔ)法期望數(shù)組是主機(jī)數(shù)組。


這是一個(gè)例子:


$ cat t32.py

import numpy as np

from numba import cuda, types, int32, int64


a = np.ones(3,dtype=np.int32)

@cuda.jit

def generate_mutants(b):

    c_a = cuda.const.array_like(a)

    b[0] = c_a[0]


if __name__ == "__main__":

    b = np.zeros(3,dtype=np.int32)

    generate_mutants[1, 1](b)

    print(b)

$ python t32.py

[1 0 0]

$

請(qǐng)注意,與 CUDA C/C++ 相比,Numba CUDA 中常量?jī)?nèi)存的實(shí)現(xiàn)有一些行為差異,這個(gè)問(wèn)題突出了其中的一些差異。


查看完整回答
反對(duì) 回復(fù) 2023-05-09
  • 1 回答
  • 0 關(guān)注
  • 180 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)