第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

Dask DataFrames 與 numpy.memmap 性能對(duì)比

Dask DataFrames 與 numpy.memmap 性能對(duì)比

PHP
阿波羅的戰(zhàn)車 2023-11-09 10:37:34
我開發(fā)了一個(gè)模型,它使用幾個(gè)大型 3 維數(shù)據(jù)集(按 (1e7, 10, 1e5) 的順序),并對(duì)這些數(shù)據(jù)集的切片進(jìn)行數(shù)百萬次讀取(和數(shù)千次寫入)調(diào)用。到目前為止,我發(fā)現(xiàn)用于進(jìn)行這些調(diào)用的最佳工具是 numpy.memmap,它允許在 RAM 中保存最少的數(shù)據(jù),并允許干凈的索引和直接在硬盤驅(qū)動(dòng)器上非常快速地調(diào)用數(shù)據(jù)。numpy.memmmap 的缺點(diǎn)似乎是性能相當(dāng)不均勻 - 讀取數(shù)組切片的時(shí)間在調(diào)用之間可能會(huì)相差 2 個(gè)數(shù)量級(jí)。此外,我使用 Dask 并行化腳本中的許多模型函數(shù)。Dask DataFrames 對(duì)大型數(shù)據(jù)集進(jìn)行數(shù)百萬次調(diào)用的性能如何?將 memmap 替換為 DataFrame 會(huì)顯著增加處理時(shí)間嗎?
查看完整描述

1 回答

?
慕碼人8056858

TA貢獻(xiàn)1803條經(jīng)驗(yàn) 獲得超6個(gè)贊

您需要使用 Dask Array 而不是 Dask Dataframe。性能通常與 Numpy 相同,因?yàn)?Numpy 執(zhí)行實(shí)際計(jì)算。

根據(jù)用例,優(yōu)化可以加快計(jì)算速度。

調(diào)度程序的開銷會(huì)降低性能。這僅適用于將數(shù)據(jù)拆分為多個(gè)分區(qū)的情況,并且通??梢院雎?。


查看完整回答
反對(duì) 回復(fù) 2023-11-09
  • 1 回答
  • 0 關(guān)注
  • 214 瀏覽

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)