首頁猿問在某些CPU上的緊密循環(huán)中ADC...

在某些CPU上的緊密循環(huán)中ADC / SBB和INC / DEC的問題

源碼算法與數(shù)據(jù)結(jié)構(gòu)

素胚勾勒不出你 2019-09-26 11:14:15

我在Delphi中編寫一個(gè)簡單的BigInteger類型。它主要由一個(gè)動(dòng)態(tài)數(shù)組TLimb組成，其中TLimb是一個(gè)32位無符號(hào)整數(shù)，以及一個(gè)32位大小的字段，該字段還保存BigInteger的符號(hào)位。要添加兩個(gè)BigInteger，我創(chuàng)建了一個(gè)適當(dāng)大小的新BigInteger，然后進(jìn)行了一些記賬，然后調(diào)用以下過程，向其傳遞三個(gè)指針，分別指向左右操作數(shù)及其結(jié)果的數(shù)組的開頭，以及左右肢的數(shù)量。簡碼：class procedure BigInteger.PlainAdd(Left, Right, Result: PLimb; LSize, RSize: Integer); asm// EAX = Left, EDX = Right, ECX = Result PUSH ESI PUSH EDI PUSH EBX MOV ESI,EAX // Left MOV EDI,EDX // Right MOV EBX,ECX // Result MOV ECX,RSize // Number of limbs at Left MOV EDX,LSize // Number of limbs at Right CMP EDX,ECX JAE @SkipSwap XCHG ECX,EDX // Left and LSize should be largest XCHG ESI,EDI // so swap@SkipSwap: SUB EDX,ECX // EDX contains rest PUSH EDX // ECX contains smaller size XOR EDX,EDX @MainLoop: MOV EAX,[ESI + CLimbSize*EDX] // CLimbSize = SizeOf(TLimb) = 4. ADC EAX,[EDI + CLimbSize*EDX] MOV [EBX + CLimbSize*EDX],EAX INC EDX DEC ECX JNE @MainLoop POP EDI INC EDI // Do not change Carry Flag DEC EDI JE @LastLimb@RestLoop: MOV EAX,[ESI + CLimbSize*EDX] ADC EAX,ECX MOV [EBX + CLimbSize*EDX],EAX INC EDX DEC EDI JNE @RestLoop@LastLimb:這段代碼很好用，我對(duì)此非常滿意，直到我注意到，在我的開發(fā)設(shè)置（iMac上的Parallels VM中為Win7）上，有一個(gè)簡單的PURE PASCAL加法例程，在用變量和一些if條款，是更快的比我的平淡，簡單的手工制作的匯編程序。我花了一段時(shí)間才發(fā)現(xiàn)，在某些CPU（包括我的iMac和較舊的筆記本電腦）上，DECor INC和ADCor 的組合SBB可能非常慢。但是，在我的大多數(shù)其他計(jì)算機(jī)上（我還有五臺(tái)PC可以對(duì)其進(jìn)行測(cè)試，盡管其中四臺(tái)完全相同），但是速度卻相當(dāng)快。這使我在“慢速”計(jì)算機(jī)上的代碼快了將近三倍，但在“更快”計(jì)算機(jī)上的代碼卻慢了約20％。因此，現(xiàn)在，作為初始化代碼，我做了一個(gè)簡單的定時(shí)循環(huán)，并用它來決定是否將單元設(shè)置為調(diào)用普通程序或仿真例程。這幾乎總是正確的，但是有時(shí)它會(huì)在應(yīng)該選擇仿真例程的情況下選擇（較慢的）普通例程。但是我不知道這是否是最好的方法。

查看完整描述

3 回答

烙印99

TA貢獻(xiàn)1829條經(jīng)驗(yàn) 獲得超13個(gè)贊

我終于有一些時(shí)間來實(shí)現(xiàn)單寄存器尋址模式。對(duì)于很長的BigIntegers，這相差約12％（總體速度提高）。我認(rèn)為現(xiàn)在沒有什么可以擠出的了。我嘗試使用更小的BigIntegers（最多1到10個(gè)肢體，平均約3個(gè)肢體），并且與簡單的簡單循環(huán)沒有明顯的時(shí)序差異，因此我將使用優(yōu)化的展開循環(huán)例程（即，最后一個(gè)版本）作為替換。它變得不那么容易閱讀，因此我不得不添加一些其他注釋。<g>

反對(duì) 回復(fù) 2019-09-26