麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁(yè) > 編程 > ASM > 正文

匯編語(yǔ)言學(xué)習(xí)筆記(十二)-浮點(diǎn)指令

2019-11-11 01:53:20
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友
浮點(diǎn)數(shù)如何存儲(chǔ)浮點(diǎn)寄存器浮點(diǎn)數(shù)指令浮點(diǎn)計(jì)算例子浮點(diǎn)高級(jí)運(yùn)算CMOV移動(dòng)指令

浮點(diǎn)數(shù)如何存儲(chǔ)

浮點(diǎn)數(shù)的運(yùn)算完全不同于整數(shù),從寄存器到指令,都有一套獨(dú)特的處理流程,浮點(diǎn)單元也稱作x87 FPU。

現(xiàn)在看浮點(diǎn)數(shù)的表示方式,我們所知道的,計(jì)算機(jī)使用二進(jìn)制存儲(chǔ)數(shù)據(jù),所表示的數(shù)字都具有確定性,那是如何表示浮點(diǎn)這種具有近似效果的數(shù)據(jù)呢,答案是通過(guò)科學(xué)計(jì)數(shù),科學(xué)計(jì)數(shù)由符號(hào),尾數(shù)和指數(shù)表示,這三部分都是一個(gè)整數(shù)值,具體來(lái)看一下IEEE二進(jìn)制浮點(diǎn)標(biāo)準(zhǔn):

格式說(shuō)明
單精度32位:符號(hào)占1位,指數(shù)占8位,尾數(shù)中的小數(shù)部分占23位
雙精度64位:符號(hào)占1位,指數(shù)占11位,尾數(shù)中的小數(shù)部分占52位
擴(kuò)展精度80位:符號(hào)占1位,指數(shù)占16位,尾數(shù)中的小數(shù)部分占63位

以單精度為例,在內(nèi)存中的儲(chǔ)存格式如下(左邊為高位):

	| 1位符號(hào) | 8位指數(shù) | 23位尾數(shù) |

其中符號(hào)位1表示負(fù)數(shù),0表示正數(shù),這與整數(shù)形式的符號(hào)位意義相同; 科學(xué)計(jì)數(shù)法表示形式如 m * (b ^ e),m為尾數(shù),b為基數(shù),e是指數(shù),再二進(jìn)制中,基數(shù)毫無(wú)疑問(wèn)是2,對(duì)單精度,指數(shù)為中間8位二進(jìn)制表示的數(shù)字,其中的尾數(shù)是形如1.1101 小數(shù)點(diǎn)后面的整數(shù)值。

關(guān)于指數(shù),由于需要表示正負(fù)兩種數(shù)據(jù),IEEE標(biāo)準(zhǔn)規(guī)定單精度指數(shù)以127為分割線,實(shí)際存儲(chǔ)的數(shù)據(jù)是指數(shù)加127所得結(jié)果,127為高位為零,后7位為1所得,其他雙精度也以此方式計(jì)算。

為了解釋內(nèi)存中浮點(diǎn)數(shù)的存儲(chǔ)方式,舉一個(gè)浮點(diǎn)數(shù)的例子說(shuō)明:

float test = 123.456;int main(){    return 0;}

例子再簡(jiǎn)單不過(guò)了,僅僅定義了一個(gè)全局的float類型,我們通過(guò)gcc -S test.c來(lái)生成匯編,看看123.456是如何存儲(chǔ)的,打開反匯編后的文件,看到符號(hào)_test后定義的數(shù)字是 1123477881(這里gcc定義成了long類型,不過(guò)沒(méi)有關(guān)系,因?yàn)槎际撬淖止?jié)數(shù)字,具體的類型還得看如何使用)。可以使用計(jì)算器把十進(jìn)制數(shù)字轉(zhuǎn)化為二進(jìn)制:0 10000101 11101101110100101111001,這里根據(jù)單精度的劃分方式把32位劃分成三部分,符號(hào)位為0,為正數(shù),指數(shù)為 133,減去127得6,尾數(shù)加上1.,形式為1.11101101110100101111001,擴(kuò)大2 ^ 23次方為111101101110100101111001,十進(jìn)制16181625,后除以2 ^ (23 – 6) = 131072,結(jié)果為123.45600128173828125,與我們所定義的浮點(diǎn)數(shù)正好相符。

浮點(diǎn)寄存器

這里介紹了浮點(diǎn)數(shù)的二進(jìn)制表示,前面說(shuō)過(guò)浮點(diǎn)單元計(jì)算使用獨(dú)立的寄存器,在寄存器那篇也稍有提及,這里詳細(xì)說(shuō)明一下浮點(diǎn)單元的寄存器設(shè)施。

FPU有 8 個(gè)獨(dú)立尋址的80位寄存器,名稱分別為r0, r1, …, r7,他們以堆棧形式組織在一起,統(tǒng)稱為寄存器棧,編寫浮點(diǎn)指令時(shí)棧頂也寫為st(0),最后一個(gè)寄存器寫作st(7)。

FPU另有3個(gè)16位的寄存器,分別為控制寄存器、狀態(tài)寄存器、標(biāo)記寄存器,現(xiàn)一一詳細(xì)說(shuō)明此三個(gè)寄存器的作用:

狀態(tài)寄存器,為用戶記錄浮點(diǎn)計(jì)算過(guò)程中的狀態(tài),其中各位的含義如下:

0 —— 非法操作異常1 —— 非規(guī)格化操作數(shù)異常2 —— 除數(shù)為0異常3 —— 溢出標(biāo)志異常4 —— 下溢標(biāo)志異常5 —— 精度異常標(biāo)志6 —— 堆棧錯(cuò)誤7 —— 錯(cuò)誤匯總狀態(tài)8 —— 條件代碼位0(c0)9 —— 條件代碼位1(c1)10 —— 條件代碼位2 (c2)11-13 —— 堆棧頂指針14 —— 條件代碼位3(c3)15 —— 繁忙標(biāo)志

其中讀取狀態(tài)寄存器內(nèi)容可使用 fstsw %ax

控制寄存器的位含義如下:

0 —— 非法操作異常掩碼 1 —— 非法格式化異常掩碼 2 —— 除數(shù)為0異常掩碼 3 —— 溢出異常掩碼 4 —— 下溢異常掩碼 5 —— 精度異常亞曼 6-7 —— 保留 8-9 —— 精度控制(00單精度,01未使用,10雙精度,11擴(kuò)展精度) 10-11 —— 舍入控制(00舍入到最近,01向下舍入,10向上舍入,11向0舍入) 12 —— 無(wú)窮大控制 13–15 —— 保留

其中讀取控制寄存器和設(shè)置控制寄存器的指令如下:

# 加載到內(nèi)存fstcw control# 加載到控制器fldcw control

最后的標(biāo)志寄存器最為簡(jiǎn)單,分別0-15位分別標(biāo)志r0-r7共8個(gè)寄存器,每個(gè)寄存器占2位,這兩位的含義如下:

11 —— 合法擴(kuò)展精度 01 —— 零 10 —— 特殊浮點(diǎn) 11 —— 無(wú)內(nèi)容

另外對(duì)浮點(diǎn)寄存器的一些控制指令如下:

# 初始化fpu,控制、狀態(tài)設(shè)為默認(rèn)值,但不改變fpu的數(shù)據(jù)finit# 恢復(fù)保存環(huán)境fldenv bufferfstenv buffer#清空浮點(diǎn)異常fnclex#fpu狀態(tài)保存fssave

fstenv 保存控制寄存器、狀態(tài)寄存器、標(biāo)記寄存器、FPU指令指針偏移量、FPU數(shù)據(jù)指針,F(xiàn)PU最后執(zhí)行的操作碼到內(nèi)存中。

浮點(diǎn)數(shù)指令

接下來(lái)將要詳細(xì)說(shuō)明其計(jì)算過(guò)程,要計(jì)算數(shù)據(jù)首先得看如何從內(nèi)存中加載數(shù)據(jù)到寄存器,同時(shí)把結(jié)果從寄存器取出到內(nèi)存,除了加載內(nèi)存中的浮點(diǎn)數(shù)據(jù)指令,另外還有一些常量的加載,現(xiàn)列舉如下:

指令說(shuō)明
finit初始化控制和狀態(tài)寄存器,不改變fpu數(shù)據(jù)寄存器
fstcw control將控制寄存器內(nèi)容放到內(nèi)存control處
fstsw status將狀態(tài)寄存器內(nèi)容放到內(nèi)存status處
flds value加載內(nèi)存中的單精浮點(diǎn)到fpu寄存器堆棧
fldl value加載內(nèi)存中的雙精浮點(diǎn)到fpu寄存器堆棧
fldt value加載內(nèi)存中的擴(kuò)展精度點(diǎn)到fpu寄存器堆棧
fld %st(i)將%st(i)寄存器數(shù)據(jù)壓入fpu寄存器堆棧
fsts value單精度數(shù)據(jù)保存到value,不出棧
fstl value雙精度數(shù)據(jù)保存到value,不出棧
fstt value擴(kuò)展精度數(shù)據(jù)保存到value,不出棧
fstps value單精度數(shù)據(jù)保存到value,出棧
fstpl value雙精度數(shù)據(jù)保存到value,出棧
fstpt value擴(kuò)展精度數(shù)據(jù)保存到value,出棧
fxch %st(i)交換%st(0)和%st(i)
fld1把 +1.0 壓入 FPU 堆棧中
fldl2t把 10 的對(duì)數(shù)(底數(shù)2)壓入 FPU 堆棧中
fldl2e把 e 的對(duì)數(shù)(底數(shù)2)壓入 FPU 堆棧中
fldpi把 pi 的值壓入 FPU 堆棧中
fldlg2把 2 的對(duì)數(shù)(底數(shù)10)壓入 FPU 堆棧中
fldln2把 2 的對(duì)數(shù)(底數(shù)e) 壓入堆棧中
fldz把 +0.0 壓入壓入堆棧中

以上指令雖多,但是還是很有規(guī)律,前綴f表示fpu操作,ld加載,st保存設(shè)置,p后綴彈出堆棧,s、l、t后綴表示單精度,雙精度,擴(kuò)展精度,c后綴表 示控制寄存器,s后綴表示狀態(tài)寄存器。當(dāng)然這僅僅是對(duì)AT&T語(yǔ)法而言,對(duì)MASM語(yǔ)法沒(méi)有s,l,t之分,需要使用type ptr來(lái)指明精度,即內(nèi)存大小。

學(xué)會(huì)靈活的加載彈出數(shù)據(jù)堆棧后,接下來(lái)就要看一些基本的計(jì)算:

fadd    浮點(diǎn)加法fdiv    浮點(diǎn)除法fdivr   反向浮點(diǎn)除法fmul    浮點(diǎn)乘法fsub    浮點(diǎn)減法fsubr   反向浮點(diǎn)減法

對(duì)于以上的每種指令,有幾種指令格式,以fadd為例,列舉如下:

# 內(nèi)從中的32位或者64位值和%st(0)相加fadd source# 把%st(x)和%st(0)相加,結(jié)果存入%st(0)fadd %st(x), %st(0)# 把%st(0)和%st(x)相加,結(jié)果存入%st(x)fadd %st(0), %st(x)# 把%st(0)和%st(x)相加,結(jié)果存入%st(x),彈出%st(0)faddp %st(0), %st(x)# 把%st(0)和%st(1)相加,結(jié)果存入%st(1),彈出%st(0)faddp# 把16位或32位整數(shù)與%st(0)相加,結(jié)果存入%st(0)fiadd source

這僅僅是對(duì)AT&T語(yǔ)法而言,對(duì)MASM源操作數(shù)與目的操作數(shù)相反!另外,對(duì)AT&T,與內(nèi)存相關(guān)指令可加s、l指定內(nèi)存精度。其中反向加法和反向除法是計(jì)算過(guò)程中目的與源反向計(jì)算。

浮點(diǎn)計(jì)算例子

接下來(lái)舉一個(gè)AT&T語(yǔ)法的例子,來(lái)計(jì)算表達(dá)式的值 ( 12.34 * 13 ) + 334.75 ) / 17.8 :

# ( 12.34 * 13 ) + 334.75 ) / 17.8.section .data    values: .float 12.34, 13, 334.75, 17.8    result: .double 0.0    outstring: .asciz "result is %f/n".section .text.globl _main_main:    leal values, %ebx    flds 12(%ebx)    flds 8(%ebx)    flds 4(%ebx)    flds (%ebx)    fmulp    faddp    fdivp %st(0), %st(1)    fstl result    leal result, %ebx    pushl 4(%ebx)    pushl (%ebx)    pushl $outstring    call _PRintfend:    pushl $0    call _exit

前四個(gè)flds加載所有的數(shù)據(jù)到寄存器堆棧,可以單步運(yùn)行并是用gdb的print $st0打印堆棧寄存器的值,可以看到為什么是堆棧寄存器。需要說(shuō)明的是由于printf的%f是double類型的輸出,所以最后要把一個(gè)8字節(jié)浮點(diǎn)放 到棧中傳遞,最終結(jié)果為27.818541,可以看到與計(jì)算器計(jì)算的結(jié)果近似相等。

浮點(diǎn)高級(jí)運(yùn)算

除了基本的浮點(diǎn)計(jì)算,x87還提供了一些諸如余弦運(yùn)算等高級(jí)計(jì)算功能:

指令說(shuō)明
f2xm1計(jì)算2的乘方(次數(shù)為st0中的值,減去1
fabs計(jì)算st0中的絕對(duì)值
fchs改變st0中的值的符號(hào)
fcos計(jì)算st0中的值的余弦
fpatan計(jì)算st0中的值的部分反正切
fprem計(jì)算st0中的值除以st1的值的部分余數(shù)
fprem1計(jì)算st0中的值除以st1的值的IEEE部分余弦
fptan計(jì)算st0中的值的部分正切
frndint把st0中的值舍入到最近的整數(shù)
fscale計(jì)算st0乘以2的st1次方
fsin計(jì)算st0中的值的正弦
fsincos計(jì)算st0中的值的正弦和余弦
fsqrt計(jì)算st0中的值的平方根
fyl2x計(jì)算st1*log st0 以2為底
fyl2xp1計(jì)算st1*log (st0 + 1) 以2為底

下面來(lái)看一下浮點(diǎn)條件分支,浮點(diǎn)數(shù)的比較不像整數(shù),可以容易的使用cmp指令比較,判斷eflags的值,關(guān)于浮點(diǎn)數(shù)比較,fpu提供獨(dú)立的比較機(jī)制和指令,現(xiàn)對(duì)這組比較指令進(jìn)行說(shuō)明:

指令說(shuō)明
fcom比較st0和st1寄存器的值
fcom %st(x)比較st0和stx寄存器的值
fcom source比較st0和32/64位內(nèi)存值
fcomp比較st0和st1寄存器的值,并彈出堆棧
fcomp %st(x)比較st0和stx寄存器的值,并彈出堆棧
fcomp source比較st0和32/64位內(nèi)存值,并彈出堆棧
fcompp比較st0和st1寄存器的值,并兩次彈出堆棧
ftst比較st0和0.0

浮點(diǎn)數(shù)比較的結(jié)果放入狀態(tài)寄存器的c0,c2,c3條件代碼位中,其值如下:

結(jié)果c3c2c0
st0 > source000
st0 < source001
st0 = source100

如此倘若直接判斷c0,c2,c3的值比較繁瑣,所以可以使用一些技巧,首先使用fstsw指令獲得fpu狀態(tài)寄存器的值并存入ax,再使用sahf指令把 ah寄存器中的值加載到eflags寄存器中,sahf指令把a(bǔ)h寄存器的第0、2、4、6、7分別傳送至進(jìn)位、奇偶、對(duì)準(zhǔn)、零、符號(hào)位,不影響其他標(biāo) 志,ah寄存器中這些位剛好包含fpu狀態(tài)寄存器的條件代碼值,所以通過(guò)fstsw和sahf指令組合,可以傳送如下值:

把c0位傳送到eflags的進(jìn)位標(biāo)志 把c2位傳送到eflags的奇偶校驗(yàn)標(biāo)志 把c3位傳送到eflags的零標(biāo)志

傳送完畢后,可以用條件跳轉(zhuǎn)使用不同的結(jié)果值,另外需要說(shuō)明的是浮點(diǎn)數(shù)相等判斷,因?yàn)楦↑c(diǎn)數(shù)本身存儲(chǔ)結(jié)構(gòu)決定了它僅僅是一個(gè)近似值,所以不能直接判斷是否相 等,這樣可能與自己預(yù)期的結(jié)果不同,應(yīng)該判斷兩個(gè)浮點(diǎn)數(shù)之差是否在一個(gè)很小的誤差范圍內(nèi),來(lái)決定這兩個(gè)浮點(diǎn)數(shù)是否相等。

根據(jù)上面的技巧,使用fstsw和fpu指令組合,可以方便的使用浮點(diǎn)判斷結(jié)果,這對(duì)我們是一種便利,而intel的工程師又為我們?cè)O(shè)計(jì)了一個(gè)組合指令,fcomi指令執(zhí)行浮點(diǎn)比較結(jié)果并把結(jié)果存放到eflags寄存器的進(jìn)位,奇偶,和零標(biāo)志。

指令說(shuō)明
fcomi比較st0和stx寄存器的值
fcomip比較st0和stx寄存器,并彈出堆棧
fucomi比較之前檢查無(wú)序值
fucomip比較之前檢查無(wú)序值,之后彈出堆棧

判斷結(jié)束后eflags的標(biāo)志設(shè)置如下:

結(jié)果ZFPFCF
st0 > st(x)000
st0 < st(x)001
st0 = st(x)100

CMOV移動(dòng)指令

最后介紹的是類似cmov的指令,根據(jù)判斷結(jié)果決定是否需要移動(dòng)數(shù)據(jù),其AT&T格式為 fcmovxx source, destination,其中source是st(x)寄存器,destination是st(0)寄存器。

指令說(shuō)明
fcmovb如果st(0)小于st(x),則進(jìn)行傳送
fcmove如果st(0)等于st(x),則進(jìn)行傳送
fcmovbe如果st(0)小于或等于st(x),則進(jìn)行傳送
fcmovu如果st(0)無(wú)序,則進(jìn)行傳送
fcmovnb如果st(0)不小于st(x),則進(jìn)行傳送
fcmovne如果st(0)不等于st(x),則進(jìn)行傳送
fcmovnbe如果st(0)不小于或等于st(x),則進(jìn)行傳送
fcmovnu如果st(0)非無(wú)序,則進(jìn)行傳送

以上可以看出,無(wú)論從寄存器的操作,還是計(jì)算過(guò)程,都比整數(shù)運(yùn)算要繁瑣的多,而且看似很簡(jiǎn)單的一個(gè)表達(dá)式,轉(zhuǎn)化成浮點(diǎn)匯編需要做很多工作,由于其復(fù)雜性,同 一個(gè)表達(dá)式可以有多種運(yùn)算過(guò)程,當(dāng)然其中的效率相差很大,這依賴于對(duì)浮點(diǎn)匯編的理解程度,好在有高級(jí)語(yǔ)言處理相關(guān)工作,編寫浮點(diǎn)指令的情況比較少見。


發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表

圖片精選

主站蜘蛛池模板: 久久精品视频国产 | 黄色的视频免费观看 | 亚洲乱码精品久久久久 | 久色亚洲 | 日韩精品一二三区 | 欧美日韩手机在线观看 | 一级黄色在线观看 | 亚洲小视频在线 | 成人福利视频导航 | 久久99久久99精品 | 欧美视频在线观看一区 | 久久国产精品影视 | 久久精品视频一区 | 久久精片 | 免费视频一区 | 欧美一级做一级爱a做片性 91在线视频观看 | h久久| 在线播放黄色网址 | 噜噜在线视频 | 欧美精品v国产精品v日韩精品 | 欧美日韩在线看片 | 日本在线视频免费 | 91免费高清视频 | 91精品国产乱码久久久久久久久 | 国产日韩欧美一区 | 日韩黄色免费电影 | 精品成人av一区二区在线播放 | 国产精品毛片va一区二区三区 | 国产精品久久久久久久久久久久久久久久 | 亚洲日色| 国产精品av久久久久久网址 | 日韩黄色av网站 | 欧日韩 | 一级大片一级一大片 | 中文字幕亚洲一区二区三区 | 国产九色视频在线观看 | 国产毛片在线看 | 免费一级毛片在线播放视频 | 日本黄色免费播放 | 久久久国产精品电影 | 成人在线国产 |