#include<stdio.h>
定義函數 int sscanf (const char *str,const char * format,........);
sscanf()會將參數str的字符串根據參數format字符串來轉換并格式化數據。格式轉換形式請參考scanf()。轉換后的結果存于對應的參數內。
scanf以及sscanf實際上是支持部分正則表達式的,sscanf提供的這個擴展功能其實并不能真正稱為正則表達式,因為他的書寫還是離不開%,而且也很局限。sscanf的這個擴展功能支持[]表示支付范圍,{}表示重復次數,^表示取非,*表示跳過。
說明: sscanf與scanf類似,都是用于輸入的,只是后者以屏幕(stdin)為輸入源,前者以固定字符串為輸入源。 其中的format可以是一個或多個 {%[*] [width] [{h | l | I64 | L}]type | ' ' | '/t' | '/n' | 非%符號} 注: 1、 * 亦可用于格式中, (即 %*d 和 %*s) 加了星號 (*) 表示跳過此數據不讀入. (也就是不把此數據讀入參數中) 2、{a|b|c}表示a,b,c中選一,[d],表示可以有d也可以沒有d?! ?、width表示讀取寬度?! ?、{h | l | I64 | L}:參數的size,通常h表示單字節size,I表示2字節 size,L表示4字節size(double例外),l64表示8字節size?! ?、type :這就很多了,就是%s,%d之類?! ?、特別的:%*[width] [{h | l | I64 | L}]type 表示滿足該條件的被過濾掉,不會向目標參數中寫入值 支持集合操作: %[a-z] 表示匹配a到z中任意字符,貪婪性(盡可能多的匹配) %[aB'] 匹配a、B、'中一員,貪婪性 %[^a] 匹配非a的任意字符,貪婪性舉例:char url[] = "dv://192.168.1.253:65001/1/1"sscanf(url,"%[^://]%*c%*c%*c%[^:]%*c%d%*c%d%*c%d",PRotocol,ip,port,chn,type);解釋一下
先取得一個最長的字符串,但不包括字串://,于是protocol="dv/0";
然后跳過三個字符(%*c),其實就是跳過://
接著取一個字符串不包括字符串:,于是ip=192.168.1.253,這里簡化處理了,IP就當個字符串來弄,而且不做檢查
然后跳過冒號取端口到port,再跳過/取通道號到chn,再跳過/取碼流類型到type。
是不是覺得還不過癮?我也覺得,接著舉例。
sscanf("Phil/nChang","%[^/n]%*c%s",first_name,last_name);
解釋:跳過一個換行符,取first_name和last_name
實驗1:
sscanf( "123456" , "%s" , str) ; ---------str的值為 "123456/0!!!"
這個實驗很簡單,把源字符串"123456"拷貝到str的前6個字符,并且把str的第7個字符設為null字符,也就是/0
實驗2:
sscanf( "123456" , "%3s" , str) ; ---------str的值為 "123/0!!!!!!"
看到沒有,正則表達式的百分號后面多了一個3,這告訴sscanf只拷貝3個字符給str,然后把第4個字符設為null字符。
實驗3:
sscanf( "aaaAAA" , "%[a-z]" , str) ; ---------str的值為 "aaa/0!!!!!!"
從這個實驗開始我們會使用正則表達式,括號里面的a-z就是一個正則表達式,它可以表示從a到z的任意字符,
在 繼續討論之前,我們先來看看百分號表示什么意思,%表示選擇 ,%后面的是條件,比如實驗1的"%s",s是一個條件,表示任意字符,"%s"的意思是:只 要輸入的東西是一個字符,就把它拷貝給str。實驗2的"%3s"又多了一個條件:只拷貝3個字符。實驗3的“%[a-z]”的條件稍微嚴格一些,輸入的 東西不但是字符,還得是一個小寫字母的字符,所以實驗3只拷貝了小寫字母"aaa"給str,別忘了加上null字符。
實驗4:
sscanf( "AAAaaaBBB" , "%[^a-z]" , str) ; ---------str的值為 "AAA/0!!!!!!"
對 于所有字符,只要不是小寫字母,都滿足"^a-z"正則表達式,符號^表示邏輯非。前3個字符都不是小寫字符,所以將其拷貝給str,但最后3個字符也不 是小寫字母,為什么不拷貝給str呢?這是因為當碰到不滿足條件的字符后,sscanf就會停止執行,不再掃描之后的字符。
實驗5:
sscanf( "AAAaaaBBB" , "%[A-Z]%[a-z]" , str) ; ---------段錯誤
這 個實驗的本意是:先把大寫字母拷貝給str,然后把小寫字母拷貝給str,但很不幸,程序運行的時候會發生段錯誤,因為當sscanf掃描到字符a時,違 反了條件"%[A-Z]",sscanf就停止執行,不再掃描之后的字符,所以第二個條件也就沒有任何意義,這個實驗說明:不能使用%號兩次或兩次以上
實驗6:
sscanf( "AAAaaaBBB" , "%*[A-Z]%[a-z]" , str) ; ---------str的值為 "aaa/0!!!!!!"
這 個實驗出現了一個新的符號:%*,與%相反,%*表示過濾 滿足條件的字符,在這個實驗中,%*[A-Z]過濾了所有大寫字母,然后再使用%[a-z]把之 后的小寫字母拷貝給str。如果只有%*,沒有%的話,sscanf不會拷貝任何字符到str,這時sscanf的作用僅僅是過濾字符串。
實驗7:
sscanf( "AAAaaaBBB" , "%[a-z]" , str) ; ---------str的值為 "!!!!!!!!!!"
做完前面幾個實驗后,我們都知道sscanf拷貝完成后,還會在str的后面加上一個null字符,但如果沒有一個字符滿足條件,sscanf不會在str的后面加null字符,str的值依然是10個驚嘆號。這個實驗也說明了,如果不使用%*過濾掉前面不需要的字符,你永遠別想取得中間的字符。
實驗8:
sscanf( "AAAaaaBC=" , "%*[A-Z]%*[a-z]%[^a-z=]" , str) ; ---------str的值為 "BC/0!!!!!!!"
這是一個綜合實驗,但這個實驗的目的不是幫我們復習前面所學的知識,而是展示兩個值得注意的地方:
注意1:%只能使用一次,但%*可以使用多次,比如在這個實驗里面,先用%*[A-Z]過濾大寫字母,然后用%*[a-z]過濾小寫字母。
注意2:^后面可以帶多個條件,且這些條件都受^的作用,比如^a-z=表示^a-z且^=(既不是小寫字母,也不是等于號)。
實驗9:
int k;
sscanf( "AAA123BBB456" , "%*[^0-9]%i" , &k) ; ---------k的值為123
首先,%*[^0-9]過濾前面非數字的字符,然后用%i把數字字符轉換成int型的整數,拷貝到變量k,注意參數必須使用k的地址。
例子: 1. 常見用法。 char buf[512] = ; sscanf("123456 ", "%s", buf); printf("%s/n", buf); 結果為:123456 2. 取指定長度的字符串。如在下例中,取最大長度為4字節的字符串。 sscanf("123456 ", "%4s", buf); printf("%s/n", buf); 結果為:1234 3. 取到指定字符為止的字符串。如在下例中,取遇到空格為止字符串。 sscanf("123456 abcdedf", "%[^ ]", buf); printf("%s/n", buf); 結果為:123456 4. 取僅包含指定字符集的字符串。如在下例中,取僅包含1到9和小寫字母的字符串。 sscanf("123456abcdedfBCDEF", "%[1-9a-z]", buf); printf("%s/n", buf); 結果為:123456abcdedf 5. 取到指定字符集為止的字符串。如在下例中,取遇到大寫字母為止的字符串。 sscanf("123456abcdedfBCDEF", "%[^A-Z]", buf); printf("%s/n", buf); 結果為:123456abcdedf 6、給定一個字符串iios/12DDWDFF@122,獲取 / 和 @ 之間的字符串,先將 "iios/"過濾掉,再將非'@'的一串內容送到buf中 sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf); printf("%s/n", buf); 結果為:12DDWDFF 7、給定一個字符串““hello, world”,僅保留world。(注意:“,”之后有一空格) sscanf(“hello, world”, "%*s%s", buf); printf("%s/n", buf); 結果為:world %*s表示第一個匹配到的%s被過濾掉,即hello被過濾了 如果沒有空格則結果為NULL。 sscanf的功能很類似于正則表達式, 但卻沒有正則表達式強大,所以如果對于比較復雜的字符串處理,建議使用正則表達式. //------------------------------------------------------- sscanf,表示從字符串中格式化輸入 上面表示從str中,輸入數字給x,就是32700 久以前,我以為c沒有自己的split string函數,后來我發現了sscanf;一直以來,我以為sscanf只能以空格來界定字符串,現在我發現我錯了。 sscanf是一個運行時函數,原形很簡單: int sscanf( const char *buffer, const char *format [, argument ] ... ); 它強大的功能體現在對format的支持上。 我以前用它來分隔類似這樣的字符串2006:03:18: int a, b, c; sscanf("2006:03:18", "%d:%d:%d", a, b, c); 以及2006:03:18 - 2006:04:18: char sztime1[16] = "", sztime2[16] = ""; sscanf("2006:03:18 - 2006:04:18", "%s - %s", sztime1, sztime2); 但是后來,我需要處理2006:03:18-2006:04:18 僅僅是取消了‘-’兩邊的空格,卻打破了%s對字符串的界定。 我需要重新設計一個函數來處理這樣的情況?這并不復雜,但是,為了使所有的代碼都有統一的風格,我需要改動很多地方,把已有的sscanf替換成我自己的分割函數。我以為我肯定需要這樣做,并伴隨著對sscanf的強烈不滿而入睡;一覺醒來,發現其實不必。 format-type中有%[]這樣的type field。如果讀取的字符串,不是以空格來分隔的話,就可以使用%[]。 %[]類似于一個正則表達式。[a-z]表示讀取a-z的所有字符,[^a-z]表示讀取除a-z以外的所有字符。 所以那個問題也就迎刃而解了: sscanf("2006:03:18 - 2006:04:18", "%[0-9,:] - %[0-9,:]", sztime1, sztime2);
|
新聞熱點
疑難解答