引言 本文之初的目的是講述設計模式中的 PRototype(原型)模式,但是如果想較清楚地弄明白這個模式,需要了解對象克隆(Object Clone),Clone 其實也就是對象復制。復制又分為了淺度復制(Shallow Copy)和 深度復制(Deep Copy),淺度復制 和 深度復制又是以 如何復制引用類型成員來劃分的。由此又引出了 引用類型 和 值類型,以及相關的對象判等、裝箱、拆箱等基礎知識。
于是我干脆新起一篇,從最基礎的類型開始自底向上寫起了。我僅僅想將對于這個主題的理解表述出來,一是總結和復習,二是交流經驗,或許有地方我理解的有偏差,希望指正。如果前面基礎的內容對你來說過于簡單,可以跳躍閱讀。
值類型 和 引用類型 我們先簡單回顧一下 C#中的類型系統。C# 中的類型一共分為兩類,一類是值類型(Value Type),一類是引用類型(Reference Type)。值類型 和 引用類型是以它們在計算機內存中是如何被分配的來劃分的。值類型包括 結構和枚舉,引用類型包括 類、接口、委托 等。還有一種特殊的值類型,稱為簡單類型(Simple Type),比如 byte,int 等,這些簡單類型實際上是 FCL類庫類型的別名,比如聲明一個 int 類型,實際上是聲明一個 System.Int32 結構類型。因此,在 Int32 類型中定義的操作,都可以應用在 int 類型上,比如 “123.Equals(2)”。 所有的 值類型 都隱式地繼承自 System.ValueType 類型(注意 System.ValueType 本身是一個類類型),System.ValueType 和所有的引用類型都繼承自 System.Object 基類。你不能顯示地讓結構繼承一個類,因為 C#不支持多重繼承,而結構已經隱式繼承自 ValueType。
NOTE:堆棧(stack)是一種后進先出的數據結構,在內存中,變量會被分配在堆棧上來進行操作。堆(heap)是用于為類型實例(對象)分配空間的內存區域,在堆上創建一個對象,會將對象的地址傳給堆棧上的變量(反過來叫變量指向此對象,或者變量引用此對象)。
1.值類型 當聲明一個值類型的變量(Variable)的時候,變量本身包含了值類型的全部字段,該變量會被分配在線程堆棧(Thread Stack)上。 假如我們有這樣一個值類型,它代表了直線上的一點:
public struct ValPoint { public int x; public ValPoint(int x) { this.x = x; } }
當我們在程序中寫下這樣的一條變量的聲明語句時:
ValPoint vPoint1;
實際產生的效果是聲明了 vPoint1 變量,變量本身包含了值類型的所有字段(即你想要的所有數據)。
NOTE:如果觀察 MSIL 代碼,會發現此時變量還沒有被壓到棧上,因為.maxstack(最高棧數) 為 0。并且沒有看到入棧的指令,這說明只有對變量進行操作,才會進行入棧。
因為變量已經包含了值類型的所有字段,所以,此時你已經可以對它進行操作了(對變量進行操作,實際上是一系列的入棧、出棧操作)。
vPoint1.x = 10; Console.WriteLine(vPoint.x); // 輸出 10
NOTE:如果 vPoint1是一個引用類型(比如 class),在運行時會拋出 NullReferenceException異常。因為 vPoint 是一個值類型,不存在引用,所以永遠也不會拋出 NullReferenceException。
如果你不對 vPoint.x 進行賦值,直接寫 Console.WriteLine(vPoint.x),則會出現編譯錯誤:使用了未賦值的局部變量。產生這個錯誤是因為.Net 的一個約束:所有的元素使用前都必須初始化。比如這樣的語句也會引發這個錯誤:
int i; Console.WriteLine(i);
解決這個問題我們可以通過這樣一種方式:編譯器隱式地會為結構類型創建了無參數構造函數。在這個構造函數中會對結構成員進行初始化,所有的值類型成員被賦予 0 或相當于 0 的值(針對 Char 類型),所有的引用類型被賦予 null 值。(因此,Struct 類型不可以自行聲明無參數的構造函數)。所以,我們可以通過隱式聲明的構造函數去創建一個 ValPoint 類型變量:
ValPoint vPoint1 = new ValPoint(); Console.WriteLine(vPoint.x); // 輸出為0
我們將上面代碼第一句的表達式由“=”分隔拆成兩部分來看:
A左邊 ValPoint vPoint1,在堆棧上創建一個 ValPoint 類型的變量 vPoint,結構的所有成員均未賦值。在進行 new ValPoint()之前,將 vPoint 壓到棧上。 B右邊 new ValPoint(),new 操作符不會分配內存,它僅僅調用 ValPoint 結構的默認構造函數,根據構造函數去初始化 vPoint 結構的所有字段。 注意上面這句,new 操作符不會分配內存,僅僅調用 ValPoint 結構的默認構造函數去初始化 vPoint 的所有字段。那如果我這樣做,又如何解釋呢?
Console.WriteLine((new ValPoint()).x); // 正常,輸出為0
在這種情況下,會創建一個臨時變量,然后使用結構的默認構造函數對此臨時變量進行初始化。我知道我這樣很沒有說服力,所以我們來看下 MS IL 代碼,為了節省篇幅,我只節選了部分:
.locals init ([0] valuetype Prototype.ValPoint CS$0$0000) // 聲明臨時變量 IL_0000: nop IL_0001: ldloca.s CS$0$0000 // 將臨時變量壓棧 IL_0003: initobj Prototype.ValPoint // 初始化此變量
而對于 ValPoint vPoint = new ValPoint(); 這種情況,其 MSIL 代碼是:
.locals init ([0] valuetype Prototype.ValPoint vPoint) // 聲明vPoint IL_0000: nop IL_0001: ldloca.s vPoint // 將vPoint 壓棧 IL_0003: initobj Prototype.ValPoint // 使用initobj初始化此變量
那么當我們使用自定義的構造函數時,ValPoint vPoint = new ValPoint(10),又會怎么樣呢?通過下面的代碼我們可以看出,實際上會使用 call 指令(instruction)調用我們自定義的構造函數,并傳遞 10 到參數列表中。
.locals init ([0] valuetype Prototype.ValPoint vPoint) IL_0000: nop IL_0001: ldloca.s vPoint // 將 vPoint 壓棧 IL_0003: ldc.i4.s 10 // 將 10 壓棧 // 調用構造函數,傳遞參數 IL_0005: call instance void Prototype.ValPoint::.ctor(int32)
對于上面的 MSIL 代碼不清楚不要緊,有的時候知道結果就已經夠用了。關于 MSIL 代碼,有空了我會為大家翻譯一些好的文章。
2.引用類型 當聲明一個引用類型變量的時候,該引用類型的變量會被分配到堆上,這個變量將用于保存位于堆上的該引用類型的實例 的內存地址,變量本身不包含對象的數據。此時,如果僅僅聲明這樣一個變量,由于在堆上還沒有創建類型的實例,因此,變量值為 null,意思是不指向任何類型實例(堆上的對象)。對于變量的類型聲明,用于限制此變量可以保存的類型實例的地址。 如果我們有一個這樣的類,它依然代表直線上的一點:
public class RefPoint { public int x; public RefPoint(int x) { this.x = x; } public RefPoint() {} }
當我們僅僅寫下一條聲明語句:
RefPoint rPoint1;
它的效果就向下圖一樣,僅僅在堆棧上創建一個不包含任何數據,也不指向任何對象(不包含創建再堆上的對象的地址)的變量。 而當我們使用 new 操作符時:
rPoint1= new RefPoint(1);
會發生這樣的事: 1. 在應用程序堆 (Heap)上創建一個引用類型 (Type)的實例 (Instance)或者叫對象(Object),并為它分配內存地址。 2. 自動傳遞該實例的引用給構造函數。(正因為如此,你才可以在構造函數中使用 this來訪問這個實例。) 3. 調用該類型的構造函數。 4. 返回該實例的引用(內存地址),賦值給 rPoint 變量。
3.關于簡單類型 很多文章和書籍中在講述這類問題的時候,總是喜歡用一個 int 類型作為 值類型 和一個Object 類型 作為引用類型來作說明。本文中將采用自定義的一個 結構 和 類 分別作值類型和引用類型的說明。這是因為簡單類型(比如 int)有一些 CLR 實現了的行為,這些行為會讓我們對一些操作產生誤解。 舉個例子,如果我們想比較兩個 int 類型是否相等,我們會通常這樣:
int i = 3; int j = 3; if(i==j) Console.WriteLine("i equals to j");
但是,對于自定義的值類型,比如結構,就不能用 “==”來判斷它們是否相等,而需要在變量上使用 Equals()方法來完成。 再舉個例子,大家知道 string 是一個引用類型,而我們比較它們是否相等,通常會這樣做:
string a = "123456"; string b = "123456"; if(a == b) Console.WriteLine("a Equals to b");
實際上,在后面我們就會看到,當使用“==”對引用類型變量進行比較的時候,比較的是它們是否指向的堆上同一個對象。而上面 a、b 指向的顯然是不同的對象,只是對象包含的值相同,所以可見,對于 string 類型,CLR 對它們的比較實際上比較的是值,而不是引用。
為了避免上面這些引起的混淆,在對象判等部分將采用自定義的結構和類來分別說明。
裝箱 和 拆箱 這部分內容可深可淺,本文只簡要地作一個回顧。簡單來說,裝箱 就是 將一個值類型轉換成等值的引用類型。它的過程分為這樣幾步: 1. 在堆上為新生成的對象(該對象包含數據,對象本身沒有名稱)分配內存。 2. 將 堆棧上 值類型變量的值拷貝到 堆上的對象 中。 3. 將堆上創建的對象的地址返回給引用類型變量(從程序員角度看,這個變量的名稱就好像堆上對象的名稱一樣)。 當我們運行這樣的代碼時:
int i = 1; Object boxed = i; Console.WriteLine("Boxed Point: " + boxed);
效果圖是這樣的: MSIL 代碼是這樣的:
.method private hidebysig static void Main(string[] args) cil managed { .entrypoint // 代碼大小 19 (0x13) .maxstack 1 // 最高棧數是1,裝箱操作后i會出棧 .locals init ([0] int32 i, // 聲明變量 i(第1個變量,索引為0) [1] object boxed) // 聲明變量 boxed (第2個變量,索引為1) IL_0000: nop IL_0001: ldc.i4.s 10 //#1 將10壓棧 IL_0003: stloc.0 //#2 10 出棧,將值賦給 i IL_0004: ldloc.0 //#3 將i壓棧 IL_0005: box [mscorlib]System.Int32 //#4 i出棧,對i裝箱(復制值到堆,返回地址) IL_000a: stloc.1 //#5 將返回值賦給變量 boxed IL_000b: ldloc.1 // 將 boxed 壓棧 // 調用WriteLine()方法 IL_000c: call void [mscorlib]System.Console::WriteLine(object) IL_0011: nop IL_0012: ret } // end of method Program::Main
而拆箱則是將一個 已裝箱的引用類型 轉換為值類型:
int i = 1; Object boxed = i; int j; j = (int)boxed; // 顯示聲明 拆箱后的類型 Console.WriteLine("UnBoxed Point: " + j);
需要注意的是:UnBox 操作需要顯示聲明拆箱后轉換的類型。它分為兩步來完成: 1. 獲取已裝箱的對象的地址。 2. 將值從堆上的對象中拷貝到堆棧上的值變量中。
對象判等 因為我們要提到對象克隆(復制),那么,我們應該有辦法知道復制前后的兩個對象是否相等。所以,在進行下面的章節前,我們有必要先了解如何進行對象判等。
NOTE:有機會較深入地研究這部分內容,需要感謝 微軟的開源 以及 VS2008 的FCL調試功能。關于如何調試 FCL 代碼,請參考 Configuring Visual Studio to Debug .NET Framework Source Code。
我們先定義用作范例的兩個類型,它們代表直線上的一點,唯一區別是一個是引用類型class,一個是值類型 struct:
public class RefPoint{ // 定義一個引用類型 public int x; public RefPoint(int x) { this.x = x; } } public struct ValPoint { // 定義一個值類型 public int x; public ValPoint(int x) { this.x = x; } }
1.引用類型判等 我們先進行引用類型對象的判等,我們知道在 System.Object 基類型中,定義了實例方法Equals(object obj) , 靜 態 方 法 Equals(object objA, object objB) , 靜 態 方 法 ReferenceEquals(object objA, object objB) 來進行對象的判等。 我們先看看這三個方法,注意我在代碼中用 #number 標識的地方,后文中我會直接引用:
public static bool ReferenceEquals (Object objA, Object objB) { return objA == objB; // #1 } public virtual bool Equals(Object obj) { return InternalEquals(this, obj); // #2 } public static bool Equals(Object objA, Object objB) { if (objA==objB) // #3 return true; if (objA==null || objB==null) return false; return objA.Equals(objB); // #4 }
我們先看 ReferenceEquals(object objA, object objB)方法,它實際上簡單地返回 objA == objB,所以,在后文中,除非必要,我們統一使用 objA == objB(省去了 ReferenceEquals 方法)。另外,為了范例簡單,我們不考慮對象為 null 的情況。 我們來看第一段代碼:
// 復制對象引用 bool result; RefPoint rPoint1 = new RefPoint(1); RefPoint rPoint2 = rPoint1; result = (rPoint1 == rPoint2); // 返回 true; Console.WriteLine(resul
新聞熱點
疑難解答