C# 類型基礎——你可能忽略的技術細節

2019-11-17 03:11:00

字體：大中小

來源：轉載

供稿：網友

C# 類型基礎——你可能忽略的技術細節

引言　　本文之初的目的是講述設計模式中的 PRototype(原型)模式，但是如果想較清楚地弄明白這個模式，需要了解對象克隆(Object Clone)，Clone 其實也就是對象復制。復制又分為了淺度復制(Shallow Copy)和深度復制(Deep Copy)，淺度復制和深度復制又是以如何復制引用類型成員來劃分的。由此又引出了引用類型和值類型，以及相關的對象判等、裝箱、拆箱等基礎知識。

　　于是我干脆新起一篇，從最基礎的類型開始自底向上寫起了。我僅僅想將對于這個主題的理解表述出來，一是總結和復習，二是交流經驗，或許有地方我理解的有偏差，希望指正。如果前面基礎的內容對你來說過于簡單，可以跳躍閱讀。

值類型和引用類型 　　我們先簡單回顧一下 C#中的類型系統。C# 中的類型一共分為兩類，一類是值類型(Value Type)，一類是引用類型(Reference Type)。值類型和引用類型是以它們在計算機內存中是如何被分配的來劃分的。值類型包括結構和枚舉，引用類型包括類、接口、委托等。還有一種特殊的值類型，稱為簡單類型(Simple Type)，比如 byte，int 等，這些簡單類型實際上是 FCL類庫類型的別名，比如聲明一個 int 類型，實際上是聲明一個 System.Int32 結構類型。因此，在 Int32 類型中定義的操作，都可以應用在 int 類型上，比如 “123.Equals(2)”。　　所有的值類型都隱式地繼承自 System.ValueType 類型(注意 System.ValueType 本身是一個類類型)，System.ValueType 和所有的引用類型都繼承自 System.Object 基類。你不能顯示地讓結構繼承一個類，因為 C#不支持多重繼承，而結構已經隱式繼承自 ValueType。

　　NOTE：堆棧(stack)是一種后進先出的數據結構，在內存中，變量會被分配在堆棧上來進行操作。堆(heap)是用于為類型實例(對象)分配空間的內存區域，在堆上創建一個對象，會將對象的地址傳給堆棧上的變量(反過來叫變量指向此對象，或者變量引用此對象)。

1.值類型 　　當聲明一個值類型的變量(Variable)的時候，變量本身包含了值類型的全部字段，該變量會被分配在線程堆棧(Thread Stack)上。　　假如我們有這樣一個值類型，它代表了直線上的一點：

public struct ValPoint { 　　public int x; 　　public ValPoint(int x) 　　{ 　　　　this.x = x; 　　} }

　　當我們在程序中寫下這樣的一條變量的聲明語句時：

ValPoint vPoint1;

　　實際產生的效果是聲明了 vPoint1 變量，變量本身包含了值類型的所有字段(即你想要的所有數據)。　　

　　NOTE：如果觀察 MSIL 代碼，會發現此時變量還沒有被壓到棧上，因為.maxstack(最高棧數) 為 0。并且沒有看到入棧的指令，這說明只有對變量進行操作，才會進行入棧。

　　因為變量已經包含了值類型的所有字段，所以，此時你已經可以對它進行操作了(對變量進行操作，實際上是一系列的入棧、出棧操作)。

vPoint1.x = 10; Console.WriteLine(vPoint.x); // 輸出 10

　NOTE：如果 vPoint1是一個引用類型(比如 class)，在運行時會拋出 NullReferenceException異常。因為 vPoint 是一個值類型，不存在引用，所以永遠也不會拋出 NullReferenceException。

　　如果你不對 vPoint.x 進行賦值，直接寫 Console.WriteLine(vPoint.x)，則會出現編譯錯誤：使用了未賦值的局部變量。產生這個錯誤是因為.Net 的一個約束：所有的元素使用前都必須初始化。比如這樣的語句也會引發這個錯誤：

int i; Console.WriteLine(i);

　　解決這個問題我們可以通過這樣一種方式：編譯器隱式地會為結構類型創建了無參數構造函數。在這個構造函數中會對結構成員進行初始化，所有的值類型成員被賦予 0 或相當于 0 的值(針對 Char 類型)，所有的引用類型被賦予 null 值。(因此，Struct 類型不可以自行聲明無參數的構造函數)。所以，我們可以通過隱式聲明的構造函數去創建一個 ValPoint 類型變量：

ValPoint vPoint1 = new ValPoint(); Console.WriteLine(vPoint.x); // 輸出為0

　　我們將上面代碼第一句的表達式由“=”分隔拆成兩部分來看：

　　A左邊 ValPoint vPoint1，在堆棧上創建一個 ValPoint 類型的變量 vPoint，結構的所有成員均未賦值。在進行 new ValPoint()之前，將 vPoint 壓到棧上。　　B右邊 new ValPoint()，new 操作符不會分配內存，它僅僅調用 ValPoint 結構的默認構造函數，根據構造函數去初始化 vPoint 結構的所有字段。　　注意上面這句，new 操作符不會分配內存，僅僅調用 ValPoint 結構的默認構造函數去初始化 vPoint 的所有字段。那如果我這樣做，又如何解釋呢？

Console.WriteLine((new ValPoint()).x); // 正常，輸出為0

　　在這種情況下，會創建一個臨時變量，然后使用結構的默認構造函數對此臨時變量進行初始化。我知道我這樣很沒有說服力，所以我們來看下 MS IL 代碼，為了節省篇幅，我只節選了部分：

.locals init ([0] valuetype Prototype.ValPoint CS$0$0000) // 聲明臨時變量 IL_0000: nop IL_0001: ldloca.s CS$0$0000 // 將臨時變量壓棧 IL_0003: initobj Prototype.ValPoint // 初始化此變量

　　而對于 ValPoint vPoint = new ValPoint(); 這種情況，其 MSIL 代碼是：

.locals init ([0] valuetype Prototype.ValPoint vPoint) // 聲明vPoint IL_0000: nop IL_0001: ldloca.s vPoint // 將vPoint 壓棧 IL_0003: initobj Prototype.ValPoint // 使用initobj初始化此變量

　　那么當我們使用自定義的構造函數時，ValPoint vPoint = new ValPoint(10)，又會怎么樣呢？通過下面的代碼我們可以看出，實際上會使用 call 指令(instruction)調用我們自定義的構造函數，并傳遞 10 到參數列表中。

.locals init ([0] valuetype Prototype.ValPoint vPoint) IL_0000: nop IL_0001: ldloca.s vPoint // 將 vPoint 壓棧 IL_0003: ldc.i4.s 10 // 將 10 壓棧 // 調用構造函數，傳遞參數 IL_0005: call instance void Prototype.ValPoint::.ctor(int32)

　　對于上面的 MSIL 代碼不清楚不要緊，有的時候知道結果就已經夠用了。關于 MSIL 代碼，有空了我會為大家翻譯一些好的文章。

2.引用類型 　　當聲明一個引用類型變量的時候，該引用類型的變量會被分配到堆上，這個變量將用于保存位于堆上的該引用類型的實例的內存地址，變量本身不包含對象的數據。此時，如果僅僅聲明這樣一個變量，由于在堆上還沒有創建類型的實例，因此，變量值為 null，意思是不指向任何類型實例(堆上的對象)。對于變量的類型聲明，用于限制此變量可以保存的類型實例的地址。　　如果我們有一個這樣的類，它依然代表直線上的一點：

public class RefPoint { 　　public int x; 　　public RefPoint(int x) 　　{ 　　　　this.x = x; 　　} 　　public RefPoint() {} }

　　當我們僅僅寫下一條聲明語句：

RefPoint rPoint1;

　　它的效果就向下圖一樣，僅僅在堆棧上創建一個不包含任何數據，也不指向任何對象(不包含創建再堆上的對象的地址)的變量。　　　　而當我們使用 new 操作符時：

rPoint1= new RefPoint(1);

　　會發生這樣的事：　　　　1. 在應用程序堆 (Heap)上創建一個引用類型 (Type)的實例 (Instance)或者叫對象(Object)，并為它分配內存地址。　　　　2. 自動傳遞該實例的引用給構造函數。(正因為如此，你才可以在構造函數中使用 this來訪問這個實例。) 　　　　3. 調用該類型的構造函數。　　　　4. 返回該實例的引用(內存地址)，賦值給 rPoint 變量。

3.關于簡單類型 　　很多文章和書籍中在講述這類問題的時候，總是喜歡用一個 int 類型作為值類型和一個Object 類型作為引用類型來作說明。本文中將采用自定義的一個結構和類分別作值類型和引用類型的說明。這是因為簡單類型(比如 int)有一些 CLR 實現了的行為，這些行為會讓我們對一些操作產生誤解。舉個例子，如果我們想比較兩個 int 類型是否相等，我們會通常這樣：

int i = 3; int j = 3; if(i==j) Console.WriteLine("i equals to j");

　　但是，對于自定義的值類型，比如結構，就不能用 “==”來判斷它們是否相等，而需要在變量上使用 Equals()方法來完成。　　再舉個例子，大家知道 string 是一個引用類型，而我們比較它們是否相等，通常會這樣做：

string a = "123456"; string b = "123456"; if(a == b) Console.WriteLine("a Equals to b");

　　實際上，在后面我們就會看到，當使用“==”對引用類型變量進行比較的時候，比較的是它們是否指向的堆上同一個對象。而上面 a、b 指向的顯然是不同的對象，只是對象包含的值相同，所以可見，對于 string 類型，CLR 對它們的比較實際上比較的是值，而不是引用。

　　為了避免上面這些引起的混淆，在對象判等部分將采用自定義的結構和類來分別說明。

裝箱和拆箱 　　這部分內容可深可淺，本文只簡要地作一個回顧。簡單來說，裝箱就是將一個值類型轉換成等值的引用類型。它的過程分為這樣幾步：　　　　1. 在堆上為新生成的對象(該對象包含數據，對象本身沒有名稱)分配內存。　　　　2. 將堆棧上值類型變量的值拷貝到堆上的對象中。　　　　3. 將堆上創建的對象的地址返回給引用類型變量(從程序員角度看，這個變量的名稱就好像堆上對象的名稱一樣)。　　當我們運行這樣的代碼時：

int i = 1; Object boxed = i; Console.WriteLine("Boxed Point: " + boxed);

　　效果圖是這樣的：　　MSIL 代碼是這樣的：

.method private hidebysig static void Main(string[] args) cil managed { .entrypoint // 代碼大小 19 (0x13) .maxstack 1 // 最高棧數是1，裝箱操作后i會出棧 .locals init ([0] int32 i, // 聲明變量 i(第1個變量，索引為0) [1] object boxed) // 聲明變量 boxed (第2個變量，索引為1) IL_0000: nop IL_0001: ldc.i4.s 10 //#1 將10壓棧 IL_0003: stloc.0 //#2 10 出棧，將值賦給 i IL_0004: ldloc.0 //#3 將i壓棧 IL_0005: box [mscorlib]System.Int32 //#4 i出棧，對i裝箱(復制值到堆，返回地址) IL_000a: stloc.1 //#5 將返回值賦給變量 boxed IL_000b: ldloc.1 // 將 boxed 壓棧 // 調用WriteLine()方法 IL_000c: call void [mscorlib]System.Console::WriteLine(object) IL_0011: nop IL_0012: ret } // end of method Program::Main

　　而拆箱則是將一個 已裝箱的引用類型 轉換為值類型：

int i = 1; Object boxed = i; int j; j = (int)boxed; // 顯示聲明 拆箱后的類型 Console.WriteLine("UnBoxed Point: " + j);

　　需要注意的是：UnBox 操作需要顯示聲明拆箱后轉換的類型。它分為兩步來完成：　　　　1. 獲取已裝箱的對象的地址。　　　　2. 將值從堆上的對象中拷貝到堆棧上的值變量中。

對象判等 　　因為我們要提到對象克隆(復制)，那么，我們應該有辦法知道復制前后的兩個對象是否相等。所以，在進行下面的章節前，我們有必要先了解如何進行對象判等。

　　NOTE：有機會較深入地研究這部分內容，需要感謝 微軟的開源 以及 VS2008 的FCL調試功能。關于如何調試 FCL 代碼，請參考 Configuring Visual Studio to Debug .NET Framework Source Code。

　　我們先定義用作范例的兩個類型，它們代表直線上的一點，唯一區別是一個是引用類型class，一個是值類型 struct：

public class RefPoint{ // 定義一個引用類型 　　public int x; 　　public RefPoint(int x) { 　　this.x = x; 　　} } public struct ValPoint { // 定義一個值類型 　　public int x; 　　public ValPoint(int x)   { 　　　　this.x = x; 　　} }

1.引用類型判等 　　我們先進行引用類型對象的判等，我們知道在 System.Object 基類型中，定義了實例方法Equals(object obj) ，靜態方法 Equals(object objA, object objB) ，靜態方法 ReferenceEquals(object objA, object objB) 來進行對象的判等。　　我們先看看這三個方法，注意我在代碼中用 #number 標識的地方，后文中我會直接引用：

public static bool ReferenceEquals (Object objA, Object objB) { 　　return objA == objB; // #1 } public virtual bool Equals(Object obj) { 　　return InternalEquals(this, obj); // #2 } public static bool Equals(Object objA, Object objB) { 　　if (objA==objB)  // #3 　　　　return true; 　　if (objA==null || objB==null) 　　　  return false; 　　return objA.Equals(objB); // #4 }

　　我們先看 ReferenceEquals(object objA, object objB)方法，它實際上簡單地返回 objA == objB，所以，在后文中，除非必要，我們統一使用 objA == objB(省去了 ReferenceEquals 方法)。另外，為了范例簡單，我們不考慮對象為 null 的情況。　　我們來看第一段代碼：

// 復制對象引用 bool result; RefPoint rPoint1 = new RefPoint(1); RefPoint rPoint2 = rPoint1; result = (rPoint1 == rPoint2); // 返回 true; Console.WriteLine(resul

上一篇：.Net中把圖片等文件放入DLL中，并在程序中引用

下一篇：.Net mvc 后臺傳單引號錯誤&#39