前些日子,爆出N篇說c#/.net太慢的,要求刪除c#/.net部分特性的文章。
撇開那些文章不說,c#/.net慢似乎是業(yè)界公認(rèn)的鐵則,不論大家如何證明c#/.net其實(shí)不比c++慢多少,但是應(yīng)用程序級別的性能卻依然這么慢。
那么c#/.net慢在哪里?
很不幸的是大部分c#程序是被大部分程序員拖慢的,也許這個結(jié)論不太容易被人接受,卻是一個廣泛存在的。
String的操作
幾乎所有的程序都有String操作,至少90%的程序需要忽略大小寫的比較,檢查一下代碼,至少其中大半的應(yīng)用程序有類似這樣的代碼:
if (str1.ToUpper() == str2.ToUpper())
或者ToLower版的,甚至我還看到過有個Web的HttpModule里面寫上了:
for (int i = 0; i < strs.Count; i++)
if (value.ToUpper() == strs[i].ToUpper())
//...
想一下,每個頁面請求過來,都要執(zhí)行這樣一段代碼,大片大片的創(chuàng)建string實(shí)例,更夸張的是還有人說這是用空間換時間。。。
性能測試
說這個方法慢,也許還有人不承認(rèn),認(rèn)為這個就是最好的方法,所以這里要用具體測試來擺個事實(shí)。
首先準(zhǔn)備一個測試性能的方法:
PRivate static TResult MeasurePerformance<TArg, TResult>(Func<TArg, TResult> func, TArg arg, int loop)
{
GC.Collect();
int gc0 = GC.CollectionCount(0);
int gc1 = GC.CollectionCount(1);
int gc2 = GC.CollectionCount(2);
TResult result = default(TResult);
Stopwatch sw = Stopwatch.StartNew();
for (int i = 0; i < loop; i++)
{
result = func(arg);
}
Console.WriteLine(sw.ElapsedMilliseconds.ToString() + "ms");
Console.WriteLine("GC 0:" + (GC.CollectionCount(0) - gc0).ToString());
Console.WriteLine("GC 1:" + (GC.CollectionCount(1) - gc1).ToString());
Console.WriteLine("GC 2:" + (GC.CollectionCount(2) - gc2).ToString());
return result;
}
然后來準(zhǔn)備一個堆string:
private static List<string> CreateStrings()
{
List<string> strs = new List<string>(10000);
char[] chs = new char[3];
for (int i = 0; i < 10000; i++)
{
int j = i;
for (int k = 0; k < chs.Length; k++)
{
chs[k] = (char)('a' + j % 26);
j = j / 26;
}
strs.Add(new string(chs));
}
return strs;
}
然后來看看ToUpper的實(shí)現(xiàn):
private static bool ImplementByToUpper(List<string> strs, string value)
{
for (int i = 0; i < strs.Count; i++)
if (value.ToUpper() == strs[i].ToUpper())
return true;
return false;
}
最后準(zhǔn)備好main方法:
List<string> strs = CreateStrings();
bool result;
Console.WriteLine("Use ImplementByToUpper");
result = MeasurePerformance(s => ImplementByToUpper(strs, s), "yZh", 1000);
Console.WriteLine("result is " + result.ToString());
Console.ReadLine();
來看看執(zhí)行結(jié)果:
Use ImplementByToUpper
2192ms
GC 0:247
GC 1:0
GC 2:0
result is True
來個對比測試,用string.Equals來測試一下:
private static bool ImplementByStringEquals(List<string> strs, string value)
{
for (int i = 0; i < strs.Count; i++)
if (string.Equals(value, strs[i], StringComparison.CurrentCultureIgnoreCase))
return true;
return false;
}
來看看執(zhí)行結(jié)果:
Use ImplementByStringEquals
1117ms
GC 0:0
GC 1:0
GC 2:0
result is True
對比一下,使用ToUpper的速度要慢一倍,并且有大量的0代垃圾對象。那些號稱是用空間換時間的人可以反思一下了,用空間換來了什么?負(fù)時間嗎?
字典類的使用
繼續(xù)說string的場景,有些人也許會想到用Hash表等類似結(jié)構(gòu)來加速,不錯,這是個好主意,只不過,Hash表不一定總是最佳方案,什么不相信?還是做個測試吧:
private static bool ImplementByHashSet(List<string> strs, string value)
{
HashSet<string> set = new HashSet<string>(strs, StringComparer.CurrentCultureIgnoreCase);
return set.Contains(value);
}
看看執(zhí)行結(jié)果:
Use ImplementByHashSet
5114ms
GC 0:38
GC 1:38
GC 2:38
result is True
驚訝吧,速度比用ToUpper還慢了1倍多,而且2代垃圾也38次的回收(執(zhí)行2代垃圾回收時,會強(qiáng)制執(zhí)行1代和0代垃圾回收)。
不過使用Hash表等類似來加速這個想法本身是一個很正確的想法,不過前提是Hash表本身能夠緩存,例如:
private static Func<string, bool> ImplementByHashSet2(List<string> strs)
{
HashSet<string> set = new HashSet<string>(strs, StringComparer.CurrentCultureIgnoreCase);
return set.Contains;
}
然后把main的方法修改為:
Console.WriteLine("Use ImplementByHashSet2");
result = MeasurePerformance(s =>
{
var f = ImplementByHashSet2(strs);
bool ret = false;
for (int i = 0; i < 1000; i++)
{
ret = f(s);
}
return ret;
}, "yZh", 1);
Console.WriteLine("result is " + result.ToString());
Console.ReadLine();
再看看結(jié)果:
Use ImplementByHashSet2
6ms
GC 0:0
GC 1:0
GC 2:0
result is True
性能出現(xiàn)了飛躍性的增長。
更多
是什么拖慢了c#/.net?簡單的說:不必要的創(chuàng)建對象,不必要的同步,循環(huán)執(zhí)行低效的方法(例如被firelong重點(diǎn)批斗的反射,不過ms并沒讓你在循環(huán)里面使用Invoke),使用低效的數(shù)據(jù)結(jié)構(gòu)和算法(看看緩存情況下Hash表類似結(jié)構(gòu)的驚人表現(xiàn),就知道區(qū)別了)
c#/.net的低門檻確實(shí)在一定程度上有利于把更多的程序員拉入c#/.net,但是也確實(shí)把整個c#/.net程序的代碼水平降低了不少,這一點(diǎn)確實(shí)很令人擔(dān)憂。
最后別忘了一點(diǎn),一個系統(tǒng)能有多少性能,不是由這個系統(tǒng)中性能最好的部分決定的,而是由這個系統(tǒng)中性能最差的部分所決定的。配一臺有16g內(nèi)存,100t硬盤,加上頂級的顯卡,缺配上386的cpu,這臺電腦的性能就是386的性能。同樣,c#/.net再好,寫程序的人水平差,寫出來的程序的性能自然也就差了。
新聞熱點(diǎn)
疑難解答
圖片精選