Python有許多吸引力,如效率,代碼可讀性和速度,使其成為數據科學愛好者的首選編程語言。Python通常是希望升級其應用程序功能的數據科學家和機器學習專家的首選。
由于其廣泛的用途,Python擁有大量的庫,使數據科學家可以更輕松地完成復雜的任務,而無需很多編寫代碼的麻煩。以下是數據科學的前3個Python庫。
使用這些庫將Python轉化為一個科學的數據分析和建模工具。
1.NumPy
NumPy(Numerical Python的縮寫)是配備有用資源的頂級庫之一,可幫助數據科學家將Python轉變為強大的科學分析和建模工具。流行的開源庫可以在BSD許可下使用。它是用于在科學計算中執行任務的基礎Python庫。NumPy是一個更大的基于Python的開源工具生態系統的一部分,稱為SciPy。
他的庫為Python提供了大量的數據結構,可以毫不費力地執行多維數組和矩陣計算。除了用于求解線性代數方程和其他數學計算外,NumPy還可用作不同類型通用數據的通用多維容器。
此外,它與其他編程語言(如C / C ++和Fortran)完美集成。NumPy庫的多功能性使其能夠輕松快速地與各種數據庫和工具結合使用。
2.Pandas
Pandas是另一個很棒的庫,可以增強你的數據科學Python技能。與NumPy一樣,它屬于SciPy開源軟件系列,可在BSD免費軟件許可下使用。
Pandas提供多功能和強大的工具,用于整理數據結構和執行大量數據分析。該庫適用于不完整,非結構化和無序的實際數據,并附帶用于整形,聚合,分析和可視化數據集的工具。
此庫中有三種類型的數據結構:
Series:單維,均勻陣列 DataFrame:具有異構類型列的二維 Panel:三維,大小可變陣列例如,讓我們看看Panda Python庫(縮寫為pd)可用于執行一些描述性統計計算。
讓我們從導入庫開始。
import pandas pd
讓我們創建一個系列詞典。
d 'Name':pd.Series'Alfrick''Michael''Wendy''Paul''Dusan''George''Andreas' 'Irene''Sagar''Simon''James''Rose' 'Years of Experience':pd.Series 'Programming Language':pd.Series'Python''JavaScript''PHP''C++''Java''Scala''React''Ruby''Angular''PHP''Python''JavaScript'
讓我們創建一個DataFrame。
df pd.DataFramed
下面是一個很好的輸出表:
Name Programming Language Years of Experience Alfrick Python Michael JavaScript Wendy PHP Paul C++ Dusan Java George Scala Andreas React Irene Ruby Sagar Angular Simon PHP James Python Rose JavaScript
下面是這個示例的全部代碼:
import pandas pd#creating a dictionary of seriesd 'Name':pd.Series'Alfrick''Michael''Wendy''Paul''Dusan''George''Andreas' 'Irene''Sagar''Simon''James''Rose' 'Years of Experience':pd.Series 'Programming Language':pd.Series'Python''JavaScript''PHP''C++''Java''Scala''React''Ruby''Angular''PHP''Python''JavaScript'#Create a DataFramedf pd.DataFramedprintdf
新聞熱點
疑難解答