新聞中心
在Python中,pandas庫(簡稱pd)用于數據處理和分析,支持數據結構如DataFrame和Series。
創(chuàng)新互聯公司執(zhí)著的堅持網站建設,小程序設計;我們不會轉行,已經持續(xù)穩(wěn)定運營十余年。專業(yè)的技術,豐富的成功經驗和創(chuàng)作思維,提供一站式互聯網解決方案,以客戶的口碑塑造品牌,攜手廣大客戶,共同發(fā)展進步。
Python中的pandas(簡稱pd)是一個功能強大的數據處理庫,它提供了大量用于數據清洗、轉換、分析和可視化的方法,本文將詳細介紹pd的基本用法,包括數據結構、數據讀取、數據篩選、數據統計和數據可視化等方面的內容。
數據結構
1、DataFrame
DataFrame是pd中最常用的數據結構,它是一個二維表格型數據結構,類似于Excel表格或SQL表,DataFrame可以存儲多種類型的數據,如數值、字符串等,并且具有很多方便的數據操作方法。
創(chuàng)建一個DataFrame:
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df)
2、Series
Series是pd中的另一種數據結構,它是一個一維數組,類似于NumPy的數組,Series可以存儲單一類型的數據,如數值或字符串。
創(chuàng)建一個Series:
import pandas as pd data = [1, 2, 3, 4, 5] s = pd.Series(data) print(s)
數據讀取
1、讀取CSV文件
使用pd.read_csv()方法可以讀取CSV文件,并將其轉換為DataFrame。
import pandas as pd
df = pd.read_csv('file.csv')
print(df)
2、讀取Excel文件
使用pd.read_excel()方法可以讀取Excel文件,并將其轉換為DataFrame。
import pandas as pd
df = pd.read_excel('file.xlsx')
print(df)
3、讀取SQL數據庫
使用pd.read_sql()方法可以讀取SQL數據庫中的數據,并將其轉換為DataFrame。
import pandas as pd
import sqlite3
conn = sqlite3.connect('database.db')
query = 'SELECT * FROM table_name'
df = pd.read_sql(query, conn)
print(df)
數據篩選
1、選擇某一列
使用df[‘column_name’]可以選擇DataFrame中的某一列。
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df['A'])
2、選擇多列
使用df[[‘column1’, ‘column2’]]可以選擇DataFrame中的多列。
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df[['A', 'C']])
3、根據條件篩選數據
使用df[df[‘column_name’] > value]可以根據條件篩選數據。
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df[df['A'] > 1])
數據統計
1、計算平均值
使用df[‘column_name’].mean()可以計算某一列的平均值。
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df['A'].mean())
2、計算總和
使用df[‘column_name’].sum()可以計算某一列的總和。
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df['A'].sum())
3、計算唯一值個數
使用df[‘column_name’].nunique()可以計算某一列的唯一值個數。
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
print(df['A'].nunique())
數據可視化
1、繪制折線圖
使用df.plot()可以繪制DataFrame的折線圖。
import pandas as pd
import matplotlib.pyplot as plt
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
df.plot()
plt.show()
2、繪制柱狀圖
使用df[‘column_name’].plot(kind=’bar’)可以繪制某一列的柱狀圖。
import pandas as pd
import matplotlib.pyplot as plt
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
df['A'].plot(kind='bar')
plt.show()
相關問題與解答:
1、如何在Python中使用pd讀取CSV文件?
答:使用pd.read_csv()方法可以讀取CSV文件,并將其轉換為DataFrame。df = pd.read_csv('file.csv')。
2、如何根據條件篩選DataFrame中的數據?
答:使用df[df[‘column_name’] > value]可以根據條件篩選數據。df[df['A'] > 1]。
3、如何使用pd計算某一列的平均值?
答:使用df[‘column_name’].mean()可以計算某一列的平均值。df['A'].mean()。
4、如何使用pd繪制DataFrame的折線圖?
答:使用df.plot()可以繪制DataFrame的折線圖。df.plot()。
標題名稱:python中pd的用法
文章起源:http://www.fisionsoft.com.cn/article/ccsocsc.html


咨詢
建站咨詢

