おいしいブログ

python pandasで基礎統計をとる

pandas.Series — pandas 0.23.4 documentation

前回の使い方メモの続き。今回は、pandasを利用して、数値の基礎統計をとっていきます。

Seriesの作成

import pandas as pd
import random

d = [[round(random.random(), 4) for i in range(3)] for j in range(50)]
df = pd.DataFrame(d, columns=['a', 'b', 'c'])

df.head

最大

df.max()

最小

df.min()

平均

df.mean()

中央値

df.median()

合計

df.sum()

相関

df.corr()

共分散

df.cov()

標準偏差

df.std()

尖度

df.kurt()

歪度

df.skew()

出現回数

alpha = 'abcdefghijklmnopqrlsuvwxyz'

d = [alpha[random.randrange(0, 26, 1)] for i in range(500)]
df = pd.Series(d)

df.value_counts()

ちょっと横着感ありますね🤔
今回のメモは、 GitHubのメモ用リポジトリに。