2つの基本的な型
Dataframe
テーブル形式のデータ構造を持つオブジェクト。行と列にそれぞれインデックス(ラベル)があり、値を持つ。
基本は2次元配列で扱うことが多いが、高次元の配列を扱うこともできる。
Series
1次元配列のオブジェクト。インデックス(ラベル)と値から構成される。
データ型変換
リストをSeries型に変換する
import pandas as pd
# リストを作成する
tmp = [0, 1, 2]
print(tmp)
# [0, 1, 2]
# Series型に変換する
s = pd.Series(tmp)
print(s)
# 0 0
# 1 1
# 2 2
# dtype: int64
# indexを変更する。
t = pd.Series(tmp, index=['t0', 't1', 't2'])
print(t)
# t0 0
# t1 1
# t2 2
# dtype: int64
Serires型をリストに変換する
#下準備としてSeriresを作成
obj = pd.Series([3, -3, 6, 1])
print(obj)
# 0 3
# 1 -3
# 2 6
# 3 1
# dtype: int64
# numpy.ndarrayのvalues属性を使って値を取得する。
list = obj.values
# array([ 3, -3, 6, 1])
# ndarray構造として取得できる
list2 = obj.tolist()
# [3, -3, 6, 1]
# 多次元配列がすべてリストに変換される。
※list()はpython標準モジュールの他の型をリスト型に変換するための関数なので、Seirisオブジェクトに対して使用することはできない。