Pandas基本操作、Seriesオブジェクトとリストの相互変換

2つの基本的な型

Dataframe
テーブル形式のデータ構造を持つオブジェクト。行と列にそれぞれインデックス(ラベル)があり、値を持つ。
基本は2次元配列で扱うことが多いが、高次元の配列を扱うこともできる。

Series
1次元配列のオブジェクト。インデックス(ラベル)と値から構成される。

データ型変換

リストをSeries型に変換する

import pandas as pd

# リストを作成する
tmp = [0, 1, 2]
print(tmp)
# [0, 1, 2]

# Series型に変換する
s = pd.Series(tmp)
print(s)
# 0    0
# 1    1
# 2    2
# dtype: int64

# indexを変更する。
t = pd.Series(tmp, index=['t0', 't1', 't2'])
print(t)
# t0    0
# t1    1
# t2    2
# dtype: int64 

Serires型をリストに変換する

#下準備としてSeriresを作成
obj = pd.Series([3, -3, 6, 1])
print(obj)
# 0    3
# 1   -3
# 2    6
# 3    1
# dtype: int64

# numpy.ndarrayのvalues属性を使って値を取得する。
list = obj.values
# array([ 3, -3,  6,  1])
# ndarray構造として取得できる

list2 = obj.tolist()
# [3, -3, 6, 1]
# 多次元配列がすべてリストに変換される。

※list()はpython標準モジュールの他の型をリスト型に変換するための関数なので、Seirisオブジェクトに対して使用することはできない。