両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン |
python:pandas [2018/04/25 11:43] – [データの追加] mumeiyamibito | python:pandas [2018/08/08 11:58] (現在) – [モジュールの読み込み] mumeiyamibito |
---|
| |
あるいは | あるいは |
<code python>import numpy as pd</code> | <code python>import pandas as pd</code> |
* ''as pd'' によって、以降 ''pd'' で呼び出せる。 | * ''as pd'' によって、以降 ''pd'' で呼び出せる。 |
* ここではこっちの読み込みをした場合で記述していく。 | * ここではこっちの読み込みをした場合で記述していく。 |
* ''INPUT.txt'': 入力ファイル | * ''INPUT.txt'': 入力ファイル |
* ''LABEL1, LABEL2,...'': カラム名 | * ''LABEL1, LABEL2,...'': カラム名 |
| |
| ==== CSV ファイルの読み書き ==== |
| * 読み込み\\ <code python>DF = pd.read_csv(CSV_FILE[, OPTION])</code> |
| * ''DF'': データフレームを格納する変数 |
| * ''CSV_FILE'': CSV ファイルのパス |
| * ''OPTION'': その他のオプション (任意) |
| * この場合、1 行目が列ラベルとして割り当てられる。 |
| * 列ラベルの指定方法 |
| * 1 行目をラベルとして割り当てたくない場合は、''OPTION'' に ''header = None'' を指定する。 |
| * 任意の列ラベルを指定する場合は、''OPTION'' に ''name = (LABEL1, LABEL2, ...)'' を付け、''LABEL1'' や ''LABEL2'' に列ラベルを指定していく。 |
| * 特定の行を列ラベルとして指定する場合は、''OPTION'' に ''header = NUM'' の ''NUM'' に行番号 (0 から始まる) を指定する。この場合、指定した行より上の行は無視される。 |
| * 行ラベルの指定方法 |
| * 特定の列を行ラベルを指定する場合は、''OPTION'' に ''index_col = NUM'' の ''NUM'' に列番号 (0 から始まる) を指定する。 |
| * 書き出し\\ <code python>DF.to_csv(CSV_FILE[, OPTION])</code> |
| * ''DF'': データフレームが格納された変数 |
| * ''CSV_FILE'': 出力する CSV ファイルのパス |
| * ''OPTION'': その他のオプション (任意) |
| * 特定の列のみを書き出す場合、''OPTION'' に ''columns = [LABEL1, LABEL2, ...]'' を追加し、''LABEL1'' や ''LABEL2'' に書き出す列ラベルを指定していく。 |
| * 列ラベルや行ラベルも書き出す場合は、''OPTION'' に ''header'' (列ラベル) や ''index'' (行ラベル) を追加し、''TRUE'' や ''FALSE'' で ON/OFF を切り替える。デフォルトは両方 ''True'' |
| * 区切り文字を指定する場合は、''OPTION'' に ''sep = SEP'' を追加し、''SEP'' に区切り文字を指定する。''SEP'' に ''\t'' を指定すると、TSV 形式のファイルで出力できる。 |
| * 参考サイト: |
| * [[https://note.nkmk.me/python-pandas-read-csv-tsv/ | pandasでcsv/tsvファイル読み込み(read_csv, read_table) | Python / note.nkmk.me]] |
| * [[https://note.nkmk.me/python-pandas-to-csv/ | pandasでcsvファイルの書き出し・追記(to_csv) | Python / note.nkmk.me]] |
| |
| |
{{tag>プログラミング}} | {{tag>プログラミング}} |
| |