コンソールで表形式データを操作するVisiDataを使ってみる
インストール
前提条件は、
Python 3.3+ h5py and numpy (if opening .hdf5 files)
ということなのでPython3のインストールが必要。
VisiDataはpipでインストールできる。
$ pip3 install visidata
使い方
下記リンクにVisiData Tourという使い方を簡単に紹介したキャプチャがあるので見てみるのがよい。
visidata/tours.rst at stable · saulpw/visidata · GitHub
詳細な使い方は下記リンクのUser Guideを参照。
visidata/user-guide.rst at stable · saulpw/visidata · GitHub
下記リンクでテスト用データを作成して基本的な操作を試してみる。
Mockaroo - Random Data Generator | CSV / JSON / SQL / Excel
$ head -n 5 MOCK_DATA.csv id,first_name,last_name,email,gender,ip_address 1,Chadd,Dmiterko,cdmiterko0@ucsd.edu,Male,105.7.48.73 2,Kirbee,Balchin,kbalchin1@devhub.com,Female,243.139.168.242 3,Enriqueta,Klimov,eklimov2@cam.ac.uk,Female,104.251.37.184 4,Anderea,Cowland,acowland3@skype.com,Female,85.189.93.128
起動、ヘルプ、終了
下記コマンドのようにファイルを指定して起動する。
$ vd MOCK_DATA.csv
F1
でヘルプを表示。
q
を押すと終了できる。
移動
Vimのようにhjkl
を押すとセルを移動できる。
g
を押した後でhjkl
を押すと先頭行(gk
)、左端列(gh
)などに移動できる。
ソート
ソートしたい列を選択した状態で[
で昇順、]
で降順にソートできる。
編集
セルを選択した状態でe
を押すと編集できる。
分布
特定列を選択した状態でF
を押すと頻度分布を表示できる。
保存
ソート、編集したあとでCtrl-s
を押してファイルを保存することもできる。