もた日記

くだらないことを真面目にやる

コンソールで表形式データを操作するVisiDataを使ってみる

VisiData


VisiDataはコンソールで表形式データを操作することができるツール。

github.com

f:id:wonder-wall:20170717204936g:plain


インストー


前提条件は、

Python 3.3+
h5py and numpy (if opening .hdf5 files)

ということなのでPython3のインストールが必要。
VisiDataはpipでインストールできる。

$ pip3 install visidata


使い方


下記リンクにVisiData Tourという使い方を簡単に紹介したキャプチャがあるので見てみるのがよい。
visidata/tours.rst at stable · saulpw/visidata · GitHub

詳細な使い方は下記リンクのUser Guideを参照。
visidata/user-guide.rst at stable · saulpw/visidata · GitHub


下記リンクでテスト用データを作成して基本的な操作を試してみる。
Mockaroo - Random Data Generator | CSV / JSON / SQL / Excel

$ head -n 5 MOCK_DATA.csv
id,first_name,last_name,email,gender,ip_address
1,Chadd,Dmiterko,cdmiterko0@ucsd.edu,Male,105.7.48.73
2,Kirbee,Balchin,kbalchin1@devhub.com,Female,243.139.168.242
3,Enriqueta,Klimov,eklimov2@cam.ac.uk,Female,104.251.37.184
4,Anderea,Cowland,acowland3@skype.com,Female,85.189.93.128


起動、ヘルプ、終了

下記コマンドのようにファイルを指定して起動する。

$ vd MOCK_DATA.csv

f:id:wonder-wall:20170717215813p:plain

F1でヘルプを表示。

f:id:wonder-wall:20170717215824p:plain

qを押すと終了できる。

移動

Vimのようにhjklを押すとセルを移動できる。
gを押した後でhjklを押すと先頭行(gk)、左端列(gh)などに移動できる。

ソート

ソートしたい列を選択した状態で[で昇順、]で降順にソートできる。

編集

セルを選択した状態でeを押すと編集できる。
f:id:wonder-wall:20170717221427p:plain


分布

特定列を選択した状態でFを押すと頻度分布を表示できる。

f:id:wonder-wall:20170717225420p:plain

保存

ソート、編集したあとでCtrl-sを押してファイルを保存することもできる。