kibana
アンケート結果の集計とプレゼン資料作りの宿題がある。 アンケート結果はCSVファイルに1行ごとにまとめてあるが、EXCELでの集計は面倒になりそう。 噂のkibanaを使ってみることにする。 とりあえずkibanaは単体では使えず、ElasticsearchというDBと組み合わせて使うものであることを知った。まずこれらを我が家のNASにインストールする。本家にRepositoryからのインストール手順があるのでこれに従う。我が家はUbuntu 16.10なのでdebianパッケージを使う。 まずはElasticsearch https://www.elastic.co/guide/en/elasticsearch/reference/current/setup-repositories.html Ubuntu 16.10はsystemdなので、この流儀でサービスを起動する。 Kibanaも同じ https://www.elastic.co/guide/en/kibana/current/_upgrading_kibana.html#setup-repositories CSVファイルからElasticsearchへのデータ投入はembulkを使った。 http://www.embulk.org/docs/recipe/scheduled-csv-load-to-elasticsearch-kibana4.html 上記ページのscheduledは関係なし。 データ投入までの手順は上記の説明に合わせる。CSVファイルはcsvフォルダにおいて、embulk exampleを実行し、ファイル置き場などを手直ししたうえでembulk guessコマンドを実行する。SHIFT JIS文字列やCRLF改行を認識してくれるので助かる。 今回投入するデータは日本語を含んでいて、日本語文字はデフォルトの構文解析器だと1文字単位にばらされるとのこと。文字列データに対して"index: not_analyzed"を指定すれば回避できるとの記事もあるが、embulkでデータを投入するとmapping設定としてindex設定ができない(設定する方法を見つけることができなかった)。 仕方がないので、以下のシェルスクリプトで