VoTTで学習用データセットを作成する
- VoTT(Visual Object Tagging Tool)はMicrosoft主導で開発されているタグ付けツール。
- 動画・画像に対応している。
- Windows, Mac, Linux問わずクロスプラットフォームで利用可能。
Ubuntuでも使用できるので使ってみた。
目次
作業環境
Ubuntu 16.04 (ubuntu18.04でも確認)
Nodo.js、npmのインストール
- VoTTはNode.jsのパッケージ
- npm(Node.jsのパッケージ管理ツール)でインストールする。
- aptのNode.jsはv8LTS版、最新はv11のよう。最新を取得するにはPPAでインストールする。
aptのLTSで良い気がしたが、今回は最新版v11を入れて見ました。
- インストール方法の参考サイト
How To Install Node.js on Ubuntu 16.04 | DigitalOcean
スクリプトをダウンロード
私の環境では、curlだとうまく行かなったのでwgetでスクリプトをダウンロードしました。
(たぶん、proxyのせいだと思われる)
wget https://deb.nodesource.com/setup_11.x -O nodesource_setup.sh
※スクリプトの編集(wget優先)
nodesource_setup.shはcurlを優先的に使用する。
私の場合、wgetが優先されるように編集した。
- 編集箇所(2箇所有り)
if [ -x /usr/bin/curl ]; then >> if [ -x /usr/bin/curl_ ]; then
スクリプトの実行
sudo bash nodesource_setup.sh
以下が表示されればOK。
## Run `sudo apt-get install -y nodejs` to install Node.js 11.x and npm ## You may also need development tools to build native addons: sudo apt-get install gcc g++ make ## To install the Yarn package manager, run: curl -sL https://dl.yarnpkg.com/debian/pubkey.gpg | sudo apt-key add - echo "deb https://dl.yarnpkg.com/debian/ stable main" | sudo tee /etc/apt/sources.list.d/yarn.list sudo apt-get update && sudo apt-get install yarn
指示通りに nodejs(npmも含まれる) を apt でインストールする
sudo apt install -y nodejs
Versionを確認する
nodejs -v #v11.11.0 npm -v #6.7.0
※npmのproxy設定
- .bashrcで環境変数に設定済みの場合
sudo npm set proxy $HTTP_PROXY sudo npm set https-proxy $HTTPS_PROXY
- 直接入力の場合
sudo npm set proxy http://<useid>:<pass>@proxy.example.com:port sudo npm set https-proxy http://<useid>:<pass>@proxy.example.com:port
- configの確認
sudo npm config list
VoTTのインストール
ソースをダウンロードする
git clone https://github.com/Microsoft/VoTT.git
インストールと起動
インストール時のnpmのワーニングは無視しました。
# インストール cd VoTT/ npm install # 起動 npm start
VoTTの使い方
画像か動画か選択
タグ付けの設定
※ trakingは設定しても動いてくれなかった・・・
タグ付け作業
オブジェクトに枠をつけて、タグを選択するだけでOK。
データセットを出力
「ctrl + E」か 「Object Detection」 >> 「Export Tags」で 上記設定画面が出る
項目を設定後に「Export」で指定したフォルダにデータセットが出力される。
出力フォーマットについて
出力フォーマットは以下の6種あるようです。
- CNTK Faster-RCNN
- Custom Vission Service
- KITTI
- Tensorflow Pascak VOC
- TFRecords
- YOLO
以上。