Kinaconの技術ブログ

Ubuntuはじめました。

VoTTで学習用データセットを作成する

f:id:m-oota-711:20190316120605p:plain

  • VoTT(Visual Object Tagging Tool)はMicrosoft主導で開発されているタグ付けツール。
  • 動画・画像に対応している。
  • Windows, Mac, Linux問わずクロスプラットフォームで利用可能。

Ubuntuでも使用できるので使ってみた。


目次


作業環境

Ubuntu 16.04 (ubuntu18.04でも確認)


Nodo.js、npmのインストール

  • VoTTはNode.jsのパッケージ
  • npm(Node.jsのパッケージ管理ツール)でインストールする。
  • aptのNode.jsはv8LTS版、最新はv11のよう。最新を取得するにはPPAでインストールする。


aptのLTSで良い気がしたが、今回は最新版v11を入れて見ました。


  • インストール方法の参考サイト

How To Install Node.js on Ubuntu 16.04 | DigitalOcean


スクリプトをダウンロード

私の環境では、curlだとうまく行かなったのでwgetでスクリプトをダウンロードしました。
(たぶん、proxyのせいだと思われる)

wget https://deb.nodesource.com/setup_11.x -O nodesource_setup.sh


※スクリプトの編集(wget優先)

nodesource_setup.shはcurlを優先的に使用する。
私の場合、wgetが優先されるように編集した。

  • 編集箇所(2箇所有り)
if [ -x /usr/bin/curl ]; then  
>>  if [ -x /usr/bin/curl_ ]; then


スクリプトの実行

sudo bash nodesource_setup.sh


以下が表示されればOK。

## Run `sudo apt-get install -y nodejs` to install Node.js 11.x and npm
## You may also need development tools to build native addons:
     sudo apt-get install gcc g++ make
## To install the Yarn package manager, run:
     curl -sL https://dl.yarnpkg.com/debian/pubkey.gpg | sudo apt-key add -
     echo "deb https://dl.yarnpkg.com/debian/ stable main" | sudo tee /etc/apt/sources.list.d/yarn.list
     sudo apt-get update && sudo apt-get install yarn


指示通りに nodejs(npmも含まれる) を apt でインストールする

sudo apt install -y nodejs


Versionを確認する

nodejs -v

#v11.11.0

npm -v

#6.7.0


※npmのproxy設定

  • .bashrcで環境変数に設定済みの場合
sudo npm set proxy $HTTP_PROXY
sudo npm set https-proxy $HTTPS_PROXY


  • 直接入力の場合
sudo npm set proxy http://<useid>:<pass>@proxy.example.com:port
sudo npm set https-proxy http://<useid>:<pass>@proxy.example.com:port


  • configの確認
sudo npm config list


VoTTのインストール

ソースをダウンロードする

git clone https://github.com/Microsoft/VoTT.git

インストールと起動

インストール時のnpmのワーニングは無視しました。

# インストール
cd VoTT/
npm install

# 起動
npm start


VoTTの使い方

画像か動画か選択

f:id:m-oota-711:20190315125111p:plain


タグ付けの設定

※ trakingは設定しても動いてくれなかった・・・

f:id:m-oota-711:20190315125145p:plain


タグ付け作業

f:id:m-oota-711:20190315125207p:plain

オブジェクトに枠をつけて、タグを選択するだけでOK。


データセットを出力

f:id:m-oota-711:20190315125230p:plain

「ctrl + E」か 「Object Detection」 >> 「Export Tags」で 上記設定画面が出る

項目を設定後に「Export」で指定したフォルダにデータセットが出力される。


 出力フォーマットについて 

出力フォーマットは以下の6種あるようです。

  • CNTK Faster-RCNN
  • Custom Vission Service
  • KITTI
  • Tensorflow Pascak VOC
  • TFRecords
  • YOLO


f:id:m-oota-711:20190315125249p:plain


以上。