STAIR Actions キャプションデータセット

 

ステアラボ

千葉工業大学

20193

 

1. データの説明

 

本データセットは, STAIR Actions () の一部である79,922動画に対して付与した399,233文のキャプションで構成されています。各動画に対して平均5文のキャプションが付与されています。各キャプションは「だれがどこで何をした」といった内容になっています。データはtarファイル形式で提供されます。

 

tarファイルに含まれるデータの説明:

-   caption.csv

-    キャプションが記載されたファイル。一行目がヘッダーになっています。

-   split.json

-    実験で使用した動画の分割が記載されたファイル。

 

() STAIR Actions動画データセットについては http://actions.stair.centerをご参照ください。

 

2. 利用規約

 

ユーザは本データセットをダウンロードしたことにより以下の利用規約に同意するものとします

・本データセットの用途を人工知能研究に限ること

・本データセットやその一部を再配布しないこと

・本データセットの利用によって生じるいかなる損害に対しても損害賠償請求をしないこと

 

3. ダウンロード

 

以下のダウンロードリンクをクリックしたことにより上記利用規約に同意したものとみなします。

 

ダウンロード

 

4. References

 

本データセットを用いる場合、以下の文献を引用してくださるようお願い致します。

 

重藤優太郎, 吉川友也, 藺佳慶, 竹内彰一,

人間の動作を日本語で説明するためのキャプションデータセット,

言語処理学会第25回年次大会, pp. 1173-1176, 2019.