タグ

Video Captioning

動画認識手法の紹介とキャプション生成手法Masked Transformerについての解説

はじめに

こんにちは、プロジェクト推進部の水船です。前の記事でもご紹介した先進技術WGでは今、動画分析を重要テーマとして調査しています。今回は2018年に提案された手法で少し古いですが、Masked Transformer [1]という動画キャプション生成モデルについての解説をしていきます。またそれに関連して、動画認識のための諸手法についてもざっくりと紹介します。Masked TransformerのPyTorch実装も公開しているのでご覧ください。 続きを読む 動画認識手法の紹介とキャプション生成手法Masked Transformerについての解説