動画アノテーションをわかりやすく解説

自動運転車の開発や、無人店舗の導入、防犯カメラでの不審者検知など、AIは私たちの身近なところで活用されています。そんなAIの裏側を支える動画アノテーションについて、今回は解説します。

 

動画アノテーションとは?

動画アノテーションとは、車や標識、人物といったように動画や映像内にある物体に対して、ラベル付け(アノテーション)を行うことを指します。

画像アノテーションと同様に、動画アノテーションは、コンピュータに動画内の物体を認識させるプロセスです。どちらもコンピュータビジョンの分野であり、コンピュータが人間のように画像や動画を認識できるよう訓練することを目的としています。

ラベル付されたデータをモデルに学習させることで、新たな映像から対象物を識別するよう訓練することが狙いです。ラベルが正確であればあるほど、AIの精度は向上します。自動化されたプロセスで、正確な動画アノテーションを行うことで、AI開発を加速化することができます。

 

アノテーションにおける動画と画像の違い

画像アノテーションの多くの手法は、動画アノテーションにも共通していますが、アノテーションを行う上で、両者の違いを知っておくことは重要です。

動画には画像よりも多くのデータが含まれている

情報量という点では、より多くの情報が動画には含まれています。物体の位置だけでなく、その物体がどの方向に動いているのかまで特定することができます。例えば、人が座っているのか、立っているのか、画像だけではわからないことがあります。しかし動画であれば、それが明確になります。

アノテーション作業が効率的に行える

動画アノテーションでは、連続するシーンで様々な物体を追跡する必要があるため、アノテーション作業を自動化しているケースが多いです。そのため一見複雑に見える動画のアノテーションですが、自動化の機能を備えたアノテーションツールを使えば、画像よりも少ないリソースとコストで、効率的に作業を行うことができます。

AIの精度を高める正確さ

動画アノテーションで自動化ツールを使用すると、フレーム間の連続性が高くなるため、エラーを減らすことができます。このため、画像のアノテーションよりもラベルの一貫性と正確さが高く、AIモデルの予測精度が高くなります。

 

動画アノテーションの種類

動画アノテーションでは、主に以下の方法でラベル付けを行います。

単一画像方式

自動化ツールが登場する前は、動画のアノテーションはあまり効率的ではありませんでした。動画からすべてのフレームを抽出し、画像アノテーションの手法を用いてラベル付けを行うのが一般的でした。

30fpsの動画では、1分間に1,800コマを含むことになります。この方法だと、動画アノテーションのメリットを活用できず、大量の画像にラベル付けするのと同じように時間とコストがかかってしまいます。また、物体を分類しても、次のフレームでは別の物体に分類されるなど、エラーが発生する可能性があります。

連続フレーム方式

自動化ツールで利用可能な連続フレーム方式により、動画アノテーションの作業は効率的に行うことができるようになりました。コンピュータは、物体とその位置をフレームごとに自動的に追跡し、撮影された映像の連続性を認識することができます。

コンピュータは、オプティカルフローのような連続フレームの技術を利用して、前後のフレームのピクセルを分析し、現在のフレームのピクセルの動きを予測します。この機能により、コンピュータは、特定の物体が数秒間映らなくても、正確に特定することができます。

しかし、この方法にも課題があります。例えば、監視カメラの映像のように、撮影された映像は解像度が低いことがあります。そのため、オプティカルフローなどの補間ツールを改良し、フレーム間の文脈をうまく利用して物体の識別を行うようにする必要があります。

 

動画アノテーションで気をつけたいポイント

動画アノテーションを行う際に重要なのは、使用するツールです。アノテーション作業を効率化し、コスト削減するには、ある程度の自動化を行うことが重要です。多くの企業が、特定の領域に対応した動画アノテーションの自動化ツールを提供しています。

もう1つ気をつけたいのが、クラシファイアです。連続性のあるアノテーションにより、エラーを減らすことができます。また、期待する精度でモデルをトレーニングするために、十分な教師データを用意しましょう。アノテーション済みの動画データが多いほど、新しいデータに対する予測の精度が高まります。

 

Appenの動画アノテーションサービス

Appenは、継続的なAIの学習や改善に欠かせない画像、文章、発話、音声、映像、その他のデータを収集、アノテーションを行うサービスを提供しています。100万人以上の熟練したクラウドワーカーからなる、グローバルネットワークを活用し、偏りの少ない高品質なデータを、大規模かつ迅速に提供します。

詳細については、以下のフォームもしくは、contact-japan@appen.comまでお問い合わせください。

お問い合わせ

Website for deploying AI with world class training data
言語