データアノテーションとは？アノテーションの種類と活用事例

03/24/2023

人間のように振舞うAIや機械学習モデルを構築するには、大量の教師データが必要です。意思決定を行い、アクションを行うモデルでは、データアノテーションによって特定の情報を理解できるようトレーニングする必要があります。

データアノテーションとは？

データアノテーションとは、画像や動画など様々な種類のデータにタグやメタデータといった情報を付けたり、データを分類する作業のことを指します。機械学習に必要な教師データを作成する上で、データアノテーション作業は欠かせません。人間による高品質なデータアノテーションを行うことで、より精度の高いA Iシステムを構築することができます。結果として、ECサイトのレコメンド機能、検索エンジンの結果、コンピュータビジョン、音声認識、チャットボットなど、様々な形で顧客体験ソリューションの向上につながります。

アノテーションの対象となるデータの主な種類には、テキスト、音声、画像、動画などがあります。State of AIが2020年に行った調査よると、調査対象の企業はAI開発や機械学習のために前年よりも25%以上多くのデータを活用したことが明らかになっています。このことは、より多くの企業が、幅広い業種や形態のデータを必要としており、信頼性の高い教師データへの投資を増やす必要性が高まっていることを示しています。

アノテーションの種類

ここではアノテーションの種類と、アノテーションデータを活用した実際の事例をご紹介します。

テキストのアノテーション

テキストアノテーションは最もよく使われているタイプで、機械学習に関する調査で回答した企業の70% が、テキストを活用しています。テキストアノテーションとは、テキストに含まれる単語やフレーズに対して、人間が意味を解釈し、タグ付けを行う作業のことで、言葉を通して人間の感情を適切に認識し、理解する方法を機械に教えるプロセスです。

テキストアノテーションにおいて、精度は非常に重要です。アノテーションの精度が低いと、誤認識を招き、特定の文脈において言葉を理解することが難しくなります。機械は、人間の話し方やSNS上でのやり取りをもとに、特定の質問や発言に対して、あらゆる言い回しを理解する必要があります。

チャットボットを例に挙げてみましょう。チャットボットにとって馴染みのない質問をユーザーがした場合、当然ながらチャットボットの回答は不自然になってしまいます。アノテーションの精度をあげることで、チャットボットは人間の言葉を適切に理解でき、ユーザーが満足する回答を提供することができます。これにより、顧客体験を向上できるだけでなく、チャットボットに任せられる業務領域が広がることで、企業全体の業務効率化にもつながります。

テキストからは人間の意図や感情を読み取ることができます。テキストアノテーションには、感情、意図、質問など幅広いアノテーションが含まれます。

センチメントアノテーション

センチメント分析（感情分析）は、テキストから態度、感情、意見を評価し、ビジネス上の意思決定に影響する重要なインサイトを提供します。そのため、非常に高い精度が求められます。

このようなデータを取得するには、ネット上のあらゆるコンテンツから感情を評価する人間のアノテーターが必要となります。彼らは、SNSへの書き込みやレビューサイトの口コミなどから、特定のワードや表現がどのような感情を持っているのかを判断し、タグ付けを行います。流行語や社会的な文脈を理解する人間のアノテーターが作業を行うため、精度が高い高品質な教師データを作成することが可能です。

インテントアノテーション

チャットボットと人間の会話が増えるにつれ、機械は人間の言葉と意図の両方を理解できるようにならなければなりません。一般的に、機械が意図を認識できない場合、リクエストを進めることができず、情報を言い換えるよう求めることが多いでしょう。それでも機会が理解できない場合、ボットはその質問を人間のオペレーターに渡すかもしれません。

顧客の興味や行動を把握するためのインテントデータを収集し、分類することで、顧客の意図を要求、命令、予約、確認といったカテゴリに区別できるようになります。これらの分類により、機械は、言葉の意図を適切に理解し、顧客のリクエストにスムーズに答えることができるようになります。

セマンティックアノテーション

セマンティックアノテーションとは、文中に含まれる商品名や企業名などの単語に対して、意味付けを行うことを指します。

セマンティックアノテーションは、商品リストのタグ付けを改善し、顧客が探している商品を確実に見つけることができるようにします。商品タイトルや検索キーワードに含まれる様々な要素をタグ付けすることで、サイト内検索における関連性やサジェスト機能を向上させるのに役立ちます。

固有表現抽出アノテーション

固有表現抽出（NER）は、大規模なデータセットから特定の情報を抽出し、抽出したデータを処理・解析するのに使用されます。正式名、場所、ブランド名といった情報の抽出・分類もその一例です。NERシステムでは、人間による手作業でアノテーションされた教師データが大量に必要になるケースが多いです。

テキストアノテーションの事例：マイクロソフト

マイクロソフトのBing検索エンジンは、その検索結果の品質を継続的に高めるため、大規模なデータセットを必要としていました。さらに、同社が展開する各マーケットに対して関連性の高い検索結果を実現することが課題でした。

そこでAppenは、検索エンジンの精度向上に必要な高品質なデータセットを提供。さらにデータの品質を高めるソリューションの開発やテストを継続的に行っています。

詳細の事例は、事例：マイクロソフト Bingの検索品質の向上でご覧いただけます。

音声アノテーション

音声アノテーションとは、音声に対しての意味付けや、音の種類や音量に対してのタグ付けを行うことです。音声アノテーションには、特定の発音やイントネーションの転写、言語や方言、話者の属性などを特定することも含まれます。

活用例は様々で、中には特殊なアプローチを必要とするものもあります。例えば、ガラスが割れるような非音声のタグ付けなどは、会話や現象の中で発生するノイズやサウンドの文脈をより明確にすることで、音や言葉を適切に理解することができます。

音声アノテーションの事例：Dialpad

クラウド型電話システムを提供するDialpadは、電話音声を収集して会話を全て書き起こし、自然言語処理アルゴリズムですべての会話を分析します。各担当者や会社全体がうまくいっていること、そうでないことを特定し、セールスの電話業務を支援しています。一方で、会話分析を行うモデルの精度を上げることが課題でした。

そこで同社はAppenのアノテーションプラットフォームを活用し、モデルの精度を向上させるために必要な音声データと教師データを作成することが可能になりました。

詳細の事例は、事例：Dialpad 会話分析の精度を向上させる教師データ作成でご覧いただけます。

画像アノテーション

画像アノテーションは、コンピュータビジョン、ロボットビジョン、顔認識、機械学習など、さまざまな分野において重要な作業です。これらのソリューションを訓練するためには、識別子、キャプション、キーワードなどの形で画像にメタデータを付与する必要があります。

自動運転車や農産物の収穫・選別機で使用されるコンピュータビジョンシステム、病状を自動診断するA Iソリューションまで、大量の画像データを必要とするシーンは数多く存在します。画像アノテーションは、これらのシステムを効果的に訓練することで、精度と正確さを向上させます。

画像アノテーションの事例：Adobe Stock

Adobeは、動画や画像、写真など2億点以上の素材を販売するストックフォトサービス Adobe Stockを運営しています。ユーザーが探している素材をすぐに見つけられるよう、Adobeはスピーディーかつ効率の良いソリューションを必要としていました。

1億を超える画像素材と、日々アップロードされる何十万の新しい画像の両方に対し、属性を明らかにするモデル作成のため、Appenは高精度な教師データを提供しました。

高精度な教師データを活用することで、ユーザーは探している画像をいち早く見つけることができ、同社に対するユーザーの信頼度やサービス満足度向上にもつながっています。

詳細の事例は、事例：Adobe Stock サイト内検索の関連性を向上でご覧いただけます。

動画アノテーション

動画アノテーションは、動画に含まれる音声や物体、テキストなど様々なデータに対してラベル付けを行う作業です。人間によるアノテーション作業は、意図の理解や曖昧さの判断において、コンピュータよりも優れており、より高精度な機械学習のための鍵となります。

例えば、検索エンジンの結果が関連したものになっているかどうかを判断する場合、人間の判断が必要です。コンピュータービジョンやパターン認識ソリューションをトレーニングする場合、木に含まれるピクセルすべての輪郭や、イメージ内の信号機など特定のデータを識別して注釈を付ける際にも、人による作業が必要になります。

動画アノテーションの事例：HERE Technologies

HERE Technologiesは、最先端の地図データや位置情報テクノロジーを多くの企業に提供しています。同社は、道路標識の検出モデルを作成するため、数万キロメートルにおよぶ道路の動画のアノテーションを行うという野心的な計画を持っていました。動画を画像化し、1コマ1コマに対してタグ付けするのは、膨大な時間とコストがかかります。そのため、標識検出アルゴリズムのパフォーマンスを微調整する方法を見つけることが課題となっていました。

そこでAppenの動画の物体追跡ソリューションにより、動画アノテーションの作業効率を上げることが可能になりました。詳細の事例は、事例：HERE 道路標識へのアノテーションでご覧いただけます。

Appenのデータアノテーションサービス

Appenでは、世界で最も革新的なAIシステムを構築し、継続的に改善するために使用される画像、テキスト、発話、音声、動画を収集してラベルを付けます。

235以上の言語の専門知識、世界中で勤務する100万人以上の熟練したスタッフ、そして業界最先端のAI支援データアノテーションプラットフォームを運用して、Appenのソリューションはテクノロジー業界、自動車業界、金融サービス業界、小売業、製造業、そして世界中の政府機関のリーダーたちが求めている品質、セキュリティ、スピードを提供しています。

詳細については、以下のフォームもしくは、contact-japan@appen.comまでメールでお問い合わせください。

お問い合わせ