動画説明文のAI自動生成を精度95%で実現したケーススタディ

本記事では、Appenが大手ソフトウェア企業と提携し、動画説明文のAI自動生成において95%の精度を達成したプロジェクトのケーススタディを紹介していきます。
動画説明文のAI自動生成を精度95%で実現
ある大手クリエイティブソフトウェア企業は、Appenと提携し、AIによる動画説明文の生成機能改善に取り組みました。
この取り組みの目的は、説明文の読みやすさ、一貫性、正確性を確保すること。プロジェクトでは、AIが生成する説明文に含まれるエラーの削減に注力し、動画の視覚的な情報をAIがより正確に捉えることを目指しました。
そのため、人間による厳密な検証(バリデーション)プロセスを導入しました。
結果として、プロジェクト全体で4万件の動画説明文を検証・修正し、95%を超える精度を達成。この構造化されたアプローチにより、生成AIモデルは高品質な説明文をスケーラブルに作成できる能力を大きく向上させることができました
プロジェクト目標
クライアント企業は、動画編集やデザインといった主要機能のパフォーマンスを向上させるため、AIによる動画説明文の精度を高める必要がありました。
そのためには、多様な動画コンテンツに対応し、AIモデルの出力を体系的に改善するスケーラブルなプロセスが不可欠でした。特に、AIが生成する説明文が、動画の内容を的確かつ情報豊かに伝えることを保証するために、人間の専門的な知見が求められていました。
プロジェクトで直面した課題
プロジェクト初期段階で直面した課題を紹介します。当初から動画の説明文を生成自体はできていたものの、出力には以下の問題が見られました。
事実誤認
視覚的な要素に関する重要な情報が欠落したり、誤った記述が含まれていました。
文法の不自然さ
生成された文章は流暢さに欠け、読み手にとって理解しにくいものでした。
文脈との不一致文脈との不一致
動画の主題と説明文が合致せず、内容が曖昧になったり、誤解を招く表現が含まれたりしました。
スケーラビリティの課題
大量のデータに対応しながら、一貫した品質を維持することが困難でした。
課題に対する解決策
これらの課題に対する解決策として、Appenは2段階の検証アプローチを採用しました。
フェーズ1:専門家によるレビュー
アノテーターが、AIが生成した説明文を正確性、網羅性、文法、文脈整合性といった観点から評価・修正しました。これにより、事実に基づいた正確で自然な文章への改善が可能となりました。
フェーズ2:自動品質強化プロセス
AppenのAIデータアノテーションプラットフォーム(ADAP)上で、スペルチェック、文法チェック、類似性チェックといった自動処理を導入しました。これにより、人間の作業と自動化ツールを組み合わせることで、効率性と品質の両立を実現。この反復的なプロセスにより、大量の説明文を処理しても一貫した品質が保たれるようになりました。
このように、専門家の知見と自動化ツールの融合によって、クライアント企業はAIモデルのアウトプット品質を大きく向上させることができました。
プロジェクトの成果
本プロジェクトを通じて、Appenは高品質な動画説明文を4万件納品し、95%以上の精度を達成しました。厳格な検証プロセスにより、事実誤認や文脈のずれが大幅に減少し、正確で文脈に即した説明文が保証されるようになりました。
この高品質なトレーニングデータは、クライアント企業がAIモデルの性能をさらに向上させ、将来的な出力精度の改善にもつながる基盤を築きました。人手によるバリデーションを活用することで、クライアントは読みやすく、一貫性があり、事実に基づいた説明文の生成を実現。さらに、スケーラビリティと効率性の両立にも成功しました。
Appenのソリューション
Appenは290以上の言語に対応する100万人以上のグローバル人材と、28年以上の経験を持つエキスパートを擁し、お客様のニーズに応じたAIデータサービスを提供してます。
AIデータサービス
Appenは、AIデータ業界のグローバルリーダーとして、28年以上にわたり、290以上の言語・方言に対応した高品質なデータを提供してきました。データクリーニング、データセット、データ収集、データアノテーションなど、お客様のAIモデル開発に必要な一連のサービスを提供しています。詳しくはこちらをご覧ください。
ファインチューニング
100万人以上のクラウドワーカーと経験豊富な専門チームが、お客様のモデルを最適化するためのファインチューニングと、人間とAIのフィードバックによる学習(RLHF)を支援します。バイアスを最小限に抑え、高性能なモデル開発を実現します。
大規模言語モデル開発プラットフォーム
Appenが独自に開発した大規模言語モデル開発プラットフォームは、大規模言語モデルの開発プロセスを効率化します。トレーニング、ファインチューニングだけでなく、開発に必要なさまざまなツールを提供し、迅速なモデル開発をサポートします。
AIセキュリティに関するご相談はお気軽にお問い合わせください!