コンテンツモデレーションのためのAIと機械学習

06/28/2024

AIを活用したコンテンツモデレーションにより、モデレーションはこれまで以上に効率的になりました。より安全なオンライン体験を実現するコンテンツモデレーションのためには、適切なデータが重要です。

機械学習でコンテンツモデレーションを最適化

インターネット上には45億人以上のユーザーがいると言われており、ユーザーは日々、画像、動画、メッセージ、投稿などのコンテンツをオンライン上にアップロードまたはダウンロードしています。インターネットユーザーのほとんどは、お気に入りのソーシャルメディアやEコマースサイトが安全でポジティブなプラットフォームであることを望んでいます。

ユーザーの期待に応えるためには、コンテンツモデレーションが必要となります。コンテンツモデレーションとは、悪質または有害なコンテンツからプラットフォームを守る解決策です。従来、コンテンツモデレーションを手作業に頼ってきましたが、インターネット上に膨大なコンテンツが溢れている今、手作業によるコンテンツモデレーションは、費用対効果も効率性も非常に悪いです。

代わりに、企業は人工知能などのテクノロジーに投資して、コンテンツを自動的にモデレートするアルゴリズムを開発しています。人工知能 (AI)を活用したコンテンツモデレーションにより、企業はより迅速に拡張し、ユーザーにとってより一貫性のある方法でコンテンツモデレーションを最適化できます。この難しい作業を機械に任せることは、企業、従業員、ユーザーの両方にメリットをもたらします。

動画 (英語):https://youtu.be/zuJ7v41P0KA

コンテンツモデレーションの実用例

企業は、ビデオゲームからチャットボット、チャットルームまで、さまざまなデジタルメディアで、機械学習ベースのコンテンツモデレーションを使用しています。最も一般的な用途として挙げられるのは、ソーシャルメディアとEコマースの2つです。

ソーシャルメディア

Facebookだけでも20億人以上のユーザーがおり、1日に平均1億時間の動画が視聴され、3億5000万枚以上の写真がアップロードされています。このトラフィックが作成するコンテンツのボリュームを、手動で確認するのに十分な人員を雇うには、信じられないほどのコストと時間がかかります。AIは、テキスト、ユーザー名、画像、動画に、ヘイトスピーチ、ネットいじめ、悪質または有害なコンテンツ、フェイクニュース、スパムがないかを自動的にチェックすることで、効率的なモデレーションを実現しています。

Eコマース

コンテンツモデレーションは、ソーシャルプラットフォームだけにとどまりません。Eコマース (ネットストア)は、コンテンツモデレーションツールを使用して、高品質でビジネスに適したコンテンツのみを消費者に表示しています。たとえば、ホテルの予約Web サイトでは、AIを活用してホテルの部屋の画像をスキャンし、サイトのルールに違反するもの (写真に人物が写っていないなど) を削除する場合があります。


コンテンツモデレーションの仕組み

機械学習ベースのレビューシステムのコンテンツキューとエスカレーションルールは企業によって異なりますが、一般的には、ステップ1、ステップ2、またはその両方でAIモデレーションが含まれます。

  1. プレ・モデレーション:プレ・モデレーションとは、投稿前にユーザーコンテンツをモデレートし、投稿を許可するか判断することです。有害ではないと判断されたコンテンツは、投稿され、ユーザーに表示されます。有害である可能性が高い、またはビジネスに適さない可能性が高いと判断されたコンテンツは投稿が拒否されるか、他ユーザーに非表示となります。AIモデルの予測の信頼性が低い場合は、人間によるレビューのため、コンテンツにフラグが付けられるケースもあります。
  2. ポスト・モデレーション:ユーザーが有害なコンテンツを発見し、それを報告し、AIまたは人間がレビューし判断するモデレーション方式です。AIがレビューを行うと、ステップ1で説明したのと同じワークフローに従い、有害と判断されたコンテンツは自動的に削除されます。

メディアの種類に応じて、AIはさまざまな機械学習テクノロジーを使用してコンテンツを予測します。

テキスト

自然言語処理 (NLP):コンピューターが人間の言語を理解するためには、NLPに依存します。コンピューターは、不適切な言語を特定して削除するため、キーワードフィルタリングなどの技術を使用する場合があります。

感情分析:インターネット上では文脈が重要であり、感情分析はコンピューターが皮肉や怒りなどのトーンを識別するのに役立ちます。

画像と動画

物体検出:画像解析により、画像や動画内のヌードなどプラットフォームの基準を満たさない対象物を識別することができます。

シーンの理解:コンピューターが、シーン内で起こっている文脈を理解することを学習し、より正確な意思決定を行うことができます。

すべてのデータ型

データタイプに関係なく、企業はユーザー信頼性技術を使用して信頼できるコンテンツを特定することがあります。コンピューターは、スパムや露骨なコンテンツを投稿している履歴のあるユーザーを「信頼できない」として分類し、信頼できないユーザーが投稿するコンテンツに対して、より厳しい審査を行います。信頼性技術はフェイクニュースへの対策にも使用されます。信頼できないニュースソースがアップロードしたコンテンツに、注意喚起のラベルを付ける可能性が高くなります。幸いなことに、コンテンツモデレーションは常に新しいトレーニングデータを生成しています。コンピューターがコンテンツを人間のレビューアーにルーティングする場合、人間はそのコンテンツを有害か否かとラベル付けし、そのラベル付けされたデータをアルゴリズムにフィードバックして、将来の精度を向上させます。


コンテンツモデレーションの課題を克服

コンテンツモデレーションは、AIモデルに多くの課題をもたらします。膨大な量のコンテンツには、精度を犠牲にすることなくスピーディーなモデルを作成する必要があります。正確なモデルを開発する上で問題となるのは、データです。デジタルプラットフォーム向けのコンテンツの公開データセットは、収集会社がライセンスを保持されているため、限られた数しかありません。

また、言語の問題もあります。インターネットに国境はないため、コンテンツモデレーションAIは、多数の異なる言語と、それらを話す文化の社会的背景を認識する必要があります。言語は時間の経過とともに変化するため、新しいデータでモデルを定期的に更新することが不可欠です。

定義にも矛盾があります。ネットいじめとはどういう意味なのか、ヌードは芸術と見なされるべきのか。モデレーションプロセスに対するユーザーの信頼を維持するため、プラットフォーム内でこれらの定義を一貫して維持することが重要です。ユーザーは創造的であり、適度な抜け穴を見つけるためにアプローチを常に進化させています。これに対抗するには、モデルを継続的に再トレーニングし、最新の詐欺やフェイクニュースなどの問題を排除する必要があります。

最後に、コンテンツモデレーションのバイアスに注意しましょう。言語やユーザーの特性が関係している場合、差別につながる可能性があります。トレーニングデータを多様化し、コンテキストを理解するようにモデルに教えることは、バイアスを減らすために重要です。


Appenのコンテンツモデレーション

Appenでは、専門家チームが質の高い顧客体験を提供しています。ビジネスROIを向上させるコンテンツモデレーションを成功させるため、最先端のモデルの構築を支援します。

コンテンツモデレーションにエキスパートでAppenプログラムマネージャーのジャスティン・アダムは、成功するコンテンツモデレーションプロジェクトに関して、次の3つのインサイトを挙げています。

  • 現実社会に沿ったポリシー更新: コンテンツモデレーションにおける意思決定は、定義されたポリシーに従う必要があります。しかし、そのためには、ギャップ、グレーゾーン、エッジケースが出現したとき、特にデリケートなトピックについて、現実社会に応じてポリシーを迅速に進化させる必要があります。市場固有のコンテンツの傾向を監視し、ポリシーのギャップを特定し、推奨事項を提供し、ポリシーの変更を展開して、提供されるデータが最新かつ最も包括的なポリシーガイダンスに沿ったモデレーターによる決定に基づいていることを確認します。
  • 人口統計学的バイアスの管理:コンテンツモデレーションは、モデレーターの構成がモデレートされる対象の構成と似ている場合、最も効果的で信頼性が高いと言えます。必要な人口統計を定義し、多様性の調達のあらゆる側面を処理して、モデルに入力されるデータが人口統計バイアスの影響を受けないようにすることが重要です。
  • 品質管理戦略とリソース:コンテンツモデレーションの意思決定は、今日の政治情勢では精査されやすいものです。エラーを効果的に特定し、修正し、そして最も重要なこととして、エラーを防ぐための包括的な戦略が必要です。Appenは、訓練を受けた専門家チームの育成、品質管理レビューレイヤーの確立、カスタマイズされた品質分析と報告など、顧客固有のニーズに基づいた適切な戦略の策定及び運用を支援します。

Appenが選ばれる理由

Appenは、AIモデルの構築と立ち上げを20年以上支援してきた経験を持っています。Appenは、顧客のコンテンツモデレーションニーズのため、包括的なデータ分類パイプラインを提供します。また、Appen独自の品質管理技術により、高い精度と正確性を実現し、専門知識とプラットフォーム機能により、迅速なデリバリーとスケーラビリティを実現します。