AI・機械学習向け学習データの作成


Appen独自のアプローチで、高精度なAI構築に不可欠な信頼性の高い学習データを提供します。


Image

Appenの高精度な学習データで 大規模なAI開発をサポート



AIソリューションの構築を成功に導くためには、質の高い訓練データ(学習データ)が大量に必要です。Appenでは、信頼性の高い、世界トップクラスの訓練データを大規模に生成するために必要不可欠なクラウドワーカー、プラットフォーム、専門知識を提供しています。



学習データとその重要性



訓練データとは、AIモデルや機械学習アルゴリズムが適切な判断を導くことができるように意味付け(ラベリング)されたデータです。訓練データは、学習データや教師データとも呼ばれます。

例えば、自動運転車に使用するモデルを構築するための訓練データには、車、道路標識そして人々を識別するようにラベル付けされた画像や映像が含まれます。カスタマーサービス業向けのチャットボット生成には、「銀行残高はいくら?」というシンプルな疑問を解決に導く、あらゆる質問に関する、文章だけでなく音声のデータも必要となります。

AIモデルやAIプロジェクトの開発において大きな役割を担っているのが訓練データです。「Garbage in Garbage out(ガーベージ・イン、ガーベージ・アウト)」という言葉があります。これは、「無意味なデータからは、意味ある結果は出てこない」という意味の慣用句です。低品質なデータをモデルのトレーニングに用いれば、最高品質のモデル構築への道のりは、遠いものとなるでしょう。

最適なアルゴリズムを使用しても、低品質のデータでトレーニングすることにより、誤った内容を学習してしまいます。思惑通りの結果は出ず、期待に添うような働きをしてくれません。AIモデルやAIプロジェクトにおける成功への道は「どのデータを選ぶか」に左右されるといっても過言ではありません。


ImageImage




Appenが選ばれる理由



訓練データのラベル付けや収集には、ヒューマン・インテリジェンスの力が不可欠です。Appenの高品質かつ信頼性の高い訓練データは、ヒューマン・インテリジェンスにより支えられています。


Image

アノテーションツール



Appenのデータアノテーションツールでは、画像、文章、音声、映像、センサーなどのデータ収集およびラベル付けをサポートし、世界トップクラスのイノベーティブなAI構築からトレーニング、継続的な向上までを担います。当社のプラグアンドプレイ機能を備えたグラフィカル・ユーザー・インターフェースや独自APIが、データアノテーション作業の作成、ローンチを簡易化します。機械学習の品質、精度、アノテーション速度の向上を図るスマートラベリング機能も搭載されています。


AIデータアノテーションツール
Image

クラウドワーカー



世界トップクラスのAI開発に欠かせない膨大な量のトレーニングデータを作成するには、数多くのクラウドワーカーのサポートが欠かせません。また、クラウド・マネージメントサービスにおいては、各企業の要件に合わせ、最適なアノテーションの人材を見極められる豊富な経験が求められます。Appenには、100万人を超える優秀なクラウドワーカーが在籍しております。そのネットワークは、170か国以上、235を超える幅広い言語をカバーしています。



Appenのグローバルネットワーク
Image

専門知識



25年以上にわたり、Appenは機械学習プロジェクトの分野において6,000を超えるプロジェクトを遂行してきました。この経験があるからこそ、今日のAIプロジェクトに求められる複雑なニーズにも対応可能な、迅速かつ精度の高いサービスを提供しております。世界各国で活躍するテクノロジー、自動車、金融サービス、小売、製造の各業界そして各国政府のリーダーから必要とされる品質、セキュリティレベル、スピードに、当社のソリューションで対応いたします。



AIデータに関する専門性


導入企業



Image
Image
Image
Image
Image
Image
Image
Image
Image




学習データの種類



Image

文章



さまざまな言語で収集、ラベリング、検証されたデータを活用し、テキストベースの自然言語処理を導入します。
Image

画像



画像データの収集および分類、またセマンティック・セグメンテーションにおけるピクセル・ラベリングを活用することで、機械学習機能にコンピュータービジョンを装備します。
Image

音声



発話に絞ったデータは、タイムスタンプが付与され、180を超える言語および方言によって分類されます。音声データを処理するスマートアシスタントなどの構築をサポートします。
Image

映像



高品質の音声と画像のアノテーションを組み合わせて映像の処理を行い、機械学習に活用可能な学習データを生成します。映像入力の理解およびオブジェクトの認識、意思決定についてモデルに学習させます。
Image

センサー



センサーから直接得られるデータをアノテーションして、データポイントを活用。また、LiDARやポイントクラウド(点群)アノテーションなどの多種多様なデータソースの決定を機械学習モデルに習得させます。