AI開発のための既製データセット・ラベル付きデータセット
Appenは、100,000時間の音声データ、500,000枚の画像データ、1億ワードのテキストなどを含む、80を超える言語と方言に対応した800以上の認定データセットを提供しています。
ASRデータセット
90以上の言語に対応した100,000時間の音声データ
10,000時間を超える90以上の会話音声データセット
70,000時間を超える120以上の朗読音声データセット
20,000時間を超える20の自由発話音声データセット
70時間の赤ちゃんの泣き声、70時間の犬と猫の泣き声、子供の声などの特殊なデータセット
大規模言語モデルデータセット
81億トークンの大規模言語モデルデータセット
500万の画像とテキストがペアになったマルチモーダルデータセット(日英韓に対応)
100万の動画とテキストがペアになったマルチモーダルデータセット(日英韓に対応)
100万のChain-of-Thoughtデータセット(日英韓に対応)
テキストデータセット
98の言語に対応した523万エントリーの発音辞書
22の言語に対応した326万エントリーの品詞辞書
8の言語に対応した100万以上のNERデータセット
画像データセット
合計600万枚の画像
多言語に対応した12,000枚のOCR画像
2,196枚のマルチラベル画像データベース
680枚の多様なポーズとライティングのポートレート
動画データセット
乳児の泣き声動画100本 (各1分)
3言語の字幕付き動画(更新一下,新的说法:东亚各国朗读视频,海量开源爬取数据集)
音声合成データセット
20以上の国籍、400人の声優
覆盖多种不同情绪的音色及应用场景(翻译)
運転者危険行動識別データセット:運転位置、危険行動、疲労度の検出に活用できます。
乗客安全監視データセット:車内に残された子供、ペット、危険物などを特定に活用できます。
車内音声データセット:音声ナビゲーションやインテリジェント運転体験の実現に活用できます。
車外データセット:車線、障害物、駐車スペースなど車外環境の識別に活用できます。
自然言語処理データセット:チャットプログラムを生成、効率的なオンラインカスタマーサポートの実現に活用できます。
音声合成データセット:テキストのリアルタイム変換、テキストを自然な音声に変換する音声合成に活用できます。
ファイナンス業界用OCRデータセット:金融や保険業界の契約書のレビュー、OCRの自動化、効率的で正確なテキスト文字起こしの自動化の実現に活用できます。
音声認識データセット:家庭用電子製品の機能的でスマートなインタラクションに活用できます。
障害物画像データセット:ロボット掃除機の物体識別、障害物回避などの機能に活用できます。
顔認識・音声認識データセット:スマートデバイスアプリケーションの展開に活用できます。
顔認識・危険行動追跡データセット:AIスマートセキュリティの構築に活用できます。
データセットにご興味のある方は、ダウンロードをクリックしてください。担当者がご連絡いたします。
700以上のテキスト、画像、動画、音声のデータセットやラベル付きデータセットを提供
迅速なデプロイ
ラベル付きデータセットがAI機械学習のトレーニングを強力に支援
高いコストパフォーマンス
既製データセットを活用することで、費用対効果を高めることが可能
専門性
データ収集とデータセット分野で20年以上の経験を持つ専門家チーム
幅広いデータ形式
画像、動画、音声、テキストなど幅広いデータ形式に対応
大規模データ
大規模な高品質データで、効率的にモデルのトレーニングを実施
高品質データ
機械学習モデルの品質を向上させ、データのバイアスを低減
Appen Japan
アッペンジャパン株式会社
東京都千代田区
丸の内1-5-1
新丸の内ビルディング9階
100-6509
TEL 03–6822-2971
Appen Japan
アッペンジャパン株式会社
東京都千代田区
丸の内1-5-1
新丸の内ビルディング9階
100-6509
TEL 03–6822-2971