|
Facebookは、AIの偏りを排除するために、研究者がさまざまな年齢、性別、肌の色、周囲の照明条件にわたってコンピュータービジョンとオーディオモデルの精度を評価するのに役立つように設計された、Casual Conversationsと呼ばれるビデオデータセットをオープンソース化すると発表した。 「カジュアル・カンバセーションズ」には、3,011人の参加者から45,000本以上の動画が投稿され、性別、年齢層、肌の色など、様々な要素が均等に分散していました。Facebookは、エラーを最小限に抑えるため、有料参加者に動画の投稿と年齢と性別のタグの提示を求めました。 さらに、FacebookはCasual Conversationsのために訓練を受けたアノテーターを採用しました。これらのアノテーターは、各動画の照明レベルにラベルを付け、AIモデルが低照度環境下で異なる肌色の人物をどのように処理するかを測定するのに役立てました。参加者の肌色は、フィッツパトリックスケールに基づいてタグ付けされました。フィッツパトリックスケールは、1975年にアメリカの皮膚科医トーマス・B・フィッツパトリックによって開発された肌色分類モデルで、紫外線に対する肌タイプの反応を一般化しており、タイプI(常に日焼けするが日焼けしない色白の肌)からタイプVI(日焼けしない色素の濃い肌)までを分類しています。 FacebookのAIチームは、新しいCasual Conversationsデータセットは、データセットが表すコミュニティのコンピュータービジョンとオーディオモデルの公平性を測定するための、精度テストに加えて補助ツールとして機能するはずだと指摘している。 現在、データセットはオープンソースコミュニティで公開されているものの、FacebookはCasual Conversationsには依然として限界があると指摘しています。例えば、性別ラベルの選択肢は「男性」「女性」「その他」のみで、ノンバイナリーとみなされる性別は含まれていません。 同社は、今後1年ほどかけてこのデータセットを拡張し、より包括的なものにして、より幅広い性自認、年齢、位置情報、活動、その他の特性を反映させる方法を模索し続けると述べた。 詳細は[リンク/参考]をご覧ください。 この記事はOSCHINAから転載したものです。 タイトル: FacebookがAIバイアスを排除するためのデータセットをオープンソース化 この記事のアドレス:https://www.oschina.net/news/136989/facebook-casual-conversations-dataset |