人工知能:より公平な人間画像データセットを目指して
Nature
2025年11月6日
Artificial Intelligence: Towards fairer human image datasets
人間中心のコンピュータービジョン向け人工知能(AI:artificial intelligence)モデルの偏りを評価するための1万点以上の人物画像を収録したデータベースを報告する論文が、今週のNature にオープンアクセスで掲載される。ソニーAIが開発した「フェア・ヒューマンセントリック・イメージ・ベンチマーク(FHIBE:Fair Human-Centric Image Benchmark)」は、倫理的に収集され同意に基づくデータセットであり、人間中心のコンピュータービジョンの課題を評価し、偏見や固定観念を特定および修正するために使用できる。
コンピュータービジョンは、自動運転車から顔認識技術まで幅広い応用分野をカバーしている。コンピュータービジョンで用いられる多くのAIモデルは、同意なく収集された可能性のある欠陥のあるデータセット、特にウェブからの大規模画像スクレイピングによって構築されている。AIモデルはまた、性差別的、人種差別的、あるいはそのほかの固定観念を永続させる偏見を反映することが知られている。
Alice Xiangら(ソニーAI〔米国〕)は、同意、多様性、およびプライバシーなど複数の要素においてベストプラクティスを実装した画像データセットを発表した。FHIBEには81の国・地域から1,981人の被写体による10,318枚の画像が含まれる。データベースには年齢、代名詞カテゴリー、祖先、および髪と肌の色など、人口統計学的属性と身体的属性の包括的な注釈が付されている。参加者は、プロジェクトの詳細と潜在的なリスクについて説明を受け、包括的なデータ保護法に準拠したインフォームド・コンセントを提供した。こうした特徴により、本データベースはAIのバイアスを責任ある形で評価するための信頼できるリソースとなる。
著者らは、FHIBEを人間中心のコンピュータービジョン応用で用いられる既存の27のデータセットと比較し、FHIBEがAI評価において多様性と確固たる同意の面でより高い基準を設定していることを確認した。また、効果的なバイアス軽減策を有し、ほかのデータセットより参加者の自己申告による注釈が多く、一般的に過小に表現されがちな個人の割合が顕著に含まれている。このデータセットは、既存のコンピュータービジョンタスク向けAIモデルの評価に利用可能であり、これまでより多様なバイアスを検出できると著者らは指摘する。データセット作成には困難と費用がともなったものの、FHIBEはより信頼性の高いAIに向けた一歩となり得ると結論づけている。
- Article
- Open access
- Published: 05 November 2025
Xiang, A., Andrews, J.T.A., Bourke, R.L. et al. Fair human-centric image dataset for ethical AI benchmarking. Nature (2025). https://doi.org/10.1038/s41586-025-09716-2
doi: 10.1038/s41586-025-09716-2
注目の論文
-
2月3日
医学:朝の免疫化学療法は肺がんの治療成績を改善するかもしれないNature Medicine
-
2月3日
神経科学:生後2ヶ月の乳児は視覚的に物体を分類できるNature Neuroscience
-
1月30日
生態学:スヴァールバル諸島のホッキョクグマは海氷の減少に対して適応しているScientific Reports
-
1月29日
ゲノミクス:AlphaGenomeはDNA変異の影響を予測するNature
-
1月29日
古生物学:中国における種多様性の高い古代の海洋生態系Nature
-
1月28日
考古学:東アジアにおける複合工具製作の最も古い証拠Nature Communications
