ー数式駆動教師あり学習と権利クリアな実画像を活用した世界初の画像生成AIモデルー
Visual Bankグループの株式会社アマナイメージズ(東京都千代田区 代表取締役CEO:望月逸平、以下「アマナイメージズ」)と国立研究開発法人産業技術総合研究所(以下「産総研」)のグループ会社である株式会社AIST Solutions(代表取締役 社長 CEO:逢坂清治、以下「AIST Solutions」)は、2024年7月8日に共同研究契約を締結しました。
産総研の有する数式生成画像による権利関係の懸念が少ない「数式駆動教師あり学習*1」と、アマナイメージズが管理する権利関係が明確で倫理的な問題を含まない「Qlean Dataset(キュリンデータセット)」の実画像を掛け合わせた『国産画像生成AIモデル』の開発に向けて共同研究を開始します。
背景
人工知能(AI)技術の進化のスピードは著しく、2022年以降、特に生成AI*2の技術は注目を集めています。生成AIは、人間の指示に応じて、自然言語から画像・動画・3Dまで、多様な形式の成果物を出力することが可能となりました。
生成AIは一般に、数億点規模の大量のデータを収集し学習した基盤モデル*3をベースとしています。一方で、学習させる画像によっては著作権侵害やプライバシー侵害、不適切に付与された教師ラベル*4が人種によって不公平な認識結果を出力するなど、「基盤モデルが学習したデータの透明性に関する問題」があります。それらが、商用利用の際の課題となりつつあり、基盤モデルをベースとして権利許諾済みのデータを追加学習することで権利上のリスクを排除するなど、実務上は様々な対応がとられている状況です。基盤モデルが学習したデータの透明性に関わる問題を解決する手段の模索は、AI分野において喫緊の課題となっています。
共同研究の内容
本共同研究は、権利リスクを最小化した『国産画像生成AIモデル』の開発を目指すものです。
産総研が保有する「数式駆動教師あり学習」をコア技術とし、アマナイメージズの権利関係が明確で倫理的な問題を含まない「Qlean Dataset」の画像データ等を利用することで、権利リスクを最小化し安心して商用利用できる基盤モデルの構築が可能です。
数式駆動教師あり学習(Formula-Driven Supervised Learning: FDSL)について
NEDO(国立研究開発法人 新エネルギー・産業技術総合開発機構)の「人と共に進化する次世代人工知能に関する技術開発事業*5」において開発された技術*6。事前の学習で実画像を一切用いず、数式*7から画像パターンや教師ラベルを自動で生成することで教師ラベル付けや実画像データ収集のコストを削減した。数式に権利がない限り、倫理的な問題、権利関係を気にせずAIの画像認識モデル(学習済みモデル)を構築する手法「数式駆動教師あり学習」を2020年に世界で初めて開発しました。
アマナイメージズのデータ素材「Qlean Dataset(キュリンデータセット)」について
創業から40年、アマナイメージズは一貫してビジュアル素材の管理・流通・作家への対価還元を事業として展開。現在は「Qlean(キュリン)」というブランドのもと、ビジュアル素材を中心に著作権や肖像権などに配慮した「権利クリアなデータ素材」を各業界に提供し、各種素材の権利者に対価還元を行うプラットフォームを整備しています。国内最大級の規模を誇る「権利許諾済みデータベース」と「利用に応じて対価を権利者に還元する仕組み」を基盤として、高品質で権利クリアなデータを各業界に提供しています。オーダーメイドの新規データ開発やAI学習用オリジナルデータの提供を含め、「Qlean Dataset」としてAI学習用データをAI開発現場に提供しています。
「数式駆動教師あり学習」と、「Qlean Dataset」の権利関係が明確で倫理的な問題を含まない実画像を組み合わせた本研究が実現すれば、数式生成画像をベースとした画像生成AIモデルとして世界初の取り組みとなります。
画像認識の文脈では、事前学習として予め「数式駆動教師あり学習」を施すことにより、追加学習に要する実画像枚数の削減につながることが実験的に明らかになっています。画像生成においても学習する実画像枚数を削減するなど、権利関係における不安を可能な限り取り除くことが期待できます。この方式での画像生成AIの開発の可能性の有用性が示されることにより、基盤モデルの開発プロセスに新しい選択肢を提供できます。
また、今回の共同研究で開発された基盤モデルは、学習データに起因する権利リスクを最小化することができます。その結果として、画像生成AIの最終的なユーザーがより安心して商用利用できるかたちを模索していきます。
なおアマナイメージズは、生成AIモデルが共同研究の結果として構築された際には、モデルを通じた収益を、作家やクリエイターなど貢献して頂いた皆さまに還元する予定です。
*1:実画像の代わりに数式から生成した図形を学習データとして学習させる手法
*2:人間の指示に応じて様々なコンテンツ(画像・動画・文章など)を生成できるAI
*3:大量のデータで事前学習し、生成を含む様々なタスクに適用できることを目的とする大規模モデル
*4:AIモデルで学習できる形式にするために、画像に対して付与したタグ情報
*5:事業概要:
https://www.nedo.go.jp/activities/ZZJP_100176.html
*6:論文概要:
https://link.springer.com/article/10.1007/s11263-021-01555-8
*7:画像パターンと教師ラベルを生成するための生成規則
株式会社アマナイメージズ
- 代表取締役CEO:望月 逸平
- 本社所在地:東京都千代田区麹町5-3-23 日テレ四谷ビル WeWork
- URL:
https://amanaimages.com/about/
- AI学習用データセット提供サービス『Qlean Dataset』
https://qleandataset.amanaimages.com/
株式会社AIST Solutions
- 代表取締役 社長CEO:逢坂 清治
- 本社所在地:茨城県つくば市梅園一丁目1番1号
- URL:
https://www.aist-solutions.co.jp/
お問い合わせ先
株式会社アマナイメージズ 広報チーム
publicrelations@visual-bank.co.jp
株式会社AIST Solutions
問合せフォームメール:
https://www.aist-solutions.co.jp/contact/form.html
※産総研と企業との連携に関するお問い合わせ