生成AIの退化とは？〜直面するリスクとその原因〜

近年における生成AIの進化と発展により、テキストや画像、映像などのコンテンツを手軽に作成できるようになりました。

この記事では、そんな生成AIが直面する「退化」のリスクや、その原因・背景などについて、解説します。

「ケクレの夢」とも重なるAIの自己崩壊

19世紀の化学者であるアウグスト・ケクレが見た「蛇が自分の尻尾を噛む」という夢は、ベンゼン分子における環状構造の発見に繋がったことで有名です。そして奇妙で象徴的なこの夢にも重なる現象は、現代におけるAIの進化にも起きているのです。

AIの進化は著しく、自然言語処理や生成AIとしての活用が広まる一方で、AI同士が互いに学び合う「自己循環」状態も進行しつつあります。AIの内部構造が複雑になるほど、自己矛盾やデータの劣化が発生するリスクも高まります。

詳細は後述しますが、生成AIが生成したデータを他のAIが再利用することで、元のデータソースが機械生成コンテンツとなる可能性が高まります。人間が制作したコンテンツに依存しないループ構造な「AI学習循環」が生じることで、やがて「自己崩壊」へと繋がるのです。

生成AIによるコンテンツ品質は、元データの品質に依存

生成AIは、ここ数年で目まぐるしい進化を遂げています。特に、テキストや画像、音声などの生成において、かつては人間によるクリエイティブな作業が必要とされた領域に進出し、多様な業界で活用され始めています。

例えば、OpenAIのChatGPTやGoogleのGemini(旧Bard)のような大規模言語モデル(LLM)は、膨大なテキストデータからパターンを学び、ほぼ人間と区別がつかないテキストを作成できます。

しかし、この技術の急速な成長の陰には不安定さが潜んでいます。

生成AIが作成するコンテンツは、人間が作成した膨大なテキストデータを基にしていますが、そのコンテンツの質は、元データの品質に強く依存します。

AIがAIから学ぶ？学習循環によるデータの劣化

AIが作成したデータやコンテンツを再び他のAIが学習する「自己循環」現象は、AI業界全体に深刻なリスクをもたらす可能性があります。

このプロセスでは、AIモデルが生成した低品質のデータや誤った情報が次のAIモデルの学習データとして利用され、データの精度や信頼性が劣化します。データの再利用が繰り返されることで、AIモデルの予測や生成の精度が著しく低下し、次第に現実とのギャップが広がっていくのです。

このような循環は、短期的には便利で効率的な手法のように思われるかもしれませんが、長期的にはAI技術の信用を損なう結果につながります。

とある研究によれば、元のデータが一部保持されていても、数回の反復によって大きな劣化が生じることが確認されています。つまり、「AIがAIから学ぶ」ことは、AIの技術的な信頼性や価値を失っていくことを意味します。

そのため、生成AIが作成するデータの質を維持するためには、人間によるデータ管理と精査が不可欠なのです。

量産型コンテンツの氾濫による創造性の危機

生成AIの広範な利用により、現時点においてすでに、テキストや音楽、映像などのコンテンツが類似したフォーマットであふれる現象が広がっています。

これは、ヒット作や成功したコンテンツを模倣し、同じ形式やスタイルで無数の「似たような」作品が生み出されることによって生じています。生成AIは学習したパターンをベースとして新たなアウトプットを作成するため、統計的にヒット作に近いものを再現する傾向が強く、結果として量産型コンテンツが濫造されてしまうのです。

この現象が続くと、創造性や多様性は喪失され、新しいアイデアや表現が生まれにくくなります。生成AIに期待される「創造性の飛躍」は、模倣の連鎖によって阻害されることとなるでしょう。

モデル崩壊の実例とは　〜ChatGPTの能力低下〜

2023年、スタンフォード大学とカリフォルニア大学バークレー校が実施した研究によれば、ChatGPTの性能がわずか数ヶ月の間で大幅に低下したことが確認されました。

この現象は「モデルのドリフト」「データのドリフト」などとも呼ばれ、AIモデルが時間の経過とともに本来の精度や能力を失ってしまうことを指します。GPT-3.5とGPT-4を比較した結果、特に数学問題の解答や繊細な質問への対応において、著しい能力低下が見られました。

GPT-3.5/4における回答精度などの経年変化 — GPT-3.5/4において、回答精度などは経年変化している。
Lingjiao Chen, Matei Zaharia, James Zou (2023) 「How Is ChatGPT's Behavior Changing over Time?」 p.3 より引用

この事例は、生成AIにおける退化のリスクを象徴しています。AIの品質は、データの質とモデルのメンテナンスに依存しているため、学習データの管理やモデル更新が適切でないと、長期的な能力低下を引き起こす可能性があるのです。

生成AIが継続的に発展・成長するために必要なこと

生成AIが今後も発展し続け、その性能と信頼性を保つためには、データ管理とモデル更新が必要不可欠です。

生成AIの性能劣化を防ぐためには、人間が作成したオリジナルなデータソースの活用や、AI作成データと人間作成データを区別するための対策が求められます。

また、AIが生成したデータによる「学習循環」を避けるためには、モデルの学習データを厳密に管理し、精度を保つ仕組みが必要です。

さらに、業界全体でデータの出所や管理手法を共有し、モデル崩壊のリスクを最小限に抑えるための共通のガイドラインを設けることも有効でしょう。データの多様性を保ちながら、元のデータが公平に反映されるようにすることで、AI技術に期待される創造的な可能性を最大限に引き出されるのです。

さいごに

今後も更なる発展が期待される生成AIですが、目的に特化したサービスなども多く出現しており、業界を問わず様々な場面で活用されています。

当社においても、AIによるパーソナライズやモデル着用画像生成のサービスを取り扱っており、アパレル企業を中心に多くの導入実績があります。サービスのご紹介や無料デモも承りますので、ご興味のある方は、ご遠慮なくご相談いただけますと幸いです。