投稿を読む
過学習とはなんでしょうか?
   
2022-02-10 14:53

過学習とはなんでしょうか?

カテゴリーAI&ラーニング・ライフ > AIインフラWiki
コメント 0|  閲覧 3
回答
投稿を読む
   
2022-02-10 14:54

過学習とは、ある訓練データに対して適合したモデルにおいて、訓練データに適合しすぎてそれ以外のデータ(実際のデータなど)において成績が大きく低下してしまう状態の事を言います。
このような状態のモデルは、汎化能力が低いとも言われます。要するに、特定の条件でしか性能が出ず、汎用性が低いということです。

ディープラーニングの場合、多層化されたニューラルネットワークを用いるため、過学習が発生しやすくなります。やっかいなのは、モデルが複雑になればなるほど、難しい問題に対処できるにも関わらず、過学習のリスクも高くなる点です。
難しい問題に対処するには複雑なモデルが必要となりますが、そうなると過学習の可能性が高くなります。逆に過学習のリスクを避けようと単純なモデルにすると、今度は複雑な問題を処理できないという本末転倒なことになってしまいます。

過学習を回避するには、正則化やドロップアウトといった手法が取られます。
正則化は数学的にモデルの複雑さに罰則を科し、シンプルなモデルにする手法です。
ドロップアウトはニューロンをある確率でしか活性化させず、それ以外の場合には出力をゼロにし、少数のニューロンに対する依存を防ぐ手法です。

訓練においては、過学習の発生を検証することが必要です。
このためには訓練データとテストデータは同じものを用いず、分けておく必要があります。
そうしないと、過学習の発生に気づくことができません。
訓練は検証しながら行い、過学習の発生を確認したら訓練を終了するべきです。
つまり、データは訓練データと検証データ、テストデータの3種類が必要になります。

コメント 0