ひたすら画像をたくさん記憶するだけでは、ご質問にもあるようにデータにない文字の書き方だった場合に認識することができません。 それに、画像をたくさん記憶するにはディスク容量も大量に必要になりますし、また、保存された画像の中から入力データに一致するものを探し出すのも困難です。
AIを用いた文字認識では、単純に大量の文字のパターンを記憶するのではなく、それらの大量の画像から、対象の文字の特徴量を抽出して、それを比較することで文字の認識を行っています。
たとえば「A」という文字ならば、斜めの棒2本と水平の棒がありますよね。 この特徴を画像から数学的に捉えることで文字の識別を行っています。 この用途には畳み込みニューラルネットワーク(CNN)というネットワークモデルなどがよく用いられます。 なお、大量の文字画像を記憶はしませんが、ディープラーニングの場合大量の文字画像を使用して、この特徴量を学習することで精度を上げることが可能です。
ちなみに、質問にあったデータにない文字の書き方であった場合ですが、AIの場合は比較しているのはあくまでも「特徴」についてなので、特徴が合致していれば、たとえデータにない文字の書き方であったとしても、文字を識別することが可能です。 |