企業におけるAI活用が急務であると言われていますが、何よりも大事なことはAIを利用するための高精度なデータがどれだけ揃っているかというのは、皆様ご存知のとおりです。
そのためのデータ生成ということで、このデータラベリングという技術、または作業が必要となってきます。アノテーションという言葉も使われますが、同じ意味と考えていただいて構いません。データラベリングというのは、文字通り、画像や動画、音声、テキストになどの学習用データに対してラベルをつけていく作業のことを言います。
AIの活用に至るまでの一連の作業におけるデータラベリング(アノテーション)の位置づけは次のようになります。
アノテーションにおける具体的な作業では、例えば、画像に対して行う場合には、次のような例があります。
・猫の画像に猫の種別情報をつける
・人の画像の中で顔部分に枠を付ける。目鼻口の位置を指定する。
・画像の中の鳥の数を数える。
・SNSの口コミのいて、良い/悪い/普通のタグを付ける
・製造業において品質不良箇所に印をつける
一つ一つの操作に対してはとても簡単な作業です。しかしこれを大量に行うためには、データの収集から始まり作業を管理するためのツールが必要となってきます。それがアノテーションツールと呼ばれるものです。無料のものから有料のものまで様々なものがあります。また対象とするデータが、テキストなのか、画像/動画、音声かによっても変わってきます。
allAi.jpではこのような便利なアノテーションツールについてもご紹介をしていきたいと思います。