人間が学習する時のメカニズムを数学で模倣することで機械に学習させる方法です。
人間の脳は神経の塊ですが、その表面にはシート状(厚さ1.5mm~4mm 1400億個前後の神経細胞で構成)の大脳皮質が覆っています。
この大脳皮質は部位によって前頭葉や後頭葉などの名前が付いていますが、ここで思考や感覚、認識など、いわゆる学習部分をつかさどっています。
ちなみに、ニューロンというと脳の神経細胞のことだと思いがちですが、ニューロンは神経細胞のことなので、脊椎には運動に関するニューロン(運動ニューロン)が存在します。
話を元に戻しますが、ニューロンには長い尻尾(軸索)が1本あり、この先端がいくつかの小さな枝に分かれています。
この枝の先端はシナプスと呼ばれており、他のニューロンと結合(シナプス結合)することで学習を深めていきます。
ニューロンは知覚などからの電気信号が、ある一定量を超えると、軸索を通して結合先のニューロンに刺激を与えます。
何度も同じ知覚を得る事で、その知覚に関するニューロンの結合量が多くなり、これが学習として定着します。
この考え方を数式で表現することで、コンピュータに学習させようというものがニューラルネットワークです。
実際のニューロンは何層も重なっているので、ニューラルネットワークも複数の層で構成します。
複数の層で構成と言ってもピンとこないかもしれませんが、1層分を数式化し、それを直列に繋げていったものと考えれば分かりやすいかもしれません。
この考え方はAIという言葉が登場する以前から存在し、研究はされてきましたが、コンピュータの性能が不足しているため満足な結果が得られませんでした。
2006年頃からコンピュータの性能がようやく追いつき、実用化されるようになってきました。