Pode ser encontrado no deep learning book
Capítulo 40 - Introdução às Redes Neurais Convolucionais - Deep Learning Book
- É um algoritmo que pode captar a imagem de entrada, atribuir importância (pesos e vieses a serem aprendidas) a vários aspectos / objeto da imagem e ser capaz de diferenciar um do outro
- A arquitetura é similar a conectividade dos neurônios e foi inspirada na organização do visual córtex
- A convet é capaz de capturar com sucesso as dependências espaciais e temporais em uma imagem através da aplicação de filtros revelantes. Ela executa uma melhor ajuste ao conjunto de dados de imagem devido à redução no número de parâmetros envolvidos a capacidade de utilização dos pesos. Em outras palavras, a rede pode ser treinada para entender melhor sofisticação das imagens
- Usa-se então três ideias básicas: campos receptivos, pesos compartilhados e pooling
Entendendo Redes Convolucionais (CNNs)
Campos receptivos (convoluções)
- Filtros que enxergam pequenos quadrados e vão “escorregando” toda a imagem captado nos traços mais marcantes
- A profundidade de saída de uma convolução é igual à quantidade de filtros aplicados. Quanto mais profundos são as camadas de convoluções, mais detalhados são os traços identificados com os activations maps
- O filtro, que também é conhecido como kernel, é formado por pesos inicializando aleatoriamente, atualizando a cada nova entrada durante o processo de bacpropagation. A pequena região da entrada de filtro aplicado é chamado de reception field
Função de ativação
- Serve para trazer não-linearidade do sistema, para que a rede consiga aprender a qualquer tipo de funcionalidade, sendo que a mais utilizada é a Relu
Pooling