Como Funciona e Como Treinar Segmentação Semântica

Опубликовано: 16 Май 2026
на канале: Programador Artificial

1,445

Como Funciona Segmentação Semântica de Imagem e Como Treinar a Arquitetura U-Net

00:00 Introdução
00:41 Classificação VS Segmentação Semântica
02:21 Como realizar anotação dataset customizado
06:00 Como converter as anotações em máscaras
10:04 Explicação paper e arquitetura U-Net
15:33 Repositório utilizado para realizar treinamento
16:47 Explicação código contendo arquitetura U-Net
19:39 Explicação código de treinamento e treinamento
22:30 Explicação código de inferência
24:58 Explicação fluxo Segmentação Semântica (e máscaras)
26:59 Inferências e análise dos resultados
28:56 Conclusão

🖼️ Neste vídeo, vamos explorar como funciona um modelo de aprendizado de máquina que realiza segmentação semântica de imagem. Se você não sabe o que é segmentação semântica, não se preocupe! Iremos ver os principais conceitos básicos, passando desde a anotação de um dataset customizado, como funciona a arquitetura destes modelos, o que são as máscaras até o treinamento e segmentações de imagens utilizando a arquitetura do U-Net.

🧠 E para entendermos como estas arquiteturas de visão computacional funcionam, iremos estudar toda a arquitetura do U-Net, um dos modelos mais simples de aprendizado profundo para realizar segmentação semântica, mas que irá ajudar a entender outros modelos mais robustos. Para ajudar ainda mais no entendimento iremos realizar o treinamento do U-Net para vermos as máscaras retornadas ao final da rede e conseguirmos compreendê-las.

🌐 Referências:
▶ Repositório principal (como_IA_funciona) - https://github.com/ProgramadorArtific...
▶ Fork da implementação do U-Net utilizada - https://github.com/ProgramadorArtific...

▶ Ferramenta de anotação LabelMe - https://github.com/wkentaro/labelme
▶ Função de perda Cross Entropy Loss no PyTorch - https://pytorch.org/docs/stable/gener...
▶ Dataset utilizado (Monkey, Cat and Dog detection) - https://www.kaggle.com/datasets/tarun...

▶ Paper U-Net: Convolutional Networks for Biomedical Image Segmentation - https://arxiv.org/abs/1505.04597
▶ Paper Deep Residual Learning for Image Recognition (ResNet) - https://arxiv.org/abs/1512.03385
▶ Survey (2020) com muitas informações de segmentação de imagem - https://arxiv.org/abs/2001.05566
▶ Survey (2016) com algoritmos de segmentação semânticas mais antigos (sem fully convolutional networks (FCN)) - https://arxiv.org/abs/1602.06541
▶ Fully Convolutional Networks for Semantic Segmentation (FCN) - https://arxiv.org/abs/1411.4038
▶ Mais informações da arquitetura U-Net - https://towardsdatascience.com/unders...
▶ Mais informações da arquitetura U-Net - https://towardsdatascience.com/u-net-...

#SegmentaçãoSemântica #UNet #VisãoComputacional #ProgramadoArtificial