AI (Artificial Intelligence)

AI-100 - Treinamento de assistentes GPT (AI-100)


Descrição
Neste vídeo, Andrej Karpathy (um dos fundadores da OpenAI) explica como funciona o pipeline de treinamento dos assistentes GPT (como o ChatGPT), abordando as etapas sequenciais de pré-treinamento (Pretraining), ajuste fino supervisionado (Supervised Finetuning), o modelo de recompensas (Reward modeling) e "Aprendizado Reforçado a partir de Feedback Humano" (Reinforcement Learning from Human Feedback -RLHF). Também é destacada a importância da tokenização.
Palestra apresentada no Microsoft Build 2023.
Link para o vídeo original: https://youtu.be/bZQun8Y4L2A

CARGA: 42 minutos OBRIGATÓRIO: Não

Conteúdo
  • Treinando assistentes GPT
  • AI-100 - Feedback
Regras para conclusão
  • Todas as unidades precisam ser concluídas
  • Leads to a certificate with a duration: Não expira