15 April 2026

242: Aprendizado por reforço, com Quentin Gallouédec, PhD. (Hugging Face)

IA Sob Controle - Inteligência Artificial

About

Nesta semana, voltamos a falar sobre o histórico, os processos, e o impacto da técnica de aprendizado por reforço dentro da Hugging Face, e no mercado de IA generativa em geral.

Vem ver quem participou desse papo:

⁠⁠Marcus Mendes⁠⁠, host sob controle⁠⁠Fabrício Carraro⁠⁠, co-host sob controle, Program Manager da Alura, ⁠⁠autor de IA⁠⁠ e host do podcast Carreira Sem FronteirasQuentin Gallouédec, PhD, Engenheiro de Pesquisa na Hugging Face

Links:

Imersão IA Sob Controle no Vale do SilícioEntrevista original em inglês com Quentin Gallouédec, PhDTRL v1.0172: Zachary Mueller, líder técnico de Accelerate no Hugging Face236: O significado de inteligência na era dos LLMs, com Adrian Valentim238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von WerraEstudo de esconde-esconde da OpenAITreinando Pokémon com aprendizado por reforço

Quer ir com o Fabrício Carraro, o Marcus Mendes e o Paulo Silveira na “Imersão IA Sob Controle e Alura no Vale do Silício“? Vagas limitadas, corra para reservar a sua!

Inscreva-se na ⁠⁠Newsletter IA Sob Controle⁠⁠, e receba notícias semanais sobre Inteligência Artificial, assinada por Fabrício Carraro.

⁠⁠Preencha o formulário⁠⁠ com as suas sugestões para deixar o conteúdo do IA Sob Controle ainda mais interessante.

Alura Cursos de Tecnologia – ⁠⁠https://www.alura.com.br⁠⁠

Edição e sonorização: ⁠⁠Rede Gigahertz de Podcasts