Cadernos de Questões

Provas Favoritas

Filtros Salvos

Foram encontradas 522 questões.
#3449381

Julgue o item subsequente, a respeito de LLM e IA generativa.


No processo de inferência, o LLaMA utiliza decodificação paralela em vez de decodificação sequencial, gerando todos os tokens simultaneamente, sem depender do contexto anterior, o que elimina a necessidade de otimizações como layer-wise quantization.

  • Certo
  • Errado
Fale com IAgo
IAgo - Assistente IAProva
IA
Olá! Sou o IAgo, seu assistente aqui no IAProvatec 😊
Veja como posso te ajudar:
Agora