Cadernos de Questões

Provas Favoritas

Filtros Salvos

Foi encontrada 1 questão.
Anulada / Desatualizada
#1756813

No processamento de linguagem natural, é preciso realizar transformações de textos em números, geralmente vetores ou matrizes, de forma que sirvam de entrada para os algoritmos computacionais de aprendizado de máquina.
obre esses algoritmos de extração de características de textos, assinale a afirmativa incorreta.

  • Os algoritmos de extração de característicasBag of Words(BoW) e TF-IDF são diferentes entre si porque o primeiro conta a quantidade de vezes que uma palavra aparece num texto e o segundo normaliza essa informação utilizando a quantidade de vezes que a palavra aparece no corpus de texto.
  • O algoritmo deword embeddingsWord2Vec depende do princípio da distribuição, em que as palavras que geralmente têm as mesmas palavras vizinhas tendem a ser semanticamente semelhantes e as colocam num vetor de tamanhos fixos que representam semanticamente as palavras vizinhas.
  • O algoritmo deword embeddingsGlovecombina estatísticas locais com estatísticas globais fazendo a análise de uma matriz de co-ocorrência palavra-palavra, de forma que se conta a frequência que essa palavra aparece relacionada com algum “contexto” em um grande corpus.
  • O algoritmo deword embeddings Word2Vecpossui duas arquiteturas de construção. A primeira é a CBOW, em que se treina uma rede neural com a tarefa de prever uma palavra dado o contexto e a outra é aSkip-Gram, em que a tarefa da rede neural será dada uma palavra, prever o contexto.
  • Na matriz de co-ocorrência do algoritmo deword embeddingsGlove, ao correlacionar uma palavra p1 com um contexto c1, se a palavra p1 possui correlação alta com c1, o valor será mais alto do que o contrário; essa correlação poderá ser utilizada para calcular correlações entre quaisquer palavras do corpus de texto e esse contexto.
Fale com IAgo
IAgo - Assistente IAProva
IA
Olá! Sou o IAgo, seu assistente aqui no IAProvatec 😊
Veja como posso te ajudar:
Agora