Os algoritmos de clusterização são utilizados na ciência de
dados para agrupar elementos semelhantes com base em
suas características. Um dos métodos mais comuns para
medir a similaridade entre pontos é a distância Euclidiana, que
calcula o quão próximos ou distantes os elementos estão em
um espaço multidimensional. Essa métrica é a base para a
determinação da formação dos clusters em algoritmos como
K-Means e DBSCAN. Uma empresa deseja agrupar clientes com base em seu
comportamento de compra. Para isso, foram coletados dois
atributos: a quantidade de produtos diferentes comprados no
último mês (X) e o valor total gasto (em centenas de reais) (Y).
A tabela, a seguir, apresenta os dados coletados de quatro
clientes, que serão usados para gerar a matriz de distâncias
com base na distância Euclidiana:
Em relação à matriz de distância gerada, assinale a alternativa
correta.