Introduction to Statistics in Python


# Subset for Belgium and USA only
be_and_usa = food_consumption[(food_consumption['country'] == "Belgium") | (food_consumption['country'] == 'USA')]

# Group by country, select consumption column, and compute mean and median
print(be_and_usa.groupby('country')['consumption'].agg([np.mean, np.median]))

Variância = distância média de cada ponto de dados até a média geral dos dados Cálculo da variância:

  1. Calcular a distância entre cada ponto de dados e a média
  2. Calcular raiz quadrada de cada distância individual
  3. Somar todos os valores
  4. Dividir a soma pelo número de pontos de dados -1

Quanto maior a variância, mais espalhados estão os dados.

Desvio padrão

  1. Raiz quadrada da variância
sales_counts.sample(5, replacement=True)
