Daniel Luan Rossi/

Introduction to Statistics in Python


Introduction to Statistics in Python

Run the hidden code cell below to import the data used in this course.

Take Notes

Add notes about the concepts you've learned and code cells with code you want to keep.

Add your notes here

# Subset for Belgium and USA only
be_and_usa = food_consumption[(food_consumption['country'] == "Belgium") | (food_consumption['country'] == 'USA')]

# Group by country, select consumption column, and compute mean and median
print(be_and_usa.groupby('country')['consumption'].agg([np.mean, np.median]))

Variância = distância média de cada ponto de dados até a média geral dos dados Cálculo da variância:

  1. Calcular a distância entre cada ponto de dados e a média
  2. Calcular raiz quadrada de cada distância individual
  3. Somar todos os valores
  4. Dividir a soma pelo número de pontos de dados -1

Quanto maior a variância, mais espalhados estão os dados.

Desvio padrão

  1. Raiz quadrada da variância
sales_counts.sample(5, replacement=True)
  • AI Chat
  • Code