Introduction to Statistics in Python
  • AI Chat
  • Code
  • Report
  • Beta
    Spinner

    Introduction to Statistics in Python

    Run the hidden code cell below to import the data used in this course.

    Take Notes

    Add notes about the concepts you've learned and code cells with code you want to keep.

    Add your notes here

    # Subset for Belgium and USA only
    be_and_usa = food_consumption[(food_consumption['country'] == "Belgium") | (food_consumption['country'] == 'USA')]
    
    # Group by country, select consumption column, and compute mean and median
    print(be_and_usa.groupby('country')['consumption'].agg([np.mean, np.median]))

    Variância = distância média de cada ponto de dados até a média geral dos dados Cálculo da variância:

    1. Calcular a distância entre cada ponto de dados e a média
    2. Calcular raiz quadrada de cada distância individual
    3. Somar todos os valores
    4. Dividir a soma pelo número de pontos de dados -1

    Quanto maior a variância, mais espalhados estão os dados.

    Desvio padrão

    1. Raiz quadrada da variância
    np.random.seed(10)
    sales_counts.sample()
    sales_counts.sample(5, replacement=True)