Beta
Table of Contents
The outline of your notebook will show up here. You can include headings in any text cell by starting a line with #
, ##
, ###
, etc., depending on the desired title hierarchy.
# Start coding here...
import pandas as pd
from scipy import stats
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
import pingouin as pg
from scipy.stats import norm
df = pd.read_excel('dados.xlsx')
print(df.head())
print(df[['NS atendimento']][-1:])
print(df[['NS atendimento']].describe())
k2, p = stats.normaltest(df['NS atendimento'])
alpha = 0.05
if p>= alpha :
print("Os dados são normais!")
else:
print("Os dados não são normais!")
sns.histplot(data=df['NS atendimento'], bins=range(59, 87, 5), kde=True)
plt.title('Histograma')
plt.xticks([59, 64, 69, 74, 79, 84])
plt.show()
sns.boxplot(data=df['NS atendimento'])
plt.yticks(np.quantile(df['NS atendimento'], [0, 0.25, 0.50, 0.75, 1]))
plt.text(0, 76.42, 'Q3', backgroundcolor='gray', c='white')
plt.text(0, 66.92, 'Q1', backgroundcolor='gray', c='white')
plt.text(-0.05, 70.62, 'Mediana', backgroundcolor='gray', c='white')
plt.title('Boxplot')
plt.show()
sns.lineplot(data=df['NS atendimento'])
plt.title('Resultado dos últimos 24 meses')
plt.xlabel("Meses")
plt.xticks([x for x in range(1, 25)], fontsize=8)
plt.show()
#valor ideal do indicador, de acordo com os objetivos do Grupo Vitta, é de 90% em média. O último valor realizado é 68%.
realizado_mes_24 = (df['NS atendimento'].iloc[-1])/100
metade_do_GAP = (0.90 - realizado_mes_24)/2
meta = int((realizado_mes_24 + metade_do_GAP) * 100)
print('A meta é, portanto, ' + str(meta) + '%.')
print(meta)
#O Ganho financeiro é de R$ 235,00 para cada 1000 clientes atendidos em pontos percentuais acima da meta (75%)
clientes_atendidos_ano = 192000
pp_acima_da_meta = meta - 75
ganho_por_1000_clientes = 235/1000
ganho_financeiro = (ganho_por_1000_clientes * pp_acima_da_meta * clientes_atendidos_ano)
print('O ganho financeiro estimado é de R$ ' + str(round(ganho_financeiro)) + '.')
df_regional = pd.read_excel('dados_regionais.xlsx')
df_regional_2 = pd.melt(df_regional, id_vars='Últimos 12 meses', value_vars=[
'Unidade BH Centro', 'Unidade BH Pampulha', 'Unidade BH Belvedere', 'Unidade Betim', 'Unidade Contagem'], var_name='Unidade')
plt.title('Unidade Betim')
sns.histplot(data=df_regional_2[df_regional_2['Unidade'] == 'Unidade Betim'], x='value')
plt.show()
plt.title('Unidade Betim')
sns.lineplot(data=df_regional_2[df_regional_2['Unidade'] == 'Unidade Betim'], x='Últimos 12 meses', y='value')
plt.show()
df_regional_2.loc[df_regional_2['Unidade'] == 'Unidade Betim', 'value'].describe()
valores = df_regional_2.loc[df_regional_2['Unidade'] == 'Unidade Betim', 'value']
grafico = pd.DataFrame({'Valores': valores})
mu, sigma = norm.fit(valores)
grafico['Probabilidade'] = norm.cdf(valores, mu, sigma)
sns.lmplot(grafico, x='Valores', y='Probabilidade')
plt.title('Gráfico da Função de Probabilidade Normal Acumulativa')
plt.xlabel('Valores')
plt.ylabel('Probabilidade Acumulativa')
plt.legend()
plt.show()
k2, p = stats.normaltest(df_regional_2.loc[df_regional_2['Unidade'] == 'Unidade Betim', 'value'])
alpha = 0.05
if p>= alpha :
print("Os dados são normais!")
else:
print("Os dados não são normais!")
plt.title('Unidade BH Centro')
sns.histplot(data=df_regional_2[df_regional_2['Unidade'] == 'Unidade BH Centro'], x='value')
plt.show()
plt.title('Unidade BH Centro')
sns.lineplot(data=df_regional_2[df_regional_2['Unidade'] == 'Unidade BH Centro'], x='Últimos 12 meses', y='value')
plt.show()
print(df_regional_2.loc[df_regional_2['Unidade'] == 'Unidade BH Centro', 'value'].describe())
valores = df_regional_2.loc[df_regional_2['Unidade'] == 'Unidade BH Centro', 'value']
grafico = pd.DataFrame({'Valores': valores})
mu, sigma = norm.fit(valores)
grafico['Probabilidade'] = norm.cdf(valores, mu, sigma)
sns.lmplot(grafico, x='Valores', y='Probabilidade')
plt.title('Gráfico da Função de Probabilidade Normal Acumulativa')
plt.xlabel('Valores')
plt.ylabel('Probabilidade Acumulativa')
plt.legend()
plt.show()
k2, p = stats.normaltest(df_regional_2.loc[df_regional_2['Unidade'] == 'Unidade BH Centro', 'value'])
alpha = 0.05
if p>= alpha :
print("Os dados são normais!")
else:
print("Os dados não são normais!")
plt.title('Unidade BH Pampulha')
sns.histplot(data=df_regional_2[df_regional_2['Unidade'] == 'Unidade BH Pampulha'], x='value')
plt.show()
plt.title('Unidade BH Pampulha')
sns.lineplot(data=df_regional_2[df_regional_2['Unidade'] == 'Unidade BH Pampulha'], x='Últimos 12 meses', y='value')
plt.show()
print(df_regional_2.loc[df_regional_2['Unidade'] == 'Unidade BH Pampulha', 'value'].describe())
valores = df_regional_2.loc[df_regional_2['Unidade'] == 'Unidade BH Pampulha', 'value']
grafico = pd.DataFrame({'Valores': valores})
mu, sigma = norm.fit(valores)
grafico['Probabilidade'] = norm.cdf(valores, mu, sigma)
sns.lmplot(grafico, x='Valores', y='Probabilidade')
plt.title('Gráfico da Função de Probabilidade Normal Acumulativa')
plt.xlabel('Valores')
plt.ylabel('Probabilidade Acumulativa')
plt.legend()
plt.show()
k2, p = stats.normaltest(df_regional_2.loc[df_regional_2['Unidade'] == 'Unidade BH Pampulha', 'value'])
alpha = 0.05
if p>= alpha :
print("Os dados são normais!")
else:
print("Os dados não são normais!")
plt.title('Unidade BH Belvedere')
sns.histplot(data=df_regional_2[df_regional_2['Unidade'] == 'Unidade BH Belvedere'], x='value')
plt.show()
plt.title('Unidade BH Belvedere')
sns.lineplot(data=df_regional_2[df_regional_2['Unidade'] == 'Unidade BH Belvedere'], x='Últimos 12 meses', y='value')
plt.show()
print(df_regional_2.loc[df_regional_2['Unidade'] == 'Unidade BH Belvedere', 'value'].describe())