Módulos e Métodos para Conexão¶
-
class
Base_de_dados_conexoes_e_limpeza.db_connection.Conexao¶ Métodos para necessários para a conexão com servidor SQl
-
classmethod
create_connection(server: str = None, database: str = None, username: str = None, password: str = None) → pyodbc.Connection¶ Cria uma conexão com uma base de dados online
- serverstr
String no formato ‘tcp:[link],[port]’
- databasestr
Nome da base de dados
- usernamestr
Nome de usuário
- passwordstr
Senha
pyodbc.Connection
- TypeError
Quando os parâmetros não são Strings
- invalid_server_string_format
Quando a string não obedece o padrão ‘tcp:nome do banco, número da porta do servidor’
- invalid_server_port_value
Quando a porta do servidor não está compatível com servidor
-
classmethod
create_df(tablename: str, cursor: pyodbc.Cursor) → pandas.core.frame.DataFrame¶ A partir de um cursor e o nome de um tabela acessável por esse cursor retorna um pd.DataFrame
- tablenamestr
Nome da tabela presente no banco
- cursorpyodbc.Cursor
Cursor obtido a partir da conexão com o server
- pd.DataFrame
DataFrame com dados do banco
-
classmethod
save_df_csv(df: pandas.core.frame.DataFrame, name: str)¶ Salva .csv a partir de um DataFrame
- dfpd.DataFrame
DataFrame para gerar o arquivo .csv
- namestr
Nome do que será atribuido ao arquivo .csv
Raises
-
classmethod
-
exception
Base_de_dados_conexoes_e_limpeza.db_connection.invalid_server_port_value¶ Exceção levantada quando o valor para porta do server não é numérica
-
exception
Base_de_dados_conexoes_e_limpeza.db_connection.invalid_server_string_format¶ Exceção levantada quando a string com informações do server não está no formato adequado
-
exception
Base_de_dados_conexoes_e_limpeza.db_connection.invalid_table_name¶ Exceção levantada quando é requisitada uma tabela que não existe no banco
Exceções específicas do módulo¶
-
exception
Base_de_dados_conexoes_e_limpeza.db_connection.invalid_server_string_format¶ Exceção levantada quando a string com informações do server não está no formato adequado
-
exception
Base_de_dados_conexoes_e_limpeza.db_connection.invalid_server_port_value¶ Exceção levantada quando o valor para porta do server não é numérica
-
exception
Base_de_dados_conexoes_e_limpeza.db_connection.invalid_table_name¶ Exceção levantada quando é requisitada uma tabela que não existe no banco
Módulos e Métodos para Limpeza¶
Limpeza dos Dados covid_airport¶
-
class
Base_de_dados_conexoes_e_limpeza.db_cleaning.Limpador_airport¶ Métodos necessários para a limpeza do covid_airports dataset
-
classmethod
clean_dataframe(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Limpa os dados para permitir a análise.
- dfpd.DataFrame
DataFrame com o dataset covid_airport original.
- pd.DataFrame
DataFrame com os dados do covid_airport limpos.
-
classmethod
create_datetime_cols(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Convert a coluna Date nas colunas Year, Month e Day
- dfpd.DataFrame
DataFrame com a coluna Date
- pd.DataFrame
DataFrame com a coluna Date, Year, Month, Day no formato datetime
-
classmethod
drop_cols(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Remove as colunas consideradas pouco úteis
- dfpd.DataFrame
DataFrame com as colunas ‘AggregationMethod’, ‘Unnamed: 0’, ‘Version’, ‘Centroid’, ‘Geography’
- pd.DataFrame
DataFrame sem as colunas ‘AggregationMethod’, ‘Unnamed: 0’, ‘Version’, ‘Centroid’, ‘Geography’
-
classmethod
standardize_country_names(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Padroniza a denomição United States para o Estados Unidos
- dfpd.DataFrame
Dataframe com a coluna Country com ‘United States of America (the)’, ‘United States’ em refencia ao país
- pd.DataFrame
Dataframe com a coluna Country com ‘United States’ em referência ao país
-
classmethod
Limpeza dos Dados fifa_players¶
-
class
Base_de_dados_conexoes_e_limpeza.db_cleaning.Limpador_fifa¶ Métodos necessários para a limpeza do fifa_players dataset
-
classmethod
adjust_dtypes(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Converte as fetures Joined e Contract_Valid_Until para o tipo datetime.
df : pd.DataFrame
- pd.DataFrame
Dataframe fifa_players com as variáveis de data como datetime.
-
classmethod
clean_dataframe(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Faz o tratamento necessário para a implementação de modelos e visualizações do dataset fifa_players.
- dfpd.DataFrame
Dados originais do dataset fifa_players
- pd.DataFrame
Dataframe com todos os dados necessários limpos
-
classmethod
clean_height_col(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Converte todos os medidas em Pés para Metros
- dfpd.DataFrame
DataFrame com a feature Height em Pés.
- pd.DataFrame
DataFrame com a feature Height em Metros.
-
classmethod
clean_money_cols(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Limpa as features relacionadas dinheiro.
- dfpd.DataFrame
Dataframe com dados dos fifa_players.
- pd.DataFrame
Dataframe sem simbolos referentes a moeda
-
classmethod
clean_position_cols(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Remove as features referente as habilidades de um jogador em cada posicionamento
- dfpd.DataFrame
Dataframe com dados dos fifa_players.
- pd.DataFrame
Datframe sem informações de habilidade em cada posicionamento
-
classmethod
clean_weight_col(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Converte todos os medidas em Libras para Kilos
- dfpd.DataFrame
DataFrame com a feature Weight em Libras.
- pd.DataFrame
DataFrame com a feature Weight em Kilos.
-
classmethod
drop_cols(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Remove do DataFrame algumas colunas consideradas pouco úteis para analise
- dfpd.DataFrame
DataFrame com os dados originais do dataset fifa_players
- pd.DataFrame
DataFrame sem as colunas ‘Unnamed: 0’, ‘Counter’, ‘Photo’, ‘Flag’, ‘Club_Logo’, ‘Loaned_From’, ‘Real_Face’ e ‘Work_Rate’
-
classmethod
drop_na_ReleaseClause(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Remove linhas com NaN na coluna Release_Clause
- dfpd.DataFrame
DataFrame de entrada
- pd.DataFrame
DataFrame com todas a linhas possuindo dados de Release_Clause
-
classmethod
drop_na_pos(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Remove linhas com excesso de NaN
- dfpd.DataFrame
DataFrame de entrada
- pd.DataFrame
Dataframe com linhas com no minimo 5 campos sem NaN
-
classmethod
foot_to_dummie(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Converte a classificação categórica da ‘Preferred_Foot’ para classificação binária.
- df:pd.DataFrame
DataFrame com coluna ‘Preferred_Foot’ com valores ‘Right’ ou ‘Left’
df:pd.DataFrame DataFrame com coluna ‘Preferred_Foot’ com valor 1 para Right e 0 para Left.
-
classmethod
ft_to_meters(value: str) → float¶ Converte a unidade pés para metros
- valuestr
Valor em unidade de pés.
- float
Valor convertido para unidade metro.
- ValueError
Se a String não estiver em formato de pés, é levando a exceção.
-
classmethod
lbs_to_kg(value: str) → float¶ Converte libras para kilos nas colunas relativas a peso
- valuestr
Valor numérico em Libras
- float
Valor convertido para kilos
- ValueError
Se a String não possuir a terminação lbs, é levantada a exceção.
-
classmethod
money_to_int(value: str) → float¶ - valuestr
String com caracteres monetarios.
- float
Valor numerico
- ValueError
Erro na alteracao dos valores
-
classmethod
remove_plus_sign(string: str) → int¶ Remove o sinal + do penúltimo caractere
- stringstr
String com valores numéricos e um “mais” no penultimo caractere
int
- ValueError
Se houver uma string sem o sinal + no penultimo caratere, é levantada esta exceção
-
classmethod
set_index(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame¶ Define a coluna ID como index do DataFrame
- dfpd.DataFrame
DataFrame de entrada
- pd.DataFrame
DataFrame com a coluna ID definida como index
-
classmethod