Módulos e Métodos para Conexão

class Base_de_dados_conexoes_e_limpeza.db_connection.Conexao

Métodos para necessários para a conexão com servidor SQl

classmethod create_connection(server: str = None, database: str = None, username: str = None, password: str = None) → pyodbc.Connection

Cria uma conexão com uma base de dados online

serverstr

String no formato ‘tcp:[link],[port]’

databasestr

Nome da base de dados

usernamestr

Nome de usuário

passwordstr

Senha

pyodbc.Connection

TypeError

Quando os parâmetros não são Strings

invalid_server_string_format

Quando a string não obedece o padrão ‘tcp:nome do banco, número da porta do servidor

invalid_server_port_value

Quando a porta do servidor não está compatível com servidor

classmethod create_df(tablename: str, cursor: pyodbc.Cursor) → pandas.core.frame.DataFrame

A partir de um cursor e o nome de um tabela acessável por esse cursor retorna um pd.DataFrame

tablenamestr

Nome da tabela presente no banco

cursorpyodbc.Cursor

Cursor obtido a partir da conexão com o server

pd.DataFrame

DataFrame com dados do banco

classmethod save_df_csv(df: pandas.core.frame.DataFrame, name: str)

Salva .csv a partir de um DataFrame

dfpd.DataFrame

DataFrame para gerar o arquivo .csv

namestr

Nome do que será atribuido ao arquivo .csv

Raises

exception Base_de_dados_conexoes_e_limpeza.db_connection.invalid_server_port_value

Exceção levantada quando o valor para porta do server não é numérica

exception Base_de_dados_conexoes_e_limpeza.db_connection.invalid_server_string_format

Exceção levantada quando a string com informações do server não está no formato adequado

exception Base_de_dados_conexoes_e_limpeza.db_connection.invalid_table_name

Exceção levantada quando é requisitada uma tabela que não existe no banco

Exceções específicas do módulo

exception Base_de_dados_conexoes_e_limpeza.db_connection.invalid_server_string_format

Exceção levantada quando a string com informações do server não está no formato adequado

exception Base_de_dados_conexoes_e_limpeza.db_connection.invalid_server_port_value

Exceção levantada quando o valor para porta do server não é numérica

exception Base_de_dados_conexoes_e_limpeza.db_connection.invalid_table_name

Exceção levantada quando é requisitada uma tabela que não existe no banco

Módulos e Métodos para Limpeza

Limpeza dos Dados covid_airport

class Base_de_dados_conexoes_e_limpeza.db_cleaning.Limpador_airport

Métodos necessários para a limpeza do covid_airports dataset

classmethod clean_dataframe(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Limpa os dados para permitir a análise.

dfpd.DataFrame

DataFrame com o dataset covid_airport original.

pd.DataFrame

DataFrame com os dados do covid_airport limpos.

classmethod create_datetime_cols(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Convert a coluna Date nas colunas Year, Month e Day

dfpd.DataFrame

DataFrame com a coluna Date

pd.DataFrame

DataFrame com a coluna Date, Year, Month, Day no formato datetime

classmethod drop_cols(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Remove as colunas consideradas pouco úteis

dfpd.DataFrame

DataFrame com as colunas ‘AggregationMethod’, ‘Unnamed: 0’, ‘Version’, ‘Centroid’, ‘Geography’

pd.DataFrame

DataFrame sem as colunas ‘AggregationMethod’, ‘Unnamed: 0’, ‘Version’, ‘Centroid’, ‘Geography’

classmethod standardize_country_names(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Padroniza a denomição United States para o Estados Unidos

dfpd.DataFrame

Dataframe com a coluna Country com ‘United States of America (the)’, ‘United States’ em refencia ao país

pd.DataFrame

Dataframe com a coluna Country com ‘United States’ em referência ao país

Limpeza dos Dados fifa_players

class Base_de_dados_conexoes_e_limpeza.db_cleaning.Limpador_fifa

Métodos necessários para a limpeza do fifa_players dataset

classmethod adjust_dtypes(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Converte as fetures Joined e Contract_Valid_Until para o tipo datetime.

df : pd.DataFrame

pd.DataFrame

Dataframe fifa_players com as variáveis de data como datetime.

classmethod clean_dataframe(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Faz o tratamento necessário para a implementação de modelos e visualizações do dataset fifa_players.

dfpd.DataFrame

Dados originais do dataset fifa_players

pd.DataFrame

Dataframe com todos os dados necessários limpos

classmethod clean_height_col(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Converte todos os medidas em Pés para Metros

dfpd.DataFrame

DataFrame com a feature Height em Pés.

pd.DataFrame

DataFrame com a feature Height em Metros.

classmethod clean_money_cols(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Limpa as features relacionadas dinheiro.

dfpd.DataFrame

Dataframe com dados dos fifa_players.

pd.DataFrame

Dataframe sem simbolos referentes a moeda

classmethod clean_position_cols(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Remove as features referente as habilidades de um jogador em cada posicionamento

dfpd.DataFrame

Dataframe com dados dos fifa_players.

pd.DataFrame

Datframe sem informações de habilidade em cada posicionamento

classmethod clean_weight_col(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Converte todos os medidas em Libras para Kilos

dfpd.DataFrame

DataFrame com a feature Weight em Libras.

pd.DataFrame

DataFrame com a feature Weight em Kilos.

classmethod drop_cols(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Remove do DataFrame algumas colunas consideradas pouco úteis para analise

dfpd.DataFrame

DataFrame com os dados originais do dataset fifa_players

pd.DataFrame

DataFrame sem as colunas ‘Unnamed: 0’, ‘Counter’, ‘Photo’, ‘Flag’, ‘Club_Logo’, ‘Loaned_From’, ‘Real_Face’ e ‘Work_Rate’

classmethod drop_na_ReleaseClause(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Remove linhas com NaN na coluna Release_Clause

dfpd.DataFrame

DataFrame de entrada

pd.DataFrame

DataFrame com todas a linhas possuindo dados de Release_Clause

classmethod drop_na_pos(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Remove linhas com excesso de NaN

dfpd.DataFrame

DataFrame de entrada

pd.DataFrame

Dataframe com linhas com no minimo 5 campos sem NaN

classmethod foot_to_dummie(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Converte a classificação categórica da ‘Preferred_Foot’ para classificação binária.

df:pd.DataFrame

DataFrame com coluna ‘Preferred_Foot’ com valores ‘Right’ ou ‘Left’

df:pd.DataFrame DataFrame com coluna ‘Preferred_Foot’ com valor 1 para Right e 0 para Left.

classmethod ft_to_meters(value: str) → float

Converte a unidade pés para metros

valuestr

Valor em unidade de pés.

float

Valor convertido para unidade metro.

ValueError

Se a String não estiver em formato de pés, é levando a exceção.

classmethod lbs_to_kg(value: str) → float

Converte libras para kilos nas colunas relativas a peso

valuestr

Valor numérico em Libras

float

Valor convertido para kilos

ValueError

Se a String não possuir a terminação lbs, é levantada a exceção.

classmethod money_to_int(value: str) → float
valuestr

String com caracteres monetarios.

float

Valor numerico

ValueError

Erro na alteracao dos valores

classmethod remove_plus_sign(string: str) → int

Remove o sinal + do penúltimo caractere

stringstr

String com valores numéricos e um “mais” no penultimo caractere

int

ValueError

Se houver uma string sem o sinal + no penultimo caratere, é levantada esta exceção

classmethod set_index(df: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame

Define a coluna ID como index do DataFrame

dfpd.DataFrame

DataFrame de entrada

pd.DataFrame

DataFrame com a coluna ID definida como index

Exceções específicas do módulo

exception Base_de_dados_conexoes_e_limpeza.db_cleaning.indexes_not_found_in_dataframe

Exceção levantada quando as colunas que seriam tratadas não existem no DataFrame

Indices and tables