import pandas as pd
data = pd.read_csv('vereadores_feira.csv')
data.sample(2).T
195 | 427 | |
---|---|---|
ano | 2020 | 2020 |
tipo_eleicao | eleicao ordinaria | eleicao ordinaria |
sigla_uf | BA | BA |
id_municipio_tse | 35157 | 35157 |
numero_candidato | 19800 | 43430 |
id_candidato_bd | 119886 | 1390692 |
sigla_partido | PODE | PV |
cargo | vereador | vereador |
turno | 1 | 1 |
resultado | nao eleito | suplente |
votos | 310 | 694 |
ano_1 | 2020 | 2020 |
tipo_eleicao_1 | eleicao ordinaria | eleicao ordinaria |
sigla_uf_1 | BA | BA |
id_municipio_tse_1 | 35157 | 35157 |
id_candidato_bd_1 | 119886 | 1390692 |
cpf | 1664561528 | 61422290549 |
titulo_eleitoral | 105101910558 | 63035790507 |
sequencial_candidato | 50000784482 | 50000692094 |
numero_candidato_1 | 19800 | 43430 |
nome_candidato | Julio Lobo Da Anunciacao | Adriana Mascarenhas Mattos Bulos |
nome_urna_candidato | Wllissys Da Rifa | Adriana Bulos |
numero_partido | 19 | 43 |
sigla_partido_1 | PODE | PV |
cargo_1 | vereador | vereador |
situacao | deferido | deferido |
ocupacao | comerciante | diretor de estabelecimento de ensino |
data_nasc | 1984-03-08 | 1972-03-15 |
idade | 37 | 49 |
genero | masculino | feminino |
instrucao | ensino medio completo | ensino superior completo |
estado_civil | casado(a) | casado(a) |
nacionalidade | brasileira | brasileira |
sigla_uf_nasc | BA | BA |
municipio_nasc | Feira De Santana | Feira De Santana |
podemosmudarfeira@gmailcom | adbulos@gmailcom | |
raca | parda | parda |
(data['resultado'].unique())
array(['suplente', 'eleito por media', 'nao eleito', 'eleito por qp'], dtype=object)
status_eleito = ['eleito por media', 'eleito por qp']
eleitos = data[data['resultado'].isin(status_eleito)]
eleitos.sample(2)
ano | tipo_eleicao | sigla_uf | id_municipio_tse | numero_candidato | id_candidato_bd | sigla_partido | cargo | turno | resultado | ... | data_nasc | idade | genero | instrucao | estado_civil | nacionalidade | sigla_uf_nasc | municipio_nasc | raca | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
725 | 2016 | eleicao ordinaria | BA | 35157 | 20120 | 1755716 | PSC | vereador | 1 | eleito por qp | ... | 1979-03-09 | 38 | masculino | ensino superior completo | solteiro(a) | brasileira | BA | Feira De Santana | pscfeiradesantana@gmailcom | parda |
326 | 2020 | eleicao ordinaria | BA | 35157 | 27075 | 1578696 | DC | vereador | 1 | eleito por media | ... | 1978-07-15 | 42 | masculino | ensino superior completo | casado(a) | brasileira | BA | Feira De Santana | emersoncosta@yahoocombr | preta |
2 rows × 37 columns
reeleitos = pd.pivot_table(eleitos, values='votos', index=['nome_urna_candidato'], columns=['ano'], aggfunc='count', margins=True)
reeleitos
ano | 2016 | 2020 | All |
---|---|---|---|
nome_urna_candidato | |||
Alberto Nery | 1.0 | NaN | 1 |
Beto Tourinho | 1.0 | NaN | 1 |
Cadmiel Pereira | 1.0 | NaN | 1 |
Correia Zezito | NaN | 1.0 | 1 |
Edvaldo Lima | 1.0 | 1.0 | 2 |
Eli Ribeiro | 1.0 | NaN | 1 |
Eli Ribeiro | NaN | 1.0 | 1 |
Emerson Minho | NaN | 1.0 | 1 |
Eremita Mota | 1.0 | 1.0 | 2 |
Ewerton Carneiro Da Costa | 1.0 | NaN | 1 |
Fabiano Da Van | 1.0 | NaN | 1 |
Fernando Torres | NaN | 1.0 | 1 |
Galeguinho | NaN | 1.0 | 1 |
Gerusa | 1.0 | NaN | 1 |
Gerusa Sampaio | NaN | 1.0 | 1 |
Gilmar Amorim Do George Americ | 1.0 | NaN | 1 |
Isaias De Diogo | 1.0 | NaN | 1 |
Jhonatas Monteiro | NaN | 1.0 | 1 |
Joao Bililiu | 1.0 | NaN | 1 |
Jose Carneiro | 1.0 | NaN | 1 |
José Carneiro | NaN | 1.0 | 1 |
Jurandy Carvalho | NaN | 1.0 | 1 |
Justiniano | 1.0 | NaN | 1 |
Luiz Da Feira | 1.0 | 1.0 | 2 |
Lulinha | 1.0 | NaN | 1 |
Lú De Ronny | NaN | 1.0 | 1 |
Marcos Lima | 1.0 | NaN | 1 |
Pastor Valdemir Santos | NaN | 1.0 | 1 |
Paulão Do Caldeirão | NaN | 1.0 | 1 |
Pedro Américo | NaN | 1.0 | 1 |
Pedro Cicero | NaN | 1.0 | 1 |
Professor Ivamberg | NaN | 1.0 | 1 |
Ron | 1.0 | NaN | 1 |
Ron Do Povo | NaN | 1.0 | 1 |
Ronny | 1.0 | NaN | 1 |
Silvio Dias | NaN | 1.0 | 1 |
Zé Curuca | 1.0 | 1.0 | 2 |
Zé Filé | 1.0 | NaN | 1 |
All | 21.0 | 21.0 | 42 |
reeleitos.sort_values(by=('All'), ascending = False)
# Foram apenas 4 vereadores reeleitos em Feira de Santana
ano | 2016 | 2020 | All |
---|---|---|---|
nome_urna_candidato | |||
All | 21.0 | 21.0 | 42 |
Luiz Da Feira | 1.0 | 1.0 | 2 |
Zé Curuca | 1.0 | 1.0 | 2 |
Edvaldo Lima | 1.0 | 1.0 | 2 |
Eremita Mota | 1.0 | 1.0 | 2 |
Pedro Américo | NaN | 1.0 | 1 |
Lulinha | 1.0 | NaN | 1 |
Lú De Ronny | NaN | 1.0 | 1 |
Marcos Lima | 1.0 | NaN | 1 |
Pastor Valdemir Santos | NaN | 1.0 | 1 |
Paulão Do Caldeirão | NaN | 1.0 | 1 |
Professor Ivamberg | NaN | 1.0 | 1 |
Pedro Cicero | NaN | 1.0 | 1 |
Jurandy Carvalho | NaN | 1.0 | 1 |
Ron | 1.0 | NaN | 1 |
Ron Do Povo | NaN | 1.0 | 1 |
Ronny | 1.0 | NaN | 1 |
Silvio Dias | NaN | 1.0 | 1 |
Zé Filé | 1.0 | NaN | 1 |
Justiniano | 1.0 | NaN | 1 |
Alberto Nery | 1.0 | NaN | 1 |
José Carneiro | NaN | 1.0 | 1 |
Beto Tourinho | 1.0 | NaN | 1 |
Cadmiel Pereira | 1.0 | NaN | 1 |
Correia Zezito | NaN | 1.0 | 1 |
Eli Ribeiro | 1.0 | NaN | 1 |
Eli Ribeiro | NaN | 1.0 | 1 |
Emerson Minho | NaN | 1.0 | 1 |
Ewerton Carneiro Da Costa | 1.0 | NaN | 1 |
Fabiano Da Van | 1.0 | NaN | 1 |
Fernando Torres | NaN | 1.0 | 1 |
Galeguinho | NaN | 1.0 | 1 |
Gerusa | 1.0 | NaN | 1 |
Gerusa Sampaio | NaN | 1.0 | 1 |
Gilmar Amorim Do George Americ | 1.0 | NaN | 1 |
Isaias De Diogo | 1.0 | NaN | 1 |
Jhonatas Monteiro | NaN | 1.0 | 1 |
Joao Bililiu | 1.0 | NaN | 1 |
Jose Carneiro | 1.0 | NaN | 1 |
instrucao_group = eleitos.groupby(['instrucao', 'ano'])
instrucao_group.size().unstack()
# Foram mais vereadores com ensino superio completo eleitos em 2020
ano | 2016 | 2020 |
---|---|---|
instrucao | ||
ensino fundamental completo | 2 | 2 |
ensino fundamental incompleto | 2 | 1 |
ensino medio completo | 11 | 9 |
ensino medio incompleto | 1 | 1 |
ensino superior completo | 5 | 8 |
superior_completo = ['ensino superior completo']
ultima_eleicao = [2020]
candidatos_superior = eleitos[eleitos['instrucao'].isin(superior_completo)]
candidatos_superior_2020 = candidatos_superior[candidatos_superior['ano'].isin(ultima_eleicao)]
candidatos_superior_2020[['nome_urna_candidato', 'instrucao', 'ocupacao']]
# Aqui podemos ver as ocupacoes dos vereadores eleitos em 2020 com ensino superior completo
nome_urna_candidato | instrucao | ocupacao | |
---|---|---|---|
23 | Eli Ribeiro | ensino superior completo | vereador |
57 | Silvio Dias | ensino superior completo | advogado |
75 | Professor Ivamberg | ensino superior completo | professor de ensino medio |
126 | Lú De Ronny | ensino superior completo | enfermeiro |
297 | Pedro Américo | ensino superior completo | professor de ensino fundamental |
314 | Gerusa Sampaio | ensino superior completo | vereador |
326 | Emerson Minho | ensino superior completo | policial civil |
470 | Jhonatas Monteiro | ensino superior completo | professor de ensino medio |
eleitos_2020 = eleitos[eleitos['ano'].isin(ultima_eleicao)]
eleitos_2020['ocupacao'].value_counts()
#A ocupacao mais frequente entre os eleitos é ser vereador
vereador 8 professor de ensino medio 2 empresario 2 policial civil 1 produtor agropecuario 1 advogado 1 policial militar 1 professor de ensino fundamental 1 locutor e comentarista de radio e televisao e radialista 1 enfermeiro 1 agente administrativo 1 sacerdote ou membro de ordem ou seita religiosa 1 Name: ocupacao, dtype: int64
genero_group = eleitos.groupby(['genero', 'ano'])
genero_group.size().unstack()
ano | 2016 | 2020 |
---|---|---|
genero | ||
feminino | 2 | 3 |
masculino | 19 | 18 |
raca_group = eleitos.groupby(['raca', 'ano'])
raca_group.size().unstack()
ano | 2016 | 2020 |
---|---|---|
raca | ||
branca | 2 | 2 |
parda | 13 | 13 |
preta | 6 | 6 |
raca_genero_group = eleitos.groupby(['raca', 'genero', 'ano'])
raca_genero_group.size().unstack()
ano | 2016 | 2020 | |
---|---|---|---|
raca | genero | ||
branca | feminino | NaN | 1.0 |
masculino | 2.0 | 1.0 | |
parda | feminino | 2.0 | 2.0 |
masculino | 11.0 | 11.0 | |
preta | masculino | 6.0 | 6.0 |
idade_2020 = eleitos_2020['idade']
idade_2020.describe()
# A média de idade dos eleitos é 49 anos. O mais novo possui 34 anos, o mais velho 65 anos
count 21.000000 mean 49.142857 std 9.671017 min 34.000000 25% 42.000000 50% 50.000000 75% 57.000000 max 65.000000 Name: idade, dtype: float64
eleicao_anterior = [2016]
eleitos_2016 = eleitos[eleitos['ano'].isin(eleicao_anterior)]
idade_2016 = eleitos_2016['idade']
idade_2016.describe()
# A média na eleição de 2016 foi 49 anos. O mais novo foi eleitos com 31 anos e o meis velho com 63 anos.
count 21.000000 mean 48.904762 std 9.104421 min 31.000000 25% 41.000000 50% 51.000000 75% 56.000000 max 63.000000 Name: idade, dtype: float64