import pandas as pd
data = pd.read_csv('vereadores_feira.csv')
data.sample(2).T
| 195 | 427 | |
|---|---|---|
| ano | 2020 | 2020 |
| tipo_eleicao | eleicao ordinaria | eleicao ordinaria |
| sigla_uf | BA | BA |
| id_municipio_tse | 35157 | 35157 |
| numero_candidato | 19800 | 43430 |
| id_candidato_bd | 119886 | 1390692 |
| sigla_partido | PODE | PV |
| cargo | vereador | vereador |
| turno | 1 | 1 |
| resultado | nao eleito | suplente |
| votos | 310 | 694 |
| ano_1 | 2020 | 2020 |
| tipo_eleicao_1 | eleicao ordinaria | eleicao ordinaria |
| sigla_uf_1 | BA | BA |
| id_municipio_tse_1 | 35157 | 35157 |
| id_candidato_bd_1 | 119886 | 1390692 |
| cpf | 1664561528 | 61422290549 |
| titulo_eleitoral | 105101910558 | 63035790507 |
| sequencial_candidato | 50000784482 | 50000692094 |
| numero_candidato_1 | 19800 | 43430 |
| nome_candidato | Julio Lobo Da Anunciacao | Adriana Mascarenhas Mattos Bulos |
| nome_urna_candidato | Wllissys Da Rifa | Adriana Bulos |
| numero_partido | 19 | 43 |
| sigla_partido_1 | PODE | PV |
| cargo_1 | vereador | vereador |
| situacao | deferido | deferido |
| ocupacao | comerciante | diretor de estabelecimento de ensino |
| data_nasc | 1984-03-08 | 1972-03-15 |
| idade | 37 | 49 |
| genero | masculino | feminino |
| instrucao | ensino medio completo | ensino superior completo |
| estado_civil | casado(a) | casado(a) |
| nacionalidade | brasileira | brasileira |
| sigla_uf_nasc | BA | BA |
| municipio_nasc | Feira De Santana | Feira De Santana |
| podemosmudarfeira@gmailcom | adbulos@gmailcom | |
| raca | parda | parda |
(data['resultado'].unique())
array(['suplente', 'eleito por media', 'nao eleito', 'eleito por qp'],
dtype=object)
status_eleito = ['eleito por media', 'eleito por qp']
eleitos = data[data['resultado'].isin(status_eleito)]
eleitos.sample(2)
| ano | tipo_eleicao | sigla_uf | id_municipio_tse | numero_candidato | id_candidato_bd | sigla_partido | cargo | turno | resultado | ... | data_nasc | idade | genero | instrucao | estado_civil | nacionalidade | sigla_uf_nasc | municipio_nasc | raca | ||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 725 | 2016 | eleicao ordinaria | BA | 35157 | 20120 | 1755716 | PSC | vereador | 1 | eleito por qp | ... | 1979-03-09 | 38 | masculino | ensino superior completo | solteiro(a) | brasileira | BA | Feira De Santana | pscfeiradesantana@gmailcom | parda |
| 326 | 2020 | eleicao ordinaria | BA | 35157 | 27075 | 1578696 | DC | vereador | 1 | eleito por media | ... | 1978-07-15 | 42 | masculino | ensino superior completo | casado(a) | brasileira | BA | Feira De Santana | emersoncosta@yahoocombr | preta |
2 rows × 37 columns
reeleitos = pd.pivot_table(eleitos, values='votos', index=['nome_urna_candidato'], columns=['ano'], aggfunc='count', margins=True)
reeleitos
| ano | 2016 | 2020 | All |
|---|---|---|---|
| nome_urna_candidato | |||
| Alberto Nery | 1.0 | NaN | 1 |
| Beto Tourinho | 1.0 | NaN | 1 |
| Cadmiel Pereira | 1.0 | NaN | 1 |
| Correia Zezito | NaN | 1.0 | 1 |
| Edvaldo Lima | 1.0 | 1.0 | 2 |
| Eli Ribeiro | 1.0 | NaN | 1 |
| Eli Ribeiro | NaN | 1.0 | 1 |
| Emerson Minho | NaN | 1.0 | 1 |
| Eremita Mota | 1.0 | 1.0 | 2 |
| Ewerton Carneiro Da Costa | 1.0 | NaN | 1 |
| Fabiano Da Van | 1.0 | NaN | 1 |
| Fernando Torres | NaN | 1.0 | 1 |
| Galeguinho | NaN | 1.0 | 1 |
| Gerusa | 1.0 | NaN | 1 |
| Gerusa Sampaio | NaN | 1.0 | 1 |
| Gilmar Amorim Do George Americ | 1.0 | NaN | 1 |
| Isaias De Diogo | 1.0 | NaN | 1 |
| Jhonatas Monteiro | NaN | 1.0 | 1 |
| Joao Bililiu | 1.0 | NaN | 1 |
| Jose Carneiro | 1.0 | NaN | 1 |
| José Carneiro | NaN | 1.0 | 1 |
| Jurandy Carvalho | NaN | 1.0 | 1 |
| Justiniano | 1.0 | NaN | 1 |
| Luiz Da Feira | 1.0 | 1.0 | 2 |
| Lulinha | 1.0 | NaN | 1 |
| Lú De Ronny | NaN | 1.0 | 1 |
| Marcos Lima | 1.0 | NaN | 1 |
| Pastor Valdemir Santos | NaN | 1.0 | 1 |
| Paulão Do Caldeirão | NaN | 1.0 | 1 |
| Pedro Américo | NaN | 1.0 | 1 |
| Pedro Cicero | NaN | 1.0 | 1 |
| Professor Ivamberg | NaN | 1.0 | 1 |
| Ron | 1.0 | NaN | 1 |
| Ron Do Povo | NaN | 1.0 | 1 |
| Ronny | 1.0 | NaN | 1 |
| Silvio Dias | NaN | 1.0 | 1 |
| Zé Curuca | 1.0 | 1.0 | 2 |
| Zé Filé | 1.0 | NaN | 1 |
| All | 21.0 | 21.0 | 42 |
reeleitos.sort_values(by=('All'), ascending = False)
# Foram apenas 4 vereadores reeleitos em Feira de Santana
| ano | 2016 | 2020 | All |
|---|---|---|---|
| nome_urna_candidato | |||
| All | 21.0 | 21.0 | 42 |
| Luiz Da Feira | 1.0 | 1.0 | 2 |
| Zé Curuca | 1.0 | 1.0 | 2 |
| Edvaldo Lima | 1.0 | 1.0 | 2 |
| Eremita Mota | 1.0 | 1.0 | 2 |
| Pedro Américo | NaN | 1.0 | 1 |
| Lulinha | 1.0 | NaN | 1 |
| Lú De Ronny | NaN | 1.0 | 1 |
| Marcos Lima | 1.0 | NaN | 1 |
| Pastor Valdemir Santos | NaN | 1.0 | 1 |
| Paulão Do Caldeirão | NaN | 1.0 | 1 |
| Professor Ivamberg | NaN | 1.0 | 1 |
| Pedro Cicero | NaN | 1.0 | 1 |
| Jurandy Carvalho | NaN | 1.0 | 1 |
| Ron | 1.0 | NaN | 1 |
| Ron Do Povo | NaN | 1.0 | 1 |
| Ronny | 1.0 | NaN | 1 |
| Silvio Dias | NaN | 1.0 | 1 |
| Zé Filé | 1.0 | NaN | 1 |
| Justiniano | 1.0 | NaN | 1 |
| Alberto Nery | 1.0 | NaN | 1 |
| José Carneiro | NaN | 1.0 | 1 |
| Beto Tourinho | 1.0 | NaN | 1 |
| Cadmiel Pereira | 1.0 | NaN | 1 |
| Correia Zezito | NaN | 1.0 | 1 |
| Eli Ribeiro | 1.0 | NaN | 1 |
| Eli Ribeiro | NaN | 1.0 | 1 |
| Emerson Minho | NaN | 1.0 | 1 |
| Ewerton Carneiro Da Costa | 1.0 | NaN | 1 |
| Fabiano Da Van | 1.0 | NaN | 1 |
| Fernando Torres | NaN | 1.0 | 1 |
| Galeguinho | NaN | 1.0 | 1 |
| Gerusa | 1.0 | NaN | 1 |
| Gerusa Sampaio | NaN | 1.0 | 1 |
| Gilmar Amorim Do George Americ | 1.0 | NaN | 1 |
| Isaias De Diogo | 1.0 | NaN | 1 |
| Jhonatas Monteiro | NaN | 1.0 | 1 |
| Joao Bililiu | 1.0 | NaN | 1 |
| Jose Carneiro | 1.0 | NaN | 1 |
instrucao_group = eleitos.groupby(['instrucao', 'ano'])
instrucao_group.size().unstack()
# Foram mais vereadores com ensino superio completo eleitos em 2020
| ano | 2016 | 2020 |
|---|---|---|
| instrucao | ||
| ensino fundamental completo | 2 | 2 |
| ensino fundamental incompleto | 2 | 1 |
| ensino medio completo | 11 | 9 |
| ensino medio incompleto | 1 | 1 |
| ensino superior completo | 5 | 8 |
superior_completo = ['ensino superior completo']
ultima_eleicao = [2020]
candidatos_superior = eleitos[eleitos['instrucao'].isin(superior_completo)]
candidatos_superior_2020 = candidatos_superior[candidatos_superior['ano'].isin(ultima_eleicao)]
candidatos_superior_2020[['nome_urna_candidato', 'instrucao', 'ocupacao']]
# Aqui podemos ver as ocupacoes dos vereadores eleitos em 2020 com ensino superior completo
| nome_urna_candidato | instrucao | ocupacao | |
|---|---|---|---|
| 23 | Eli Ribeiro | ensino superior completo | vereador |
| 57 | Silvio Dias | ensino superior completo | advogado |
| 75 | Professor Ivamberg | ensino superior completo | professor de ensino medio |
| 126 | Lú De Ronny | ensino superior completo | enfermeiro |
| 297 | Pedro Américo | ensino superior completo | professor de ensino fundamental |
| 314 | Gerusa Sampaio | ensino superior completo | vereador |
| 326 | Emerson Minho | ensino superior completo | policial civil |
| 470 | Jhonatas Monteiro | ensino superior completo | professor de ensino medio |
eleitos_2020 = eleitos[eleitos['ano'].isin(ultima_eleicao)]
eleitos_2020['ocupacao'].value_counts()
#A ocupacao mais frequente entre os eleitos é ser vereador
vereador 8 professor de ensino medio 2 empresario 2 policial civil 1 produtor agropecuario 1 advogado 1 policial militar 1 professor de ensino fundamental 1 locutor e comentarista de radio e televisao e radialista 1 enfermeiro 1 agente administrativo 1 sacerdote ou membro de ordem ou seita religiosa 1 Name: ocupacao, dtype: int64
genero_group = eleitos.groupby(['genero', 'ano'])
genero_group.size().unstack()
| ano | 2016 | 2020 |
|---|---|---|
| genero | ||
| feminino | 2 | 3 |
| masculino | 19 | 18 |
raca_group = eleitos.groupby(['raca', 'ano'])
raca_group.size().unstack()
| ano | 2016 | 2020 |
|---|---|---|
| raca | ||
| branca | 2 | 2 |
| parda | 13 | 13 |
| preta | 6 | 6 |
raca_genero_group = eleitos.groupby(['raca', 'genero', 'ano'])
raca_genero_group.size().unstack()
| ano | 2016 | 2020 | |
|---|---|---|---|
| raca | genero | ||
| branca | feminino | NaN | 1.0 |
| masculino | 2.0 | 1.0 | |
| parda | feminino | 2.0 | 2.0 |
| masculino | 11.0 | 11.0 | |
| preta | masculino | 6.0 | 6.0 |
idade_2020 = eleitos_2020['idade']
idade_2020.describe()
# A média de idade dos eleitos é 49 anos. O mais novo possui 34 anos, o mais velho 65 anos
count 21.000000 mean 49.142857 std 9.671017 min 34.000000 25% 42.000000 50% 50.000000 75% 57.000000 max 65.000000 Name: idade, dtype: float64
eleicao_anterior = [2016]
eleitos_2016 = eleitos[eleitos['ano'].isin(eleicao_anterior)]
idade_2016 = eleitos_2016['idade']
idade_2016.describe()
# A média na eleição de 2016 foi 49 anos. O mais novo foi eleitos com 31 anos e o meis velho com 63 anos.
count 21.000000 mean 48.904762 std 9.104421 min 31.000000 25% 41.000000 50% 51.000000 75% 56.000000 max 63.000000 Name: idade, dtype: float64