Gráfico

Como o ‘Nexo’ achou as cidades com pontos cardeais no nome

Gabriel Zanlorenssi

12 de julho de 2024(atualizado 12/07/2024 às 21h16)

Norte, Sul, Leste e Oeste aparecem no nome oficial de 228 municípios. Confira como o jornal trabalhou com linguagem de programação para identificá-los

O Nexo depende de você para financiar seu trabalho e seguir produzindo um jornalismo de qualidade, no qual se pode confiar.Conheça nossos planos de assinatura.Junte-se ao Nexo! Seu apoio é fundamental.

Temas

Compartilhe

 

O Nexo fez uma análise dos 228 municípios brasileiros que têm os pontos cardeais em seu nome. Foram poucas linhas de código para classificar essa nomenclatura, o que permitiu uma maior disponibilidade de tempo para o tratamento visual do material. Confira como fizemos esse conteúdo, que pode ser facilmente adaptado para outras análises.

Fonte dos dados

Os dados são da base de municípios do IBGE, conforme a Divisão Territorial Brasileira de 2022. Para acessar essas informações diretamente no R — a linguagem de programação que usamos no Nexo para trabalhar com dados —, utilizamos o pacote geobr.

Pacotes ou bibliotecas expandem a funcionalidade básica de linguagens de programação. Aqui estamos baixando um mapa de municípios de 2022 e depois abandonando a geometria geográfica, por ora.

A nomenclatura do IBGE segue a definição estabelecida em leis estaduais ou municipais. Alguns dos nomes pelos quais as pessoas reconhecem uma cidade podem não ser os oficiais. Esse é o caso de Aparecida (SP), que não leva “do Norte” em seu nome. Informalmente, a cidade ganhou essa alcunha porque os romeiros utilizavam a antiga Estrada de Ferro do Norte para chegar até lá.

Tratamento dos dados

Com a base dos municípios em mãos, identificamos os pontos cardeais nos nomes usando regex. Esse termo significa “expressões regulares” e é uma forma comum de localizar padrões textos, seja em ferramentas como Excel ou linguagens de programação como o R.

No caso dos nomes dos municípios, podemos usar “(?i)oeste” para achar a palavra oeste independente se maiúscula ou minúscula (case-insensitive, o termo técnico em inglês). Dessa forma, encontramos tanto Lindoeste (PR), como Santa Bárbara d’Oeste (SP).

O regex é utilizado em um encadeamento lógico chamado case when, que é um pouco mais versátil que o tradicional if/else (se/então).

Revisão e produção de mapas

Fizemos também uma checagem, para garantir que nenhum município foi erroneamente incluído na lista. Sulina (PR) e Riversul (SP), por exemplo, conferimos que de fato o “sul” no nome se refere à direção geográfica.

Uma versão inicial dos mapas e gráficos foi gerada no R, como todo o acabamento visual finalizado no Adobe Illustrator. Já contamos mais sobre essa parte do processo em outros bastidores da nossa produção. Quer saber mais sobre como fizemos algum conteúdo específico? Você pode escrever essa e outras sugestões para dados@nexojornal.com.br.

 

NEWSLETTER GRATUITA

Nexo | Hoje

Enviada à noite de segunda a sexta-feira com os fatos mais importantes do dia

Este site é protegido por reCAPTCHA e a Política de Privacidade e os Termos de Serviço Google se aplicam.

Gráficos

nos eixos

O melhor em dados e gráficos selecionados por nosso time de infografia para você

Este site é protegido por reCAPTCHA e a Política de Privacidade e os Termos de Serviço Google se aplicam.

Navegue por temas