Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Embellecer los nombres de los municipios con una función de posprocesado #1

Closed
JaimeObregon opened this issue Jul 27, 2020 · 0 comments
Labels
enhancement New feature or request good first issue Good for newcomers

Comments

@JaimeObregon
Copy link
Owner

En /src/includes/municipios y en MUNICIPIOS_INEXISTENTES de /src/includes/constants.php están las tablas que relacionan los códigos de municipio del INE con su nombre oficial. Lo he detallado en La fiesta de los municipios.

Pero los nombres oficiales son feos. Por ejemplo:

  • Romana, la en vez de La Romana
  • Bolo, O en vez de O Bolo
  • Alqueria d'Asnar, l' en vez L'Alqueria d'Asnar
  • Alqueries, les/Alquerías del Niño Perdido en vez de sabe $DEITY qué

Estaría bien embellecer estos nombres. No editando las tablas oficiales, por supuesto, sino con una función —relativamente sencilla, estimo— que aplicada en el momento de la decodificación y probablemente mediante expresiones regulares, traduzca los nombres feos en nombres bonitos.

Esta función seguramente se aplicará de una manera similar a como ahora se realiza el embellecimiento de la capitalización de los nombres de los candidatos (FRANCISCO DE LA ROSAFrancisco de la Rosa) en /src/list.php.

Nótese que puede haber otras conversiones adicionales a las que he puesto como ejemplo, así que habría que echar antes un vistazo a las tablas y buscar todas las casuísticas.

Y téngase en cuenta que el objetivo final de este embellecimiento de nombres de municipios es que en un inminente portal de información electoral el usuario pueda buscar municipios por cualquier término (incluso en idiomas cooficiales) y han de mostrársele resultados coherentes y escritos de manera natural.

@JaimeObregon JaimeObregon added enhancement New feature or request good first issue Good for newcomers labels Jul 27, 2020
JaimeObregon added a commit that referenced this issue Jul 31, 2020
1. Aplica un algoritmo de embellecimiento de municipios válido también para el caso de municipios
con dos nombres. Por ejemplo, `Alqueries, les/Alquerías del Niño Perdido`. También mejora el
criterio para identificar artículos (`El`, 'Las', 'O', 'Els'...), pues se buscan expresamente los
artículos empleados en los municipios españoles en lugar de detectarse heurísticamente por su
longitud. Este algoritmo resuelve satisfactoriamente todos los escenarios descritos en #1.

2. Mueve a sendas funciones este algoritmo y el que embellece los nombres de los candidatos.
JaimeObregon added a commit that referenced this issue Jul 31, 2020
Resuelve #1: embellecer los nombres de los municipios
This issue was closed.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request good first issue Good for newcomers
Projects
None yet
Development

No branches or pull requests

1 participant