Data Analytics challenge resolved. We started from the following statement: “Because the United Kingdom (UK) was the main country to colonize the United States of America (USA), and UK is on the east side of USA, there are more cities/towns with UK names alongside USA´s East Coast than West Coast”.
From a data standpoint, 3 issues were faced:
- Cities belonging to each group, as initially they belong to different administrative border levels.
- It could be more than one city with the same name.
- Cities with composite names.
Conclusion: “The deep gap between US Coast cities counter drove us to find a better comparative indicator, based on percentages. 'Percentage of Cities with UK names over Total Cities by Coast' returns 8,6% for East Coast and 4,9% for West Coast, so even though there is a difference, it is insignificant, so we could say the starting hypothesis must be rejected”.
Click here to access interactive Data Viz (please display in full screen).
El repositorio contiene documentos sobre un desafío de Data Analytics. Comenzando por la siguiente afirmación: “Dado que el Reino Unido (UK) fue uno de los principales países que colonizaron los Estados Unidos (USA), y UK se encuentra en el lado este de USA, entonces hay más ciudades/poblados con nombres de ciudades de UK en la costa este de USA en comparación a su costa oeste”.
Desde una perspectiva de los datos, 3 problemas emergieron durante el análisis:
- Determinar la pertenencia de las ciudades a cada grupo (Costa Este, Costa Oeste, Reino Unido), ya que estos implican divisiones administrativas de distinto nivel.
- El descubrimiento de que puede existir más de una ciudad o poblado con el mismo nombre.
- Las ciudades con nombres compuestos.
Conclusión: “Teniendo en cuenta la enorme disparidad en la cantidad de ciudades de cada costa, la comparación pertinente debe realizarse en porcentajes. El indicador 'Porcentaje de Ciudades con nombres del Reino Unido sobre el Total de Ciudades de cada Costa' arroja 8,6 % para la Costa Este y 4,9 % para la Costa Oeste, con lo cual si bien existe una diferencia, es mínima, y la hipótesis inicial debe ser rechazada”.
Click aquí para acceder a una visualización interactiva de los datos (por favor, ver en modo pantalla completa).