Skip to content

Projeto visa à mineração de dados em repositórios no github, com objetivo de obter dados a serem analisados testando hipóteses sobre os mesmos.

Notifications You must be signed in to change notification settings

ovitorj/lab-exp-software

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Laboratório de Experimentação de Software

Badge Badge Badge Badge Badge

Tabela de conteúdos

📄 Sobre o projeto

Neste laboratório, vamos estudar as principais características de sistemas populares open-source. Dessa forma, vamos analisar como eles são desenvolvidos, com que frequência recebem contribuição externa, com qual frequência lançam releases, entre outras características. Para tanto, colete os dados indicados a seguir para os 1.000 repositórios com maior número de estrelas no GitHub e discuta os valores obtidos.

🎯 Questões de pesquisa

  • RQ 01. Sistemas populares são maduros/antigos?

    • Métrica: idade do repositório (calculado a partir da data de sua criação).
  • RQ 02. Sistemas populares recebem muita contribuição externa?

    • Métrica: total de pull requests aceitas.
  • RQ 03. Sistemas populares lançam releases com frequência?

    • Métrica: total de releases.
  • RQ 04. Sistemas populares são atualizados com frequência?

    • Métrica: tempo até a última atualização (calculado a partir da data de última atualização).
  • RQ 05. Sistemas populares são escritos nas linguagens mais populares (Links para um site externo.)?

    • Métrica: linguagem primária de cada um desses repositórios.
  • RQ 06. Sistemas populares possuem um alto percentual de issues fechadas?

    • Métrica: razão entre número de issues fechadas pelo total de issues.

📝 Relatório final

Para cada uma questões de pesquisa anteriores, faça uma sumarização dos dados obtidos através de valores medianos (Links para um site externo.). Mesmo que de forma informal, elabore hipóteses sobre o que você espera de resposta e tente analisar a partir dos valores obtidos. Para valores de categoria (ex.: linguagem de programação), elabore uma contagem por categoria, para facilitar suas descobertas.

Elabore um documento que apresente (i) uma introdução simples com hipóteses informais; (ii) a metodologia que você utilizou para responder às questões de pesquisa; (iii) os resultados obtidos para cada uma delas; (iii) a discussão sobre o que você esperava como resultado (suas hipóteses) e os valores obtidos.

✅ Bônus

Divida os resultados obtidos nas RQs 02, 03 e 04 por linguagem e analise como esses valores se comportam de acordo com as linguagem de cada repositório. Ou seja, acrescente ao seu trabalho a seguinte questão:

RQ. 07: Sistemas escritos em linguagens mais populares recebem mais contribuição externa, lançam mais releases e são atualizados com mais frequência?

Dica: compare os resultados para os sistemas com as linguagens da reportagem com os resultados de sistemas em outras linguagens.

:octocat: Processo de desenvolvimento

  • Lab01S01: Consulta graphql para 100 repositórios + requisição automática (5 pontos) - (Entrega: 23 fev)

  • Lab01S02: Paginação (consulta 1000 repositórios) + dados em arquivo .csv (5 pontos) - (Entrega: 02 mar)

  • Lab01S03: Análise de dados + elaboração do relatório final (10 pontos)

👥 Alunos

  • Matheus Santos Rosa Carneiro.
  • Raíssa Carolina Vilela da Silva.
  • Vitor Augusto Alves de Jesus.

👤 Professor responsável

  • Jose Laerte Pires Xavier Junior.

🚧 Spring 3 🚀 Em construção... 🚧

About

Projeto visa à mineração de dados em repositórios no github, com objetivo de obter dados a serem analisados testando hipóteses sobre os mesmos.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%