Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Praca domowa 1 #69

Closed
kozaka93 opened this issue Oct 12, 2023 · 16 comments
Closed

Praca domowa 1 #69

kozaka93 opened this issue Oct 12, 2023 · 16 comments
Assignees

Comments

@kozaka93
Copy link
Owner

Celem pracy domowej jest sprawdzenie znajomości pakietów dplyr oraz tidyr.
Do rozwiązania jest 12 zadań. Plik z treścią zadań jest dostępny tutaj.

Poniższe zadania dotyczą zbioru danych o piosenkach dostępnego w pliku .csv. Opis kolumn.

df <- read.csv("spotify-2023.csv")

Rozwiązanie należy przesłać w postaci pliku .R z kodem do wygenerowania odpowiedzi oraz zakomentowaną odpowiedzią.

Przykładowa odpowiedź na zadane pytanie:

obraz

Czas na wykonanie pracy domowej wynosi tydzień od zajęć laboratoryjnych numer 2, czyli: 19.10.2023 do 16:00.
Prace przesłane po tym terminie będą mieć minus jeden punkt za każdy dzień zwłoki.

Skrypt z rozwiązaniem należy umieścić w folderze NazwiskoImie w ../homeworks/hw1

Rozwiązanie dodajemy poprzez pull request, proszę w tytule podać nazwisko, imię oraz numer pracy domowej.

@NoisyBeaver
Copy link

NoisyBeaver commented Oct 13, 2023

Dzień dobry, mam kilka pytań.

Czy jest dozwolone tworzenie zmiennych i czy można używać inner_join() itp?

W zadaniu 5, artysta to mianowicie 1 osoba? 5. Spośród piosenek znajdujących się w 10% najbardziej tanecznych, piosenka którego artysty ma średnio najwięcej odtworzeń na rok?

W zadaniu 8, czy para key-mode może mieć key = ""?
8.Dla 10 najpopularniejszych par key-mode w roku 2022 wybierz tę którą najcześcej tworzą artyści solowi.

@woznicak
Copy link
Collaborator

@NoisyBeaver ,

Tak, można a nawet jest to wskazane aby tworzyć nowe zmienne i korzystać z warintów funkcji join.

W zadaniu 5 nie trzeba wyszczególniać artystów - jeśli poiosenka, którra spełniła ten warunek była wykonywana przez 2 lub więcej osób trzeba podać je wszystkie.

W zadaniu 8, para key-mode może mieć key = "".

@MaciejMomot
Copy link
Contributor

Dzień dobry,
Czy w pracy można korzystać z innych bibliotek niz dplyr i tidyr ?

@miloszkita
Copy link
Contributor

Dzień dobry, mam pytania dotyczące pracy domowej. Pierwsze z nich dotyczy pytania 5, w poleceniu napisane jest że dla piosenek wypuszczonych w 2023 roku liczymy że były dostępne cały jeden rok, czy dla piosenek wypuszczonych wcześniej również mamy liczyć że były dostępny cały 2023 rok ? Drugie pytanie dotyczy zad 9, czy mamy brać pod uwagę tylko piosenki które wykonywał jeden artysta i dla każdego zliczać wyświetlenia tylko z nich, czy jeśli artysta ma również piosenki których nie wykonywał sam to mamy wliczać te wyświetlenia do jego całkowitej liczby wyświetleń ? Trzecie pytanie dotyczy zad 10, czy mamy tam osobno rozważać skale i tonacje czy połączyć je w pary ?

@kozaka93
Copy link
Owner Author

@MaciejMomot,
można korzystać też z innych.

@woznicak
Copy link
Collaborator

woznicak commented Oct 14, 2023

@miloszkita

Pierwsze z nich dotyczy pytania 5, w poleceniu napisane jest że dla piosenek wypuszczonych w 2023 roku liczymy że były dostępne cały jeden rok, czy dla piosenek wypuszczonych wcześniej również mamy liczyć że były dostępny cały 2023 rok ? *

Tak

Drugie pytanie dotyczy zad 9, czy mamy brać pod uwagę tylko piosenki które wykonywał jeden artysta i dla każdego zliczać wyświetlenia tylko z nich, czy jeśli artysta ma również piosenki których nie wykonywał sam to mamy wliczać te wyświetlenia do jego całkowitej liczby wyświetleń ?

Zliczamy wszystkie wyświetlenia danego artysty, również te, które wykonywał z kimś

Trzecie pytanie dotyczy zad 10, czy mamy tam osobno rozważać skale i tonacje czy połączyć je w pary ?

Rozpatrujemy ich kombinacje.

@woznicak woznicak self-assigned this Oct 14, 2023
@vecel
Copy link
Contributor

vecel commented Oct 15, 2023

Jak powinna wyglądać odpowiedź na pytanie "Jakie charakterystyki taneczności itd ... " w zadaniu 7?

@woznicak
Copy link
Collaborator

@vecel ,

Najlepiej w kolejnych kolumnach podać srednią wartość danej cechy

@Sebislaw
Copy link
Contributor

Dzień dobry,
czy w zadaniu 5. 'Spośród piosenek znajdujących się w 10% najbardziej tanecznych...?' mamy brać pod uwagę piosenki o taneczności >90%, czy pierwsze 10% najbardziej tanecznych piosenek?

@woznicak
Copy link
Collaborator

@Sebislaw , nie widzę różnicy w dwóch opcjach o których Pan napisał. Proszę doprecyzować

@Sebislaw
Copy link
Contributor

Na przykładzie; jeśli mamy 10 piosenek i ich poziomy taneczności to malejąco (99, 98, 97, 26, 25, 24, 23, 22, 21, 20), to pierwsza opcja obejmuje piosenki (99, 98, 97), bo ich taneczność jest w przedziale 100-90, a druga opcja tylko (99) jako najbardziej taneczne 10% z liczby wszystkich piosenek.

@woznicak
Copy link
Collaborator

@Sebislaw ,
Moim zdaniem pytanie jest sformułowne jednoznacznie i dotyczy zrozumienia operacji na procentach. Jako wskazówka: proszę sobie zadać pytanie ile powinno być piosenek w wyniku zapytania wybierz 10 % wszystkich piosenek

@kateqwerty001
Copy link
Contributor

Dzień dobry,

  1. Jakim średnim tempem i najczęściej występującą skalą ('mode') charakteryzują się piosenki,
    które są w 20% najczęściej odtwarzanych piosenek w przeliczeniu na liczbę playlist spotify?

Czy poprawnie rozumiem, że wartością sortującą tutaj powinna być średnia liczba odtworzeń piosenki na 1 playlist Spotify?
Czy po prostu liczba playlistów na Spotify?

Z góry dziękuję za odpowiedź.

@annaostrowska03
Copy link
Contributor

Dzień dobry, w wierszu nr 576 w kolumnie ,,streams" wartość pola to ,,BPM110KeyAModeMajorDanceability53Valence75Energy69Acousticness7Instrumentalness0Liveness17Speechiness3". Czy można ten wiersz usunąć/zmodyfikować? Czy po prostu mamy go ignorować?

@woznicak
Copy link
Collaborator

@kateqwerty001

wartością sortującą tutaj powinna być średnia liczba odtworzeń piosenki na 1 playlist Spotify?

Tak

@woznicak
Copy link
Collaborator

@annaostrowska03 ,

Dzień dobry, w wierszu nr 576 w kolumnie ,,streams" wartość pola to ,,BPM110KeyAModeMajorDanceability53Valence75Energy69Acousticness7Instrumentalness0Liveness17Speechiness3". Czy można ten wiersz usunąć/zmodyfikować? Czy po prostu mamy go ignorować?

Można ignorować i przypisać wartość streams -> 0, albo w funkcjach agregujących podać na.rm=TRUE

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

9 participants