Sprawy organizacyjne

Zadanie 1: wyniki (dodano: 10/11/2024, 11:59)
Zadanie 2: wyniki (dodano: 14/11/2024, 15:38)
Zadanie 3: wyniki (dodano: 25/11/2024, 16:01)

 

Kolokwium końcowe - przykładowe zagadnienia:

  • Wpisz komendę, która utwórzy wektor ‘A’ składający się z wartości narastających od 1 do 10 z interwałem co 1
  • Wpisz komendę, która utwórzy wektor ‘B’ składający się z wartości -2.45, 1, 8, 9.5
  • Wpisz komendę, która utwórzy wektor ‘C’ zawierający w kolejności alfabetycznej pierwsze 3 oraz ostatnie 2 litery alfabetu łacińskiego/angielskiego
  • Wpisz komendę, która utwórzy wektor ‘D’ zawierający 200 liczb od 0 do 100 w jednakowych interwałych
  • Wpisz komendę, która utwórzy wektor ‘E’ zawierający liczby: 20.5, 19.5, 18.5, 17.5, 16.5, 15.5, 14.5, 13.5, 12.5, 11.5, 10.5, 9.5, 8.5, 7.5, 6.5, 5.5, 4.5, 3.5, 2.5, 1.5, 0.5, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 99
  • Wpisz komendę, która zamieni 3-ci element wektora ‘E’ brakiem danych (NA)
  • Wpisz komendę, która z wektora letters usunie: 5-ty, 10-ty i 15-ty element
  • Wpisz komendę, która pozwoli na wygenerowanie 5000 losowych wartości o rozkładzie normalnym ( rnorm() ) / losowym ( runif() )
  • Wpisz komendę, która utwórzy wektor składający się z 1000 elementów i każdy z nich będzie równy 5
  • Wpisz komendę, która pozwoli na obliczenie: (1) sumy, (2) średniej arytmetycznej, (3) maksimum, (4) minimum, (5) odchylenia standardowego, (6) logarytmu, (7) pierwiastka kwadratowego, (8) liczby elementów (długości wektora), (9) …

z wektora wartości Nile (lub wyniku polecenia as.numeric(Nile))

  • Jakiego argumentu należało by użyć dla podanych powyżej funkcji arytmetycznych jeśli w wektorze znajdują się braki danych (NA)?
  • Jaka komenda pozwola na wyświetlenie pomocy dla danej funkcji?
  • Jakie zadanie wykonują funkcje: round(), ceiling(), floor(), rep(), sort(), rev()?
  • Wpisz komendę, która posortuje/odwróci kolejność wektora A i nadpisze jego wcześniejszą zawartość
  • Wpisz komendę, która stworzy wektor logiczny zawierący 2 razy wartości ‘prawda’ i 2 razy wartości ‘fałsz’
  • Stosując indeksowanie przez negację wyświetl wszystkie elementy wektora A bez pierwszych dwóch / bez pierwszego i ostatniego
  • Stosując wyrażenia logiczne sprawdź, które elementy wektora x są większe od 0. Wynikiem powinien być wektor wartości logicznych (TRUE/FALSE)
  • Napisz komendę, która zwróci indeksy elementów wektora x, które są mniejsze bądź równe 0. Wynikiem powinien być wektor wartości całkowitych
  • Korzystając z nawiasów kwadratowych wyświetl tylko parzyste elementy wektora letters
  • Wpisz komendę, która wyświetli zawartość kolumny Temp z ramki danych airquality
  • Oblicz minimalną i/lub maksymalną wartość kolumny Temp z ramki danych airquality
  • Wyświetl pierwszy rząd / pierwsze 5 rzędów ramki danych airquality
  • Wyświetl 1, 5 i 20 rząd ramki danych airquality
  • Oblicz średnią z pierwszej kolumny ramki danych airquality
  • Oblicz wartość minimalną z drugiej kolumny ramki danych airquality
  • Wyświetl pierwsze dwie kolumny ramki danych airquality
  • Pomijając dwa pierwsze wiersze ramki danych airquality wyświetl zawartość drugiej i trzeciej kolumny
  • Stwórz dowolną ramkę danych zawierającą 3 dowolnie nazwane kolumny. Każdy wiersz powinien zawierać 2 wartości.
  • Dodaj nową kolumnę o nazwie cisnienie do ramki danych airquality. Całą kolumnę wypełnij brakiem wartości (NA)
  • Dodaj nową kolumnę o nazwie TempC do ramki danych airquality. Kolumnę wypełnij wynikiem działania (airquality$Temp-32)*(5/9)
  • Wczytaj do środowiska R plik dostępny pod adresem http://biecek.pl/MOOC/dane/koty_ptaki.csv. Jego zawartość zapisz do zmiennej dane
  • Wczytaj do środowiska R plik binarny .Rdata, który wcześniej pobierzesz z adresu: http://www.enwo.pl/przetwarzanie/dane/pm10.Rdata ; Pamiętaj o konieczności zdefiniowania wcześniej katalogu roboczego
  • Wczytaj plik w formacie RDS i przypisz jego zawartość do obiektu dane. Dane do wczytania dostępne są pod adresem: http://www.enwo.pl/przetwarzanie/dane/pm10_new.rds
  • Wpisz komendę, która zapisze obiekt dane do pliku RDS pod nazwą dane.rds
  • Wpisz rozwiązanie, które złączy ciągi tekstowe zawarte w wektorach: A, B i C do postaci jednoelementowego wektora, bez spacji.
  • Napisz pętlę programistyczną “for” z wbudowaną zmienną “i”, która będzie przyjmować narastające wartości liczb całkowitych od 1 do 5. Wewnątrz pętli użyj funkcji “print()”, która będzie wyświetlać chwilową zawartość zmiennej “i”. Napisz kod w RStudio i przeklej go w pole odpowiedzi
  • Napisz pętlę programistyczną “while” ze zdefinowaną wcześniej zmienną “i” równą 5, która będzie się uruchamiać dla i>0. Pętla powinna być skonstruowana w taki sposób, aby wartość parametru “i” zmniejszała się przy każdym jej uruchomieniu o 1.
  • Napisz pętlę programistyczną for, która będzie wyświetlać nazwy wszystkich plików znajdujacych się w aktualnym katalogu roboczym
  • Przekształć ciąg znaków “2015-02-22” do obiektu klasy Date
  • Utwórz wektor klasy Date dla wszystkich dni w roku 2017
  • Utwórz wektor klasy Date od 1. stycznia 2017 roku do 31. grudnia 2017 roku z interwałem co 7 dni
  • Oblicz liczbę dni pomiędzy datą 10. maja 2009 roku a dzisiaj
  • Przekonwertuj ciąg tekstowy “2015-02-13 12:56:26” do obiektu klasy POSIX w czasie lokalnym
  • Przekonwertuj ciąg tekstowy “2015-02-13 12:56:26” do obiektu klasy POSIX w czasie ‘UTC’
  • Zakres rozdziału 8. oraz 9.1-9.3 analogiczny do pytań zawartych w teście: https://goo.gl/forms/KzrTeavRMi3dixNp2
  • Operator przetwarzania potokowego %>% można wygenerować w środowisku RStudio za pomocą skrótu klawiszowego …
  • Wpisz polecenie, które ze zbioru danych airquality wybierz jedynie kolumny, Temp i Month
  • Wpisz polecenie, które ze zbioru danych airquality usunie wszystkie kolumny oprócz Temp i Month
  • Wpisz polecenie, które ze zbioru danych airquality wybierze jedynie przypadki z temperaturą powyżej 86*F
  • Wpisz polecenie, które posortuje zbiór danych airquality według narastających wartości temperatur
  • Wpisz polecenie, które posortuje zbiór danych airquality według malejących wartości temperatur
  • Korzystając z przetwarzania potokowego i funkcji pakietu dplyr wybierz ze zbioru danych airquality jedynie dni, w których (1) temperatura powietrza przekroczyła 85F, (2) pozostawi jedynie kolumny Temp i Month, (3) posortuje te dni w kolejności od najwyższych do najniższych koncentracji ozonu
  • Analogicznie do zadań podsumowujących rozdział 9.4
  • Korzystając z przetwarzania potokowego oraz funkcji group_by oraz summarise oblicz średnią miesięczną temperaturę powietrza ze zbioru airquality
  • Korzystając z przetwarzania potokowego oraz funkcji group_by oraz summarise oblicz średnią, maksymalną i minimalną miesięczną temperaturę powietrza ze zbioru airquality
  • Korzystając z przetwarzania potokowego oraz funkcji group_by oraz summarise oblicz średnią i sumę miesięczną temperatur powietrza oraz średnią miesieczną koncentrację ozonu (po usunięciu braków w obserwacjach) ze zbioru airquality. Nazwij te kolumny odpowiednio: “sred”, “suma”, “ozon”
  • Wczytaj zbiór danych: dane <- readRDS(gzcon(url("http://enwo.pl/przetwarzanie/dane/synop.rds"))) ; Następnie korzystając z przetwarzania potokowego wybierz jedynie miesiące zimowe dla Poznania i oblicz średnią temperaturę powietrza zimy. Rozwiązaniem jest wynik zaokrąglony do 2. miejsc po przecinku
  • Wczytaj zbiór danych: dane <- readRDS(gzcon(url("http://enwo.pl/przetwarzanie/dane/synop.rds"))) ; Następnie korzystając z przetwarzania potokowego wybierz jedynie miesiące letnie dla Warszawy i oblicz średnią prędkość wiatru w poszczególnych sezonach (2000, 2001, 2002, itd.). Który z sezonów letnich był najbardziej wietrzny? Podaj rok
  • Wczytaj zbiór danych: dane <- readRDS(gzcon(url("http://enwo.pl/przetwarzanie/dane/synop.rds"))) ; Następnie korzystając z przetwarzania potokowego oblicz średnią prędkość wiatru w poszczególnych latach (2000, 2001, 2002, itd.) na każdej ze stacji. Który rok i na jakiej stacji był najmniej wietrzny?
  • Przekształć do postaci szerokiej dane, które można wczytać funkcją: dane <- readRDS(gzcon(url("http://enwo.pl/przetwarzanie/dane/opady.rds"))) . Dane w postaci szerokiej powinny zawierać w pierwszej kolumnie datę, a w kolejnych identyfikator stacji wraz z odnotowanymi wartościami opadów
  • Za pomocą funkcji gather z pakiety tidyr przekształć wynik działania z wcześniejszego punktu do postaci wąskiej (pierwotnej)

Wskazówka: zadania z rozdziałów 8-10 obejmujące rozwiązanie realnych problemów z przetwarzania danych będą punktowane wyżej od zadań teoretycznych.

W trakcie kolokwium końcowego dopuszczalne jest korzystanie z podręczników, notatek oraz komputera (w tym z dostępem do internetu, bez możliwości stosowania komunikatorów i pokrewnych rozwiązań).



Ostatnia wersja skryptu wygenerowana w dniu: 2018-06-21 21:43:47