Sprawy organizacyjne
Zadanie 1: wyniki (dodano: 10/11/2024, 11:59)Zadanie 2: wyniki (dodano: 14/11/2024, 15:38)
Zadanie 3: wyniki (dodano: 25/11/2024, 16:01)
Kolokwium końcowe - przykładowe zagadnienia:
- Wpisz komendę, która utwórzy wektor ‘A’ składający się z wartości narastających od 1 do 10 z interwałem co 1
- Wpisz komendę, która utwórzy wektor ‘B’ składający się z wartości -2.45, 1, 8, 9.5
- Wpisz komendę, która utwórzy wektor ‘C’ zawierający w kolejności alfabetycznej pierwsze 3 oraz ostatnie 2 litery alfabetu łacińskiego/angielskiego
- Wpisz komendę, która utwórzy wektor ‘D’ zawierający 200 liczb od 0 do 100 w jednakowych interwałych
- Wpisz komendę, która utwórzy wektor ‘E’ zawierający liczby:
20.5, 19.5, 18.5, 17.5, 16.5, 15.5, 14.5, 13.5, 12.5, 11.5, 10.5, 9.5, 8.5, 7.5, 6.5, 5.5, 4.5, 3.5, 2.5, 1.5, 0.5, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 99
- Wpisz komendę, która zamieni 3-ci element wektora ‘E’ brakiem danych (
NA
) - Wpisz komendę, która z wektora
letters
usunie:5-ty, 10-ty i 15-ty
element - Wpisz komendę, która pozwoli na wygenerowanie 5000 losowych wartości o rozkładzie normalnym (
rnorm()
) / losowym (runif()
) - Wpisz komendę, która utwórzy wektor składający się z 1000 elementów i każdy z nich będzie równy 5
- Wpisz komendę, która pozwoli na obliczenie: (1) sumy, (2) średniej arytmetycznej, (3) maksimum, (4) minimum, (5) odchylenia standardowego, (6) logarytmu, (7) pierwiastka kwadratowego, (8) liczby elementów (długości wektora), (9) …
z wektora wartości Nile
(lub wyniku polecenia as.numeric(Nile)
)
- Jakiego argumentu należało by użyć dla podanych powyżej funkcji arytmetycznych jeśli w wektorze znajdują się braki danych (
NA
)? - Jaka komenda pozwola na wyświetlenie pomocy dla danej funkcji?
- Jakie zadanie wykonują funkcje:
round()
,ceiling()
,floor()
,rep()
,sort()
,rev()
? - Wpisz komendę, która posortuje/odwróci kolejność wektora
A
i nadpisze jego wcześniejszą zawartość - Wpisz komendę, która stworzy wektor logiczny zawierący 2 razy wartości ‘prawda’ i 2 razy wartości ‘fałsz’
- Stosując indeksowanie przez negację wyświetl wszystkie elementy wektora
A
bez pierwszych dwóch / bez pierwszego i ostatniego - Stosując wyrażenia logiczne sprawdź, które elementy wektora
x
są większe od 0. Wynikiem powinien być wektor wartości logicznych (TRUE/FALSE
) - Napisz komendę, która zwróci indeksy elementów wektora
x
, które są mniejsze bądź równe 0. Wynikiem powinien być wektor wartości całkowitych - Korzystając z nawiasów kwadratowych wyświetl tylko parzyste elementy wektora
letters
- Wpisz komendę, która wyświetli zawartość kolumny
Temp
z ramki danychairquality
- Oblicz minimalną i/lub maksymalną wartość kolumny
Temp
z ramki danychairquality
- Wyświetl pierwszy rząd / pierwsze 5 rzędów ramki danych
airquality
- Wyświetl 1, 5 i 20 rząd ramki danych
airquality
- Oblicz średnią z pierwszej kolumny ramki danych
airquality
- Oblicz wartość minimalną z drugiej kolumny ramki danych
airquality
- Wyświetl pierwsze dwie kolumny ramki danych
airquality
- Pomijając dwa pierwsze wiersze ramki danych
airquality
wyświetl zawartość drugiej i trzeciej kolumny - Stwórz dowolną ramkę danych zawierającą 3 dowolnie nazwane kolumny. Każdy wiersz powinien zawierać 2 wartości.
- Dodaj nową kolumnę o nazwie
cisnienie
do ramki danychairquality
. Całą kolumnę wypełnij brakiem wartości (NA
) - Dodaj nową kolumnę o nazwie
TempC
do ramki danychairquality
. Kolumnę wypełnij wynikiem działania(airquality$Temp-32)*(5/9)
- Wczytaj do środowiska R plik dostępny pod adresem http://biecek.pl/MOOC/dane/koty_ptaki.csv. Jego zawartość zapisz do zmiennej
dane
- Wczytaj do środowiska R plik binarny .Rdata, który wcześniej pobierzesz z adresu: http://www.enwo.pl/przetwarzanie/dane/pm10.Rdata ; Pamiętaj o konieczności zdefiniowania wcześniej katalogu roboczego
- Wczytaj plik w formacie RDS i przypisz jego zawartość do obiektu
dane
. Dane do wczytania dostępne są pod adresem: http://www.enwo.pl/przetwarzanie/dane/pm10_new.rds - Wpisz komendę, która zapisze obiekt
dane
do pliku RDS pod nazwądane.rds
- Wpisz rozwiązanie, które złączy ciągi tekstowe zawarte w wektorach: A, B i C do postaci jednoelementowego wektora, bez spacji.
- Napisz pętlę programistyczną “for” z wbudowaną zmienną “i”, która będzie przyjmować narastające wartości liczb całkowitych od 1 do 5. Wewnątrz pętli użyj funkcji “print()”, która będzie wyświetlać chwilową zawartość zmiennej “i”. Napisz kod w RStudio i przeklej go w pole odpowiedzi
- Napisz pętlę programistyczną “while” ze zdefinowaną wcześniej zmienną “i” równą 5, która będzie się uruchamiać dla i>0. Pętla powinna być skonstruowana w taki sposób, aby wartość parametru “i” zmniejszała się przy każdym jej uruchomieniu o 1.
- Napisz pętlę programistyczną
for
, która będzie wyświetlać nazwy wszystkich plików znajdujacych się w aktualnym katalogu roboczym - Przekształć ciąg znaków “2015-02-22” do obiektu klasy
Date
- Utwórz wektor klasy
Date
dla wszystkich dni w roku 2017 - Utwórz wektor klasy
Date
od 1. stycznia 2017 roku do 31. grudnia 2017 roku z interwałem co 7 dni - Oblicz liczbę dni pomiędzy datą 10. maja 2009 roku a dzisiaj
- Przekonwertuj ciąg tekstowy “2015-02-13 12:56:26” do obiektu klasy POSIX w czasie lokalnym
- Przekonwertuj ciąg tekstowy “2015-02-13 12:56:26” do obiektu klasy POSIX w czasie ‘UTC’
- Zakres rozdziału 8. oraz 9.1-9.3 analogiczny do pytań zawartych w teście: https://goo.gl/forms/KzrTeavRMi3dixNp2
- Operator przetwarzania potokowego
%>%
można wygenerować w środowisku RStudio za pomocą skrótu klawiszowego … - Wpisz polecenie, które ze zbioru danych
airquality
wybierz jedynie kolumny,Temp
iMonth
- Wpisz polecenie, które ze zbioru danych
airquality
usunie wszystkie kolumny opróczTemp
iMonth
- Wpisz polecenie, które ze zbioru danych
airquality
wybierze jedynie przypadki z temperaturą powyżej 86*F - Wpisz polecenie, które posortuje zbiór danych
airquality
według narastających wartości temperatur - Wpisz polecenie, które posortuje zbiór danych
airquality
według malejących wartości temperatur - Korzystając z przetwarzania potokowego i funkcji pakietu
dplyr
wybierz ze zbioru danychairquality
jedynie dni, w których (1) temperatura powietrza przekroczyła 85F, (2) pozostawi jedynie kolumnyTemp i Month
, (3) posortuje te dni w kolejności od najwyższych do najniższych koncentracji ozonu - Analogicznie do zadań podsumowujących rozdział 9.4
- Korzystając z przetwarzania potokowego oraz funkcji
group_by
orazsummarise
oblicz średnią miesięczną temperaturę powietrza ze zbioruairquality
- Korzystając z przetwarzania potokowego oraz funkcji
group_by
orazsummarise
oblicz średnią, maksymalną i minimalną miesięczną temperaturę powietrza ze zbioruairquality
- Korzystając z przetwarzania potokowego oraz funkcji
group_by
orazsummarise
oblicz średnią i sumę miesięczną temperatur powietrza oraz średnią miesieczną koncentrację ozonu (po usunięciu braków w obserwacjach) ze zbioruairquality
. Nazwij te kolumny odpowiednio: “sred”, “suma”, “ozon” - Wczytaj zbiór danych:
dane <- readRDS(gzcon(url("http://enwo.pl/przetwarzanie/dane/synop.rds")))
; Następnie korzystając z przetwarzania potokowego wybierz jedynie miesiące zimowe dla Poznania i oblicz średnią temperaturę powietrza zimy. Rozwiązaniem jest wynik zaokrąglony do 2. miejsc po przecinku - Wczytaj zbiór danych:
dane <- readRDS(gzcon(url("http://enwo.pl/przetwarzanie/dane/synop.rds")))
; Następnie korzystając z przetwarzania potokowego wybierz jedynie miesiące letnie dla Warszawy i oblicz średnią prędkość wiatru w poszczególnych sezonach (2000, 2001, 2002, itd.). Który z sezonów letnich był najbardziej wietrzny? Podaj rok - Wczytaj zbiór danych:
dane <- readRDS(gzcon(url("http://enwo.pl/przetwarzanie/dane/synop.rds")))
; Następnie korzystając z przetwarzania potokowego oblicz średnią prędkość wiatru w poszczególnych latach (2000, 2001, 2002, itd.) na każdej ze stacji. Który rok i na jakiej stacji był najmniej wietrzny? - Przekształć do postaci szerokiej dane, które można wczytać funkcją:
dane <- readRDS(gzcon(url("http://enwo.pl/przetwarzanie/dane/opady.rds")))
. Dane w postaci szerokiej powinny zawierać w pierwszej kolumnie datę, a w kolejnych identyfikator stacji wraz z odnotowanymi wartościami opadów - Za pomocą funkcji
gather
z pakietytidyr
przekształć wynik działania z wcześniejszego punktu do postaci wąskiej (pierwotnej)
Wskazówka: zadania z rozdziałów 8-10 obejmujące rozwiązanie realnych problemów z przetwarzania danych będą punktowane wyżej od zadań teoretycznych.
W trakcie kolokwium końcowego dopuszczalne jest korzystanie z podręczników, notatek oraz komputera (w tym z dostępem do internetu, bez możliwości stosowania komunikatorów i pokrewnych rozwiązań).
Ostatnia wersja skryptu wygenerowana w dniu: 2018-06-21 21:43:47