WIN wk14 / H9 / Pandas intro

Data verwerken met Pandas
Programming basics-II
Hoofdstuk 9 / Week 14
 

1 / 47
volgende
Slide 1: Tekstslide
Applicatie- en mediaontwikkelaarMBOStudiejaar 1

In deze les zitten 47 slides, met interactieve quizzen en tekstslides.

Onderdelen in deze les

Data verwerken met Pandas
Programming basics-II
Hoofdstuk 9 / Week 14
 

Slide 1 - Tekstslide

Deze slide heeft geen instructies

Deze week
  • Kennis opfrissen
  • Nieuwe manier van data-analyse ('pandas')
  • Draaitabellen 

Slide 2 - Tekstslide

Deze slide heeft geen instructies

Deze week
  • Kennis opfrissen
  • Nieuwe manier van data-analyse ('pandas')
  • Draaitabellen 
Nu eerst: kleine-opfris-quiz.
Let op de tijd bij meerkeuzevragen!

Slide 3 - Tekstslide

Deze slide heeft geen instructies

Wat is _waarschijnlijk_ het datatype van
averageSalary na deze regel?
A
String
B
Integer
C
Float
D
Boolean

Slide 4 - Quizvraag

Deze slide heeft geen instructies


Wat is géén datatype?
A
List
B
Dictionary
C
Datetime
D
CSV

Slide 5 - Quizvraag

Deze slide heeft geen instructies

Je wil je scherm leegmaken.
Wat komt er _exact_ op de puntjes?
A
"clear"
B
"cls"
C
clear
D
cls

Slide 6 - Quizvraag

Deze slide heeft geen instructies

Je wil deze csv openen.
Wat komt er op de puntjes?
A
w
B
a
C
r
D
l

Slide 7 - Quizvraag

Deze slide heeft geen instructies

Wat komt er op de puntjes?
A
open
B
reader
C
maintenance.csv
D
planeFile

Slide 8 - Quizvraag

Deze slide heeft geen instructies

Wat komt er op de puntjes?
A
planeList = list(reader)
B
planeFile = list(reader)
C
planeList = list(planeFile)
D
planeFile = list(planeList)

Slide 9 - Quizvraag

Deze slide heeft geen instructies

Leg uit; wat is een CSV en/of
waarvoor staat de afkorting?

Slide 10 - Open vraag

Deze slide heeft geen instructies


A
$d.$m.$Y
B
%d.%m.%y
C
$d-$m-$y
D
%d-%m-%Y

Slide 11 - Quizvraag

Deze slide heeft geen instructies


A
%d/%m/%Y
B
%d/%m/%y
C
%m/%d/%Y
D
%y/%m/%d

Slide 12 - Quizvraag

Deze slide heeft geen instructies


Slide 13 - Open vraag

Deze slide heeft geen instructies

Leg uit; wat gebeurt hier?

Slide 14 - Open vraag

Deze slide heeft geen instructies

Leg uit; wat gebeurt hier?

Slide 15 - Open vraag

Deze slide heeft geen instructies

Zelfstandig werken - stappenplan:

  1. Herhalingopdracht H6 (blz 46)
  2. Bestuderen theorie H8 (blz 56)
  3. Weekcheck H8 (blz 59)
  4. Herhalingopdracht H8 (blz 60)

Stilte, werk voor jezelf
Overleg met buur is ok
Werk in groepjes
timer
30:00

Slide 16 - Tekstslide

Deze slide heeft geen instructies

Weekchecks
Alle uitwerkingen tot nu toe kun je vinden op ItsLearning

NAT-PRB-II ➜ Uitwerkingen

Gebruik deze uitwerkingen om je eigen werk te controleren.
Deze uitwerkingen mag je ook tijdens de toets gebruiken!

Slide 17 - Tekstslide

Deze slide heeft geen instructies

Hoofdstuk 9: Python libraries
import statement kennen we al van:
  • csv
  • os
  • datetime
  • timedelta

Slide 18 - Tekstslide

Deze slide heeft geen instructies

Hoofdstuk 9: Python libraries
import statement kennen we al van:
  • csv
  • os
  • datetime
  • timedelta
Dit zijn losse libraries, maar ze worden wel standaard meegeleverd als je Python installeert.

Slide 19 - Tekstslide

Deze slide heeft geen instructies

Hoofdstuk 9: Python libraries
Er zijn ook nog externe libraries, die je moet eerst downloaden voordat je ze kunt import'en.

Slide 20 - Tekstslide

Deze slide heeft geen instructies

Hoofdstuk 9: Python libraries
Er zijn ook nog externe libraries, die je moet eerst downloaden voordat je ze kunt import'en.

Dit doe je met een package manager, een soort app-store voor Python-libraries.

Slide 21 - Tekstslide

Deze slide heeft geen instructies

Hoofdstuk 9: Python libraries
Er zijn ook nog externe libraries, die je moet eerst downloaden voordat je ze kunt import'en.

Dit doe je met een package manager, een soort app-store voor Python-libraries.

Tip: 'package' en 'library' betekenen feitelijk hetzelfde.

Slide 22 - Tekstslide

Deze slide heeft geen instructies

pip: Package Installer for Python
pip is de package manager ('app-store') voor Python.

Slide 23 - Tekstslide

Deze slide heeft geen instructies

pip: Package Installer for Python
pip is de package manager ('app-store') voor Python.

pip wordt standaard meegeleverd als je Python installeert.
Check je installatie door in de terminal te runnen:

     pip --version

Slide 24 - Tekstslide

Deze slide heeft geen instructies

Run "pip --version" in je terminal in VS code (of cmd-scherm).
Krijg je zoiets?
Ja
Nee

Slide 25 - Poll

Deze slide heeft geen instructies

Pandas
Python data analysis framework




Slide 26 - Tekstslide

Deze slide heeft geen instructies

Pandas
Python data analysis framework

Voordelen:
  • Echte .xlsx-files inlezen
  • Minder code voor analyse
  • Véél meer opties



Slide 27 - Tekstslide

Deze slide heeft geen instructies

Pandas: voorbeeld

Slide 28 - Tekstslide

Deze slide heeft geen instructies

Zelf klikken en kijken
Het is een conventie ('afspraak') binnen Python om pandas altijd te importeren onder de naam "pd". Je weet; developers zijn lui. Dus men typt liever 'pd' dan helemaal 'pandas'.
Merk op dat je niet zelf een for-loop hoeft te schrijven! Je kunt in één keer van een kolom het gemiddelde opvragen. Op de achtergrond gaat pandas voor jou alle rijen af om dat te berekenen.
Mean: wij vertalen 'gemiddelde' vaak naar 'average'. Maar de wetenschappelijk correcte term is eigenlijk 'mean'.

Dit betekent in het Nederlands dus ook gewoon gemiddelde.
read_excel: je hoeft niet zelf het bestand te openen en te converteren naar een list. Pandas doet al die dingen in één keer voor jou met de functie read_excel().

Pandas kan overigens ook gewoon CSV-bestanden openen, maar een Excel is dus net zo eenvoudig!

Slide 29 - Tekstslide

Deze slide heeft geen instructies

Eventueel: nog paragraaf 1 t/m 5 maken
> Lees + maak H9, paragraaf 6 + 7
Inleveren: screenshot code par. 7
timer
8:00
Klaar
Werk verder in het boekje vanaf paragraaf 6.

Slide 30 - Open vraag

Deze slide heeft geen instructies

Top Z

Slide 31 - Tekstslide

Deze slide heeft geen instructies

Top Z

Slide 32 - Tekstslide

Deze slide heeft geen instructies

Top Z

Slide 33 - Tekstslide

Deze slide heeft geen instructies

Top Z

Slide 34 - Tekstslide

Deze slide heeft geen instructies

Top Z
  • top10 is nu een variabele met alle gegevens van de top-vluchten
  • Met pandas kun je die in één keer printen, je hebt geen loop nodig
  • Pandas maakt voor jou een nette tabel:

Slide 35 - Tekstslide

Deze slide heeft geen instructies

Lees + maak paragraaf 8 t/m 9 (zie blz. 62)
Inleveren: screenshot code + console van
opdracht 9.
timer
10:00
Klaar
Werk verder in het boekje vanaf paragraaf 10.

Slide 36 - Open vraag

Deze slide heeft geen instructies

Filteren

Slide 37 - Tekstslide

Deze slide heeft geen instructies

Filteren

Slide 38 - Tekstslide

Deze slide heeft geen instructies

Filteren

Slide 39 - Tekstslide

Deze slide heeft geen instructies

Filteren

Slide 40 - Tekstslide

Deze slide heeft geen instructies

Datetime in de mix

Slide 41 - Tekstslide

Deze slide heeft geen instructies

Datetime in de mix

Slide 42 - Tekstslide

Deze slide heeft geen instructies

Lees + maak paragraaf 10 t/m 11 (zie blz. 63)
Inleveren: screenshot code + console van
opdracht 11.
timer
10:00
Klaar
Werk verder in het boekje vanaf paragraaf 12.

Slide 43 - Open vraag

Deze slide heeft geen instructies

Slide 44 - Tekstslide

Uitleg draaitabel. "van een bak gegevens naar een overzicht waar managers enzovoort vaak om vragen"

Slide 45 - Tekstslide

Deze slide heeft geen instructies

Slide 46 - Tekstslide

Deze slide heeft geen instructies

Aan de slag



Lees + maak H9, par. 12 t/m 14.


Daarna de weekcheck.





Klaar?
  • Bonusopdracht ✔ weekcheck
  • Herhalingsopdrachten H7
  • Herhalingsopdrachten H1 t/m 6
  • Huiswerk ander vak
Stilte, werk voor jezelf
Overleg met buur is ok
Werk in groepjes

Slide 47 - Tekstslide

Deze slide heeft geen instructies