Τρ 23/9/2014: Ημερολόγιο μαθήματος

Σήμερα κάναμε μια μικρή εισαγωγή στο μάθημα, στα διαδικαστικά του και στο προγραμματιστικό περιβάλλον (γλώσσα R) που θα χρησιμοποιούμε κατά τη διάρκεια του εξαμήνου.

Πιο συγκεκριμένα:

  1. Μιλήσαμε για τις έννοιες του πληθυσμού (population), του δείγματος (sample) και την έννοια της στατιστικής (statistic) ως συνάρτηση του δείγματος.
  2. Αν το δείγμα μας είναι οι αριθμοί X_1, \ldots, X_N (έχει επιλεγεί τυχαία από τον πληθυσμό) τότε είδαμε τις εξής δύο στατιστικές:
    Δειγματικός μέσος (sample mean): \overline{X} = \frac1N (X_1+\cdots+X_N)
    Δειγματική διασπορά (sample variance): S^2 = \frac{1}{N-1} \sum_{i=1}^N (X_i-\overline{X})^2
  3. Αποδείξαμε ότι αν ο μέσος του πληθυσμού μας είναι \mu και η διασπορά του είναι \sigma^2 (αυτό, με άλλα λόγια, σημαίνει ότι οι ΤΜ X_1,\ldots,X_N είναι ανεξάρτητες και ισόνομες και η κατανομή τους έχει μέση τιμή \mu και διασπορά \sigma^2) τότε ισχύει
                   \Mean{\overline{X}} = \mu και \Mean{S^2} = \sigma^2.
    Οι εκτιμήτριες ΤΜ \overline{X} και S^2 των ποσοτήτων \mu και \sigma^2 είναι δηλ. αμερόληπτες (η μέση τιμή τους δηλ. ισούται με την υπό εκτίμηση ποσότητα).
  4. Τρέξαμε διάφορα παραδείγματα στο προγραμματιστικό περιβάλλον Rstudio/R το οποίο πρέπει κι εσείς να εγκαταστήσετε στον υπολογιστή σας για να παρακολουθήσετε το μάθημα. Ακολουθείστε τις οδηγίες που είναι εδώ για να το εγκαταστήσετε.

Αφού εγκαταστήσετε το Rstudio για να πάρετε μια ιδέα για το πρόγραμμα αυτό και τη γλώσσα προγραμματισμού R γενικότερα ακολουθείστε προσεκτικά τις παρακάτω οδηγίες:

  1. Ξεκινείστε το Rstudio.
  2. Αριστερά στο > δίνετε τις διάφορες εντολές σε γλώσσα R.

    Ενέργεια που κάνετε.

    Κείμενο σε courier font είναι εντολές που δίνετε στο > 

    Σχόλια, αποτέλεσμα                                               

    Ανοίξτε ένα καθαρό κατάλογο στον υπολογιστή σας (directory, folder)

    Κατεβάστε εκεί μέσα το αρχείο grades.csv

    Δεξιά στο R: Import Dataset -> From Text File, και επιλέξτε το αρχείο

    grades.csv που κατεβάσατε προηγουμένως στον υπολογιστή σας.

    Τα περιεχόμενα του αρχείο έχουν ανατεθεί στη μεταβλητή grades της οποίας τα περιεχόμενα βλέπετε πάνω και αριστερά σας ένα πίνακα.

    Αριστερά βλέπετε ποια είναι η εντολή που δόθηκε στη γλώσσα R για να υλοποιηθεί το Import Dataset που μόλις κάνατε.

    hist(grades$id) Δεξιά και κάτω βλέπετε το ιστόγραμμα της στήλης id (αριθμός μητρώου).
    hist(grades$id, col='green') Ίδιο σε πράσινο.
    plot(density(grades$id)) Κατανομή της πυκνότητας των id εξομαλυμένη
    hist(grades$Final) Δεξιά βλέπετε το ιστόγραμμα της μεταβλητής (στήλης) Final (τελικοί βαθμοί)
    par(new=T) Λέει στο rstudio να μη σβήσει το τωρινό γράφημα πριν γράψει το επόμενο
    hist(grades$ProblemGrade, col='red') Προστίθεται το ιστόγραμμα της μεταβλητής ProblemGrade σε κόκκινο χρώμα
    Πατείστε δεξιά Clear All Καθαρίζουν τα γραφήματα δεξιά.
    plot(grades$ProblemGrade, grades$MCGrade) Εμφανίζεται το scatterplot των δύο μεταβλητών ProblemGrade και MCGrade. Κάθε σημείο αντιπροσωπεύει ένα γραπτό που η x συντεταγμένη του είναι η τιμή της μεταβλητής ProblemGrade και η y συντεταγμένη του είναι η τιμή της μεταβλητής MCGrade.
Last modified: Wednesday, 24 September 2014, 11:28 PM