Site pages
Current course
Participants
General
22 September - 28 September
29 September - 5 October
6 October - 12 October
13 October - 19 October
20 October - 26 October
27 October - 2 November
3 November - 9 November
10 November - 16 November
17 November - 23 November
24 November - 30 November
1 December - 7 December
8 December - 14 December
15 December - 21 December
22 December - 28 December
29 December - 4 January
5 January - 11 January
12 January - 18 January
18 May - 24 May
15 June - 21 June
14 September - 20 September
21 September - 27 September
28 September - 4 October
Τρ 23/9/2014: Ημερολόγιο μαθήματος
Σήμερα κάναμε μια μικρή εισαγωγή στο μάθημα, στα διαδικαστικά του και στο προγραμματιστικό περιβάλλον (γλώσσα R) που θα χρησιμοποιούμε κατά τη διάρκεια του εξαμήνου.
Πιο συγκεκριμένα:
- Μιλήσαμε για τις έννοιες του πληθυσμού (population), του δείγματος (sample) και την έννοια της στατιστικής (statistic) ως συνάρτηση του δείγματος.
- Αν το δείγμα μας είναι οι αριθμοί
(έχει επιλεγεί τυχαία από τον πληθυσμό) τότε είδαμε τις εξής δύο στατιστικές:
Δειγματικός μέσος (sample mean):
Δειγματική διασπορά (sample variance): - Αποδείξαμε ότι αν ο μέσος του πληθυσμού μας είναι
και η διασπορά του είναι
(αυτό, με άλλα λόγια, σημαίνει ότι οι ΤΜ
είναι ανεξάρτητες και ισόνομες και η κατανομή τους έχει μέση τιμή
και διασπορά
) τότε ισχύει
και
.
Οι εκτιμήτριες ΤΜκαι
των ποσοτήτων
και
είναι δηλ. αμερόληπτες (η μέση τιμή τους δηλ. ισούται με την υπό εκτίμηση ποσότητα).
- Τρέξαμε διάφορα παραδείγματα στο προγραμματιστικό περιβάλλον Rstudio/R το οποίο πρέπει κι εσείς να εγκαταστήσετε στον υπολογιστή σας για να παρακολουθήσετε το μάθημα. Ακολουθείστε τις οδηγίες που είναι εδώ για να το εγκαταστήσετε.
Αφού εγκαταστήσετε το Rstudio για να πάρετε μια ιδέα για το πρόγραμμα αυτό και τη γλώσσα προγραμματισμού R γενικότερα ακολουθείστε προσεκτικά τις παρακάτω οδηγίες:
- Ξεκινείστε το Rstudio.
- Αριστερά στο > δίνετε τις διάφορες εντολές σε γλώσσα R.
Ενέργεια που κάνετε.
Κείμενο σε courier font είναι εντολές που δίνετε στο >
Σχόλια, αποτέλεσμα Ανοίξτε ένα καθαρό κατάλογο στον υπολογιστή σας (directory, folder)
Κατεβάστε εκεί μέσα το αρχείο grades.csv
Δεξιά στο R: Import Dataset -> From Text File, και επιλέξτε το αρχείο
grades.csv που κατεβάσατε προηγουμένως στον υπολογιστή σας.
Τα περιεχόμενα του αρχείο έχουν ανατεθεί στη μεταβλητή grades της οποίας τα περιεχόμενα βλέπετε πάνω και αριστερά σας ένα πίνακα.
Αριστερά βλέπετε ποια είναι η εντολή που δόθηκε στη γλώσσα R για να υλοποιηθεί το Import Dataset που μόλις κάνατε.
hist(grades$id) Δεξιά και κάτω βλέπετε το ιστόγραμμα της στήλης id (αριθμός μητρώου). hist(grades$id, col='green') Ίδιο σε πράσινο. plot(density(grades$id)) Κατανομή της πυκνότητας των id εξομαλυμένη hist(grades$Final) Δεξιά βλέπετε το ιστόγραμμα της μεταβλητής (στήλης) Final (τελικοί βαθμοί) par(new=T) Λέει στο rstudio να μη σβήσει το τωρινό γράφημα πριν γράψει το επόμενο hist(grades$ProblemGrade, col='red') Προστίθεται το ιστόγραμμα της μεταβλητής ProblemGrade σε κόκκινο χρώμα Πατείστε δεξιά Clear All Καθαρίζουν τα γραφήματα δεξιά. plot(grades$ProblemGrade, grades$MCGrade) Εμφανίζεται το scatterplot των δύο μεταβλητών ProblemGrade και MCGrade. Κάθε σημείο αντιπροσωπεύει ένα γραπτό που η x συντεταγμένη του είναι η τιμή της μεταβλητής ProblemGrade και η y συντεταγμένη του είναι η τιμή της μεταβλητής MCGrade.