Proseminar Data Mining - Summer 12
- Term
- Summer 12
- Lecturer
- Benjamin Peherstorfer, Alexander Heinecke,Valeriy Khakhutskyy,Dirk Pflüger
- Time and Place
- Vorbesprechung: Di., 31.01 um 14:00 Uhr im FMI 02.07.23
- Vortragsblock (voraussichtlich): Fr., 22.6.12, 29.6.12 und 13.07.12 von 09:00 - 16:00 Uhr.
- Audience
- Informatik (Bachelor)
- Tutorials
- -
- Exam
- -
- Semesterwochenstunden / ECTS Credits
- 2 SWS / 4 Credits
- TUMonline
- {{{tumonline}}}
Contents
Vorbesprechung
- Am 31.01 um 14:00 Uhr im 02.07.23
- Finale Anmeldung erfolgt ueber TUMOnline
- Folien der Vorbesprechung gibt es hier
- Die Themen wurden in der Vorbesprechung zugeteilt. Jeder Teilnehmer soll sich bei seinem Betreuer (siehe unten) per E-Mail melden.
Themen
- Valeriy Khakhutskyy
- Einsatz von Data Mining in Industrie
- Neuronale Netze I
- Neuronale Netze II
- Natural Language Processing
- Big Learning
- Spam Filtering with Naive Bayes Classifier
- Recommender Systems with Collaborative Filtering
- Alexander Heinecke
- Überblick
- Software: RapidMiner
- Lineare Modelle für Regression
- Lineare Modelle und Logistische Regression für Klassifikation
- Entscheidungsbäume
- Association Rules
- Benjamin Peherstorfer
- Software: Matlab und R
- Überblick: Data at Scale
- Clustering
- Dichteschätzung
- Ensemble Learning
- AdaBoost
- Dirk Pflüger
- Software: Google API
- Aufbereitung von Daten, Pre-Processing
- Reinforcement Learning
- Hauptkomponentenanalyse
- Sequential Data
Inhalt
Überblick und Methoden des Data Mining: Software, Data at Scale, Klassifikation, Regression, Clustering, u.v.a.m. Details gibt es in der Vorbesprechung.
Recherchetipps
Um weitere Literatur zu finden, gibt es vielfältige Möglichkeiten, z.B.
oder direkt über die Webseiten der Verlage (Elsevier, Springer, IEEE, ACM, ...)
Sowie Bibliotheksrecherche online
aus dem Uni-Netz (VPN Zugang bzw. lokal vor Ort) muss der Proxy gesetzt werden, dann gibt es kostenlosen Zugriff auf viele Journals etc., siehe
Manche Bücher sind zudem über den OPAC-Katalog abrufbar ("Volltext" Button):
Tipps zum Schreiben eines Papers
- D. E. Knuth, T. Larrabee, P. M. Roberts: Mathematical Writing,
http://tex.loria.fr/typographie/mathwriting.pdf
- M. Ashby: How to Write a Paper,
http://www-mech.eng.cam.ac.uk/mmd/ashby-paper-V6.pdf
- W. Strunk and E. B. White, The Elements of Style, Longman
Publishers, 1979
- A. Bundy: How to Write an Informatics Paper, http://
homepages.inf.ed.ac.uk/bundy/how-tos/writingGuide.html
- N. Dragoni: How to Write a Research Paper, www2.imm.dtu.dk/
courses/02234/slides/writing-a-paper-Nicola.pdf
- WIKIPEDIA IST KEINE LITERATURQUELLE
Plagiate
- LIEGT EIN VERSTOSS VOR, MUSS DIE ARBEIT MIT 5.0 BEWERTET WERDEN!
- jegliche Art von Plagiaten ist zu vermeiden:
- jegliches fremdes geistiges Eigentum muss zitiert werden (Bilder, Text, Web-Seiten, etc.)
- zitieren bedeutet nicht, dass danach Text 1:1 kopiert werden darf!
- Umstellen von Woerten ist auch noch ein Plagiat!
- jede Ausarbeitung wird auf Plagiate gechecked!
- Um Aerger zu ersparen: ALLES MIT EIGENEN WOERTERN SCHREIBEN UND ABBILDUNGEN SELBER ERSTELLEN!
LaTeX
- Bitte das IEEE Template verwenden.
Formalia
- Vortrag: 20min + Diskussion
- Ausarbeitung: 8 Seiten im IEEE Format (Template)