Proseminar Data Mining - Summer 12: Difference between revisions
Jump to navigation
Jump to search
No edit summary |
No edit summary |
||
Line 12: | Line 12: | ||
* Am 31.01 um 14:00 Uhr im 02.07.23 | * Am 31.01 um 14:00 Uhr im 02.07.23 | ||
* Finale Anmeldung erfolgt ueber TUMOnline | * Finale Anmeldung erfolgt ueber TUMOnline | ||
* Folien der Vorbesprechung gibt es [http://www5.in.tum.de/lehre/seminare/datamining/vorbespr.pdf hier] | |||
* Die Themen wurden in der Vorbesprechung zugeteilt. '''Jeder Teilnehmer soll sich bei seinem Betreuer (siehe unten) per E-Mail melden.''' | * Die Themen wurden in der Vorbesprechung zugeteilt. '''Jeder Teilnehmer soll sich bei seinem Betreuer (siehe unten) per E-Mail melden.''' | ||
Revision as of 15:49, 3 February 2012
- Term
- Summer 12
- Lecturer
- Benjamin Peherstorfer, Alexander Heinecke,Valeriy Khakhutskyy,Dirk Pflüger
- Time and Place
- Vorbesprechung: Di., 31.01 um 14:00 Uhr im FMI 02.07.23
- Audience
- Informatik (Bachelor)
- Tutorials
- -
- Exam
- -
- Semesterwochenstunden / ECTS Credits
- 2 SWS / 4 Credits
- TUMonline
- {{{tumonline}}}
Vorbesprechung
- Am 31.01 um 14:00 Uhr im 02.07.23
- Finale Anmeldung erfolgt ueber TUMOnline
- Folien der Vorbesprechung gibt es hier
- Die Themen wurden in der Vorbesprechung zugeteilt. Jeder Teilnehmer soll sich bei seinem Betreuer (siehe unten) per E-Mail melden.
Themen
- Valeriy Khakhutskyy
- Einsatz von Data Mining in Industrie
- Neuronale Netze I
- Neuronale Netze II
- Natural Language Processing
- Big Learning
- Spam Filtering with Naive Bayes Classifier
- Recommender Systems with Collaborative Filtering
- Alexander Heinecke
- Überblick
- Software: RapidMiner
- Lineare Modelle für Regression
- Lineare Modelle und Logistische Regression für Klassifikation
- Entscheidungsbäume
- Association Rules
- Benjamin Peherstorfer
- Software: Matlab und R
- Überblick: Data at Scale
- Clustering
- Dichteschätzung
- Ensemble Learning
- AdaBoost
- Dirk Pflüger
- Software: Google API
- Aufbereitung von Daten, Pre-Processing
- Reinforcement Learning
- Hauptkomponentenanalyse
- Sequential Data
Inhalt
Überblick und Methoden des Data Mining: Software, Data at Scale, Klassifikation, Regression, Clustering, u.v.a.m. Details gibt es in der Vorbesprechung.
Recherchetipps
Um weitere Literatur zu finden, gibt es vielfältige Möglichkeiten, z.B.
oder direkt über die Webseiten der Verlage (Elsevier, Springer, IEEE, ACM, ...)
Sowie Bibliotheksrecherche online
aus dem Uni-Netz (VPN Zugang bzw. lokal vor Ort) muss der Proxy gesetzt werden, dann gibt es kostenlosen Zugriff auf viele Journals etc., siehe
Manche Bücher sind zudem über den OPAC-Katalog abrufbar ("Volltext" Button):