Proseminar Data Mining - Summer 12: Difference between revisions
Jump to navigation
Jump to search
No edit summary |
No edit summary |
||
Line 60: | Line 60: | ||
oder direkt über die Webseiten der Verlage (Elsevier, Springer, IEEE, ACM, ...) | oder direkt über die Webseiten der Verlage (Elsevier, Springer, IEEE, ACM, ...) | ||
* [ | Sowie Bibliotheksrecherche online | ||
* [ | * [http://rzblx1.uni-regensburg.de/ezeit/ Elektronische Zeitschriftenbibliothek] | ||
aus dem Uni-Netz (VPN Zugang bzw. lokal vor Ort) muss der Proxy gesetzt werden, dann gibt es kostenlosen Zugriff auf viele Journals etc., siehe | |||
* [http://www.ub.tum.de/medien/ejournals/readme.html Hinweise der TUM UniBib] | |||
* [http://www.ub.tum.de/eaccess#Bookmarklet%20f%C3%BCr%20eAccess Hinweise um ein Bookmarklet zu setzen] | |||
Manche Bücher sind zudem über den OPAC-Katalog abrufbar ("Volltext" Button): | |||
* [http://www.ub.tum.de/opac] | |||
= LaTeX = | = LaTeX = | ||
= Formalia = | = Formalia = |
Revision as of 14:44, 3 February 2012
- Term
- Summer 12
- Lecturer
- Benjamin Peherstorfer, Alexander Heinecke,Valeriy Khakhutskyy,Dirk Pflüger
- Time and Place
- Vorbesprechung: Di., 31.01 um 14:00 Uhr im FMI 02.07.23
- Audience
- Informatik (Bachelor)
- Tutorials
- -
- Exam
- -
- Semesterwochenstunden / ECTS Credits
- 2 SWS / 4 Credits
- TUMonline
- {{{tumonline}}}
Vorbesprechung
- Am 31.01 um 14:00 Uhr im 02.07.23
- Finale Anmeldung erfolgt ueber TUMOnline
- Die Themen wurden in der Vorbesprechung zugeteilt. Jeder Teilnehmer soll sich bei seinem Betreuer (siehe unten) per E-Mail melden.
Themen
- Valeriy Khakhutskyy
- Einsatz von Data Mining in Industrie
- Neuronale Netze I
- Neuronale Netze II
- Natural Language Processing
- Big Learning
- Spam Filtering with Naive Bayes Classifier
- Recommender Systems with Collaborative Filtering
- Alexander Heinecke
- Überblick
- Software: RapidMiner
- Lineare Modelle für Regression
- Lineare Modelle und Logistische Regression für Klassifikation
- Entscheidungsbäume
- Association Rules
- Benjamin Peherstorfer
- Software: Matlab und R
- Überblick: Data at Scale
- Clustering
- Dichteschätzung
- Ensemble Learning
- AdaBoost
- Dirk Pflüger
- Software: Google API
- Aufbereitung von Daten, Pre-Processing
- Reinforcement Learning
- Hauptkomponentenanalyse
- Sequential Data
Inhalt
Überblick und Methoden des Data Mining: Software, Data at Scale, Klassifikation, Regression, Clustering, u.v.a.m. Details gibt es in der Vorbesprechung.
Recherchetipps
Um weitere Literatur zu finden, gibt es vielfältige Möglichkeiten, z.B.
oder direkt über die Webseiten der Verlage (Elsevier, Springer, IEEE, ACM, ...)
Sowie Bibliotheksrecherche online
aus dem Uni-Netz (VPN Zugang bzw. lokal vor Ort) muss der Proxy gesetzt werden, dann gibt es kostenlosen Zugriff auf viele Journals etc., siehe
Manche Bücher sind zudem über den OPAC-Katalog abrufbar ("Volltext" Button):