Proseminar Data Mining - Summer 12

From Sccswiki
Revision as of 09:29, 6 February 2012 by Heinecke (talk | contribs)
Jump to navigation Jump to search
Term
Summer 12
Lecturer
Benjamin Peherstorfer, Alexander Heinecke,Valeriy Khakhutskyy,Dirk Pflüger
Time and Place
Vorbesprechung: Di., 31.01 um 14:00 Uhr im FMI 02.07.23
Vortragsblock (voraussichtlich): Fr., 22.6.12, 29.6.12 und 13.07.12 von 09:00 - 16:00 Uhr.
Audience
Informatik (Bachelor)
Tutorials
-
Exam
-
Semesterwochenstunden / ECTS Credits
2 SWS / 4 Credits
TUMonline
{{{tumonline}}}



Vorbesprechung

  • Am 31.01 um 14:00 Uhr im 02.07.23
  • Finale Anmeldung erfolgt ueber TUMOnline
  • Folien der Vorbesprechung gibt es hier
  • Die Themen wurden in der Vorbesprechung zugeteilt. Jeder Teilnehmer soll sich bei seinem Betreuer (siehe unten) per E-Mail melden.

Themen

  • Valeriy Khakhutskyy
    • Einsatz von Data Mining in Industrie
    • Neuronale Netze I
    • Neuronale Netze II
    • Natural Language Processing
    • Big Learning
    • Spam Filtering with Naive Bayes Classifier
    • Recommender Systems with Collaborative Filtering
  • Alexander Heinecke
    • Überblick
    • Software: RapidMiner
    • Lineare Modelle für Regression
    • Lineare Modelle und Logistische Regression für Klassifikation
    • Entscheidungsbäume
    • Association Rules
  • Benjamin Peherstorfer
    • Software: Matlab und R
    • Überblick: Data at Scale
    • Clustering
    • Dichteschätzung
    • Ensemble Learning
    • AdaBoost
  • Dirk Pflüger
    • Software: Google API
    • Aufbereitung von Daten, Pre-Processing
    • Reinforcement Learning
    • Hauptkomponentenanalyse
    • Sequential Data

Inhalt

Überblick und Methoden des Data Mining: Software, Data at Scale, Klassifikation, Regression, Clustering, u.v.a.m. Details gibt es in der Vorbesprechung.


Recherchetipps

Um weitere Literatur zu finden, gibt es vielfältige Möglichkeiten, z.B.

oder direkt über die Webseiten der Verlage (Elsevier, Springer, IEEE, ACM, ...)

Sowie Bibliotheksrecherche online

aus dem Uni-Netz (VPN Zugang bzw. lokal vor Ort) muss der Proxy gesetzt werden, dann gibt es kostenlosen Zugriff auf viele Journals etc., siehe

Manche Bücher sind zudem über den OPAC-Katalog abrufbar ("Volltext" Button):


Tipps zum Schreiben eines Papers

  • D. E. Knuth, T. Larrabee, P. M. Roberts: Mathematical Writing,

http://tex.loria.fr/typographie/mathwriting.pdf

  • M. Ashby: How to Write a Paper,

http://www-mech.eng.cam.ac.uk/mmd/ashby-paper-V6.pdf

  • W. Strunk and E. B. White, The Elements of Style, Longman

Publishers, 1979

  • A. Bundy: How to Write an Informatics Paper, http://

homepages.inf.ed.ac.uk/bundy/how-tos/writingGuide.html

  • N. Dragoni: How to Write a Research Paper, www2.imm.dtu.dk/

courses/02234/slides/writing-a-paper-Nicola.pdf

  • WIKIPEDIA IST KEINE LITERATURQUELLE


Plagiate

  • LIEGT EIN VERSTOSS VOR, MUSS DIE ARBEIT MIT 5.0 BEWERTET WERDEN!
  • jegliche Art von Plagiaten ist zu vermeiden:
    • jegliches fremdes geistiges Eigentum muss zitiert werden (Bilder, Text, Web-Seiten, etc.)
    • zitieren bedeutet nicht, dass danach Text 1:1 kopiert werden darf!
    • Umstellen von Woerten ist auch noch ein Plagiat!
  • jede Ausarbeitung wird auf Plagiate gechecked!
  • Um Aerger zu ersparen: ALLES MIT EIGENEN WOERTERN SCHREIBEN UND ABBILDUNGEN SELBER ERSTELLEN!

LaTeX

Formalia

  • Vortrag: 20min + Diskussion
  • Ausarbeitung: 8 Seiten im IEEE Format (Template)