Difference between revisions of "Proseminar Data Mining - Summer 12"

From Sccswiki
Jump to navigation Jump to search
Line 75: Line 75:
  
 
* D. E. Knuth, T. Larrabee, P. M. Roberts: [http://tex.loria.fr/typographie/mathwriting.pdf Mathematical Writing]
 
* D. E. Knuth, T. Larrabee, P. M. Roberts: [http://tex.loria.fr/typographie/mathwriting.pdf Mathematical Writing]
* M. Ashby: How to Write a Paper,
+
* M. Ashby: [http://www-mech.eng.cam.ac.uk/mmd/ashby-paper-V6.pdf How to Write a Paper]
[http://www-mech.eng.cam.ac.uk/mmd/ashby-paper-V6.pdf]
 
 
* W. Strunk and E. B. White, The Elements of Style, Longman
 
* W. Strunk and E. B. White, The Elements of Style, Longman
 
Publishers, 1979
 
Publishers, 1979
* A. Bundy: How to Write an Informatics Paper, http://
+
* A. Bundy: [http://
homepages.inf.ed.ac.uk/bundy/how-tos/writingGuide.html
+
homepages.inf.ed.ac.uk/bundy/how-tos/writingGuide.html How to Write an Informatics Paper]
* N. Dragoni: How to Write a Research Paper, www2.imm.dtu.dk/
+
* N. Dragoni:[www2.imm.dtu.dk/
courses/02234/slides/writing-a-paper-Nicola.pdf
+
courses/02234/slides/writing-a-paper-Nicola.pdf How to Write a Research Paper]
 
* WIKIPEDIA IST KEINE LITERATURQUELLE
 
* WIKIPEDIA IST KEINE LITERATURQUELLE
  

Revision as of 09:32, 6 February 2012

Term
Summer 12
Lecturer
Benjamin Peherstorfer, Alexander Heinecke,Valeriy Khakhutskyy,Dirk Pflüger
Time and Place
Vorbesprechung: Di., 31.01 um 14:00 Uhr im FMI 02.07.23
Vortragsblock (voraussichtlich): Fr., 22.6.12, 29.6.12 und 13.07.12 von 09:00 - 16:00 Uhr.
Audience
Informatik (Bachelor)
Tutorials
-
Exam
-
Semesterwochenstunden / ECTS Credits
2 SWS / 4 Credits
TUMonline
{{{tumonline}}}



Vorbesprechung

  • Am 31.01 um 14:00 Uhr im 02.07.23
  • Finale Anmeldung erfolgt ueber TUMOnline
  • Folien der Vorbesprechung gibt es hier
  • Die Themen wurden in der Vorbesprechung zugeteilt. Jeder Teilnehmer soll sich bei seinem Betreuer (siehe unten) per E-Mail melden.

Themen

  • Valeriy Khakhutskyy
    • Einsatz von Data Mining in Industrie
    • Neuronale Netze I
    • Neuronale Netze II
    • Natural Language Processing
    • Big Learning
    • Spam Filtering with Naive Bayes Classifier
    • Recommender Systems with Collaborative Filtering
  • Alexander Heinecke
    • Überblick
    • Software: RapidMiner
    • Lineare Modelle für Regression
    • Lineare Modelle und Logistische Regression für Klassifikation
    • Entscheidungsbäume
    • Association Rules
  • Benjamin Peherstorfer
    • Software: Matlab und R
    • Überblick: Data at Scale
    • Clustering
    • Dichteschätzung
    • Ensemble Learning
    • AdaBoost
  • Dirk Pflüger
    • Software: Google API
    • Aufbereitung von Daten, Pre-Processing
    • Reinforcement Learning
    • Hauptkomponentenanalyse
    • Sequential Data

Inhalt

Überblick und Methoden des Data Mining: Software, Data at Scale, Klassifikation, Regression, Clustering, u.v.a.m. Details gibt es in der Vorbesprechung.


Recherchetipps

Um weitere Literatur zu finden, gibt es vielfältige Möglichkeiten, z.B.

oder direkt über die Webseiten der Verlage (Elsevier, Springer, IEEE, ACM, ...)

Sowie Bibliotheksrecherche online

aus dem Uni-Netz (VPN Zugang bzw. lokal vor Ort) muss der Proxy gesetzt werden, dann gibt es kostenlosen Zugriff auf viele Journals etc., siehe

Manche Bücher sind zudem über den OPAC-Katalog abrufbar ("Volltext" Button):


Tipps zum Schreiben eines Papers

Publishers, 1979

  • A. Bundy: [http://

homepages.inf.ed.ac.uk/bundy/how-tos/writingGuide.html How to Write an Informatics Paper]

  • N. Dragoni:[www2.imm.dtu.dk/

courses/02234/slides/writing-a-paper-Nicola.pdf How to Write a Research Paper]

  • WIKIPEDIA IST KEINE LITERATURQUELLE


Plagiate

  • LIEGT EIN VERSTOSS VOR, MUSS DIE ARBEIT MIT 5.0 BEWERTET WERDEN!
  • jegliche Art von Plagiaten ist zu vermeiden:
    • jegliches fremdes geistiges Eigentum muss zitiert werden (Bilder, Text, Web-Seiten, etc.)
    • zitieren bedeutet nicht, dass danach Text 1:1 kopiert werden darf!
    • Umstellen von Woerten ist auch noch ein Plagiat!
  • jede Ausarbeitung wird auf Plagiate gechecked!
  • Um Aerger zu ersparen: ALLES MIT EIGENEN WOERTERN SCHREIBEN UND ABBILDUNGEN SELBER ERSTELLEN!

LaTeX

Formalia

  • Vortrag: 20min + Diskussion
  • Ausarbeitung: 8 Seiten im IEEE Format (Template)