Trainingskurs "Data analysis and data mining with Python"
(Kurs-Nr. 83/2014 im Trainingsprogramm des Forschungszentrums)
Zielgruppe: | Wissenschaftler, die Python zur Datenanalyse einsetzen wollen. |
Inhalt: | |
Teilnahmevoraussetzungen: | Grundkenntnise in Python (s. Einführung in Python) |
Sprache: | Der Kurs wird auf Englisch gehalten. |
Dauer: | 3 Tage |
Termin: | 17. - 19. November 2014, 9.00 - 16.30 Uhr |
Ort: | Jülich Supercomputing Centre, Ausbildungsraum 1, Geb. 16.3, Raum 021 |
Teilnehmerzahl: | mindestens 5 |
Referenten: | Dr. Jan Meinke, Dr. Olav Zimmermann, JSC |
Ansprechpartner: | Dr. Jan Meinke Telefon: +49 2461 61-2315 E-mail: j.meinke@fz-juelich.de |
Anmeldung: | Bitte senden Sie Ihre Anmeldung an Dr. Jan Meinke. Anmeldung bis 31. Oktober 2014. |
Pandas, matplotlib, and scikit-learn make Python a powerful tool for data analysis, data mining, and visualization. All of these packages and many more can be combined with IPython to provide an interactive extensible environment.
In this course, we will explore matplotlib for visualization, pandas for time series analysis, and scikit-learn for data mining. We will use IPython to show how these and other tools can be used to facilitate interactive data analysis and exploration.
Day 1: Basic data analysis and visualization
- Introduction to IPython for interactive data analysis.
- pandas
- NumPy
- matplotlib
Day 2: Advanced data analysis visualization
- pandas
- Statsmodels
- Mayavi2
Day 3: Advanced topics
- Portable data formats
- scikit-learn
- PyMAFIA
This course is aimed at scientists who wish to explore the productivity gains made possible by Python for data analysis. Basic Experience with Python such as provided by the "Einführung in Python" course is assumed and required for the hands-on sessions.