Предмет | Напредна анализа података |
---|---|
Модул | Информациони системи и технологије |
Статус предмета | Изборни предмет |
Катедра | Катедра за софтверско инжењерство |
Број ЕСПБ бодова | 5 |
Упознати студенте са актуелним методама и техникама напредне анализе података и њиховим применама у различитим доменима. Омогућити им да овладају софтверским библиотекама (Python, R) за практичну примену метода и техника напредне анализе података.
Студенти ће стећи знања и вештине потребне за практичну примену актуелних метода и техника напредне анализе података, укључујући: а) избор методе за решавање датог реалног проблема, и б) развој програма који имплементира изабране методе анализе.
Предавања у учионици уз помоћ рачунара, интернета и софтверских библиотека отвореног кода. Вежбе у рачунарским лабораторијама. Вежбе делом изводи наставник а студенти прате, а делом се заснивају на самосталном раду студената, индивидуално или у групи, уз помоћ наставника.
Теоријска настава
Припрема и трансформација података. Експлораторна анализа података. Идентификовање патерна у подацима. Анализа секвенци: визуелизација и експлораторна анализа секвенци; идентификација патерна у секвенцама (sequential pattern mining); кластеровање секвенци Анализа текста: идентификација тема текста применом статистичких метода (topic modeling) и метода заснованих на мрежној анализи (community detection); кластеризација текстуалних садржаја
Практична настава
Упознавање са софтверским библиотекама и алатима релевантним за сваку од области обухваћених теоријском наставом. Примена ових библиотека и алата за имплементацију програма (у одабраном програмском језику) заснованих на уведеним теоријским концептима, методама и техникама.
1. G. Grolemund, H. Wickham. R for Data Science O’Reilly Media 2017
2. W. McKinney. Python for Data Analysis, 2nd Edition O’Reilly Media 2017
3. J. Silge and D. Robinson. Text mining with R, A Tidy Approach O’Reilly Media 2017
4. B. Bengfort, R. Bilbro, T. Ojeda Applied Text Analysis with Python: Enabling Language-Aware Data Products with Machine Learning. O’Reilly Media 2018