Предмет | Big data инфраструктура и сервиси |
---|---|
Модул | Информациони системи и технологије |
Статус предмета | Изборни предмет |
Катедра | Катедра за електронско пословање |
Број ЕСПБ бодова | 5 |
Циљ овог предмета је оспособљавање студената за самостално пројектовање, реализацију и коришћење big data инфраструктуре, сервиса и решења у електронском пословању.
Студенти су оспособљени за самостално пројектовање, реализацију и коришћење big data система у електронском пословању
Предавања, аудиторне вежбе, анализа случајева из праксе, вежбе у учионицама са рачунарима, израда пројеката/семинарских радова, електронско образовање.
Теоријска настава
Улога big data у пословању предузећа. Big data инфраструктура и сервиси у електронском пословању. Пројектовање информационих система у big data окружењу. Нерелационе базе података. Прелаз са релационог на нерелациони модел података. Увођење контолисане редудансе. Апстракције релационог модела на табелу (big table модел) и на бинарну релацију (key value модел). Скалабилно и дистрибуирано процесирање података у big data окружењу. MapReduce. Big data решења у Apache Hadoop екосистему. Big SQL концепти и решења. Big data аналитика и откривање знања. Big data аналитика у реалном времену. In-database аналитика. Инфраструктура за аналитику у реалном времену, Apache Spark. Примена big data у: електронској трговини, интернет маркетингу, е-управи, е-здравству, е-банкарству. Анализа логова великих веб сајтова. Анализа података из великих електронских продавница. Big data у мобилном пословању. Анализа друштвених мрежа. Сентимент анализа. Анализа мултимедијалних и неструктурираних података у електронском пословању. Примена big data за прикупљање и анализу сензорских података у паметним окружењима. Управљање подацима у big data окружењу. Проблеми приватности и сигурности. Трендови у big data.
Практична настава
Пројектовање big data решења за предузећа. Развој big data решења над нерелационим базама података. MongoDB. Cassandra. Redis. Big data обрада у реалном времену: Apache Spark, Twitter Heron. Имплементација стриминг послова у реалном времену. Управљање ресурсима big data инфраструктуре. Hadoop екосистем за big data: hdfs, Hbase, Yarn, mapreduce, Pig, Hive, Ambari, Zookeeper. Big data аналитика. Apache Mahout. Spark MLlib. Развој персонализованих решења у big data окружењу. Развој система за претрагу података у електронском пословању. Apache Solr. Развој big data решења за системе засноване на мобилним и технологијама интернета интелигентних уређаја. Анализа друштвених мрежа у Python-у. Визуелизација података. Израда пројеката и евалуација развијених решења.
1. Б.Раденковић, М.Деспотовић-Зракић, З.Богдановић, Д.Бараћ, А.Лабус Електронско пословање, поглавље 20. Трендови у технологијама електронског пословања, пп. 275- 282 ФОН 2015
2. Milovanović S., Bogdanović Z., Labus A., Barać D., Despotović-Zrakić, M. An approach to identify user preferences based on social network analysis. Future Generation Computer Systems, 93, 121-129 ISSN 0167-739X 2019
3. T. White Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale O’Reilly Media 2015
4. M. Bonzanini Mastering Social Media Mining with Python Packt Publishing 2016
5. B. Radenković, M. Despotović-Zrakić, Z. Bogdanović, D. Barać, A. Labus Materijali za predmet Big data infrastruktura i servisi, u e-formi, sa portala za e-učenje moodle.elab.fon.bg.ac.rs 2021
6. Kleppmann, M. Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems O’Reilly Media; 1 edition, ISBN10: 1449373321. 2017