FCUP-CC3047-2023/2024-2S
UC info
Ciência de Dados em Larga Escala
Código: | CC3047 | Sigla: | CC3047 | Nível: | 300 |
Áreas Científicas | |
---|---|
Classificação | Área Científica |
OFICIAL | Ciência de Computadores |
Ocorrência: 2023/2024 - 2S
Ativa? | Sim |
Página Web: | https://moodle2324.up.pt/course/view.php?id=2125 |
Unidade Responsável: | Departamento de Ciência de Computadores |
Curso/CE Responsável: | Licenciatura em Inteligência Artificial e Ciência de Dados |
Ciclos de Estudo/Cursos
Sigla | Nº de Estudantes | Plano de Estudos | Anos Curriculares | Créditos UCN | Créditos ECTS | Horas de Contacto | Horas Totais |
---|---|---|---|---|---|---|---|
L:BIOINF | 0 | Plano de Estudos Oficial | 3 | - | 6 | 48 | 162 |
L:CC | 17 | Plano estudos a partir do ano letivo 2021/22 | 3 | - | 6 | 48 | 162 |
L:IACD | 59 | Plano Oficial a partir do ano letivo 2021/22 | 3 | - | 6 | 48 | 162 |
Língua de trabalho
Português e inglêsObjetivos
Introdução ao uso de infra-estruturas de "cloud computing" para processamento massivo de dados ("big data") em problemas do mundo real.Resultados de aprendizagem e competências
- Uso de serviços de cloud-computing para aplicações big data.- Desenho e implementação de aplicações para big-data usando modelos de programação suportados pela cloud.
- Conhecimento de fundamentos e algoritmos nucleares para mineração de dados em aplicações de big data.
- Experiência prática com ferramentas do estado da arte disponíveis para cloud computing e big data.
Modo de trabalho
PresencialPrograma
- Introdução ao big data: desafios, cenários de exemplo sob o ponto de vista científico e empresarial.
- O paradigma de cloud computing: modelos de serviço (PaaS, SaaS, IaaS); virtualização, instalação e orquestração de serviços; integração de recursos de computação, networking e armazenamento de dados; expansibilidade, tolerância a falhas, elasticidade.
- Programação de aplicações big data baseadas no paradigma map-reduce.
- Trabalhos de programação de aplicações big-data em tópicos como streams de dados, grafos de redes sociais, sistemas de recomendação ou bioinformática.Bibliografia Obrigatória
Ian Foster and Dennis B. Gannon; Cloud Computing for Science and Engineering, MIT Press, 2017. ISBN: 978-0262037242Bibliografia Complementar
Tom White; Hadoop, The Definitive Guide, 4th edition, O'Reilly Media, 2015. ISBN: 978-1491901632N. Marz and J. Warren; Big Data: Principles and best practices of scalable realtime data systems,, Manning Publications, 2015. ISBN: 978-1617290343
Dan C. Marinescu; Cloud Computing - Theory and Practice, 2nd edition, Morgan Kaufmann, 2018. ISBN: 978-0-12-812810-7
Jure Leskovec, Anand Rajaraman, Jeff Ullman ; Mining of Massive Datasets, Cambridge University Press, 2014. ISBN: 978-1107077232 (Disponível de forma gratuita em PDF pelos autores em http://mmds.org)
M. Zaharia and B. Chambers; Spark: The Definitive Guide - Big Data Processing Made Simple, O'Reilly, 2018. ISBN: 978-1491912218
Métodos de ensino e atividades de aprendizagem
- Introdução às tecnologias de cloud computing tendo em conta os requisitos das aplicações big data.
- Projectos de programação usando ferramentas dos principais fornecedores de serviços cloud (Amazon Web Services, Microsoft Azure, Google Cloud, etc) e servidores de algo desempenho.
Tipo de avaliação
Avaliação distribuída com exame finalComponentes de Avaliação
Designação | Peso (%) |
---|---|
Trabalho prático ou de projeto | 40,00 |
Teste | 60,00 |
Total: | 100,00 |
Componentes de Ocupação
Designação | Tempo (Horas) |
---|---|
Elaboração de projeto | 52,00 |
Frequência das aulas | 52,00 |
Estudo autónomo | 58,00 |
Total: | 162,00 |
Obtenção de frequência
--Fórmula de cálculo da classificação final
Os componentes de avaliação compreendem:
- 1 exame (60%) (12 valores)
- 1 trabalho prático (TP) com peso de 40% (8 valores)
- mini-trabalhos ao longo do semestre
Aprovação: nota final maior ou igual a 10 E nota do exame pelo menos 30% do valor total (>=3,6 valores).
Melhoria de classificação
A data de exame de recurso pode ser usada para melhoria de nota.A classificação dos trabalho práticos não pode ser melhorada.