fbpx

Ciclo de vida de um processo de ciência de dados

ciência de dados abrange os estudos, as metodologias e os processos para a análise de um conjunto de dados. A matéria-prima da informação, o dado, é coletada, armazenada e, depois, processada para que gere o conhecimento necessário ao objeto de estudo.

O contexto se propõe a analisar dados estruturados, semiestruturados
e não estruturados em um ciclo contínuo de melhoria e garantia da veracidade. Assim, as boas práticas são necessárias para que o
produto entregue seja, de fato, uma representação da realidade
e solução para o problema dado.

Nesta Unidade de Aprendizagem, você vai conhecer as etapas
do ciclo de vida dentro de ciência de dados, identificar as fases
de coleta e armazenamento e realizar a análise da recuperação
​​​​​​​e o descarte dos dados.

Estatística descritiva para ciência de dados

Atualmente, vive-se na era da informação e cercado de dispositivos conectados que geram grandes volumes de dados diariamente. Esses dados estão presentes na rotina das empresas, que cada vez mais buscam por metodologias que sejam capazes de armazená-los e processá-los em busca de informações para agregar valor a um negócio. Com isso, a ciência de dados, área do conhecimento voltada para o estudo e a análise dos dados com o objetivo de detectar padrões e extrair informações, tem sido aplicada nos setores de produção, vendas, marketing, comunicação, financeiro e jurídico de empresas de diferentes ramos.

Para a análise dos dados, os cientistas de dados usam a estatística como uma das principais ferramentas. Na etapa inicial, a estatística descritiva permite avaliar a posição das variáveis por meio de métricas como moda, média, mediana, mínimo, máximo e quartis. Além disso, é possível analisar a dispersão das variáveis utilizando indicadores como variância, desvio padrão, coeficiente de variação, intervalo interquartil e amplitude. Outro recurso muito importante é a análise da distribuição de frequência das variáveis por meio de gráficos e tabelas.

Técnicas utilizadas em ciência de dados e Big Data

A coleta e o armazenamento dos dados possibilitaram que as ferramentas de análise os recuperem e realizem a extração de conhecimento. Utilizando os contextos das redes neurais, houve grande avanço em descoberta de padrões, análise de características, classificações, predições e diversas outras atividades.

Em Ciência da Computação, as redes neurais artificiais são modelos computacionais inspirados pelo sistema nervoso central humano capazes de realizar o aprendizado de máquina.

O aprendizado de máquina visa a conceber um raciocínio a respeito de um conjunto de dados, compreendendo o que eles representam, e realizar inferências a partir deles.

Nesta Unidade de Aprendizagem, você verá as técnicas nos processos de ciência de dados, a aplicação do aprendizado de máquina (machine learning) e os conceitos de aprendizagem profunda (deep learning).

Ferramentas utilizadas em ciência de dados e Big Data

O conhecimento humano tem se difundido rapidamente, fazendo com que a sociedade atual assista a mudanças outrora inimagináveis. Para acompanhar esse progresso, a humanidade precisa constantemente buscar atualizações, gerando demandas de coleta e armazenamento de informações, sejam elas oriundas de dispositivos eletrônicos, sistemas Web, aplicativos móveis ou pessoas de uma forma geral. 

O ser humano é o principal responsável pela produção e coleta de bilhões de dados que são processados em questão de segundos e que, com o advento da inteligência artificial e do machine learning, passaram a ser os ativos mais valiosos para as grandes instituições. Na era da informação, o poder e o valor agregados aos dados se sobrepõem aos bens materiais de uma instituição. 

Nesta Unidade de Aprendizagem, você verá as ferramentas utilizadas pelos analistas ou cientistas de dados para a produção de insights que facilitam tomadas de decisão. Entre essas ferramentas, você verá as linguagens de programação Python e R, destinadas à análise de dados em data science.

python
html5
lingr
bigdata

Professores dos Cursos

Atuação com dados em todo seu ciclo de vida, desde bancos de dados, business intelligence, ciência de dados e inteligência artificial. Atuo com delivery de projetos de AI, condução de sessões de design thinking e suporte a parceiros de negócio e clientes. Atualmente é Coordenador de Inteligência e Performance de Negócios na Totvs.

Possui graduação em Análise e Desenvolvimento de Sistemas pela Universidade Nove de Julho (2015). Atualmente é especialista em tecnologia – UNIDAS S.A.. Tem experiência na área de Ciência da Computação, com ênfase em Arquitetura de Sistemas de Computação, atuando principalmente nos seguintes temas: bots, resource-constrained project scheduling problem, métodos ágeis, modelo computacional, chat bot e interfaces conversacionais.

Atua com desenvolvimento de soluções de software web, mobile, utilizando as tecnologias nodeJs, React Native, e ReactJs. Atualmente é FrontEnd Developer na Emdia.

DPO | Membro ANPPD® Comitê de Segurança e Comitê Científico | Mestre em Engenharia de Produção | Professora Universitária.

Possui experiência como Gerente de Clientes e parceiros da área de Delivery Security da T-Systems do Brasil. Carrega em seu histórico profissional pequenos e grandes projetos em âmbito nacional e internacional voltados para automações, gestão de acessos privilegiados (PAM) e Transformação cultural. Atualmente é Gerente de projetos e serviços de manutenção na Paylivre.

CONHEÇA TAMBÉM…

0
Precisa de ajuda?