• Roger Sampaio

Matemática: ela ainda vai te ajudar a contar seu ‘salário gordo’


Fala meus guerreiros. Hoje iremos tratar da famosa Matemática aplicada a Ciência de Dados. Acredito que você ou pelo menos conheça alguém que odeie matemática, não suporta ouvir falar o nome dela (que dá calafrios, que pensa ser extremamente difícil e chata). Não é mesmo? Aposto que sim. Você estudou uma série de coisas no ensino médio, encontrou tantos x e y nos sistemas, desenhou gráficos lindos no plano cartesiano... e pensou que nunca irá usar isso na sua vida? Vamos com calma, se você optou para ser um cientista de dados, não há como fugir muito. E não precisa ser tão ruim a experiência com ela, afinal quando você dominá-la, ela certamente te ajudará a contar sua ‘grana gorda’ no final do mês (essa é a parte boa que todo mundo quer) e se tornará uma ‘mão na roda’. Nesse artigo vou explicar o porquê de saber Matemática quando falamos em ciência de dados e ao final dele vou dar algumas dicas para facilitar o aprendizado.


1. Uma estrutura chamada matriz

Suponha que você, como cientista de dados, deseje armazenar uma série de valores em uma variável. Você precisa guardar em uma tabela os salários e indenizações de funcionários públicos de um determinado órgão da seguinte maneira:

Uma boa opção para representar essa informação é através da estrutura chamada de matriz, estrutura bidimensional, que permite armazenar diversos valores do mesmo tipo (no caso acima: valores reais). Cada linha representa um funcionário. Qualquer elemento da matriz é acessado através da informação da linha e coluna. Exemplo: M(2,1) significa elemento da segunda linha e primeira coluna = R$ 1300. E podemos efetuar operações com essa matriz. Exemplo: suponha que queira determinar o total da remuneração (salário + indenização), salvando o resultado numa nova matriz. A matemática prega que nesse caso a operação de soma acontecerá da seguinte maneira abaixo. Lembre-se que primeiro índice é linha, depois coluna.

Embora seja simples o exemplo e pareça intuitivo, se você não compreende as matrizes segundo a matemática, poderá ter dificuldade de implementar numa linguagem de análise de dados como, por exemplo, a linguagem R. Vamos implementar agora o exemplo acima usando R. Não vou entrar em detalhes técnicos, o script tem algumas dicas dizendo o que é cada função. Veja que com cinco linhas conseguimos representar o resultado acima.

Existem muitas outras operações como, por exemplo, multiplicar os valores das matrizes por um escalar (número), obter a matriz inversa, matriz transporta, multiplicação de duas ou mais matrizes entre outras e cada para uma delas a linguagem de análise como, por exemplo, R oferece funções. Recaímos na questão anterior: se você não compreende o básico de matrizes na matemática, poderá ter dificuldades para interpretar e usar as funções aqui. Veja aqui um exemplo prático da matriz transporta e posteriormente a implementação em R.

A matriz transporta inverte: o que era linha vira coluna, o que era coluna vira linha.

2. Funções Estatísticas

Quando falamos em análise de dados, é comum sabermos algumas informações estatísticas sobre eles como, por exemplo, média aritmética, somatório de valores, valor máximo, valor mínimo, valor que mais se repete e por aí vai. No exemplo anterior podemos, por exemplo, calcular a média aritmética. Mas e aí: se você não sabe como se faz na matemática, como usará uma função em R se nem ao menos entende o conceito? Fica complicado. Bem, segundo a matemática a média aritmética é a soma de todos os valores divididos pela quantidade de elementos. Veja:

No R, para calcular a média aritmética basta usar a função mean. Para calcular o valor mínimo e máximo usamos respectivamente min e max. É simples e prático. Acredite em mim quando digo (kkk). Veja no script abaixo:

Existem muitas operações incluindo a construção de gráficos no plano cartesiano. Porém se você não compreende a matemática em cada um deles, poderá ter dificuldade para usar uma função correspondente em R. Conhecendo matemática, ela se tornará uma grande aliada bastante apenas se preocupar com os aspectos técnicos da implementação (do código).


3. Não precisa ser especialista

Você não precisa de uma graduação em Matemática ou Estatística, embora isso possa te ajudar muito na compreensão do mundo da ciência de dados. E tampouco precisa ser expert nelas, uma boa dica é compreender bem os conceitos à medida que for precisando deles. Exemplo: precisa armazenar os dados numa matriz? É importante compreender como trabalhar as matrizes em matemática para depois poder usar as funções de manipulação em R Precisa criar um gráfico de dispersão? Primeiro estude as características dele e então poderá usar R para implementá-lo. Precisa de um modelo de regressão? Pesquise na web, estude deles e depois poderá se divertir implementando em R.


4. Dicas de Aprendizado

Certamente vocês já devem ter ouvido falar, porém vou repetir: matemática é prática, prática e prática. Enquanto mais prática, maior a propensão de aprendê-la mesmo com certo grau de dificuldade em alguns assuntos. Fez uma questão de matriz e errou? Refaça quantas vezes forem necessárias até não cometer mais o erro. Os números não mentem. Se 2 + 2 = 4 e sua resposta diz que é cinco, algo de errado há com ela. Com dedicação você encontrará o erro.

5. E no Fim das Contas

Não há como separar a matemática da ciência de dados, elas estão intrinsecamente ligadas. Se você procurar aprender aquela à medida que for precisando, facilitará o seu dia-a-dia como cientista de dados, sem dúvida alguma. Você terá apenas que se preocupar em conhecer as funções em alguma linguagem de análise como, por exemplo, R. Matrizes, funções estatísticas (média aritmética, valor máximo e mínimo, somatório de valores) derivam da matemática e são bens comuns de serem utilizadas quando trabalhamos com análise de dados. Caso tenha dificuldades em algum conceito da matemática e precise dele, a dica é praticá-lo a ponto de dominá-lo, afinal matemática é prática. Conhecendo bem a matemática, ela será uma mão na roda para você e certamente te ajudará a contar consequentemente seu salário gordo no final do mês como cientista de dados. Abraços e até a próxima.

script-matematica
.zip
ZIP • 611B



7 visualizações0 comentário

Posts recentes

Ver tudo