Como Professor do Mestrado Profissional em Computação Aplicada da UnB e responsável pelo Observatório da Despesa Pública (ODP), uma das perguntas que mais tenho recebido em palestras, reuniões e até por e-mail é como transformar servidores públicos em cientistas de dados. Essa foi a principal motivação para apresentar a palestra Como transformar servidores públicos em cientistas de dados e diminuir a distância entre a academia e o governo na segunda edição do Brasil 100% Digital. Para aqueles que não puderam participar ou que preferem ler que assistir a apresentação (gravada e disponível no Youtube), resolvi escrever esse post! 😉

Antes de explicar como transformar servidores em cientistas de dados, é importante entender o que é Ciência de Dados. Para os interessados, sugiro a leitura do post O que é Ciência de Dados? Why should I care?. Algo que gosto sempre de destacar é que não é simplesmente trabalhar com dados. O principal objetivo é ser capaz de obter insights dos dados de forma a diminuir a incerteza no processo de tomada de decisão, aumentando, assim, as chances de sucesso e o impacto da sua organização, seja ela pública ou privada.

Na iniciativa privada, no entanto, é mais fácil convencer as pessoas a se capacitarem e virarem cientistas de dados. Geralmente uso basicamente duas informações. Primeiramente, é importante destacar o relatório de 2011 da McKinsey Global Institute que diz que até 2018, só nos Estados Unidos, haverá mais de 140 mil vagas não preenchidas para pessoas com conhecimento profundo de analytics, ou seja, para cientistas de dados!

There will be a shortage of talent necessary for organizations to take advantage of big data. By 2018, the United States alone could face a shortage of 140,000 to 190,000 people with deep analytical skills as well as 1.5 million managers and analysts with the know-how to use the analysis of big data to make effective decisions.
Fonte: McKinsey Global Institute

O segundo ponto que geralmente convence boa parte dos ouvintes é a questão financeira. Segundo a PayScale Human Capital, enquanto um Desenvolvedor Web ganha em média 57,8 mil dólares por ano, um Cientista de Dados ganha 92,1 mil dólares, simplesmente 59,3% a mais. Quem não gostaria de um aumento desses? Para tirar qualquer dúvida, eu aproveito para mostrar que um Cientista de Dados experiente ganha em média 127,1 mil dólares, 38% a mais que um iniciante ou 119% a mais que o Desenvolvedor Web. Convencidos?!

Bom, infelizmente, para os servidores públicos, a resposta é não. Por quê?! Simples, o salário do servidor público não aumenta ao mudar de atividade ou ao aprender novas técnicas. Muitas vezes, não aumenta nem ao adquirir um novo título, como mestrado ou doutorado. Aliás, o servidor público só tem aumento ao subir de nível (e isso não tem nada a ver com sua capacidade técnica, muitas vezes só dependendo do tempo de serviço) ou quando assume uma função de gestão (que para uma pessoa técnica, acaba sendo o fim de sua carreira útil e promissora no governo) [more on this topic in another post]. Então, why bother?!

Comparação de salários de Desenvolvedor Web x Cientista de Dados x Cientista de Dados Senior

Realmente, de que adianta se esforçar em aprender novas técnicas e se especializar se a falta de pessoal qualificado e o valor de mercado não têm relação direta nenhuma com a carreira do servidor público? Para essa pergunta, também tenho duas respostas. Apesar de parecer um pouco egoísta, sejamos sinceros, quem não gosta de ter seu trabalho reconhecido? Mais que isso, e se eu te dissesse que o seu trabalho pode ser responsável por mudar o país, ou pelo menos parte dele, e de quebra você ainda ser reconhecido e ter seu trabalho divulgado em mídia nacional [e quem sabe internacional]?! Não, não é apenas sonho nem otimismo em excesso. Essa tem sido a experiência de diversos servidores públicos que trabalham com Ciência de Dados no Governo Brasileiro. Como eu disse na apresentação do Brasil 100% Digital (veja figura abaixo), para fazer o Mestrado em Computação Aplicada da UnB (PPCA), basta pagar a inscrição (o resto é grátis), ou seja, 600 reais. Já publicar um trabalho de qualidade em congresso de renome, aí já se vão uns 15 mil reais, entre inscrição, passagem e hospedagem (além de muitas horas de ralação!!). Agora, mudar o Brasil e ter seu trabalho divulgado na mídia nacional… Ah! ISSO NÃO TEM PREÇO!!

Slide da apresentação no Segundo Seminário Brasil 100% Digital com informações sobre os sucessos de projetos de governo que fazem uso de Ciência de Dados (Fonte: SlideShare do Rommel N. Carvalho)
No projeto da ODP, 18 bancos de dados fornecem 4,4 mil atributos únicos sobre os funcionários públicos. Quando combinadas, essas informações geram mais de 60 mil atributos, que são analisados, baseados em perfis já existentes, e determinam as chances de alguém se meter em falcatrua.
Fonte: Gizmodo Brasil

Na notícia Como a inteligência artificial está ajudando no combate à corrupção no Brasil, o Bruno Romani da Gizmodo Brasil destaca dois trabalhos do governo: o trabalho da CGU de mapeamento de risco de corrupção de servidores públicos e o trabalho de detecção de exportações fraudulentas na Receita Federal. Algum de vocês imaginava que no governo havia iniciativas para mapear a corrupção e identificar casos de lavagem de dinheiro com uso de dados e de forma inteligente?! Acredito que muitos não, mas acreditem, esses e muitos outros projetos estão dominando o spotlight digital da esplanada! Não é à toa que notícias como essas têm gerado centenas de comentários e de compartilhamentos nas redes sociais. Outro caso de sucesso é o trabalho também da Receita de avaliação de liberação de crédito, que será responsável por uma recuperação na ordem dos bilhões, como destaca a notícia Receita espera recuperar R$ 16 bilhões com operações de investigação, divulgada na Folha de São Paulo. E aí, você ainda duvida que é possível mudar o país e ver o seu trabalho sendo reconhecido e divulgado aos quatro ventos?!

Se consegui sua atenção com essa motivação, sua próxima pergunta seria, e aí, como faço para virar um cientista de dados?! Bom, com motivação, a tarefa fica um pouco menos difícil. Para os que realmente estão interessados em levar o assunto a sério, sugiro se inscrever no Mestrado Profissional em Computação Aplicada da UnB (PPCA). Uma das linhas de pesquisa do Mestrado é Mineração de Dados (o nome não ficou como Ciência de Dados por questões “políticas”, em tratativas com outros departamentos). Vejam a grade curricular das matérias comuns e específicas aqui. Percebam que todos os projetos que comentei e apresentei nesse post são de alunos ou ex-alunos do PPCA. Não precisa falar mais nada, precisa?!

Para aqueles que já possuem Mestrado ou que não estão animados com a ideia de virar noite escrevendo artigo e dissertação, se preparando para defesa, entre outros, sugiro fazer Cursos Online Abertos e Massivos, do inglês, Massive Open Online Courses (MOOCs). Essa é a alternativa mais flexível, por ser online, e mais barata, por vários cursos serem oferecidos gratuitamente. A lista de MOOCs na área de Ciência de Dados é grande demais para ser apresentada em detalhes aqui. No entanto, destaco dois para quem está começando: Data Science Specialization do Coursera e Nanodegree Analista de Dados do Udacity. Eu fiz os cursos da Johns Hopkins University que deram origem à especialização do Coursera e fiz o nanodegree do Udacity, ambos muito bons! Se quiserem mais dicas de MOOCs e uma discussão um pouco mais aprofundada sobre que curso fazer e por onde começar, sugiro a leitura desse post no Quora. No entanto, eu já vou avisando que não tem muito como escapar de várias horas de estudo e, provavelmente, algumas noites viradas e finais de semanas “perdidos”… não se preocupem, vale muito à pena!! 😉

Por fim, aos mais tradicionais e interessados em cursos presenciais e/ou online, mas em português, entrem em contato pessoalmente comigo que tenho vários cursos preparados especialmente para vocês, com exemplos customizados para seu trabalho e tudo mais. Insisto, não tem milagre… fazer aula em português pode ajudar, mas não vai deixar de exigir muito esforço, prática e horas de dedicação!

Não se esqueçam! Para mais notícias sobre #AnaliseDeDados, #CienciaDeDados, #ResultadoNaPratica, #BigData, #RevolucaoNoGoverno, #GovernoDigital, entre outros, não deixe de nos seguir na #RepublicaDigital! Temos novidades todas segunda e quinta-feiras!


Editado dia 22/03/2017: Hoje encontrei um post bem interessante que já havia lido há um tempo no Medium, mas não havia encontrado durante a escrita desse post. O título é I Dropped Out of School to Create My Own Data Science Master’s — Here’s My Curriculum. Ele fala de alguns cursos que já comentei aqui, mas dá dicas de outros também. Boa leitura complementar! 😉