Existem dezenas de algoritmos disponíveis no mercado para tratamento de dados e construção de modelos preditivos. Em geral, as empresas interessadas em processar big data contratam cientistas de dados para construirem um algoritmo próprio ou escolherem algum existente. Uma empresa norte-americana chamada DataRobot acaba de chegar ao Brasil com uma proposta de automação desse trabalho. Ela tem uma plataforma que analisa os dados fornecidos pelo cliente e escolhe automaticamente o melhor algoritmo para tratá-los – ou, às vezes, até mesmo propõe uma combinação de dois ou mais algoritmos.
“É uma solução que automatiza o machine learning. O cliente faz a inserção dos dados históricos e a solução realiza uma análise exploratória gerando modelos preditivos automaticamente. Ela faz todo o processo que um cientista de dados faria tradicionalmente, mas de maneira mais rápida e comparando muito mais algoritmos do mercado”, descreve Marcos Hayashi, executivo contratado como country manager da Data Robot para o Brasil.
Em geral, um cientista de dados precisa combinar três habilidades: programação, matemática/estatística e conhecimento de negócios. Segundo Hayashi, é difícil encontrar no mercado profissionais que sejam muito bons nessas três áreas simultaneamente. O DataRobot não substitui completamente a necessidade de uma empresa ter cientistas de dados, mas automatiza boa parte do trabalho de programação, de matemática e de estatística. De todo modo, o executivo entende que é importante os clientes terem apoio de cientistas de dados próprios, pois conseguirão tirar mais proveito da solução da DataRobot. “Se a empresa tiver um cientista de dados, ele vai entender um pouco melhor e interpretar melhor as análises, os modelos etc. Vai conseguir fazer um ajuste fino da ferramenta para melhorar a assertividade do modelo”, diz.
Casos de uso
Para exemplificar como a ferramenta funciona, Hayashi cita o caso do mercado de seguros. A partir dos dados históricos dos sinistros, uma seguradora conseguiria com o DataRobot montar rapidamente um modelo para indicar quais novos sinistros têm maior probabilidade de serem fraudulentos e, logo, mereceriam ser investigados. A solução usa machine learning e segue aprendendo com o passar do tempo e a adição de novos dados, melhorando cada vez mais a sua assertividade.
O setor de telecom é um dos potenciais usuários do DataRobot, afirma o executivo. Com base nos dados históricos de uma operadora é possível prever o churn de assinantes; fazer manutenção preventiva mais assertiva; prever o ciclo de vida de um produto; identificar fraudes com antecedência etc.
No Brasil, um dos primeiros clientes é a Lenovo. A fabricante usa a DataRobot para calcular quantas unidades de cada produto deve enviar para cada revenda, com base no histórico de vendas e diversos outros dados que ajudam a prever a demanda.
A solução pode ficar hospedado na nuvem ou nos servidores do cliente. A DataRobot cobra uma licença anual cujo preço varia de acordo com a quantidade de usuários e com a capacidade de uso.
Super Bots Experience
As novas profissões que surgem na era dos bots e da inteligência artificial, como cientistas de dados, treinadores de bots e linguistas computacionais, serão debatidas em painel no seminário Super Bots Experience, que será realizado nos dias 8 e 9 de agosto, no WTC, em São Paulo. A agenda completa e mais informações estão disponíveis no site www.botsexperience.com.br, pelo telefone/WhatsApp 11-3138-4619, ou pelo email [email protected]