A insuficiência respiratória é uma das principais razões para a internação de pessoas infectadas pelo novo coronavírus. O problema é que, em muitos casos, antes de o sintoma aparecer, a pessoa já está com a oxigenação sanguínea perigosamente baixa sem que isso seja percebido. É o que os médicos chamam de hipóxia silenciosa. Essa característica da Covid-19 faz com que pessoas que aparentemente estão com sintomas leves precisem ser internadas às pressas por causa de uma insuficiência respiratória súbita. A resposta para saber com antecedência se alguém precisa de internação pode estar na análise da voz dos doentes. Essa é a proposta do projeto Spira (Sistema de detecção Precoce de Insuficiência Respiratória por meio de análise de Áudio), que usará inteligência artificial na comparação de vozes de pessoas internadas por Covid-19 com aquelas de pessoas saudáveis. O estudo é conduzido por pesquisadores da USP e é um dos primeiros do centro de inteligência artificial C4AI, que está sendo instalado dentro da universidade.
Há cerca de três semanas profissionais de saúde estão coletando vozes de pessoas internadas por Covid-19 nos leitos de enfermaria e do CTI do Hospital das Clínicas, em São Paulo. O áudio é gravado e enviado por WhatsApp, usando os smartphones dos médicos que atuam no projeto. Os pacientes são instruídos a lerem a seguinte frase: “O amor ao próximo ajuda a enfrentar o coronavírus com a força que a gente precisa.” As vozes de cerca de 100 pacientes já foram captadas.
Paralelamente, foi lançada uma página na web do projeto para a captação das vozes de pessoas saudáveis, para que sejam comparadas àquelas dos doentes. A página está aberta para quem quiser participar voluntariamente – os dados são tratados de forma anônima. Mais de 6 mil pessoas já contribuíram. O processo leva poucos minutos. Primeiro é preciso responder a um questionário informando sua idade e gênero, e responder se apresenta sintomas da Covid-19 (febre, dor de garganta, coriza, tosse, falta de ar) e se possui doenças crônicas (diabetes, doença coronariana, doença prévia de pulmão, pressão alta). Em seguida, a pessoa é convidada a gravar três frases, incluindo aquela falada pelos pacientes.
Os áudios serão comparados usando algoritmos em um sistema de inteligência artificial com rede neural no modelo “caixa preta”, ou seja, os pesquisadores permitirão que a solução aprenda sozinha. A ideia é identificar alguma alteração na voz dos doentes assintomáticos ou com sintomas leves que possa indicar que haverá uma piora de sua condição clínica em um futuro próximo, recomendando assim a sua internação. “Queremos captar alguma alteração que não se conheça ainda, mas que a rede neural consiga perceber”, explica Marcelo Finger, chefe de departamento de ciência da computação do IME-USP, pesquisador principal C4AI e um dos responsáveis pelo Spira. Ele estima que será necessário captar entre 250 e 300 vozes de doentes internados para começar a treinar a rede neural.
Uma vez treinada a solução e obtendo sucesso na identificação de características na voz que alertariam antecipadamente para uma insuficiência respiratória futura, será desenvolvido um software para a realização automática desse teste pelo público. “Não se trata de fazer o diagnóstico de Covid-19 pela voz. O que queremos é saber se a pessoa precisa ou não ser internada. A ideia é ajudar na triagem de pacientes. Pediremos para a pessoa ler uma frase e vamos rodar em cima do áudio um método diagnóstico, que provavelmente será rápido”, descreve Finger.
O pesquisador alerta, contudo, que o projeto enfrenta dificuldades técnicas. “Não é fácil a coleta dos dados dos internados: o hospital é barulhento, o paciente está sem óculos e não consegue ler a frase, a gravação é feita no celular… Do lado de quem grava em casa, nosso desafio é lidar com a infinidade de configurações de hardware e software usados no registro dos áudios. As condições estão longe do ideal, mas é o que dá para fazer neste momento”, relata.
Para compensar as diferenças nas condições das gravações, será feito um trabalho pesado de pré-processamento dos áudios. Uma das medidas a serem tomadas, por exemplo, será a de equalizar o barulho de fundo do hospital, para que seja o mesmo em todas as gravações.
Os primeiros resultados da Spira devem chegar dentro de três meses. Mas um sistema de monitoramento para o público demorará mais tempo para ser disponibilizado. De acordo com Finger, o importante é conseguir uma solução que tenha uma taxa de falso positivo menor que 14% e de falso negativo menor que 3%. “Neste caso, o falso positivo é menos pior que o falso negativo. Ou seja, é menos grave a gente mandar para o hospital alguém que não precise do que deixar em casa alguém que precise ser internado”, resume.
Quem quiser pode gravar sua voz e contribuir com o projeto através deste link.