O algoritmo acertou o resultado em 70% dos casos, segundo empresa de IA acelerada pelo Google
A Datarisk acaba de desenvolver uma tecnologia de inteligência artificial (IA) que prevê a probabilidade individual de gravidade pela Covid-19. O algoritmo possibilita verificar as chances de morte de um brasileiro, dada a internação no SUS, segundo informações públicas sobre o histórico de internações do DATASUS (Departamento de Informática do Sistema Único de Saúde do Brasil).
Foram analisados 361.879 pacientes entre os anos de 2008 e 2020 para a construção de um modelo de Machine Learning, considerando características básicas como: idade, sexo, unidade federativa, dias de permanência em internação, número de vezes que esteve no hospital, histórico de doenças e indicação de comorbidades em um período de até 3 anos antes de 2020.
“O modelo foi criado com base em uma técnica conhecida como boosting, método que tem como base treinar vários modelos mais simples com a finalidade de produzir um exemplar final mais robusto. Ou seja, o modelo aprende a classificar o paciente de acordo com determinados critérios, como um processo de decisão muito próximo do humano”, explicou Carlos Relvas, cientista de dados da Datarisk.
Por exemplo, a Risk-19 pode identificar que pacientes com 30 anos têm uma probabilidade de óbito de cerca de 3% já pacientes com 60 anos e com uma comorbidade como obesidade, tem sua probabilidade de óbito na faixa de 13%.
Durante o estudo, 70% dos dados, levantados entre janeiro e agosto de 2020, foram utilizados para treinamento. O restante foi dividido igualmente em outros dois conjuntos: validação e teste (mantendo a ordem dos eventos). Essa divisão foi feita para manter a disposição temporal, evitando, com isso, que a IA use eventos futuros para prever o passado, o que eventualmente pode superestimar o desempenho do modelo.
A partir dessas informações, o processo de modelagem da IA é iniciado. Em seguida sua assertividade e os critérios que mais impactam na previsão são analisados. No caso da Risk-19, identificamos a idade como fator mais impactante para decidir a probabilidade de óbito de determinado paciente.
O exercício de encontrar padrões nas informações do DATASUS permitiu a verificação do perfil da doença em 2020. “Treinamos, validamos e testamos nosso algoritmo baseado em dados deste mesmo ano, porém, este exercício apresenta limitações, principalmente quanto ao rigor científico, não permitindo que seja utilizado para fins de prognóstico, ou seja, não é possível aproveitá-lo para determinar como será o desenvolvimento da Covid-19 em possíveis pacientes”, finalizou Relvas.