No dia 28 de fevereiro, a Sociedade Paulista de Radiologia (SPR), com o apoio da AWS, lançou seu primeiro desafio de Inteligência Artificial. A competição durará cerca de 2 meses e os vencedores serão anunciados numa cerimônia durante a Jornada Paulista de Radiologia 2023. O objetivo desta competição é criar algoritmos que sejam capazes de determinar o gênero e a idade de pacientes em radiografias de tórax. A competição tem três grandes objetivos:
- Criar modelos computacionais que auxiliem na identificação de potenciais erros de identificação de exames, mitigando danos à saúde dos pacientes;
- Disseminar o conhecimento sobre as técnicas de machine learning em Radiologia e Diagnóstico por Imagem;
- Estimular a criação de novos algoritmos que melhorem o cuidado ao paciente.
Este desafio está sendo realizado na plataforma Kaggle, a mesma utilizada nas competições da RSNA, e conta com dezenas de milhares de radiografias de tórax que foram anonimizadas e gentilmente cedidas por diversas instituições públicas e privadas de São Paulo.
Para participar, acesse o link para predição de idade – www.kaggle.com/competitions/spr-x-ray-age/overview/description – e de gênero – www.kaggle.com/competitions/spr-x-ray-gender/overview/description. Nesse ambiente, você terá acesso à descrição do desafio e poderá entender melhor como os exames foram selecionados, anonimizados e curados para a competição. Numa outra aba, você poderá conhecer como são calculadas as métricas de performance utilizadas para classificar o resultado dos competidores.
Os dados da competição ficam disponíveis numa aba específica. Nela, você terá acesso às imagens anonimizadas que serão utilizadas para seu treino e validação. Além disso, será fornecido um arquivo CSV contendo três colunas: código do exame, gênero e idade. De posse destes dados, os competidores deverão criar modelos que sejam capazes de predizer estas informações em quaisquer exames, o que chamamos de generalização. Para fazer uma submissão, o algoritmo deve analisar um outro conjunto de exames desconhecido e gerar um arquivo CSV que contenha suas predições de sexo e idade. A classificação dos melhores colocados será dada pela diferença entre a informação inferida pelo algoritmo e as informações reais destes pacientes que os competidores não têm acesso.
Uma das grandes vantagens destas competições é poder aprender com outros participantes. Habitualmente, nas abas de código e discussão, alguns competidores compartilham abertamente seus algoritmos, que podem ser usados como base por outros participantes na criação dos seus próprios modelos. Apesar desta ser uma competição, normalmente há um forte clima de cooperação e troca de informações, o que leva ao aprendizado para todos.
Hoje, o Python é a principal linguagem de programação utilizada nestas competições. Porém, nada impede que um participante se inscreva para acompanhar as discussões ou mesmo usar um dos códigos disponibilizados abertamente para entender seu funcionamento e fazer sua própria submissão. Além disso, é possível formar times, aumentando suas chances de sucesso. Para muitos colegas, esses desafios possibilitaram o primeiro contato com a programação e despertaram o interesse em aprender mais.
Outra dúvida comum está relacionada ao equipamento mínimo necessário para participar. A grande vantagem do Kaggle é que os competidores podem criar seus códigos e os executar gratuitamente na própria plataforma em nuvem, inclusive com acesso a GPUs. Além disso, alguns participantes podem optar por utilizar outras plataformas mais poderosas como a Amazon SageMaker ou o Google Colab, porém nestes casos pode haver custos adicionais. Como incentivo aos competidores, a AWS disponibilizou vouchers para os primeiros inscritos na competição. No site do Kaggle, você poderá ter mais detalhes. Além disso, também é possível treinar seus modelos em casa usando PCs com placas de vídeo ou Macs com processadores M1/M2. O debate sobre qual a melhor plataforma podemos discutir num outro artigo.
Para aqueles que já programam, sintam-se convidados a participar deste desafio que conta com um dataset de pacientes brasileiros. Tenha a certeza de que haverá muita troca de experiências e você poderá contribuir para a melhoria da saúde da nossa população.
E um convite especial àqueles que não programam. Esta é uma oportunidade imperdível de participar do seu primeiro desafio de IA, podendo aprender com as discussões em português e porque não, desenvolver uma nova habilidade. Não deixe de se inscrever.
A Sociedade Paulista de Radiologia deseja a todos um ótimo desafio!