Backend + IA: Criando uma API para inferir diagnóstico de diabetes

Backend + IA: Criando uma API para inferir diagnóstico de
diabetes Ana Paula Mendes

Ana Paula Mendes Engenheira de Software Sênior no Jusbrasil Mestranda
em Computação Inteligente na UFPI Diabética Tipo 1 desde 2020

Sobre essa palestra O objetivo deste projeto é utilizar backend
+ inteligência artificial para fins didáticos com Python. Todos os materiais utilizados neste projeto estão disponíveis abertamente na internet.

Materiais e Ferramentas Framework: FastAPI: https://fastapi.tiangolo.com/ Machine Learning: scikit-learn: https://scikit-learn.org/stable/index.html
Base de Dados: Kaggle: https://www.kaggle.com/

A diabetes é um conjunto de distúrbios metabólicos caracterizados pela
hiperglicemia. O Brasil ocupa o 5º lugar no mundo em incidências de diabetes, ficando atrás apenas da China, Índia, Estados Unidos e Paquistão. Projeções da Federação Internacional de Diabetes indicam que até 2030, o número de pessoas com diabetes pode chegar a 21,5 milhões. Sobre a Diabetes

Sobre a Base de Dados A base de dados utilizada
neste trabalho é originalmente do Instituto Nacional de Diabetes e Doenças Digestivas e Renais. Várias restrições foram colocadas na seleção dessas instâncias de um banco de dados maior. Em particular, todos os pacientes aqui são mulheres com pelo menos 21 anos de idade, descendentes dos indígenas Pima.

Pregnancies: número de gravidezes Glucose: Concentração de glicose plasmática após
2 horas em um teste oral de tolerância à glicose BloodPressure: Pressão arterial diastólica (mm Hg) SkinThickness: Espessura da prega cutânea do tríceps (mm) Insulin: Insulina sérica de 2 horas (mu U/ml) BMI: Índice de massa corporal (peso em kg/altura em m²) DiabetesPedigreeFunction: Função de pedigree de diabetes Age: Idade (anos) Outcome: Diagnóstico, com 0 sendo negativo para diabetes e 1 positivo para diabetes. Essa base contém dados clínicos de cada paciente. A base contém 768 instâncias, 8 classes-atributos, para cada atributo todos são valores numéricos.

Algoritmos de Aprendizado de Máquina Para o KNN utilizamos a
classe KNeighborsClassifier da biblioteca scikit-learn, um classificador que implementa o voto dos k vizinhos mais próximos. Para Redes Neurais utilizamos a classe MLPClassifier da biblioteca scikit-learn, um classificador perceptron multicamada. Árvore de Decisão Para árvore de decisão utilizamos a classe DecisionTreeClassifier da biblioteca scikit-learn, uma árvore de decisão para classificação. KNN Redes Neurais

Árvore de Decisão "Árvores de decisão são um método de
aprendizagem supervisionado não paramétrico usado para classificação e regressão. O objetivo é criar um modelo que preveja o valor de uma variável alvo, aprendendo regras de decisão simples inferidas a partir dos recursos dos dados. Uma árvore pode ser vista como uma aproximação constante por partes." Fonte: https://scikit-learn.org/

KNN (K-Nearest Neighbors) "O princípio por trás dos métodos de
vizinhos mais próximos é encontrar um número pré-definido de amostras de treinamento mais próximas ao novo ponto em distância, e prever o rótulo a partir delas. O número de amostras pode ser uma constante definida pelo usuário (aprendizado com k vizinhos mais próximos) ou variar com base na densidade local dos pontos (aprendizado com vizinhos baseados em raio). A distância pode, em geral, ser qualquer medida métrica: a distância euclidiana padrão é a escolha mais comum. Métodos baseados em vizinhos são conhecidos como métodos de aprendizado de máquina não generalizantes, já que eles simplesmente "lembram" todos os seus dados de treinamento." Fonte: https://scikit-learn.org/

Redes Neurais Artificiais Cada conexão entre os neurônios tem um
peso numérico que ajusta durante o processo de treinamento, permitindo que a rede aprenda padrões complexos nos dados. As redes neurais são capazes de lidar com problemas complexos e não-lineares, como reconhecimento de padrões, classificação e previsão, tornando-as amplamente utilizadas em áreas como visão computacional, processamento de linguagem natural, e reconhecimento de voz. Sua capacidade de aprender e adaptar-se a partir dos dados as torna uma ferramenta fundamental em muitas aplicações de inteligência artificial. Fonte: https://scikit-learn.org/

Construção da API Foram construídos ao total 5 rotas. Uma
rota para checar o status da API, uma para visualizar a acurácia dos modelos disponíveis na API, e mais três sendo um para cada modelo (árvore de decisão, KNN e redes neurais). Entrada de dados para os modelos: { "pregnancies": 0, "glucose": 0, "blood_pressure": 0, "skin_thickness": 0, "insulin": 0, "bmi": 0, "diabetes_pedigree_function": 0, "age": 0 }

Vamos ao código!

Obrigada! Perguntas?

Backend + IA: Criando uma API para inferir diag...

Backend + IA: Criando uma API para inferir diagnóstico de diabetes

Ana Paula Mendes

More Decks by Ana Paula Mendes

Other Decks in Programming

Featured

Transcript

Backend + IA: Criando uma API para inferir diagnóstico de

Ana Paula Mendes Engenheira de Software Sênior no Jusbrasil Mestranda

Sobre essa palestra O objetivo deste projeto é utilizar backend

Materiais e Ferramentas Framework: FastAPI: https://fastapi.tiangolo.com/ Machine Learning: scikit-learn: https://scikit-learn.org/stable/index.html

A diabetes é um conjunto de distúrbios metabólicos caracterizados pela

Sobre a Base de Dados A base de dados utilizada

Pregnancies: número de gravidezes Glucose: Concentração de glicose plasmática após

Algoritmos de Aprendizado de Máquina Para o KNN utilizamos a

Árvore de Decisão "Árvores de decisão são um método de

KNN (K-Nearest Neighbors) "O princípio por trás dos métodos de

Redes Neurais Artificiais Cada conexão entre os neurônios tem um

Construção da API Foram construídos ao total 5 rotas. Uma

Vamos ao código!

Obrigada! Perguntas?