Filipe Miranda finaliza o seu Doutoramento

Tema da Tese: Semantic Data Interoperability among Heterogeneous Standards using Machine Learning

Autor: Filipe Manuel Mota Miranda

Programa Doutoral: Programa Doutoral em Engenharia Biomédica

Orientadores: José Manuel Ferreira Machado; António Carlos da Silva Abelha

Data: 21/05/2021  

Abstract: A partilha de dados entre diferentes sistemas em contexto hospitalar constituí atualmente algo indispensável garantindo a qualidade e segurança do ato clínico. O presente trabalho está focado na interoperabilidade ao nível sintático e semântico, ou seja, a partilha e perceção do conteúdo da mensagem. Nesse sentido, foram desenvolvidas soluções que envolvem standards internacionais como HL7 V2, FHIR, openEHR e ICD em conjunto com metodologias modernas para partilha de informação em tempo real (Apache Kafka). Ao mesmo tempo que foram incluídos modelos de machine learning (ML) na génese da partilha de dados e ainda desenvolvidos aplicativos que facilitem a geração e workflow de informação em contexto clínico, como as Single Page Applications (SPA).

Design Science Research (DSR) foi a metodologia de investigação escolhida para responder à principal pergunta de investigação, “Qual o impacto que a introdução de Machine Learning pode ter para a troca de informação em ambiente hospitalar?”. Utilizou-se uma abordagem pluralista com desenvolvimento de 5 casos de estudo. O primeiro visa a implementação de uma ferramenta de codificação hospitalar (formato SPA) utilizando os standards ICD-9/10-CM. O segundo aborda o design da arquitetura para a introdução do standard openEHR (para armazenamento e geração de informação) numa unidade de saúde portuguesa. O terceiro e quarto casos de estudo, focam-se na escolha e desenvolvimento de um sistema inovador (Apache Kafka pub/sub) para a troca de mensagens em formato HL7 FHIR. O último aborda a temática do ML nomeadamente redes neuronais para a previsão de sobrecargas em interfaces HL7. Demonstrando passos iniciais, propriedades que definem modelo e melhor modelo (ANN-LSTM) para o cenário descrito.

Os resultados permitem perceber impactos positivos na implementação de ML (robustez, escalabilidade e fiabilidade) de um modelo do tipo LSTM. Além disso, conclui-se que a passagem do formato HL7 V2 (mais utilizado) para FHIR confere um conteúdo semântico mais rico inexistente até momento. A inclusão do sistema de publicação/subscrição Apache Kafka garante o meio de comunicação sólido, escalável e estável. O sistema foi testado em ambiente laboratorial utilizando a exportação do modelo ML treinado previamente. O formato openEHR garante universalidade no armazenamento de dados fomentado a utilização de standards como SNOMED CT e ICD essenciais para integração com futuros sistemas de codificação e previsão.

PALAVRAS-CHAVE: BIG DATA, INTEROPERABILIDADE, MAS, SAÚDE, NEURAL NETWORKS, APRENDIZAGEM