Potencialidade de Uso de Large Language Model (LLM) para Alinhamento Semântico entre Esquemas Conceituais de Dados Geoespaciais
Diante do cenário atual, em que o exponencial crescimento na produção de dados geoespaciais converge com a necessidade de sua disseminação e compartilhamento, torna-se salutar o desenvolvimento de mecanismos que facilitem a interoperabilidade dos dados, cujas fontes de produção podem ser diversas. A...
Saved in:
Published in | Revista brasileira de cartografia Vol. 77; no. a |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | English Portuguese |
Published |
Universidade Federal de Uberlândia
27.05.2025
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | Diante do cenário atual, em que o exponencial crescimento na produção de dados geoespaciais converge com a necessidade de sua disseminação e compartilhamento, torna-se salutar o desenvolvimento de mecanismos que facilitem a interoperabilidade dos dados, cujas fontes de produção podem ser diversas. Assim, questões voltadas a promover os processos de interoperabilidade semântica, entre distintas modelagens conceituais destes dados, tornam-se relevantes. Deste modo, este artigo investiga o potencial de utilização de uma ferramenta de processamento de linguagem natural, construída sobre um grande modelo de linguagem (Large Language Model - LLM), como um elemento facilitador para futura automatização dos mecanismos de alinhamento semântico entre esquemas conceituais diversos. Como resultado, a ferramenta utilizada – ChatGPT – apresentou 123 associações semânticas entre os esquemas utilizados: 34 classes da categoria edificações da base cartográfica de referência do Brasil e quaisquer tags aplicadas para criação de dados voluntários no OpenStreetMap (OSM). Em alguns casos, as associações foram detalhadas, em outros, mais genéricas, sendo possível sua comparação com trabalhos prévios realizados manualmente por humanos. Importante salientar o papel relevante da construção do diálogo de solicitação do alinhamento, com organização estruturada dos dados conceituais, bem como utilização de diálogo claro e sem ambiguidades. Ainda existem limitações no processo, em especial para entendimento da hierarquia dos conceitos utilizados, o que indica necessidade de novos estudos e avaliação de outros LLM disponíveis. Entretanto, o uso de inteligência artificial para interoperabilidade semântica de dados geoespaciais desponta como um caminho viável a ser aplicado.
Given the current scenario, where the exponential growth in the production of geospatial data converges with the need for its dissemination and sharing, the development of mechanisms that facilitate data interoperability, whose sources of production may be diverse, becomes crucial. Thus, issues aimed at promoting semantic interoperability processes between different conceptual models of these data become relevant. Accordingly, this paper investigates the potential use of a natural language processing tool, built on a Large Language Model (LLM), as a facilitator for the future automation of semantic alignment mechanisms between different conceptual schemas. As a result, the tool used – ChatGPT – presented 123 semantic associations between the utilized schemas: 34 classes from the building category of Brazil's reference cartographic base and various tags applied for creating voluntary data in OpenStreetMap (OSM). In some cases, the associations were detailed, while in others, they were more general, allowing for comparison with previous work manually conducted by humans. It is important to highlight the significant role of constructing the alignment request dialogue, with structured organization of conceptual data, as well as the use of clear and unambiguous dialogue. There are still limitations in the process, particularly in understanding the hierarchy of the concepts used, indicating the need for further studies and evaluation of other available LLMs. Nevertheless, the use of artificial intelligence for the semantic interoperability of geospatial data emerges as a viable path to be applied. |
---|---|
ISSN: | 0560-4613 1808-0936 0560-4613 |
DOI: | 10.14393/rbcv77n0a-75193 |