Potencialidade de Uso de Large Language Model (LLM) para Alinhamento Semântico entre Esquemas Conceituais de Dados Geoespaciais
Diante do cenário atual, em que o exponencial crescimento na produção de dados geoespaciais converge com a necessidade de sua disseminação e compartilhamento, torna-se salutar o desenvolvimento de mecanismos que facilitem a interoperabilidade dos dados, cujas fontes de produção podem ser diversas. A...
Saved in:
Published in | Revista brasileira de cartografia Vol. 77; no. a |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | English Portuguese |
Published |
Universidade Federal de Uberlândia
27.05.2025
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Abstract | Diante do cenário atual, em que o exponencial crescimento na produção de dados geoespaciais converge com a necessidade de sua disseminação e compartilhamento, torna-se salutar o desenvolvimento de mecanismos que facilitem a interoperabilidade dos dados, cujas fontes de produção podem ser diversas. Assim, questões voltadas a promover os processos de interoperabilidade semântica, entre distintas modelagens conceituais destes dados, tornam-se relevantes. Deste modo, este artigo investiga o potencial de utilização de uma ferramenta de processamento de linguagem natural, construída sobre um grande modelo de linguagem (Large Language Model - LLM), como um elemento facilitador para futura automatização dos mecanismos de alinhamento semântico entre esquemas conceituais diversos. Como resultado, a ferramenta utilizada – ChatGPT – apresentou 123 associações semânticas entre os esquemas utilizados: 34 classes da categoria edificações da base cartográfica de referência do Brasil e quaisquer tags aplicadas para criação de dados voluntários no OpenStreetMap (OSM). Em alguns casos, as associações foram detalhadas, em outros, mais genéricas, sendo possível sua comparação com trabalhos prévios realizados manualmente por humanos. Importante salientar o papel relevante da construção do diálogo de solicitação do alinhamento, com organização estruturada dos dados conceituais, bem como utilização de diálogo claro e sem ambiguidades. Ainda existem limitações no processo, em especial para entendimento da hierarquia dos conceitos utilizados, o que indica necessidade de novos estudos e avaliação de outros LLM disponíveis. Entretanto, o uso de inteligência artificial para interoperabilidade semântica de dados geoespaciais desponta como um caminho viável a ser aplicado.
Given the current scenario, where the exponential growth in the production of geospatial data converges with the need for its dissemination and sharing, the development of mechanisms that facilitate data interoperability, whose sources of production may be diverse, becomes crucial. Thus, issues aimed at promoting semantic interoperability processes between different conceptual models of these data become relevant. Accordingly, this paper investigates the potential use of a natural language processing tool, built on a Large Language Model (LLM), as a facilitator for the future automation of semantic alignment mechanisms between different conceptual schemas. As a result, the tool used – ChatGPT – presented 123 semantic associations between the utilized schemas: 34 classes from the building category of Brazil's reference cartographic base and various tags applied for creating voluntary data in OpenStreetMap (OSM). In some cases, the associations were detailed, while in others, they were more general, allowing for comparison with previous work manually conducted by humans. It is important to highlight the significant role of constructing the alignment request dialogue, with structured organization of conceptual data, as well as the use of clear and unambiguous dialogue. There are still limitations in the process, particularly in understanding the hierarchy of the concepts used, indicating the need for further studies and evaluation of other available LLMs. Nevertheless, the use of artificial intelligence for the semantic interoperability of geospatial data emerges as a viable path to be applied. |
---|---|
AbstractList | Diante do cenário atual, em que o exponencial crescimento na produção de dados geoespaciais converge com a necessidade de sua disseminação e compartilhamento, torna-se salutar o desenvolvimento de mecanismos que facilitem a interoperabilidade dos dados, cujas fontes de produção podem ser diversas. Assim, questões voltadas a promover os processos de interoperabilidade semântica, entre distintas modelagens conceituais destes dados, tornam-se relevantes. Deste modo, este artigo investiga o potencial de utilização de uma ferramenta de processamento de linguagem natural, construída sobre um grande modelo de linguagem (Large Language Model - LLM), como um elemento facilitador para futura automatização dos mecanismos de alinhamento semântico entre esquemas conceituais diversos. Como resultado, a ferramenta utilizada – ChatGPT – apresentou 123 associações semânticas entre os esquemas utilizados: 34 classes da categoria edificações da base cartográfica de referência do Brasil e quaisquer tags aplicadas para criação de dados voluntários no OpenStreetMap (OSM). Em alguns casos, as associações foram detalhadas, em outros, mais genéricas, sendo possível sua comparação com trabalhos prévios realizados manualmente por humanos. Importante salientar o papel relevante da construção do diálogo de solicitação do alinhamento, com organização estruturada dos dados conceituais, bem como utilização de diálogo claro e sem ambiguidades. Ainda existem limitações no processo, em especial para entendimento da hierarquia dos conceitos utilizados, o que indica necessidade de novos estudos e avaliação de outros LLM disponíveis. Entretanto, o uso de inteligência artificial para interoperabilidade semântica de dados geoespaciais desponta como um caminho viável a ser aplicado.
Given the current scenario, where the exponential growth in the production of geospatial data converges with the need for its dissemination and sharing, the development of mechanisms that facilitate data interoperability, whose sources of production may be diverse, becomes crucial. Thus, issues aimed at promoting semantic interoperability processes between different conceptual models of these data become relevant. Accordingly, this paper investigates the potential use of a natural language processing tool, built on a Large Language Model (LLM), as a facilitator for the future automation of semantic alignment mechanisms between different conceptual schemas. As a result, the tool used – ChatGPT – presented 123 semantic associations between the utilized schemas: 34 classes from the building category of Brazil's reference cartographic base and various tags applied for creating voluntary data in OpenStreetMap (OSM). In some cases, the associations were detailed, while in others, they were more general, allowing for comparison with previous work manually conducted by humans. It is important to highlight the significant role of constructing the alignment request dialogue, with structured organization of conceptual data, as well as the use of clear and unambiguous dialogue. There are still limitations in the process, particularly in understanding the hierarchy of the concepts used, indicating the need for further studies and evaluation of other available LLMs. Nevertheless, the use of artificial intelligence for the semantic interoperability of geospatial data emerges as a viable path to be applied. Diante do cenário atual, em que o exponencial crescimento na produção de dados geoespaciais converge com a necessidade de sua disseminação e compartilhamento, torna-se salutar o desenvolvimento de mecanismos que facilitem a interoperabilidade dos dados, cujas fontes de produção podem ser diversas. Assim, questões voltadas a promover os processos de interoperabilidade semântica, entre distintas modelagens conceituais destes dados, tornam-se relevantes. Deste modo, este artigo investiga o potencial de utilização de uma ferramenta de processamento de linguagem natural, construída sobre um grande modelo de linguagem (Large Language Model - LLM), como um elemento facilitador para futura automatização dos mecanismos de alinhamento semântico entre esquemas conceituais diversos. Como resultado, a ferramenta utilizada – ChatGPT – apresentou 123 associações semânticas entre os esquemas utilizados: 34 classes da categoria edificações da base cartográfica de referência do Brasil e quaisquer tags aplicadas para criação de dados voluntários no OpenStreetMap (OSM). Em alguns casos, as associações foram detalhadas, em outros, mais genéricas, sendo possível sua comparação com trabalhos prévios realizados manualmente por humanos. Importante salientar o papel relevante da construção do diálogo de solicitação do alinhamento, com organização estruturada dos dados conceituais, bem como utilização de diálogo claro e sem ambiguidades. Ainda existem limitações no processo, em especial para entendimento da hierarquia dos conceitos utilizados, o que indica necessidade de novos estudos e avaliação de outros LLM disponíveis. Entretanto, o uso de inteligência artificial para interoperabilidade semântica de dados geoespaciais desponta como um caminho viável a ser aplicado. |
Author | da Silva, Estephanie Daiane Batista Souza, Fabiola Andrade Camboim, Silvana Philippi |
Author_xml | – sequence: 1 givenname: Fabiola Andrade orcidid: 0000-0003-2475-4520 surname: Souza fullname: Souza, Fabiola Andrade – sequence: 2 givenname: Estephanie Daiane Batista orcidid: 0009-0001-0022-5870 surname: da Silva fullname: da Silva, Estephanie Daiane Batista – sequence: 3 givenname: Silvana Philippi orcidid: 0000-0003-3557-5341 surname: Camboim fullname: Camboim, Silvana Philippi |
BookMark | eNo9kc9u2zAMxoWhA5Z2ve-oY3twR1myZB2L9M8KuNiArWeDsuhMhSOlUlKgtz3LXmUvVicdCpD8SB5-BPEds6OYIjH2RcCFUNLKr9kNz8ZEwMo0wsoPbCFaaCuwUh-xBTQaKqWF_MROSwkOQAqhGlUv2J8faUtxCDgFj574HA8l7aXDvNrXuNrh3NwnTxM_67r7c77BjPxyCvE3riluE_9J639_4zYMic9zJn5dnna0xsKXKQ4UtjsMZQ-9Qp8Kv6VEZYPz1VA-s48jToVO_-sJe7i5_rX8VnXfb--Wl101CGVlRWIUtRqUB1ePBlTrVOOsGUEgaPDey8a2AyrUVu8fwRa0N0q72s6NRHnC7t64PuFjv8lhjfmlTxj6wyLlVY95_mCiXoCH1mnnyBlla4MCGm-013N6En5mwRtryKmUTOM7T0B_MKR_N6Q_GCJfAb_1gqQ |
ContentType | Journal Article |
DBID | AAYXX CITATION DOA |
DOI | 10.14393/rbcv77n0a-75193 |
DatabaseName | CrossRef DOAJ Open Access Journals |
DatabaseTitle | CrossRef |
DatabaseTitleList | CrossRef |
Database_xml | – sequence: 1 dbid: DOA name: DOAJ Directory of Open Access Journals url: https://www.doaj.org/ sourceTypes: Open Website |
DeliveryMethod | fulltext_linktorsrc |
Discipline | Geography |
EISSN | 1808-0936 0560-4613 |
ExternalDocumentID | oai_doaj_org_article_10d08b6bbeb74927a105d76d676dde1d 10_14393_rbcv77n0a_75193 |
GroupedDBID | 123 29P 2WC AAYXX ADBBV ALMA_UNASSIGNED_HOLDINGS BCNDV CITATION E3Z EBS EJD FRP GROUPED_DOAJ OVT P2P XSB ~02 |
ID | FETCH-LOGICAL-c1493-e1f124c4d0b2f7048b45b97f01a060ddd3598ca4a696dadea806d746b2906d3a3 |
IEDL.DBID | DOA |
ISSN | 0560-4613 |
IngestDate | Wed Aug 27 01:06:22 EDT 2025 Thu Jul 03 08:25:55 EDT 2025 |
IsDoiOpenAccess | true |
IsOpenAccess | true |
IsPeerReviewed | true |
IsScholarly | true |
Issue | a |
Language | English Portuguese |
License | https://creativecommons.org/licenses/by/4.0 |
LinkModel | DirectLink |
MergedId | FETCHMERGED-LOGICAL-c1493-e1f124c4d0b2f7048b45b97f01a060ddd3598ca4a696dadea806d746b2906d3a3 |
ORCID | 0000-0003-3557-5341 0000-0003-2475-4520 0009-0001-0022-5870 |
OpenAccessLink | https://doaj.org/article/10d08b6bbeb74927a105d76d676dde1d |
ParticipantIDs | doaj_primary_oai_doaj_org_article_10d08b6bbeb74927a105d76d676dde1d crossref_primary_10_14393_rbcv77n0a_75193 |
PublicationCentury | 2000 |
PublicationDate | 2025-05-27 |
PublicationDateYYYYMMDD | 2025-05-27 |
PublicationDate_xml | – month: 05 year: 2025 text: 2025-05-27 day: 27 |
PublicationDecade | 2020 |
PublicationTitle | Revista brasileira de cartografia |
PublicationYear | 2025 |
Publisher | Universidade Federal de Uberlândia |
Publisher_xml | – name: Universidade Federal de Uberlândia |
SSID | ssib003114542 ssib050737257 ssj0040545 |
Score | 2.2209682 |
Snippet | Diante do cenário atual, em que o exponencial crescimento na produção de dados geoespaciais converge com a necessidade de sua disseminação e compartilhamento,... |
SourceID | doaj crossref |
SourceType | Open Website Index Database |
SubjectTerms | bases de referência chatGPT OpenStreetMap processamento de linguagem natural |
Title | Potencialidade de Uso de Large Language Model (LLM) para Alinhamento Semântico entre Esquemas Conceituais de Dados Geoespaciais |
URI | https://doaj.org/article/10d08b6bbeb74927a105d76d676dde1d |
Volume | 77 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrV1LS8QwEA7iRS_iE9_k4ME9FNM2m2yP67qLyK4IurC3knQSXNBWtqvgRfwt_hX_mDNtXfbmRWgTKCUJM0m-yWO-YewsyoQJZeTIo0cH0gofWPBR4EMfJaGDTuzIOXl0q67H8mbSniyF-qI7YTU9cC04HNUgOlZZ66yWSaQNGgSgFSh8wYVAsy9i3u9iqp6D0QqpwhMjuotAImI1B5SIvvHFzGZvWufCBLpdHTgvAdISb38FMINNttFYhrxbt2iLrbh8m601Qcof33fY511BBi52mCkYcByfcVlQNqTr3JjWW4-c4ps98fPhcNTiRO3Nu2hLPhraByz4vXv-_sqxjoJXnJa8XyI0PJuS98iDcTqngMxU6JWBouRYv8NJB2udlrtsPOg_9K6DJoBCkOHCJw5c6BG-MwnCRl7jWLWybRPtRWiEEgBA9H2ZkUYlihpuOkKBlsoSBzzEJt5jq3mRu33GZeg7PtYJmjeZ1JBYVKWwcWSStgYTwwFr_Uoxfal5MlJaX5DE04XE00riB-ySxLz4jxiuqw-o97TRe_qX3g__o5Ajth5RPF9BfnnHbHU-e3UnaGTM7WnVnzAdffR_AFNH0UE |
linkProvider | Directory of Open Access Journals |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=Potencialidade+de+Uso+de+Large+Language+Model+%28LLM%29+para+Alinhamento+Sem%C3%A2ntico+entre+Esquemas+Conceituais+de+Dados+Geoespaciais&rft.jtitle=Revista+brasileira+de+cartografia&rft.au=Souza%2C+Fabiola+Andrade&rft.au=da+Silva%2C+Estephanie+Daiane+Batista&rft.au=Camboim%2C+Silvana+Philippi&rft.date=2025-05-27&rft.issn=0560-4613&rft.eissn=1808-0936&rft.volume=77&rft_id=info:doi/10.14393%2Frbcv77n0a-75193&rft.externalDBID=n%2Fa&rft.externalDocID=10_14393_rbcv77n0a_75193 |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=0560-4613&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=0560-4613&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=0560-4613&client=summon |