Potencialidade de Uso de Large Language Model (LLM) para Alinhamento Semântico entre Esquemas Conceituais de Dados Geoespaciais

Diante do cenário atual, em que o exponencial crescimento na produção de dados geoespaciais converge com a necessidade de sua disseminação e compartilhamento, torna-se salutar o desenvolvimento de mecanismos que facilitem a interoperabilidade dos dados, cujas fontes de produção podem ser diversas. A...

Full description

Saved in:
Bibliographic Details
Published inRevista brasileira de cartografia Vol. 77; no. a
Main Authors Souza, Fabiola Andrade, da Silva, Estephanie Daiane Batista, Camboim, Silvana Philippi
Format Journal Article
LanguageEnglish
Portuguese
Published Universidade Federal de Uberlândia 27.05.2025
Subjects
Online AccessGet full text

Cover

Loading…
Abstract Diante do cenário atual, em que o exponencial crescimento na produção de dados geoespaciais converge com a necessidade de sua disseminação e compartilhamento, torna-se salutar o desenvolvimento de mecanismos que facilitem a interoperabilidade dos dados, cujas fontes de produção podem ser diversas. Assim, questões voltadas a promover os processos de interoperabilidade semântica, entre distintas modelagens conceituais destes dados, tornam-se relevantes. Deste modo, este artigo investiga o potencial de utilização de uma ferramenta de processamento de linguagem natural, construída sobre um grande modelo de linguagem (Large Language Model - LLM), como um elemento facilitador para futura automatização dos mecanismos de alinhamento semântico entre esquemas conceituais diversos. Como resultado, a ferramenta utilizada – ChatGPT – apresentou 123 associações semânticas entre os esquemas utilizados: 34 classes da categoria edificações da base cartográfica de referência do Brasil e quaisquer tags aplicadas para criação de dados voluntários no OpenStreetMap (OSM). Em alguns casos, as associações foram detalhadas, em outros, mais genéricas, sendo possível sua comparação com trabalhos prévios realizados manualmente por humanos. Importante salientar o papel relevante da construção do diálogo de solicitação do alinhamento, com organização estruturada dos dados conceituais, bem como utilização de diálogo claro e sem ambiguidades. Ainda existem limitações no processo, em especial para entendimento da hierarquia dos conceitos utilizados, o que indica necessidade de novos estudos e avaliação de outros LLM disponíveis. Entretanto, o uso de inteligência artificial para interoperabilidade semântica de dados geoespaciais desponta como um caminho viável a ser aplicado. Given the current scenario, where the exponential growth in the production of geospatial data converges with the need for its dissemination and sharing, the development of mechanisms that facilitate data interoperability, whose sources of production may be diverse, becomes crucial. Thus, issues aimed at promoting semantic interoperability processes between different conceptual models of these data become relevant. Accordingly, this paper investigates the potential use of a natural language processing tool, built on a Large Language Model (LLM), as a facilitator for the future automation of semantic alignment mechanisms between different conceptual schemas. As a result, the tool used – ChatGPT – presented 123 semantic associations between the utilized schemas: 34 classes from the building category of Brazil's reference cartographic base and various tags applied for creating voluntary data in OpenStreetMap (OSM). In some cases, the associations were detailed, while in others, they were more general, allowing for comparison with previous work manually conducted by humans. It is important to highlight the significant role of constructing the alignment request dialogue, with structured organization of conceptual data, as well as the use of clear and unambiguous dialogue. There are still limitations in the process, particularly in understanding the hierarchy of the concepts used, indicating the need for further studies and evaluation of other available LLMs. Nevertheless, the use of artificial intelligence for the semantic interoperability of geospatial data emerges as a viable path to be applied.
AbstractList Diante do cenário atual, em que o exponencial crescimento na produção de dados geoespaciais converge com a necessidade de sua disseminação e compartilhamento, torna-se salutar o desenvolvimento de mecanismos que facilitem a interoperabilidade dos dados, cujas fontes de produção podem ser diversas. Assim, questões voltadas a promover os processos de interoperabilidade semântica, entre distintas modelagens conceituais destes dados, tornam-se relevantes. Deste modo, este artigo investiga o potencial de utilização de uma ferramenta de processamento de linguagem natural, construída sobre um grande modelo de linguagem (Large Language Model - LLM), como um elemento facilitador para futura automatização dos mecanismos de alinhamento semântico entre esquemas conceituais diversos. Como resultado, a ferramenta utilizada – ChatGPT – apresentou 123 associações semânticas entre os esquemas utilizados: 34 classes da categoria edificações da base cartográfica de referência do Brasil e quaisquer tags aplicadas para criação de dados voluntários no OpenStreetMap (OSM). Em alguns casos, as associações foram detalhadas, em outros, mais genéricas, sendo possível sua comparação com trabalhos prévios realizados manualmente por humanos. Importante salientar o papel relevante da construção do diálogo de solicitação do alinhamento, com organização estruturada dos dados conceituais, bem como utilização de diálogo claro e sem ambiguidades. Ainda existem limitações no processo, em especial para entendimento da hierarquia dos conceitos utilizados, o que indica necessidade de novos estudos e avaliação de outros LLM disponíveis. Entretanto, o uso de inteligência artificial para interoperabilidade semântica de dados geoespaciais desponta como um caminho viável a ser aplicado. Given the current scenario, where the exponential growth in the production of geospatial data converges with the need for its dissemination and sharing, the development of mechanisms that facilitate data interoperability, whose sources of production may be diverse, becomes crucial. Thus, issues aimed at promoting semantic interoperability processes between different conceptual models of these data become relevant. Accordingly, this paper investigates the potential use of a natural language processing tool, built on a Large Language Model (LLM), as a facilitator for the future automation of semantic alignment mechanisms between different conceptual schemas. As a result, the tool used – ChatGPT – presented 123 semantic associations between the utilized schemas: 34 classes from the building category of Brazil's reference cartographic base and various tags applied for creating voluntary data in OpenStreetMap (OSM). In some cases, the associations were detailed, while in others, they were more general, allowing for comparison with previous work manually conducted by humans. It is important to highlight the significant role of constructing the alignment request dialogue, with structured organization of conceptual data, as well as the use of clear and unambiguous dialogue. There are still limitations in the process, particularly in understanding the hierarchy of the concepts used, indicating the need for further studies and evaluation of other available LLMs. Nevertheless, the use of artificial intelligence for the semantic interoperability of geospatial data emerges as a viable path to be applied.
Diante do cenário atual, em que o exponencial crescimento na produção de dados geoespaciais converge com a necessidade de sua disseminação e compartilhamento, torna-se salutar o desenvolvimento de mecanismos que facilitem a interoperabilidade dos dados, cujas fontes de produção podem ser diversas. Assim, questões voltadas a promover os processos de interoperabilidade semântica, entre distintas modelagens conceituais destes dados, tornam-se relevantes. Deste modo, este artigo investiga o potencial de utilização de uma ferramenta de processamento de linguagem natural, construída sobre um grande modelo de linguagem (Large Language Model - LLM), como um elemento facilitador para futura automatização dos mecanismos de alinhamento semântico entre esquemas conceituais diversos. Como resultado, a ferramenta utilizada – ChatGPT – apresentou 123 associações semânticas entre os esquemas utilizados: 34 classes da categoria edificações da base cartográfica de referência do Brasil e quaisquer tags aplicadas para criação de dados voluntários no OpenStreetMap (OSM). Em alguns casos, as associações foram detalhadas, em outros, mais genéricas, sendo possível sua comparação com trabalhos prévios realizados manualmente por humanos. Importante salientar o papel relevante da construção do diálogo de solicitação do alinhamento, com organização estruturada dos dados conceituais, bem como utilização de diálogo claro e sem ambiguidades. Ainda existem limitações no processo, em especial para entendimento da hierarquia dos conceitos utilizados, o que indica necessidade de novos estudos e avaliação de outros LLM disponíveis. Entretanto, o uso de inteligência artificial para interoperabilidade semântica de dados geoespaciais desponta como um caminho viável a ser aplicado.
Author da Silva, Estephanie Daiane Batista
Souza, Fabiola Andrade
Camboim, Silvana Philippi
Author_xml – sequence: 1
  givenname: Fabiola Andrade
  orcidid: 0000-0003-2475-4520
  surname: Souza
  fullname: Souza, Fabiola Andrade
– sequence: 2
  givenname: Estephanie Daiane Batista
  orcidid: 0009-0001-0022-5870
  surname: da Silva
  fullname: da Silva, Estephanie Daiane Batista
– sequence: 3
  givenname: Silvana Philippi
  orcidid: 0000-0003-3557-5341
  surname: Camboim
  fullname: Camboim, Silvana Philippi
BookMark eNo9kc9u2zAMxoWhA5Z2ve-oY3twR1myZB2L9M8KuNiArWeDsuhMhSOlUlKgtz3LXmUvVicdCpD8SB5-BPEds6OYIjH2RcCFUNLKr9kNz8ZEwMo0wsoPbCFaaCuwUh-xBTQaKqWF_MROSwkOQAqhGlUv2J8faUtxCDgFj574HA8l7aXDvNrXuNrh3NwnTxM_67r7c77BjPxyCvE3riluE_9J639_4zYMic9zJn5dnna0xsKXKQ4UtjsMZQ-9Qp8Kv6VEZYPz1VA-s48jToVO_-sJe7i5_rX8VnXfb--Wl101CGVlRWIUtRqUB1ePBlTrVOOsGUEgaPDey8a2AyrUVu8fwRa0N0q72s6NRHnC7t64PuFjv8lhjfmlTxj6wyLlVY95_mCiXoCH1mnnyBlla4MCGm-013N6En5mwRtryKmUTOM7T0B_MKR_N6Q_GCJfAb_1gqQ
ContentType Journal Article
DBID AAYXX
CITATION
DOA
DOI 10.14393/rbcv77n0a-75193
DatabaseName CrossRef
DOAJ Open Access Journals
DatabaseTitle CrossRef
DatabaseTitleList CrossRef

Database_xml – sequence: 1
  dbid: DOA
  name: DOAJ Directory of Open Access Journals
  url: https://www.doaj.org/
  sourceTypes: Open Website
DeliveryMethod fulltext_linktorsrc
Discipline Geography
EISSN 1808-0936
0560-4613
ExternalDocumentID oai_doaj_org_article_10d08b6bbeb74927a105d76d676dde1d
10_14393_rbcv77n0a_75193
GroupedDBID 123
29P
2WC
AAYXX
ADBBV
ALMA_UNASSIGNED_HOLDINGS
BCNDV
CITATION
E3Z
EBS
EJD
FRP
GROUPED_DOAJ
OVT
P2P
XSB
~02
ID FETCH-LOGICAL-c1493-e1f124c4d0b2f7048b45b97f01a060ddd3598ca4a696dadea806d746b2906d3a3
IEDL.DBID DOA
ISSN 0560-4613
IngestDate Wed Aug 27 01:06:22 EDT 2025
Thu Jul 03 08:25:55 EDT 2025
IsDoiOpenAccess true
IsOpenAccess true
IsPeerReviewed true
IsScholarly true
Issue a
Language English
Portuguese
License https://creativecommons.org/licenses/by/4.0
LinkModel DirectLink
MergedId FETCHMERGED-LOGICAL-c1493-e1f124c4d0b2f7048b45b97f01a060ddd3598ca4a696dadea806d746b2906d3a3
ORCID 0000-0003-3557-5341
0000-0003-2475-4520
0009-0001-0022-5870
OpenAccessLink https://doaj.org/article/10d08b6bbeb74927a105d76d676dde1d
ParticipantIDs doaj_primary_oai_doaj_org_article_10d08b6bbeb74927a105d76d676dde1d
crossref_primary_10_14393_rbcv77n0a_75193
PublicationCentury 2000
PublicationDate 2025-05-27
PublicationDateYYYYMMDD 2025-05-27
PublicationDate_xml – month: 05
  year: 2025
  text: 2025-05-27
  day: 27
PublicationDecade 2020
PublicationTitle Revista brasileira de cartografia
PublicationYear 2025
Publisher Universidade Federal de Uberlândia
Publisher_xml – name: Universidade Federal de Uberlândia
SSID ssib003114542
ssib050737257
ssj0040545
Score 2.2209682
Snippet Diante do cenário atual, em que o exponencial crescimento na produção de dados geoespaciais converge com a necessidade de sua disseminação e compartilhamento,...
SourceID doaj
crossref
SourceType Open Website
Index Database
SubjectTerms bases de referência
chatGPT
OpenStreetMap
processamento de linguagem natural
Title Potencialidade de Uso de Large Language Model (LLM) para Alinhamento Semântico entre Esquemas Conceituais de Dados Geoespaciais
URI https://doaj.org/article/10d08b6bbeb74927a105d76d676dde1d
Volume 77
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrV1LS8QwEA7iRS_iE9_k4ME9FNM2m2yP67qLyK4IurC3knQSXNBWtqvgRfwt_hX_mDNtXfbmRWgTKCUJM0m-yWO-YewsyoQJZeTIo0cH0gofWPBR4EMfJaGDTuzIOXl0q67H8mbSniyF-qI7YTU9cC04HNUgOlZZ66yWSaQNGgSgFSh8wYVAsy9i3u9iqp6D0QqpwhMjuotAImI1B5SIvvHFzGZvWufCBLpdHTgvAdISb38FMINNttFYhrxbt2iLrbh8m601Qcof33fY511BBi52mCkYcByfcVlQNqTr3JjWW4-c4ps98fPhcNTiRO3Nu2hLPhraByz4vXv-_sqxjoJXnJa8XyI0PJuS98iDcTqngMxU6JWBouRYv8NJB2udlrtsPOg_9K6DJoBCkOHCJw5c6BG-MwnCRl7jWLWybRPtRWiEEgBA9H2ZkUYlihpuOkKBlsoSBzzEJt5jq3mRu33GZeg7PtYJmjeZ1JBYVKWwcWSStgYTwwFr_Uoxfal5MlJaX5DE04XE00riB-ySxLz4jxiuqw-o97TRe_qX3g__o5Ajth5RPF9BfnnHbHU-e3UnaGTM7WnVnzAdffR_AFNH0UE
linkProvider Directory of Open Access Journals
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=Potencialidade+de+Uso+de+Large+Language+Model+%28LLM%29+para+Alinhamento+Sem%C3%A2ntico+entre+Esquemas+Conceituais+de+Dados+Geoespaciais&rft.jtitle=Revista+brasileira+de+cartografia&rft.au=Souza%2C+Fabiola+Andrade&rft.au=da+Silva%2C+Estephanie+Daiane+Batista&rft.au=Camboim%2C+Silvana+Philippi&rft.date=2025-05-27&rft.issn=0560-4613&rft.eissn=1808-0936&rft.volume=77&rft_id=info:doi/10.14393%2Frbcv77n0a-75193&rft.externalDBID=n%2Fa&rft.externalDocID=10_14393_rbcv77n0a_75193
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=0560-4613&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=0560-4613&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=0560-4613&client=summon