Programa AIA 2025

9:00-9:10 - abertura

9:10-9:50 palestra 1: Evgeny Smirnov - Commercial and Open-Source Large Language
Models in Astronomy: Tools, Applications, and Use Cases

9:50-10:05 Valerio Carruba - Vision Transformers for identifying asteroids interacting with
secular resonances

10:05-10:20 Abreuçon Atanasio Alves - Deep learning identification of asteroids interacting
with g-s secular resonances

10:20-10:35 coffee break

10:35-10:50 apresentação dos posters

10:50-11:05 Prajwal Hassan Puttasiddappa - Geodesic-Informed Neural Networks (GINN) for
Star Dynamics Near SgrA : Orbital parameter estimation ∗

11:05-11:20 Luander Bernardes - Mixed Models como ferramenta de investigação da relação
entre exoplanetas, sistemas planetários e vida

11:05-11:20 Rose Clívia Santos Sales de Lima - Machine Learning em Astronomia:
Classificação de Supernovas

11:20-12:00 palestra 2: Rafael S. de Souza - Embeddings, Then and Now - How AI Maps
Reality?

12:00-14:00 intervalo para almoço

14:00-14:40 palestra 3: Fabricio Olivetti de França - Symbolic Regression: Discovering
Equations from Observational Data

14:40-14:55 Eduardo Galvani Massino - Estimativa de larguras equivalentes de linhas de
emissão em espectros de galáxias usando técnicas de aprendizado de máquina

14:55-15:10 Rodrigo Haack - Estimation of galaxy properties in the direction of Fornax
Cluster with S-PLUS, LePhare and ML/DL techniques. Initial steps of the study of the
Doradus-Fornax-Eridanus Filament

15:10-15:25 coffee break

15:25-15:40 Roberto Bertoldo de Menezes - O uso de machine learning para a classificação da
emissão nuclear de galáxias

15:40-15:55 Dener César Mendes - An Approach for Estimating the Structural Properties of
Open Star Clusters using Deep Learning

15:55-16:30 : Discussão: iniciativas para melhorar as atividades de IA em Astronomia

________________________________________________________________________________

PALESTRAS CONVIDADAS

Evgeny Smirnov
Astronomical Observatory Belgrade, Serbia
Commercial and Open-Source Large Language Models in Astronomy: Tools, Applications, and Use
Cases
In this talk, I explore how open-source large language models (LLMs) like LLaMA 3.2, Gemma,
and DeepSeek can be useful in astronomical data analysis by providing cost-effective alternatives to
expensive commercial models such as gpt-4.1/o3 and Claude Sonnet/Opus 4. My research
demonstrates that these freely available models, which can run on a researcher's laptop, can achieve
acceptable performance comparable to traditional neural networks for astronomical classification
tasks — particularly in identifying mean-motion resonances in asteroid dynamics. Through careful
prompt engineering, model instruction, and fine-tuning, I show that open-source LLMs can
effectively leverage their pattern recognition capabilities to analyze time series data and
astronomical images, tasks that typically demand specialized algorithms and substantial
computational resources. I also present a comprehensive framework for developing standardized
benchmarks specifically designed for astronomical applications of LLMs.

Rafael S. de Souza
University of Hertfordshire
Embeddings, Then and Now - How AI Maps Reality?
Embeddings are the backbone of how modern AI systems represent language, images, and
knowledge, mapping complex data into mathematical spaces. Yet the idea of representing the world
through structured mappings has deep roots in science. This talk explores how the concept of
embeddings evolved, from early scientific models to today’s machine learning systems. We will
discuss how embeddings capture meaning, relationships, and patterns, and how this framework
ultimately enables machines to learn.

Fabricio Olivetti de França
UFABC
Symbolic Regression: Discovering Equations from Observational Data
Discovering new scientific laws, expressed as concise mathematical equations, is a fundamental
part of scientific studies, especially in the current data-driven era. Symbolic Regression is a
technique that helps scientists design mathematical functions that describe observational data.
Unlike traditional regression techniques, in which data are fitted to a pre-specified function,
Symbolic Regression searches for both the functional form and the optimal parameters of an
equation, discovering mathematical relationships without the need for prior specification. This talk
will briefly introduce Symbolic Regression, explaining its operation, limitations, and practical tools.
In addition, we will show how it is possible to incorporate domain knowledge so that such
equations obey certain mathematical properties (e.g., monotonicity, symmetry), physical
constraints, units of measurement, among other properties. In addition to the objective of
introducing this technique to the scientific community, this talk will also be an invitation to discuss
desirable requirements for the effective use of such tools in fundamental science applications.
________________________________________________________________________________

CONTRIBUIÇÕES ORAIS

Valerio Carruba
UNESP/Guaratinguetá
Vision Transformers for identifying asteroids interacting with secular resonances
Currently, more than 1.4 million asteroids are known in the main belt. Future surveys, like those
that the Vera C. Rubin Observatory will perform, may increase this number to up to 8 million.
While in the past identification of asteroids interacting with secular resonances was performed by a
visual analysis of images of resonant arguments, this method is no longer feasible in the age of big
data. Deep learning methods based on Convolutional Neural Networks (CNNs) have been used in
the recent past to automatically classify databases of several thousands of images of resonant
arguments for resonances like the ${\nu}_6$, the $g-2g_6+g_5$, and the $s-s_6-g_5 + g_6$.
However, it has been shown that computer vision methods based on the Transformer architecture
tend to outperform CNN models if the scale of the image database is large enough. Here, for the
first time, we developed a Vision Transformer (ViT) model and applied it to publicly available
databases for the three secular resonances quoted above. ViT architecture outperforms CNN models
in speed and accuracy while avoiding overfitting concerns. If hyper-parameter tuning research is
undertaken for each analyzed database, ViT models should be preferred over CNN architectures.

Abreuçon Atanasio Alves
UNESP/Guaratinguetá
Deep learning identification of asteroids interacting with g-s secular resonances
Secular resonances occur when there is a commensurability between the fundamental frequencies of
asteroids and planets. These interactions can affect orbital elements like eccentricity and inclination.
In this work, our
focus is to study the − 6 − + 6 resonance, which affects highly inclined asteroids in the inner g g s s
main belt around the Phocaea family. Traditionally, the identification of these asteroids was done
manually, which demanded a significant amount of time and became unfeasible due to the large
volume of data. Our goal is to develop deep learning models for the automatic identification of
asteroids affected by this resonance. In this work, Convolutional Neural Network (CNN) models,
such as VGG, Inception, and ResNet, as well as the Vision Transformer (ViT) architecture, are used.
To evaluate the performance of the models, we used metrics such as accuracy, precision, recall, and
F1-score, applied to both filtered and unfiltered elements. We applied deep learning methods and
evaluated which one presented the best effectiveness in the classification of asteroids affected by
the secular resonance. To improve the performance of the models, we employed regularization
techniques, such as data augmentation and dropout. CNN models demonstrated excellent
performance with both filtered and unfiltered elements, but the Vision architecture stood out,
providing exceptional performance across all used metrics and low processing times.

Prajwal Hassan Puttasiddappa
UFES, UERJ
Geodesic-Informed Neural Networks (GINN) for Star Dynamics Near SgrA : Orbital ∗
parameter estimation
I will present the first part of the Geodesic-Informed Neural Networks (or GINN) where we make
use of Physics-Informed Neural Networks to estimate the orbital parameters ($e, a, M$) of the stars
near the galactic center. We also look at the relativistic correction to the Keplerian orbit to estimate
deviations from the Schwarzschild precession of the S2 orbit. I will also describe the roadmap for
the ongoing second part, where we extend this framework to feed the network-predicted orbit to a
Bayesian inference pipeline to estimate the posteriors of the orbital parameters of the star S2, the
distance to the black hole along with its the offset parameters and also the gravity-model parameters
simultaneously.

Luander Bernardes
Centro Universitário Estácio de Ribeirão Preto
Mixed Models como ferramenta de investigação da relação entre exoplanetas, sistemas
planetários e vida
Desde a descoberta do primeiro exoplaneta a orbitar uma estrela da Sequência Principal, um enorme
esforço vem sendo realizado pela comunidade científica para tentar entender algumas questões
básicas relacionadas à existência destes novos mundos: Como são formados? Quantos são? Onde
estão localizados? Qual a sua constituição? Eles possuem atmosferas? Eles podem ser habitáveis?
etc. Entretanto, pouco ainda se conhece sobre a constituição interna deles ou de como os sistemas
planetários podem influenciar o surgimento de condições otimizadas para o surgimento da vida.
Desse modo, a pesquisa desenvolvida se propôs a investigar a relação entre exoplanetas, sistemas
planetários e o desenvolvimento da vida. Com essa finalidade, optou-se por uma abordagem que
considera a perspectiva multinível, considerando as características de centenas de exoplanetas e de
suas estrelas hospedeiras que foram estudadas por meio de técnicas não supervisionadas e
supervisionadas de Machine Learning a fim de identificar a formação de clusters e compreender a
possível relação multinível entre planetas e nichos planetários. Assim, estudou-se como as relações
contextuais podem influenciar a estimativa do grau de semelhança entre um planeta e a Terra e,
consequentemente, a possibilidade da existência de corpos aptos a abrigar vida. O trabalho
demonstra quantitativamente qual é a influência dos ambientes planetários na formação de planetas
que, provavelmente, tenham condições de possuir uma biosfera capaz de sustentar formas de vida,
mesmo que esse resultado não considere as constituições internas reais dos objetos estudados, já
que elas são desconhecidas, o que impede uma reconstrução histórica do processo de evolução
desses planetas. O trabalho ainda fornece uma ferramenta preditiva do grau de semelhança de um
exoplaneta com a Terra, além de servir como um filtro para se escolher os melhores alvos na busca
de vida extraterrestre.

Rose Clívia Santos Sales de Lima
UNIFESP
Machine Learning em Astronomia: Classificação de Supernovas
O avanço dos levantamentos astronômicos de larga escala, como o LSST do Observatório Vera C.
Rubin, inaugura uma nova era de descobertas com fluxos massivos de dados sobre eventos
transientes, incluindo supernovas do Tipo Ia — ferramentas fundamentais para a cosmologia
observacional. No entanto, a limitação no número de objetos com confirmação espectroscópica
representa um desafio significativo para o treinamento eficaz de modelos de aprendizado de
máquina. Este estudo investiga o uso de estratégias de Active Learning para aprimorar a seleção de
amostras de treinamento em contextos com dados escassos e assimetrias entre amostras
espectroscópicas e fotométricas. Utilizando curvas de luz simuladas, demonstramos que é possível,
de forma iterativa e eficiente, melhorar a capacidade de classificação mesmo nas fases iniciais de
um levantamento. A abordagem proposta aponta para um caminho viável e promissor rumo à
automação confiável da análise de grandes volumes de dados astronômicos. Mais do que uma
solução técnica, representa uma estratégia inteligente de maximizar descobertas científicas com o
menor custo observacional.

Eduardo Galvani Massino
IAG/USP
Estimativa de larguras equivalentes de linhas de emissão em espectros de galáxias usando
técnicas de aprendizado de máquina
Estudo a utilização de modelos de regressão simbólica, especificamente Operon e PySR, para
estimação das larguras equivalentes em função dos parâmetros das galáxias, fazendo a comparação
entre os 2 algoritmos, com auxílio de diagrama BPT na avaliação de desempenho.

Rodrigo Haack
IALP (CONICET-UNLP)
Estimation of galaxy properties in the direction of Fornax Cluster with S-PLUS, LePhare and
ML/DL techniques. Initial steps of the study of the Doradus-Fornax-Eridanus Filament
In this talk we will present the latest results obtained in the context of the S-PLUS Fornax Project
(S+FP; Smith Castelli et al. 2024) and the selection of targets to observe for the Chilean Cluster
Galaxy Evolution Survey (CHANCES; Sifón et al. 2025) of the 4-MOST collaboration. Focusing
on the preparation and construction of The Extragalactic Catalog of S+FP in 208 deg2 around ∼
NGC 1399, taking advantage of the 12 optical bands of S-PLUS and advanced machine learning
techniques to separate real galaxies from stars and spurious objects. In addition, photometric
redshifts and stellar masses were estimated by LePhare (SED-Fitting), and galaxies with emission
lines were identified. This work took as a basis (Haack et al. 2024) for a new publication recently
(Haack et al. submitted). In parallel, we developed our own models based on machine learning
(ML) and deep learning (DL) techniques to estimate stellar mass, SFR, Dn4000 index, age and
metallicity, with performances superior to classical methods (SED-Fitting). These models are being
applied to new regions: the Doradus group, the Eridanus group complex and its connection with
Fornax, in the context of the study of the Eridanus-Fornax-Doradus filament. Images were already
obtained with the T80-S telescope (16 nights) and with DECam (Abell 2744), and catalogs were
generated in key regions such as Hydra and Stripe-82. The methodology includes tools such as
SExtractor for detection, LePhare for SED-Fitting, CALSAGOS for substructure analysis, and
ML/DL classification and regression models. Current results and next steps will be presented,
including the analysis of filament substructure as a function of the estimated physical properties of
galaxies, with the aim of studying the formation and evolution of galaxies in different environments
along the Eridanus-Fornax-Doradus filament.

Dener César Mendes
INPE
An Approach for Estimating the Structural Properties of Open Star Clusters using Deep
Learning
Open stellar clusters are groups of gravitationally bound stars originated from the
same molecular cloud. Given their diversity in terms of age, metallic content, morphology, and
location within the Milky Way, these objects are useful tools to understand both stellar evolution
and the Galactic structure. Current approaches to determine its structural parameters often rely on
trial-and-error methods, such as Markov Chain Monte Carlo (MCMC) and Maximum-Likelihood
Poisson Regression, which aim to explore the entire parameter space. However, depending on the
convergence criteria, these methods can become trapped in local minima, leading to suboptimal
solutions. This article aims to determine the structural parameters of open clusters via artificial
intelligence (AI), offering a more efficient and scalable solution. Thus, the AI-based Inference for
Open-cluster Networks (AION-1) is introduced which is, indeed, a machine learning (ML) and deep
learning (DL) strategy. The approach integrates the analytical King profile with ML techniques
trained on astrometric and photometric data from the Gaia DR3 catalog. DL models are used for
extracting the features from the celestial maps of the open clusters. AION-1 provides a data-driven
framework for deriving parameters such as central density, core radii, tidal radii, and background
density, contributing to the automation of cluster structure characterization. Based on nine deep
neural networks (DNNs) models to extract features from the celestial maps and two traditional ML
techniques, i.e., Multilayer Perceptron Regressor (MLR) and Support Vector Regression (SVR),
results show that the AION-1 approach performed effectively in predicting the structural parameters
of open star clusters. Additionally, the approach addressed the challenge of determining the tidal
radii, a parameter known for its inherent uncertainty. Grad-CAM, an explainable artificial
intelligence (XAI) technique, was used to explain the behavior of the DNN models.

________________________________________________________________________________

POSTERS
Caio Gomes de Oliveira
UNESP/Guaratinguetá
Comportamento Dinâmico e Características de Superfície do Asteroide Super-Rápido
(436724) 2011 UW158
O asteroide (436724) 2011 UW158 é um asteroide próximo à Terra classificado como
potencialmente perigoso e de rotação super-rápida, com período de rotação de aproximadamente 36
minutos, com raio estimado em 300 metros, que apresenta uma forma alongada e peculiar. Sua
dinâmica é fortemente influenciada pela sua alta velocidade angular, que afeta tanto o potencial
gravitacional quanto a distribuição dos pontos de equilíbrio. Neste estudo, analisamos a estrutura do
geopontencial do asteroide e as curvas de velocidade zero para investigar as condições de
estabilidade de partículas em sua superfície. Nossos resultados indicam que os contornos de
velocidade zero se assemelham a um formato de um paraboloide, essa característica sugere um
único ponto de equilíbrio próximo ao centro de massa, diferentemente de asteroides bilobados ou
altamente irregulares com menor velocidade angular, em que múltiplos pontos de equilíbrio
tipicamente emergem devido a distribuições de massa complexas. A rotação super-rápida do
asteroide 2011 UW158 implica em uma rotação centrífuga que domina o potencial do asteroide,
minimizando regiões estáveis em sua superfície. A ausência de pontos de equilíbrio estáveis na
superfície sugere que é improvável que qualquer regolito solto persista em longas escalas de tempo,
reforçando a hipótese de que UW158 pode exibir coesão interna significativa. Nosso trabalho
fornece novos insights sobre a estabilidade de asteroides super-rápidos e suas implicações para a
dinâmica da superfície e ejeção de material e, além disso, compreender tais propriedades dinâmicas
é crucial para estratégias de defesa planetária e o planejamento de futuras missões espaciais.

Maria Antoniazi; Andre Amarante; Alesca Barbosa; Caio Gomes; Leonardo Braga
UNESP/Guaratinguetá
Mapeando o Geopotencial do Asteroide Didymos Após o Impacto da Sonda DART
A missão DART, conduzida pela NASA, realizou um experimento pioneiro de desvio de asteroides,
colidindo intencionalmente com Dimorphos, o satélite do sistema binário (65803) Didymos, como
parte de um teste para defesa planetária. Após o impacto, observou-se, por meio de telescópios, uma
evolução dinâmica na ejeção de material da superfície de Dimorphos, acompanhada por uma
alteração em seu formato. O impacto causou uma redução no semi-eixo maior da órbita de
Dimorphos, passando de 1.206 km para 1.144 km, além de um aumento de 0,021 na excentricidade
orbital. Adicionalmente, o período orbital, antes estimado em aproximadamente 12 horas, foi
reduzido em 33 minutos. Neste estudo, utilizamos um modelo poliédrico para o asteroide Didymos,
composto por 1.996 faces triangulares e 1.000 vértices, com o intuito de investigar como o impacto
da sonda DART em Dimorphos afeta o geopotencial de Didymos. O geopotencial foi calculado
como a soma dos potenciais gravitacional e centrífugo, considerando o baricentro de cada face do
modelo, e levando em conta o estado do sistema após a colisão.
Os resultados obtidos sugerem variações no geopotencial de Didymos, tanto no pericentro quanto
no apocentro de sua órbita, quando comparados os cenários antes e depois do impacto.

Alesca Garcia Barbosa
UNESP/Guaratinguetá
Mapeando o Aceleração de Superfície do Satélite Dimorphos Após o Impacto da Sonda DART
A missão DART da NASA realizou com sucesso o primeiro experimento para deflexão de
asteroides, impactando Dimorphos, o satélite do asteroide binário (65803) Didymos, como um teste
de defesa planetária. As observações por telescópios mostraram uma evolução complexa da ejeção
de material da superfície de Dimorphos com uma reconfiguração no seu formato devido ao impacto.
Além disso, o impacto da sonda DART diminuiu o semi-eixo da órbita do satélite Dimorphos de
1.206 km para 1.144 km, já a excentricidade da órbita, teve um aumento de 0.021. Por fim, seu o
período orbital de ~12 h teve uma diminuição de 33 min. A sonda Hera da ESA está planejada para
obter imagens dos materiais ejetados da superfície de Dimorphos no final de 2026. Assim, neste
trabalho, mapeamos a aceleração de superfície do satélite Dimorphos, que é definida como a soma
das acelerações gravitacional e centrífuga, calculadas no baricentro de cada face que compõe o
modelo poliédrico de Dimorphos. Levando em consideração o estado do sistema, após o impacto da
sonda DART. O objetivo é analisar como esse impacto em Dimorphos influencia a mudança da
aceleração em sua superfície. Para este fim, utilizamos um modelo poliédrico do satélite Dimorphos
com 960 faces triangulares e 482 vértices. Nossos resultados mostram diferenças entre a aceleração
de superfície antes e após o impacto calculado no pericentro e apocentro da órbita.

Eduardo Batista
IAG/USP
Otimização de Métodos de Machine Learning para a Detecção de Associações Estelares
Jovens
A identificação de aglomerados estelares jovens em dados astrométricos modernos é um desafio
importante. Nela, o desempenho de algoritmos de Machine Learning, como DBSCAN e
HDBSCAN, é diretamente influenciado pela escolha, muitas vezes arbitrária, de seus parâmetros
iniciais (ε e min_samples). Atualmente, a literatura carece de critérios objetivos para essa seleção, o
que frequentemente leva a resultados inconsistentes. Nosso trabalho propõe uma nova metodologia
para otimizar o desempenho desses algoritmos. O objetivo é determinar intervalos de parâmetros
que permitam a obtenção de clusters que se aproximem significativamente da realidade física. Para
isso, empregamos uma análise paramétrica rigorosa, mapeando o impacto da variação dos
parâmetros iniciais no número, tamanho e qualidade dos aglomerados. Ao aplicar essa abordagem
na associação Canis Major OB1/R1 (CMa), utilizando dados do Gaia DR3, conseguimos identificar
a combinação de parâmetros que melhor reproduz os aglomerados já conhecidos na literatura. Além
disso, a análise também revelou novas subestruturas. Nossa investigação também destacou relações
intrínsecas entre os parâmetros (ε e min_samples), indicando tendências que sugerem uma
correspondência entre os aglomerados detectados e suas propriedades físicas reais. Este estudo
demonstra o potencial do nosso método para refinar a aplicação de algoritmos de Machine Learning
em astrometria, aprimorando significativamente o uso de técnicas de agrupamento para a
compreensão de aglomerados abertos.

Pedro Henrique do Vale Cunha
IAG/USP
Miragens cósmicas: um catálogo de quasares sob o efeito de lentes gravitacionais
Lentes gravitacionais são fenômenos astrofísicos raros, mas de grande valor científico. O
alinhamento entre uma fonte distante, como um quasar, e um objeto massivo no primeiro plano,
como uma galáxia defletora, produz múltiplas imagens e um ambiente ideal para o estudo da
distribuição de matéria escura, além de permitir medições independentes do parâmetro de Hubble-
Lemaître. Na última década, a Missão Espacial Gaia revolucionou a astrometria ao prover dados com precisão
sub-miliarcosegundo para bilhões de fontes celestes. Originalmente concebida para o estudo da Via
Láctea, Gaia mostrou-se também capaz de detectar e caracterizar sistemas extragalácticos de lentes
gravitacionais, mesmo com separações angulares muito pequenas. Nesse contexto surgiu o grupo
Gaia Gravitational Lenses (Gaia GraL), uma colaboração internacional formada em 2014 e
composta por cerca de 30 pesquisadores de 21 instituições. O grupo tem como objetivo identificar,
confirmar e modelar lentes gravitacionais de quasares em todo o céu, com base nos dados da missão
Gaia, complementados por catálogos públicos e informações da literatura. Este trabalho apresenta
os resultados da construção do catálogo mais completo já publicado de lentes gravitacionais de
quasares confirmadas. Foram revisados sistematicamente trabalhos da literatura e cruzadas as
posições das imagens e galáxias com os catálogos Gaia DR3 e FPR, AllWISE e bases
espectroscópicas, como Milliquas, Quaia e SHSRC. Compilamos 427 sistemas confirmados (91
quádruplos e 336 duplos), com 381 redshifts de quasares e 199 de galáxias defletoras. Identificamos
191 medições de time delay extraídas da literatura em 71 sistemas. Aplicamos modelagens com o
perfil SIE+shear a 19 quádruplos totalmente resolvidos pelo Gaia DR3. Os dados estarão
disponíveis em graldatabase.iag.usp.br, com suporte a ferramentas VO e exploração interativa. O
catálogo já é utilizado no treinamento de algoritmos de busca e como referência para estudos
cosmológicos com lentes (priv. comm). Este trabalho foi submetido à Astronomy & Astrophysics e
aguarda publicação oficial.

Otavio Sebastião Krinski Moreira
IAG-USP
Censo de falsos positivos de lentes gravitacionais fortes de quasares
As lentes gravitacionais fortes de quasares provêm uma forma independente de medir a constante de
Hubble, sendo uma ferramenta importante para estudar a tensão de Hubble. Entretanto, são
fenômenos difíceis de serem descobertos, ao serem objetos com magnitude aparente média de 19.6
e precisarem ser confirmados espectralmente, com apenas 425 lentes confirmadas até 2025. No
processo de busca por lentes, a maior parte das candidatas observadas acabam sendo falsos
positivos, compostos por objetos de vários tipos, como quasares, galáxias, estrelas, anãs brancas,
anãs marrons, etc. Este trabalho utiliza dados da colaboração internacional Gaia Gravitational
Lenses (Gaia GraL) que, ao confirmar 98 lentes, observou também centenas de falsos positivos nos
telescópios NTT, SOAR, Gemini, Keck e Palomar. A partir dessas observações e do catálogo de
todas as lentes gravitacionais de quasares conhecidas do Gaia GraL, buscamos separar as lentes
confirmadas dos falsos positivos. Para isso, utilizamos catálogos de diferentes faixas do espectro
eletromagnético, do raio-x ao infravermelho, assim como a astrometria do Gaia. Com esses dados,
aplicaremos métodos estatísticos de classificação e aprendizagem de máquina, visando melhor
definição das probabilidades e filtragem na busca por lentes.

Daniele da Silva Ferreira Medeiros
INPE/CBJLSW
Machine Learning for Identifying Magnetic Recconection at the Earth's Magnetopause
The interaction between the solar wind and Earth’s magnetosphere results in a phenomenon known
as magnetic reconnection. Magnetic reconnection is a universal physical process that occurs in
magnetized plasmas and acts as a mechanism for accelerating charged particles by converting
magnetic energy into kinetic energy, especially when the interplanetary magnetic field is southward
(Bz < 0), this process takes place at the dayside magnetopause, transporting magnetic flux to the
nightside (magnetotail) and directly influencing the occurrence of geomagnetic storms and
substorms. Analyzing satellite data from missions such as MMS enables the investigation of the
local characteristics of reconnection. The project intends to develop machine learning to identify
reconnection events in near real-time, based on artificial intelligence (AI) to identify reconnection
events, integrating them into space weather monitoring systems and improving response times.
These methods will be based on the physical parameters of the solar wind using Physics-Informed
Neural Networks (PINNs). The project will be conducted in collaboration with the Galileo Solar
Space Telescope (GSST) mission team and the Solar Physics AI initiative.

Marcos William da Silva Oliveira
IFSP-SJC / INPE
CHARACTERIZATION OF SOLAR FLARES USING HOT ONSET FLARES AND
MACHINE LEARNING
Contextualization: Solar flares are considered the onset of many phenomena and impacts in Space
Weather. The nature of these events presents challenges for accurate forecasting. The identification
of hot onsets in certain flare events offers an opportunity to bridge classification and prediction
tasks.
Objectives: This postdoctoral project aims to identify and characterize precursors of solar flares
using high-resolution image databases, from AIA/SDO instruments.
Methodology: The methodology involves the construction of structured datasets and image
repositories, along with the development of machine learning models to characterize the
phenomenon of solar flares. The research is currently in progress, at the database construction stage.
The proposed algorithm involves image processing techniques for the automatic localization of the
region of interest, followed by cropping 256x256 pixel images throughout the flare’s evolution. For
this purpose, the start, peak and end times from the GOES event list are used. The next step is
perform feature extraction and develop machine learning models for classification.
Expected Results: In addition to contributing to advances in the field of Heliophysics, the project is
expected to generate indirect benefits to the national Space Weather monitoring initiative
(EMBRACE) and the Galileo Solar Space Telescope mission, both hosted at INPE.
Future Efforts: The project also aims to foster the training and renewal of qualified human resources
for the continued development of regional and national scientific research.

Idowu Raji
INPE
Unsupervised Clustering and Temporal Evolution of Solar Features using Self-Organizing
Maps on Continuum and Magnetogram Images
This study explores the use of Self-Organizing Maps (SOMs), an unsupervised machine learning
method for clustering and tracking the temporal evolution of solar surface features. Using data from
the Solar Dynamics Observatory (SDO), specifically continuum and magnetogram images. We
demonstrate how SOMs can distinguish solar features such as sunspots, quiet Sun regions, and
active magnetic areas. By analyzing cluster transitions over time, this approach contributes to
automated, data-driven solar monitoring and offers potential applications in space weather
forecasting.

José Matheus da Silva Rocha
INPE
A simple approach using Self-Organizing Maps for classifying structures in the photosphere
using spectropolarimetry data from the SOT/SP instrument onboard the HINODE mission
This work explores the application of Self-Organizing Maps (SOM), a type of artificial neural
network, for the classification of structures within the solar photosphere using spectropolarimetric
data. The SOM technique is employed to convert complex, high-dimensional data relationships into
a low-dimensional map, facilitating the visualization and analysis of distinct photospheric regions.
For this study, data from 13 active region events were combined into a single dataset. The network
was then trained using a randomly selected subset, corresponding to approximately 10% of the total
pixels from this aggregated dataset. A SOM with a 5x5 hexagonal topology was applied to this
training data to cluster pixels into 25 initial classes. The trained network demonstrated qualitative
success in identifying and segmenting characteristic regions such as the umbra, penumbra, and quiet
Sun. The k-Means algorithm was subsequently applied to consolidate these classes. A quantitative
evaluation of the trained network yielded a Quantization Error (QE) of 0.1637 and a Topographic
Error (TE) of 0.1094. Although the qualitative results are promising, these error metrics indicate the
potential for improvement. Therefore, future steps will focus on minimizing these errors by
exploring and enhancing the pre-processing strategies for the Stokes data, with the goal of
improving the quantitative accuracy of the classification.

Luis Eduardo Antunes Vieira
INPE
All-Optical Classification of solar spectral Profiles via Diffractive Neural Networks
We outline the concept of a compact, all-optical approach to classify solar spectropolarimetric
profiles by combining ultra-narrow-band Volume Holographic Gratings (VHGs) with a diffractive
deep neural network (D2NN). VHGs provide high spectral and angular selectivity while preserving
polarization, enabling precise isolation of Zeeman-sensitive line cores and wings for robust Stokes
sampling in space-borne conditions. The downstream classifier is a D2NN—multiple passive
diffractive layers trained digitally but performing inference entirely optically—that routes input
profiles to detector regions encoding morphological classes at the speed of light, with minimal
power and no moving parts. Demonstrated D2NN image classification capabilities and scalability
indicate feasibility for onboard, low-latency sorting and compression of Hinode-like datasets.
Together, VHG pre-filtering and all-optical inference promise higher cadence and reduced
complexity for the classification of near-absorption solar spectral profiles, supporting improved
magnetic diagnostics from Hinode-style observations. Authors: SolarAI@Inpe Workgroup

Bruno Fernandes Garcia
INPE
PINNs e aplicação em simulações de campo magnético da coroa solar
A atmosfera solar é uma região altamente dinâmica, onde a evolução das estruturas é governada
principalmente pelo campo magnético. Embora a medição direta na coroa solar enfrente limitações,
sua configuração pode ser inferida a partir de dados da fotosfera. Este estudo propõe a utilização de
Redes Neurais Informadas pela Física (Physics-Informed Neural Networks- PINNs) para modelar o
campo magnético coronal. Essa metodologia combina a eficiência do aprendizado de máquina com
as equações diferenciais da magnetohidrodinâmica solar. A aplicação de PINNs permite incorporar
restrições físicas diretamente no processo de aprendizado, viabilizando inferências mais robustas a
partir de dados observacionais. O objetivo é aprimorar a modelagem tridimensional do campo
magnético, contribuindo para uma compreensão mais detalhada de sua interação com o plasma local
e de sua evolução temporal. Essa abordagem busca uma análise mais precisa da estrutura magnética
e de seu comportamento.

Edith Tueros Cuadros
INPE
Machine Learning-Based Estimation of Cn2 at Astronomical Sites Using Meteorological Data
Accurate estimation of the refractive index structure parameter (C 2) is fundamental for optimizing n
astronomical observations and adaptive optics performance. In this study, we explore the
application of machine learning models to predict C 2 based on Differential Image Motion Monitor 
n(DIMM) measurements using ERA5 reanalysis data provided by the European Centre for Medium-
Range Weather Forecasts (ECMWF). Three machine learning approaches were evaluated: a
Multilayer Perceptron (MLP), a Long Short-Term Memory (LSTM) recurrent neural network, and
the Extreme Gradient Boosting (XGBoost) algorithm. Data preprocessing was performed to
temporally align the different time series and handle missing data. Model training and validation
were conducted using data from Paranal Observatory, Chile. The trained models were subsequently
applied to estimate C 2 at the Laboratório Nacional de Astrofísica (LNA) Observatory located at n
Pico dos Dias, Brazil. The input-output relationship was modeled using time-synchronized datasets,
where the features included ERA5-derived atmospheric parameters (temperature, pressure, relative
humidity, and wind profiles), while the target variable was the DIMM-measured C 2. This study n
highlights the potential of combining reanalysis data with machine learning techniques for real-time
turbulence monitoring and prediction at astronomical sites, offering a cost-effective alternative to
continuous in-situ measurements.

Beatriz Dantas Quina
Universidade Presbiteriana Mackenzie
MAGNETIC INTERACTION BETWEEN STARS AND THEIR TRANSITING PLANETS
The light curve of a star represents the variation in its luminosity over time and can reveal both the
occurrence of stellar flares and the presence of orbiting planets. This study explores the magnetic
interaction between a planet and its host star by analyzing their light curves. We identified a few
stars that not only exhibited flares but also showed planetary transits. Notably, TIC 149603524
presents both flares and periodic dips in luminosity of approximately 1.5% every 4.4 days, due to a
hot Jupiter-type planet in orbit. The light curves were systematically analyzed, and all detected
flares were characterized in terms of peak time, duration, and energy. To assess a possible planetary
influence on stellar flares, we investigated correlations between flare occurrence and energy and the
planet's orbital period. Our analysis focused on whether flares occurring near planetary transits
indicate a link between stellar activity and planetary motion. In particular, we explored whether
magnetic field reconnection between the star and planet could trigger enhanced stellar flaring. The
results are discussed in detail, and when no correlation is found, possible explanations are provided.