AIA 2021

O Workshop SPAnet de Inteligência Artificial em Astronomia foi realizado virtualmente em 27/09/2021. O evento registrou 93 participantes na sala virtual e sua transmissão ao vivo foi acompanhada por 70 interessados. A realização foi da SPAnet - Rede Paulista de Astronomia e do IAG/USP, com apoio da FAPESP. CECS/UFABC, INPE e MAUÁ foram parceiros nesta organização.

Os resumos das apresentações foram publicados em um número especial do Journal of Production and Automation. Acesso em: https://jpaut.com.br/volume-4-number-2-2021/

Comite Científico

Laerte Sodré Junior – IAG/USP (coordenador)
Rodrigo Nemmen – IAG/USP
Rafael Santos – INPE
Tiago Sanches da Silva – IMT
Vanderlei Cunha Parro – IMT
Annibal Hetem Jr – UFABC
Luiz Antonio Celiberto Junior – UFABC
Roberto Bertoldo Menezes – IMT

Comitê Local

Rodrigo Nemmen – IAG/USP (coordenador)
Roberta Duarte Pereira – IAG/USP
Erik Vinicius Rodrigues de Lima – IAG/USP

Captura de tela do Google Meet com participantes do evento Captura de tela do Google Meet com participantes do evento

Assista ao workshop completo:

Chamada

Técnicas de Inteligência Artificial estão tendo aplicação crescente em Astronomia, por permitirem resolver problemas que, de outro modo, não poderiam ser abordados. Diversos grupos vêm apresentando soluções inovadoras, usando Machine Learning e outras técnicas, para uma vasta gama de problemas astrofísicos. Com este workshop queremos contribuir para o desenvolvimento dessas atividades no Estado de São Paulo e no país. O workshop será realizado virtualmente em 27/09/2021.

O workshop tem três objetivos principais:

  • Disseminar o conhecimento que tem sido produzido em aplicações de IA à Astronomia no Estado de São Paulo e no Brasil;
  • Promover o networking entre os pesquisadores atuando na área, com ênfase entre os estudantes;
  • Discutir possíveis ações para promover o desenvolvimento e a visibilidade da área.


Inscrições até 27/08/2021. Os resumos das apresentações serão publicados em um número especial do Journal of Production and Automation (https://jpaut.com.br/)

Programa

Abertura - Laerte Sodré Jr. (IAG-USP, SPAnet)
14:00 - 14:05 - Motivação do Workshop

Seção Científica I - Chair: Rafael Santos (INPE)
14:05 - 14:20 - Valerio Carruba (UNESP)
Chaos identification through the autocorrelation function indicator (ACFI)
14:20 - 14:35 - André Leon Sampaio Gradvohl (UNICAMP)
Previsão de explosões solares com algoritmos de aprendizado de máquina
14:35 - 14:50 - NADJA SIMÃO MAGALHÃES (UNIVERSIDADE FEDERAL DE SÃO PAULO)
O que são mapas auto organizáveis na aprendizagem não supervisionada

intervalo 

Seção Científica II- Chair: Roberto Bertoldo Menezes (IMT)
15:05 - 15:20 - Carlos Andres Galarza Arevalo (Observatório Nacional)
Estimation of Stellar Parameter narrow-band surveys J-PLUS & S-PLUS
15:20 - 15:35 - Vitor Cernic (IAG-USP)
Stellar Population Photometric Synthesis with Artificial Intelligence as revealed by S-PLUS
15:35 - 15:50 - Erik Vinicius Rodrigues de Lima (IAG-USP)
Redshifts fotométricos para o S-PLUS utilizando técnicas de aprendizado de máquina
15:50 - 16:05 - Laerte Sodré Jr. (IAG-USP)
Membership of the Fornax cluster of galaxies as a classification problem
16:05 - 16:20 - Luís Ricardo Arantes Filho (INPE)
DANI: A Multilearning Solution for Classifying Supernovae Data in an MMA Framework

Discussão: coordenação Rodrigo Nemmen (IAG-USP)
16:20 - 16:55 - Iniciativas para promover IA na Astronomia

Encerramento
16:55 - 17:00 - Laerte Sodré Jr. (SPAnet)

Apresentações

1. Valerio Carruba (UNESP) [PDF]
Chaos identification through the autocorrelation function indicator (ACFI) 

Chaotic motion affecting small bodies in the Solar System can be caused by close encounters or collisions, or by resonance overlapping.  Chaotic motion can be detected using approaches that measure the separation rate of trajectories that starts infinitesimally close, or changes in the frequency power spectrum of time series, among others.  In this work, we introduce an approach based on the auto-correlation function of time series, the ACF index (ACFI). Auto-correlation coefficients measure the correlation of a time-series with a lagged copy of itself. By measuring the fraction of auto-correlation coefficients obtained after a given time-lag that are higher than the 5% null hypothesis threshold, we can determine how the time-series auto-correlates with itself. This allows identifying unpredictable time-series, characterized by low  values of ACFI.  Applications of ACFI to orbital regions affected by both types of chaos show that this method can correctly identify chaotic   motion caused by resonance overlapping, but it is mostly blind to close-encounters induced chaos.  ACFI could be used in these regions to select the effects of resonance overlapping.
Accepted for publication in Celestial Mechanics and Dynamical Astronomy.
This is a publication from the MASB (Machine-learning applied to small bodies research group).

2. André Leon Sampaio Gradvohl (UNICAMP) [PDF]
Previsão de explosões solares com algoritmos de aprendizado de máquina

O Clima Espacial se refere aos fenômenos que ocorrem no Sol e que afetam a magnetosfera e a ionosfera terrestre. Esses fenômenos – entre eles, as explosões solares – podem influenciar o desempenho e a confiabilidade dos sistemas tecnológicos em Terra ou em sua órbita próxima. Desde 2015, o grupo de pesquisas HighPIDS tem se dedicado às pesquisas sobre previsão de explosões solares. Para desenvolver mecanismos para realizar essas previsões de forma automática, o HighPIDS pesquisa estratégias que utilizam algoritmos de aprendizado de máquina e aprendizado profundo, combinados com metodologias para seleção de atributos, otimização da escolha de hiperparâmetros, tratamento de dados desbalanceados e a busca de uma boa relação entre taxas de acerto e precisão das previsões [1, 2, 3]. As provas-de-conceito desenvolvidas obtiveram acurácias entre 83% e 85%, com horizontes de previsão de 24h até 72h de antecedência, e estão implementadas em um serviço disponível na web em um software chamado Guaraci [4]. Nessa apresentação, serão abordadas as pesquisas realizadas pelo grupo e os resultados obtidos até o momento.
[1] RIBEIRO, F.; GRADVOHL, A. L. S. Machine learning techniques applied to solar flares forecasting. Astronomy and Computing, v. 35, p. 100468, 2021. DOI: http://dx.doi.org/10.1016/j.ascom.2021.100468
[2] CINTO, T.; GRADVOHL, A. L. S.; COELHO, G. P.; SILVA, A. E. A. Solar Flare Forecasting Using Time Series and Extreme Gradient Boosting Ensembles. SOLAR PHYSICS, v. 295, p. 93, 2020. DOI: http://dx.doi.org/10.1007/s11207-020-01661-9
[3] CINTO, T. ; GRADVOHL, A. L. S. ; COELHO, G. P. ; SILVA, A. E. A. A Framework for Designing and Evaluating Solar Flare Forecasting Systems. MONTHLY NOTICES OF THE ROYAL ASTRONOMICAL SOCIETY, v. 495, p. 3332-3349, 2020. DOI: http://dx.doi.org/10.1093/mnras/staa1257
[4] CINTO, T. ; GRADVOHL, A. L. S. ; COELHO, G. P. ; SILVA, A. E. A. Guaraci, the solar flare forecasting system. Available at https://highpids.ft.unicamp.br/guaraci

3. Nadja Simão Magalhães (Unifesp)
O que são mapas auto organizáveis na aprendizagem não supervisionada

O grande volume de dados astronômicos disponível atualmente torna muito difícil realizar análises a olho, especialmente quando se procura padrões e correlações. Assim, novas maneiras de exploração dos dados se fazem necessárias para que hipóteses sejam levantadas e analisadas em busca do conhecimento. A aprendizagem de máquina (AM, ou "machine learning") é um dos recursos que podem ser usados para mineração de dados, por exemplo na limpeza e na discriminação deles. Uma das vertentes da AM envolve algoritmos que processam os dados sem necessitar de supervisão humana. Normalmente os dados mais adequados para esse tipo de tratamento possuem propriedades medidas mas não têm uma variável específica como objetivo; não obstante, esse tipo de algoritmo pode encontrar padrões nos dados. Aplicações práticas para AM não supervisionada são, por exemplo: agrupamentos dos dados ("clustering"), redução de dimensionalidade e detecção de pontos fora da curva ("outliers"). Nesta exposição irei apresentar uma ferramenta de AM chamada "mapas auto organizáveis" ("self organizing maps" - SOM), capaz de processar dados de maneira não supervisionada e promovendo tanto a redução de dimensionalidade quanto agrupamento de dados.

4. Carlos Andres Galarza Arevalo (Observatório Nacional) [PDF]
Estimation of Stellar Parameter narrow-band surveys J-PLUS & S-PLUS

J-PLUS (Javalambre Photometric Local Survey) and S-PLUS (Southern Photometric Local Survey)  are unprecedented  photometric surveys, using a set of 12 narrow band optical filters located at  which offers a valuable opportunity to observe at some non standard passband filters especially developed for this project.
We present JPLUS-SPEEM (J-PLUS-Stellar Parameters Estimator with Ensemble Methods), based on the machine learning algorithm Random Forest,  which may be potentially included in the process of J-PLUS data analysis. JPLUS-SPEEM provides morphological classification and estimations of stellar parameters for J-PLUS Data. In this talk, we present one possible application aiming at searching for VMP- and EMP-star candidates to be confirmed by high-resolution spectroscopy. A sample of 11 VMP-stars candidates have been selected for observation with the ISIS spectrograph mounted on the William Herschel Telescope (WHT) and analyzed with a generalization of the SEGUE Stellar Parameter Pipeline (n-SSPP,  Beers et al. 2014). The comparison between stellar parameters Teff, logg, and [Fe/H] obtained from spectral analysis and JPLUS-SPEEM shows good agreement within 178K, 0.76 dex and 0.5 dex respectively. An adaptation of this pipeline to S-PLUS data is currently an ongoing project.

5. Vitor Cernic (IAG-USP) [PDF]
Stellar Population Photometric Synthesis with Artificial Intelligence as revealed by S-PLUS

We trained a Neural Network that can obtain selected STARLIGHT parameters directly from S-PLUS photometric data. The training set consisted of over 200 thousand galaxy objects with their stellar population parameters obtained from an application of STARLIGHT by Werle (2019). These galaxies were crossmatched with the S-PLUS iDR3 database, thus, recovering the photometry for the 12 band filters for 55803 objects. We also considered the spectroscopic redshift for each object which was obtained from the SDSS. Finally, we trained a fully connected Neural Network with the 12 photometries plus the redshift as features and targeted some of the STARLIGHT parameters, such as stellar mass and mean star age. The model performed very well for some parameters, for example, the stellar mass, with a less than 2% error. In the following months, we aim to apply the whole S-PLUS database to this trained model, obtaining never-before-seen photometric synthesis for most objects in the catalogue.

6. Erik Vinicius Rodrigues de Lima (IAG-USP) [PDF]
Redshifts fotométricos para o S-PLUS utilizando técnicas de aprendizado de máquina

Neste trabalho, o nosso objetivo é desenvolver um método para estimar redshifts fotométricos de galáxias no S-PLUS. Utilizando dados fotométricos e morfológicos do S-PLUS, GALEX, 2MASS e unWISE, junto a um catálogo de redshifts espectroscópicos que inclui dados do SDSS DR16, 2dFGRS, PRIMUS, GAMA e outros, nós podemos treinar um modelo de aprendizado de máquina profundo que tem, como base, uma rede bayesiana de mistura de densidades. Nossos resultados são analisados em termos de métricas relevantes para estimativas de ponto único (dispersão, viés e fração de outliers) e de funções de distribuição de probabilidade (odds, PIT e HPDCI). A união entre a boa qualidade dos dados do S-PLUS e seu sistema de filtros estreitos e técnicas sofisticadas de aprendizado permitem a obtenção de redshifts fotométricos de alta precisão, viés negligível e baixa fração de outliers, e funções de distribuição de probabilidade com boa calibração.

7. Laerte Sodré Jr. (IAG-USP) [PDF]
Membership of the Fornax cluster of galaxies as a classification problem

The Fornax cluster of galaxies is an interesting structure because it is very close (19 Mpc) and has, besides many bright galaxies, a rich dwarf population, that can be studied up to very faint luminosities due to the small cluster distance. In general, cluster membership is done with redshifts, but here this is available only for a fraction of the galaxies in the cluster direction. Photometric redshifts are useful for this task, but not for Fornax.
Indeed, the cluster distance, z=0.005, is significantly smaller than the typical errors in photometric redshifts, what makes galaxy distances for Fornax obtained through this technique unreliable. We present here an alternative approach, where we attempt to address membership as a two-class classification problem: galaxies which are below a certain redshift (z < 0.01) and those that are above this value. We present results considering different inputs, algorithms, and strategies of data augmentation.

8. Luís Ricardo Arantes Filho (INPE) [PDF]
DANI: A Multilearning Solution for Classifying Supernovae Data in an MMA Framework

Supernovae (SNe) can be divided into two main ways, Type Ia Supernovae (SNeIa) and Core-Collapse Supernovae (CCSNe). This division between SNeIa and CCSNe is mainly due to the explosion mechanism, that is, the way a star explodes. SNeIa are formed by the collapse of white dwarfs in a mass accretion system between the white dwarf and a companion star, the explosion occurs when the white dwarf star reaches the Chandrasekhar limit. In a simplified way, CCSNe occur when massive stars reach the production of the Iron core, at this stage, there are instabilities between the fusion and the gravitational force, so the star collapses against its core, releasing an enormous amount of energy and luminosity. The correct analysis and classification of these objects have produced major scientific advances in recent years, among these advances, are the verification of the accelerated expansion of the universe and the detection of gravitational waves (GW). SNeIa are central objects for astronomical distance calculations, this type of object behaves like a standard candle in that the luminosity does not vary much from case to case. This attribution of SNeIa allowed the development of studies that calculate the accelerated expansion of the universe, resulting in the 2011 Nobel Prize in Physics. Regarding GW detection, recent studies have listed that CCSNe formed by massive stars can produce a violent collapse to the point of generating GW. In this sense, the development of methods for the analysis and detection of these explosions is important for the development of the areas that comprise the study of extreme cosmic events. Thus, in this work, we present a Deep Learning solution able to analyze the SNe data to distinguish between SNeIa and CCSNe. The Deep Architecture for superNovae Identification (DANI) is a system able to classify these objects, operating in a framework to evaluate multiple sources, i.e., DANI can evaluate at the same time the light curves and spectra collected by telescopes. The DANI's structure is formed by convolutional neural networks that operate on multidimensional data, each input component of the system is treated separately and joined into a single structure at the end, in this way, DANI can learn about different types of data and infer the object class. We called this strategy Multilearning because it's possible to work with astronomical objects that produce data from multiple sources. This concept is related to the recent field called Multi-Messenger Astrophysics (MMA), this field is related to the development of structures and computational models for data analysis that allow the specialist to observe and analyze objects in sources of light, particles, and gravitational waves. DANI is part of a single structure called MMA-Supernovae fed with all available SNe catalogs, this architecture provides easy-handled data available for the scientific community and people in general. We analyzed the raw data corresponding to about 15134 instances of SNe spectra, we have also added 117000 instances of SNeIa artificially generated by the TARDIS, to validate the efficacy of the DANI system to identify in a short period the SNeIa. As results DANI can evaluate about 120K samples of SNe data identifying with 99.6% accuracy the SNeIa and CCSNe, being this way an efficient alternative for coupling systems that need an autonomous and accurate classification over an expressive volume of data.

 

Participantes inscritos

 

Realização
SPAnet IAG/USP USP
Parceiros
UFABC
CECS-UFABC
INPE IMT
Apoio
FAPESP