Saídas

Arquivos de Saída

Os arquivos de saída das sínteses são armazenados na pasta sintese do diretório de trabalho. Para cada síntese realizada, é configurados um arquivo com metadados e um conjunto de arquivos com os dados sintetizados. Para as sínteses da operação e de cenários, além dos arquivos com os dados brutos sintetizados, são criados arquivos com estatísticas pré-calculadas sobre os dados brutos, permitindo análises mais rápidas.

No caso de uma síntese do sistema, são esperados os arquivos:

$ ls sintese
>>> EST.parquet
>>> METADADOS_SISTEMA.parquet
>>> PAT.parquet
>>> REE.parquet
>>> SBM.parquet
>>> UHE.parquet
>>> UTE.parquet

Para a síntese da execução:

$ ls sintese
>>> CONVERGENCIA.parquet
>>> CUSTOS.parquet
>>> METADADOS_EXECUCAO.parquet
>>> PROGRAMA.parquet
>>> TEMPO.parquet

Para a síntese da política:

$ ls sintese
>>> CORTES.parquet
>>> ESTADOS.parquet
>>> METADADOS_POLITICA.parquet

Alguns dos arquivos esperados na síntese de cenários:

$ ls sintese
>>> ENAA_REE_BKW.parquet
>>> ENAA_REE_FOR.parquet
>>> ENAA_REE_SF.parquet
>>> ...
>>> ESTATISTICAS_CENARIOS_REE_BKW.parquet
>>> ESTATISTICAS_CENARIOS_REE_FOR.parquet
>>> ESTATISTICAS_CENARIOS_REE_SF.parquet
>>> ESTATISTICAS_CENARIOS_UHE_BKW.parquet
>>> ESTATISTICAS_CENARIOS_UHE_FOR.parquet
>>> ...
>>> METADADOS_CENARIOS.parquet
>>> QINC_UHE_BKW.parquet
>>> QINC_UHE_FOR.parquet
>>> ...

Alguns dos arquivos esperados na síntese da operação:

$ ls sintese
>>> CDEF_SBM.parquet
>>> CDEF_SIN.parquet
>>> CMO_SBM.parquet
>>> COP_SIN.parquet
>>> CTER_SBM.parquet
>>> CTER_SIN.parquet
>>> ...
>>> ESTATISTICAS_OPERACAO_REE.parquet
>>> ESTATISTICAS_OPERACAO_SBM.parquet
>>> ESTATISTICAS_OPERACAO_SBP.parquet
>>> ESTATISTICAS_OPERACAO_SIN.parquet
>>> ESTATISTICAS_OPERACAO_UHE.parquet
>>> ESTATISTICAS_OPERACAO_UTE.parquet
>>> EVERFT_REE.parquet
>>> EVERFT_SBM.parquet
>>> ...
>>> GHID_REE.parquet
>>> GHID_SBM.parquet
>>> GHID_SIN.parquet
>>> GHID_UHE.parquet
>>> GTER_SBM.parquet
>>> GTER_SIN.parquet
>>> GTER_UTE.parquet
>>> HJUS_UHE.parquet
>>> HLIQ_UHE.parquet
>>> HMON_UHE.parquet
>>> INT_SBP.parquet
>>> MERL_SBM.parquet
>>> MERL_SIN.parquet
>>> ...
>>> METADADOS_OPERACAO.parquet
>>> QAFL_UHE.parquet
>>> QDEF_REE.parquet
>>> QDEF_SBM.parquet
>>> ...
>>> VARMF_UHE.parquet
>>> VARMI_REE.parquet
>>> VARMI_SBM.parquet
>>> ...

Formato dos Metadados

As sínteses realizadas são armazenadas em arquivos de metadados, que também são DataFrames, no mesmo formato que foi solicitado para a saída da síntese (por padrão é utilizado o parquet).

Os metadados são armazenados em arquivos com o prefixo METADADOS_ e o nome da síntese. Por exemplo, para a síntese do sistema, os metadados são armazenados em METADADOS_SISTEMA.parquet.

Por exemplo, em uma síntese da operação, os metadados podem ser acessados como:

import pandas as pd
meta_df = pd.read_parquet("sintese/METADADOS_OPERACAO.parquet")
meta_df

            chave nome_curto_variavel              nome_longo_variavel nome_curto_agregacao      nome_longo_agregacao  unidade  calculado  limitado
0         CMO_SBM                 CMO       Custo Marginal de Operação                  SBM                Submercado  'R$/MWh'      False     False
1       VAGUA_REE               VAGUA                    Valor da Água                  REE  Reservatório Equivalente  'R$/MWh'      False     False
2       VAGUA_UHE               VAGUA                    Valor da Água                  UHE       Usina Hidroelétrica  'R$/hm3'      False     False
3      VAGUAI_UHE   VAGUA Incremental        Valor da Água Incremental                  UHE       Usina Hidroelétrica  'R$/hm3'      False     False
4        CTER_SBM         Custo de GT         Custo de Geração Térmica                  SBM                Submercado '10^6 R$'      False     False
..            ...                 ...                              ...                  ...                       ...      ...        ...       ...
164  VNEGEVAP_UHE  Violação Neg. EVAP  Violação Negativa de Evaporação                  UHE       Usina Hidroelétrica                False     False
165     VEVAP_UHE       Violação EVAP           Violação de Evaporação                  UHE       Usina Hidroelétrica     'hm3'       True     False
166     VEVAP_REE       Violação EVAP           Violação de Evaporação                  REE  Reservatório Equivalente     'hm3'       True     False
167     VEVAP_SBM       Violação EVAP           Violação de Evaporação                  SBM                Submercado     'hm3'       True     False
168     VEVAP_SIN       Violação EVAP           Violação de Evaporação                  SIN       Sistema Interligado     'hm3'       True     False

[169 rows x 8 columns]

Formato das Estatísticas

As sínteses da operação e dos cenários gerados também produzem estatísticas dos dados envolvidos. Em cada uma das sínteses, as estatísticas são armazenadas segundo diferentes premissas, dependendo geralmente da agregação espacial dos dados. No caso da síntese dos cenários, além da agregação espacial, também é considerada a etapa da execução do modelo para a qual os cenários foram gerados (forward, backward ou simulação final).

As estatísticas são armazenadas em arquivos com o prefixo ESTATISTICAS_ e o nome da síntese. Por exemplo, para a síntese da operação, as estatísticas são armazenadas em arquivos com prefixo ESTATISTICAS_OPERACAO_, sendo um arquivo por agregação espacial.

Por exemplo, em uma síntese da operação, as estatísticas podem ser acessadas como:

import pandas as pd
hydro_df = pd.read_parquet("sintese/ESTATISTICAS_OPERACAO_UHE.parquet")
hydro_df

        variavel  estagio data_inicio   data_fim cenario  patamar  ...       valor  codigo_usina  codigo_ree  codigo_submercado  limite_inferior  limite_superior
0          VAGUA        1  2023-10-01 2023-11-01     max        0  ...   13.249930             1          10                  1             -inf              inf
1         VAGUAI        1  2023-10-01 2023-11-01     max        0  ...    2.568698             1          10                  1             -inf              inf
2           VTUR        1  2023-10-01 2023-11-01     max        0  ...  522.970000             1          10                  1              0.0           562.82
3           VVER        1  2023-10-01 2023-11-01     max        0  ...    0.850000             1          10                  1              0.0              inf
4           QTUR        1  2023-10-01 2023-11-01     max        0  ...  198.850000             1          10                  1              0.0           214.00
...          ...      ...         ...        ...     ...      ...  ...         ...           ...         ...                ...              ...              ...
2451565     GHID       51  2027-12-01 2028-01-01     std        3  ...   21.759415           314           8                  4             -inf              inf
2451566   VGHMIN       51  2027-12-01 2028-01-01     std        3  ...    0.000000           314           8                  4             -inf              inf
2451567    VFPHA       51  2027-12-01 2028-01-01     std        3  ...         NaN           314           8                  4             -inf              inf
2451568     HJUS       51  2027-12-01 2028-01-01     std        3  ...    0.136938           314           8                  4             -inf              inf
2451569     HLIQ       51  2027-12-01 2028-01-01     std        3  ...    0.136938           314           8                  4             -inf              inf

[2451570 rows x 13 columns]

No arquivo de estatísticas, ao invés dos dados associados aos N cenários da etapa de simulação final, são armazenadas as estatísticas dos dados associados a cada entidade, em cada estágio / patamar, calculadas nos cenários. Nestes arquivos, a coluna cenario possui tipo str, assumindo valores mean, std e percentis de 5 em 5 (min, p5, …, p45, median, p55, …, p95, max).

Formato dos Dados Brutos

Os dados brutos também são armazenados em arquivos de mesma extensão dos demais produzidos pela síntese. Por exemplo, para a síntese da operação, os dados são armazenados em arquivos que possuem os nomes da chave identificadora da variável e da agregação espacial, como CMO_SBM e EARMF_REE. Para uma mesma entidade, os arquivos de todas as variáveis possuem as mesmas colunas:

import pandas as pd
eer_df = pd.read_parquet("sintese/EARMF_REE.parquet")
eer_df

       codigo_ree  codigo_submercado  estagio data_inicio   data_fim  cenario  patamar  duracao_patamar    valor  limite_inferior  limite_superior
0               1                  1        1  2023-10-01 2023-11-01        1        0            730.0  30647.0          10194.0          50969.0
1               1                  1        1  2023-10-01 2023-11-01        2        0            730.0  30494.0          10194.0          50969.0
2               1                  1        1  2023-10-01 2023-11-01        3        0            730.0  31585.0          10194.0          50969.0
3               1                  1        1  2023-10-01 2023-11-01        4        0            730.0  30273.0          10194.0          50969.0
4               1                  1        1  2023-10-01 2023-11-01        5        0            730.0  31046.0          10194.0          50969.0
...           ...                ...      ...         ...        ...      ...      ...              ...      ...              ...              ...
18332          12                  1       51  2027-12-01 2028-01-01        3        0            730.0  10132.0           2027.0          11831.0
18333          12                  1       51  2027-12-01 2028-01-01        4        0            730.0  10132.0           2027.0          11831.0
18334          12                  1       51  2027-12-01 2028-01-01        5        0            730.0   3955.0           2027.0          11831.0
18335          12                  1       51  2027-12-01 2028-01-01        6        0            730.0   7294.0           2027.0          11831.0
18336          12                  1       51  2027-12-01 2028-01-01        7        0            730.0   9903.0           2027.0          11831.0

[4284 rows x 11 columns]