Un conjunto de datos sintéticos de prosumidores de electricidad residencial daneses

Scientific Data volumen 10, Número de artículo: 371 (2023) Citar este artículo

1 Altmetric

Detalles de métricas

Los consumidores residenciales de electricidad convencionales se están convirtiendo en prosumidores que no solo consumen electricidad sino que también la producen. Se espera que este cambio ocurra durante las próximas décadas a gran escala y presenta numerosas incertidumbres y riesgos para la operación, la planificación, la inversión y los modelos comerciales viables de la red eléctrica. Para prepararse para este cambio, los investigadores, las empresas de servicios públicos, los legisladores y las empresas emergentes requieren una comprensión integral del consumo de electricidad de los futuros prosumidores. Desafortunadamente, hay una cantidad limitada de datos disponibles debido a problemas de privacidad y la lenta adopción de nuevas tecnologías, como vehículos eléctricos a batería y domótica. Para abordar este problema, este documento presenta un conjunto de datos sintéticos que contiene cinco tipos de datos de electricidad importados y exportados de prosumidores residenciales. El conjunto de datos se desarrolló utilizando datos reales de consumidores tradicionales de Dinamarca, datos de generación fotovoltaica del modelo global de estimación de energía solar (GSEE), datos de carga de vehículos eléctricos (EV) generados con el paquete emobpy, un operador de sistema de almacenamiento de energía residencial (ESS) y un modelo basado en la red generativa antagónica (GAN) para producir datos sintéticos. La calidad del conjunto de datos se evaluó y validó mediante inspección cualitativa y tres métodos: estadísticas empíricas, métricas basadas en la teoría de la información y métricas de evaluación basadas en técnicas de aprendizaje automático.

Con la creciente penetración de las fuentes de energía renovable (RES), los vehículos eléctricos (EV) y los sistemas de almacenamiento de energía (ESS) en los hogares modernos, los consumidores convencionales se están convirtiendo en prosumidores, lo que hace que los sistemas de energía sean cada vez más dinámicos y bidireccionales. En 2022, las FER continuaron su rápido crecimiento, representando el 13 % de la generación de energía global, mostrando un aumento del 17 % en comparación con 20211. La perspectiva de la Agencia Internacional de Energía (AIE), publicada en 2021, predijo que el 56 % de la generación de electricidad global provendría energías renovables para 2050, donde se proyecta que la energía solar sea el principal recurso renovable y absorba hasta el 43% de la participación total de RES2. El consumo global de electricidad también aumentará debido a la calefacción de espacios y la electrificación del transporte. Entre todo el uso de electricidad, se cree que los vehículos eléctricos domésticos son los principales contribuyentes a la reducción de emisiones, y se espera que representen el 70 % del total de vehículos de pasajeros para 2050, mientras que los vehículos eléctricos de batería (BEV) representarán el 56 % de todas las ventas de vehículos3.

Según esta proyección, es imperativo que los operadores de la red, los encargados de formular políticas, las empresas de servicios públicos y otras partes interesadas comprendan la dinámica del consumo de electricidad residencial en el futuro. Sin embargo, existen varias barreras para esto, principalmente con respecto a la disponibilidad de datos de alta calidad. Primero, los datos de consumo de electricidad individual a gran escala no están disponibles para los profesionales e investigadores debido a las preocupaciones de privacidad de los consumidores. En países con implementaciones generalizadas de medidores inteligentes, los datos de consumo de intervalos están disponibles solo para los consumidores, operadores de sistemas y minoristas para la facturación. Sin embargo, en todos los casos, se desconocen los tipos de usuarios en función de su equipo detrás del medidor (BTM), por ejemplo, EV, baterías estacionarias o sistemas solares fotovoltaicos. En segundo lugar, el tipo de prosumidores de electricidad existente es casi dinámico y cambia con el tiempo sin ningún mecanismo para actualizar las categorizaciones de los prosumidores. Por ejemplo, un mal funcionamiento de la energía solar fotovoltaica puede hacer que un usuario solar se convierta temporalmente en un usuario no solar o la falta de disponibilidad de un vehículo eléctrico puede cambiar temporalmente el tipo de usuario. El conocimiento dinámico del tipo de prosumidor (por ejemplo, por hora o por día) podría ser crucial para que los operadores de sistemas, agregadores y minoristas estimen mejor el comportamiento de la demanda en horas o días para la planificación y operación. En este sentido, un conjunto de datos etiquetados a gran escala de diferentes tipos de consumo de electricidad de los prosumidores facilita la modernización de las redes eléctricas4.

Los conjuntos de datos públicos existentes se dividen en dos categorías principales: (1) datos recopilados de laboratorios vivos5,6,7 y (2) estudios de simulación8,9. Algunos laboratorios vivientes en todo el mundo recopilan datos de intervalos a nivel de electrodomésticos con medidores inteligentes y otros dispositivos inteligentes6,7,10,11. Estos pueden proporcionar datos de alta resolución, pero solo para un número limitado de prosumidores. Debido a problemas de privacidad u obligaciones contractuales, algunos de ellos no pueden compartir datos públicamente. De los estudios de simulación, algunos investigadores han construido modelos basados en la física o basados en datos para simular el uso de electricidad de los hogares individuales8,9,12. Los modelos basados en la física requieren parámetros físicos de los edificios, como la capacitancia térmica, la resistencia térmica, las temperaturas interiores, etc., que son difíciles de obtener y mantener en la práctica. Además, los modelos basados en la física exacerban las preocupaciones sobre la privacidad porque cuanto más se sabe sobre un prosumidor, más fácil es identificar el hogar. En comparación con los modelos basados en la física, los modelos basados en datos se basan únicamente en datos históricos de consumidores/prosumidores. El problema principal es que las tecnologías BTM residenciales con la automatización adecuada aún no se han adoptado a gran escala, en particular para baterías estacionarias y BEV. Por lo tanto, los modelos basados en datos no tienen suficientes datos de intervalo para sintetizar una amplia variedad de diferentes tipos de series temporales de prosumidores.

Para resolver el problema de disponibilidad de datos, primero construimos un conjunto de datos basado en datos de consumidores del mundo real como usuarios de referencia y lo agregamos con tres datos de intervalo RES diferentes considerando otra información de Dinamarca. Los tres RES considerados son: sistemas automatizados de almacenamiento de energía (ESS), sistemas solares fotovoltaicos de techo y BEV, ya que se espera que los BEV dominen el futuro mercado de vehículos3. De esta manera, creamos cinco prototipos de prosumidores y un prototipo de consumidores en aras de la exhaustividad. Para abordar la preocupación por la privacidad del uso de datos de consumidores del mundo real, reformateamos los datos de manera diaria y aplicamos sintetizadores de datos basados en la red generativa antagónica condicional (CTGAN) para generar datos sintéticos para cada prototipo. Este procedimiento puede proteger la privacidad de los consumidores del mundo real por tres razones. Primero, usamos datos de electricidad de consumidores reales para producir diferentes tipos de perfiles de electricidad de prosumidores, lo que significa que su consumo real se oculta mezclándolo con la serie temporal de RES. En segundo lugar, el generador de datos es un método de caja negra que no se puede aplicar ingeniería inversa y es difícil de desagregar. Además, el estilo de vida y la ocupación del usuario final no existen en el conjunto de datos porque el conjunto de datos contiene solo perfiles diarios bajo ciertas estaciones y temperaturas; por lo tanto, no hay conexión entre dos días consecutivos. En general, creamos un conjunto de datos sintéticos de 600 000 días de energía importada de la red y energía exportada a la red. El algoritmo desarrollado produce seis tipos de perfiles de consumo de los usuarios de electricidad considerando dos tipos de días (entre semana y otros días, que incluye festivos y fines de semana), cuatro estaciones y la temperatura ambiente. En particular, nos dirigimos a los prosumidores residenciales daneses porque nuestro socio industrial, Watts A/S, es de Dinamarca y proporcionó los datos de uso por hora de los consumidores tradicionales para nuestro proyecto13. Sin embargo, el sintetizador de datos propuesto es genérico y se puede utilizar para sintetizar datos para otras regiones y países dependiendo de la disponibilidad de datos e información requerida.

Varios factores hacen que este estudio y conjunto de datos sean significativos. En primer lugar, el conjunto de datos contiene el uso de electricidad importado (de la red) y exportado (a la red) por hora de usuarios residenciales individuales etiquetados por equipo BTM, tipo de día, temporada y temperatura diaria. Hasta donde sabemos, dicho conjunto de datos no está actualmente disponible para el público para investigación y desarrollo7,14. Además, el conjunto de datos se puede utilizar en diferentes aplicaciones, por ejemplo, planificación de sistemas, análisis de mercado y desarrollo de modelos comerciales, modelado de flexibilidad BTM, diseño de centros de energía comunitarios, diseño de microrredes y mercados locales, y evaluación de electrificación y su impacto en las emisiones de gases de efecto invernadero en el era de los prosumidores15,16. En segundo lugar, la calidad del conjunto de datos se valida de cuatro maneras, es decir, inspección cualitativa, estadísticas empíricas, métricas de evaluación basadas en aprendizaje automático (ML) y teoría de la información. Finalmente, el conjunto de datos sintéticos elude las preocupaciones de privacidad debido a las razones discutidas anteriormente.

Esta sección describe la metodología para generar el conjunto de datos sintéticos propuesto, incluido un flujo de trabajo general, modelado de consumo de BEV residencial, modelado de generación de PV residencial y modelado de ESS automatizado para sintetizar los datos. Finalmente, presentamos el CTGAN utilizado para la generación de datos sintéticos.

El diagrama de bloques en la Fig. 1 muestra el flujo de trabajo de nuestra metodología. En general, ocho fases están involucradas en la obtención del conjunto de datos sintético final. Estas fases incluyen la recopilación de datos, la generación de perfiles anuales de PV y EV, la determinación de prosumidores con ESS, la generación de perfiles de ESS, el resumen de los tipos de prosumidores, la división de datos, el etiquetado de datos y la generación de datos sintéticos. En la etapa de recopilación de datos, utilizamos datos de energía de 2000 consumidores daneses reales, incluidos datos de energía importados y exportados en resolución horaria para 2019, proporcionados por nuestro socio de la industria del proyecto. Estos perfiles sirven como carga base. Estos son hogares residenciales daneses que viven en el mismo vecindario bajo las mismas condiciones climáticas. Los datos sin procesar se recopilaron del DataHub17 del operador del sistema de transmisión (TSO) danés EnergiNet, con el consentimiento de los consumidores siguiendo las políticas de privacidad del socio de la industria18, el Reglamento general de protección de datos (GDPR)19 y la Ley danesa de protección de datos20. Los datos meteorológicos se recopilan de OpenWeather para el área específica21 y se reducen para que coincidan con la resolución de los datos de energía, es decir, la resolución por hora. Si bien la tasa de adopción de BEV ha aumentado exponencialmente en los últimos años22, no hay suficientes propietarios de BEV dispuestos a compartir sus datos para ayudar a construir un conjunto de datos creíble. Además, la mayoría de los propietarios actuales de BEV usan cargadores lentos en casa y su consumo de carga de BEV no se registra por separado. Por lo tanto, necesitamos un modelo sofisticado de datos de carga de BEV para generar datos para los propietarios de EV daneses en diferentes escenarios. Utilizamos una herramienta confiable y validada23 con muchas características y funcionalidades para simular en detalle la demanda de carga de los vehículos eléctricos en el sector residencial de Dinamarca. Para incorporar los hábitos de conducción daneses, recopilamos estadísticas de movilidad danesas sobre la cantidad de viajes por día, la distancia y la duración, las especificaciones de los BEV, como el tipo de motor, el tamaño de la batería, la transferencia de calor y otros factores externos, como la disponibilidad de la estación de carga y la potencia nominal del vehículo. cargadores de la Oficina de Estadísticas y cuota de mercado de BEV en Dinamarca24,25. Se presentan más detalles sobre los datos de carga de BEV en la sección 'Generador de perfil de EV'.

El proceso de generación de datos se rompe.

Tuvimos el mismo problema de disponibilidad de datos con los datos de generación fotovoltaica residencial. A finales de 2019, solo el 13 % de los hogares daneses poseían sistemas fotovoltaicos en tejados26. Además, la generación fotovoltaica no se mide por separado; solo están disponibles los datos de energía exportados. Por lo tanto, utilizamos un modelo de generación fotovoltaica que tiene en cuenta la información meteorológica local y los sesgos sistemáticos en el conjunto de datos satelitales basados en Meteosat. El proceso de síntesis de datos de generación fotovoltaica se explica en detalle en la sección 'Generador de perfiles fotovoltaicos'. Teniendo los perfiles EV y PV en la mano, una consideración adicional es si los prosumidores tienen una batería estacionaria en el hogar, lo que se hace en la etapa de determinación de prosumidores con ESS. Aquí, seleccionamos arbitrariamente a 300 prosumidores como usuarios de ESS debido a la falta de datos sobre el estado actual del almacenamiento de energía residencial en Dinamarca. Sin embargo, se pueden asumir diferentes niveles de penetración para ver el impacto en el perfil de energía importada/exportada de los prosumidores. Para los consumidores con una batería estacionaria en sus instalaciones, se desarrolla un sistema de automatización basado en reglas para producir los perfiles de carga/descarga de la batería según el consumo interno, la generación fotovoltaica y el consumo de BEV (si corresponde). El controlador basado en reglas para la operación de ESS residenciales es el enfoque más común en la industria hoy en día27. Explicamos la generación de datos ESS en la sección 'Generador de perfiles ESS'.

Con los tres modelos y los datos de los consumidores reales, construimos un conjunto de datos inicial que incluye cinco tipos de prosumidores con diferentes combinaciones de equipos BTM. A continuación, el conjunto de datos se divide en perfiles diarios con dos tipos de días, es decir, entre semana y otros días, incluidos festivos y fines de semana. Como se muestra en el diagrama de la Fig. 1, etiquetamos los datos generados según los dos tipos de días (laborables u otros), la temperatura media del día, la desviación estándar de la temperatura diaria y las cuatro estaciones para generar un resumen sintético. conjunto de datos con 12 CTGAN en función de sus tipos de usuario. Se proporcionan más detalles en 'Modelo generativo de datos sintéticos'.

Los perfiles de uso de electricidad varían significativamente de una región a otra por muchas razones socioeconómicas, culturales y técnicas. Si bien utilizamos el marco propuesto para sintetizar los datos de los consumidores y prosumidores residenciales daneses en este estudio, el marco propuesto se puede aplicar para sintetizar los datos de los consumidores y prosumidores en cualquier región al personalizar los parámetros de entrada.

La actividad de carga de BEV se simula con el emobpy23 en PYTHON. emobpy es una herramienta de código abierto que permite generar perfiles de carga de BEV a partir de estadísticas empíricas de movilidad y propiedades físicas de los vehículos. Modela la movilidad de conducción de los BEV individuales, el consumo de electricidad, la disponibilidad de la red y la energía importada de la red para un hogar utilizando cuatro modelos secuenciales. Específicamente, el modelo de movilidad de vehículos utiliza un enfoque de muestreo para generar rutinas de viaje plausibles para cada día del período de cálculo basado en distribuciones de probabilidad empíricas. El resultado de este modelo es una lista de viajes ordenada cronológicamente, representada por bordes que conectan las ubicaciones de origen y destino con la hora de salida, la distancia recorrida y la duración del viaje. El modelo de consumo de electricidad estima una serie temporal de consumo de electricidad de los BEV durante la conducción. Formula los requisitos de potencia para la tracción, la calefacción y la refrigeración del vehículo considerando la serie temporal de movilidad del vehículo generada por el modelo de movilidad del vehículo, el tipo de vehículo, la velocidad y el terreno. El modelo de disponibilidad de la red tiene en cuenta el consumo de electricidad impulsor y la disponibilidad de la infraestructura de carga para determinar la serie temporal de disponibilidad de la red, que representa el porcentaje de tiempo en el que es posible cargar los BEV en un área determinada. Por último, la energía importada del modelo de red genera una serie temporal de demanda de electricidad de la red para cargar los BEV en función de la serie temporal de consumo de electricidad impulsora y la disponibilidad de la red generada por los modelos anteriores.

Para reutilizar la herramienta para nuestra aplicación, integramos los cuatro modelos presentados en emobpy en un modelo y configuraciones personalizadas para construir un nuevo modelo que toma las propiedades físicas de BEV y las condiciones climáticas como entradas y extrae el perfil de carga de BEV residencial como salida. Los parámetros de entrada, que se muestran en la Fig. 1, se recopilan en función de las estadísticas de participación en el mercado de BEV en Dinamarca25 y los datos de empleo de Estadísticas de Dinamarca24. Considerando la cantidad total de datos y excluyendo los casos de falla, generamos 743 perfiles de carga residencial de usuarios de BEV durante un año, incluidos diferentes estados de empleo, es decir, usuarios de BEV de tiempo completo, tiempo parcial y tiempo libre y diferentes marcas de BEV. en base a las estadísticas anteriores. Por lo tanto, producimos 538 usuarios de tiempo completo, 178 usuarios de medio tiempo y 30 perfiles de carga de BEV de usuarios de tiempo libre que se utilizarán más adelante para sintetizar muchos más usuarios de BEV. Para simplificar y debido a que no involucramos EV híbridos en el estudio, etiquetamos a los usuarios de BEV como usuarios de EV en el conjunto de datos a continuación. Además, no consideramos la operación de vehículo a red en este documento.

Utilizamos ninja solar para generar perfiles fotovoltaicos. La herramienta utiliza el modelo estimador de energía solar global (GSEE) para representar el comportamiento de los sistemas solares en los techos junto con los reanálisis meteorológicos globales y el conjunto de datos del satélite CM-SAF SARAH basado en Meteosat para producir perfiles de generación fotovoltaica por hora28. Para ser más específicos, la herramienta utiliza modelos matemáticos para estimar la potencia de salida de los paneles fotovoltaicos mediante el cálculo de la irradiancia solar en el plano del fotovoltaico, así como la contabilización de las pérdidas del inversor y del sistema causadas por las curvas de eficiencia del panel que dependen de la temperatura. Por lo tanto, el modelo es determinista y requiere entradas de irradiancia difusa, irradiancia directa, temperatura, latitud, longitud, pérdida del sistema, inclinación, capacidad nominal de los paneles, ángulo del panel y orientación del panel. El modelo GSEE ha sido validado en varios países europeos en varios estudios de investigación, por ejemplo,29,30,31. Para aprovechar las capacidades de esta herramienta en nuestro estudio, a excepción de los parámetros meteorológicos y geográficos, se obtienen otros parámetros de entrada (p. ej., capacidad fotovoltaica, pérdidas e inclinación) de la plataforma de salida fotovoltaica32, que es una plataforma pública de intercambio de datos de generación fotovoltaica residencial. . Además, utilizamos hojas de datos del TSO danés para extraer parámetros típicos, como la capacidad fotovoltaica, la inclinación y la pérdida del sistema, para pequeños sistemas fotovoltaicos residenciales en Dinamarca33. Con estas entradas, se construyen modelos representativos para sintetizar datos de generación fotovoltaica para su uso posterior en este estudio.

La mayor parte de la investigación sobre tecnologías de almacenamiento de energía en Dinamarca se divide en dos tipos: soluciones centralizadas y almacenamiento a nivel residencial, mientras que los estudios son generalmente de un nivel agregado, ya que los usuarios con ESS tienden a modelarse como un grupo34,35,36,37. En nuestro conjunto de datos propuesto, asumimos que el ESS es propiedad de usuarios residenciales y opera usando un controlador simple basado en reglas (una práctica común en la industria llamada método de operación ingenua)27. El estudio muestra que el método de operación ingenua tiene un rendimiento comparable al de los complicados modelos de optimización estocástica en la mayoría de los casos27. Para simular el funcionamiento del ESS, se requieren dos parámetros, a saber, la capacidad de carga (almacenamiento máximo de energía utilizable Smax) y el límite de potencia de carga/descarga Pmax. Estos dos parámetros se generan utilizando la distribución de probabilidad de diferentes marcas de ESS en función de su cuota de mercado de nuestro socio industrial13 y las especificaciones de ESS en38,39. El controlador de batería basado en reglas funciona de la siguiente manera, suponiendo que el estado de carga (SoC) en el momento t es St:

Cuando la demanda neta es positiva, es decir, la generación es mayor que la demanda (p. ej., t>Ed, t), la potencia de carga de la batería, por lo tanto, la energía horaria, será \({\rm{\min }}\left({E }_{{\rm{g}},t}-{E}_{{\rm{d}},t},{P}_{{\rm{\max }}},{S}_{ {\rm{\max }}}-{S}_{t}\right)\), donde la energía importada es cero, y la energía exportada será:

Cuando la demanda neta es negativa, es decir, la generación es menor o igual a la demanda (Eg,t > Ed,t), la energía exportada será nula. Por lo tanto, la potencia de descarga de la batería es igual a \({\rm{\min }}\left({E}_{{\rm{d}},t}-{E}_{{\rm{g}} ,t},{P}_{{\rm{\max }}},{S}_{t}\right)\), y la energía importada será:

Usando el método de operación simple descrito anteriormente, la batería se cargará cuando haya generación fotovoltaica en exceso disponible. La batería se descargaría para minimizar la energía importada de la red cuando la demanda de electricidad de los hogares sea mayor que la generación fotovoltaica.

Con los generadores de perfiles EV, PV y ESS, creamos un conjunto de datos que incluye cinco tipos de prosumidores y un tipo de consumidor. Para abordar la preocupación por la privacidad que se analiza en "Antecedentes y resumen", dividimos la serie temporal de cada usuario en días separados, los agrupamos en perfiles diarios y luego los usamos como entradas para generar un conjunto de datos sintético. Otros parámetros de entrada son la mediana diaria y la desviación estándar de la temperatura como variables continuas, además de que la estación es una variable categórica. En resumen, los parámetros son los siguientes:

tipo de los dias

Días laborables (252 días): Todos los días laborables excepto festivos.

Resto de días (113 días): Festivos y fines de semana.

Principales equipos BTM

fotovoltaica

PV y ESS

PV y VE

PV y EV y ESS

consumidores convencionales

Temperatura

Temperatura media diaria

Desviación estándar diaria de la temperatura

Estaciones (primavera, verano, otoño e invierno)

Existen muchas técnicas para sintetizar series temporales, incluidos modelos basados en cópula40,41, modelos basados en flujo42, modelos de difusión43,44 y modelos GAN45,46,47. Aunque los modelos de difusión funcionan mejor en la generación de imágenes sintéticas, los modelos basados en GAN son los preferidos para sintetizar series temporales debido a su capacidad para generalizar y producir una variedad de datos de alta fidelidad48,49,50. En este artículo, usamos el modelo CTGAN, que contiene un GAN condicional y dos técnicas para generar datos sintéticos a partir de datos reales tabulados. Más específicamente, CTGAN aplica una técnica de entrenamiento por muestreo para columnas categóricas y utiliza un modelo de mezcla gaussiana variacional (VGM) en lugar de un GMM (modelo de mezcla gaussiana) para columnas numéricas para modelar con precisión distribuciones complicadas. En este estudio, tenemos 12 tipos de prosumidores/consumidores (según el equipo BTM y el tipo de día mencionado anteriormente); por lo tanto, 12 CTGAN, como se muestra en la Fig. 1. Luego, los 12 modelos CTGAN se entrenan en función de cada tipo de usuario de datos. Con esos 12 tipos de modelos de usuario, generamos un conjunto de datos sintéticos equilibrado. La relación de distribución de usuarios entre los conjuntos de datos reales y sintéticos se muestra en la Fig. 4. Los hiperparámetros de los CTGAN son idénticos en los 12 modelos y se establecen como se muestra en la Tabla 1.

Usando el marco discutido en la Fig. 1, se generó el conjunto de datos sintético final. El conjunto de datos se pone a disposición del público en Figshare51 en dos formatos, a saber, un archivo pickle con la misma estructura que en la Fig. 2 para uso exclusivo en PYTHON, y un archivo XLSX para usuarios que no están familiarizados con herramientas informáticas51. Específicamente, el archivo pickle es un objeto anidado que contiene seis tipos de usuarios por su equipo principal, a saber, usuarios de PV, usuarios de PV y ESS, usuarios de PV y EV, usuarios de PV y EV y ESS, usuarios de EV y consumidores convencionales, respectivamente. Cada tipo de usuario tiene dos tipos de días, es decir, laborables y otros días, que incluyen energía importada y exportada, temperatura promedio diaria, desviación estándar de temperatura diaria y temporada. Por otro lado, el archivo XLSX presenta seis tipos de energía importada y exportada de los usuarios en dos tipos de días, cada uno con su propia hoja de cálculo formateada. En particular, hay 20 hojas de cálculo/pestañas en total, ya que los usuarios de EV y los consumidores convencionales no tienen generación renovable, por lo tanto, no exportan energía. Las columnas de cada hoja de cálculo son las marcas de tiempo de 24 horas en un día, es decir, 0–23, la temperatura media, la desviación estándar de la temperatura y la estación del día. En el repositorio en línea51, también explicamos cómo convertir la hoja de trabajo XLSX en un archivo CSV para la comodidad de los usuarios que utilizan herramientas informáticas distintas a las de PYTHON.

Estructura del conjunto de datos propuesto.

El repositorio público contiene los archivos como se muestra en la Fig. 3, donde la carpeta de datos contiene el conjunto de datos propuesto en dos formatos, incluidos pickle y XLSX51. La carpeta Recursos contiene códigos en PYTHON para conversión y análisis de datos. La carpeta de resultados incluye los resultados visualizados generados al ejecutar el código de análisis de parcelas 'generate_plots_analysis.py' en la carpeta de Recursos. El archivo de requisitos describe las dependencias utilizadas en este proyecto51.

Estructura de archivos del conjunto de datos.

Distribuciones de tipo de usuario (donut interno: datos reales, donut externo: datos sintéticos).

Validamos la calidad de los datos sintéticos mediante inspección cualitativa y tres análisis numéricos: estadísticas empíricas, métricas basadas en la teoría de la información y métricas de evaluación basadas en ML52. Como se discutió en 'Antecedentes y resumen', no existe un conjunto de datos de prosumidores reales a gran escala etiquetados. Por lo tanto, tomamos el conjunto de datos semilla de entrada para el modelo generativo de datos sintéticos como el conjunto de datos real para fines de validación. Discutimos cada método de validación respectivamente en las cuatro subsecciones a continuación.

Comparamos el consumo estacional promedio de los consumidores convencionales entre semana en la Fig. 5. Este perfil promedio se estudia y se compara con las características reales del consumo de electricidad residencial danés a nivel agregado11,53. La forma general del perfil y la hora pico de electricidad importada a las 7 pm son similares. Además de los perfiles de consumidores promedio, comparamos los patrones diarios más frecuentes para cada tipo de prosumidor, denominados Motivos Refinados (RM), entre los conjuntos de datos reales y sintéticos4. Los resultados se muestran en la Fig. 6 para diferentes tipos de prosumidores y días. Los RM para datos sintéticos y datos reales comparten amplitud y tendencia similares, lo que indica que el conjunto de datos sintético tiene formas similares al conjunto de datos real4.

Comparación del perfil de demanda estacional para consumidores convencionales.

Comparación de RM para datos reales y sintéticos (azul: datos sintéticos, naranja: datos reales).

En primer lugar, utilizamos diagramas de caja para comparar visualmente las estadísticas empíricas de los conjuntos de datos reales y sintéticos, incluido el grado de dispersión (propagación) y la asimetría de los dos conjuntos de datos, cuartiles 1 y 3, rango intercuartílico, media, mediana, mínimo, máximo y valores atípicos La primera comparación se realiza para los datos agregados, que se muestran en la Fig. 7 por separado para diferentes tipos de día y energía importada/exportada. En general, las estadísticas de datos sintéticos siguen los valores del conjunto de datos real. El conjunto de datos de energía importada del día laboral muestra los errores más altos para los usuarios de PV, EV y ESS, mientras que las estadísticas de los otros días son casi idénticas. También comparamos los diagramas de caja de energía importada y exportada por horas para cada tipo de usuario en los conjuntos de datos sintéticos y reales, que se muestran en la Fig. 8, donde los datos sintéticos siguen la tendencia general en cada figura. Para cuantificar la diferencia entre las distribuciones de datos reales y sintéticos, se calcula para cada intervalo la distancia de Wasserstein, una métrica de la distancia entre dos distribuciones de probabilidad54. Los valores más bajos de la distancia de Wasserstein indican una mayor similitud o superposición entre las distribuciones de datos reales y datos sintéticos. De los diagramas de caja en la Fig. 8, parece que el conjunto de datos sintéticos tiene un valor máximo más bajo que los datos reales para algunos tipos de usuarios, por ejemplo, usuarios de PV y EV y ESS y usuarios de PV y EV. Una razón podría ser la función de pérdida en CTGAN, evidencia de pérdida de límite inferior (ELBO), que omite los datos anormales del conjunto de datos real en el proceso de optimización. Desde la distancia de Wasserstein, los usuarios de PV, EV y ESS exhiben las mayores diferencias entre los conjuntos de datos sintéticos y reales entre todos los tipos de usuarios. Esta observación se ve respaldada por los diagramas de caja de datos diarios, que brindan información detallada sobre las diferencias de rango intercuartílico. Específicamente, los mayores desajustes para los usuarios de PV, EV y ESS tienden a ocurrir entre las 8 y las 11 a. m. para la electricidad exportada y entre las 7 y las 8 p. m. para la electricidad importada. Estos períodos de tiempo coinciden con una alta estocasticidad en los datos de generación y demanda de los prosumidores debido a la influencia de la generación fotovoltaica, la carga de vehículos eléctricos y la operación de ESS. En consecuencia, esta discrepancia conduce a mayores diferencias en las estadísticas empíricas de nivel agregado entre los conjuntos de datos sintéticos y reales.

Estadísticas diarias (azul: datos sintéticos, naranja: datos reales).

Estadísticas horarias en días laborables. (verde: distancia de Wasserstein entre datos sintéticos y reales. azul: diagrama de caja de datos sintéticos, naranja: diagrama de caja de datos reales).

La entropía de permutación (PE) es una conocida métrica de la teoría de la información de series temporales que cuantifica la complejidad de un sistema dinámico capturando las relaciones de orden entre los valores de una serie temporal y extrayendo una distribución de probabilidad de los patrones ordinales52. En un intento de superar algunas limitaciones, por ejemplo, la incapacidad de diferenciar entre patrones distintos y la insensibilidad a patrones cercanos al ruido de fondo, lo que lo hace inadecuado para aplicaciones como el análisis de datos de sistemas de potencia55, se propuso la entropía de permutación ponderada (WPE) como un medir con más robustez y estabilidad incorporando información de amplitud55,56.

Usamos la medida WPE para comparar la complejidad del conjunto de datos sintético con el conjunto de datos real para cada tipo de usuario. Los hiperparámetros WPE se configuran en el orden de 6 y retardo de τ = 1 en base a las recomendaciones de 57,58. En la Tabla 3 se presenta una comparación entre datos reales y sintéticos. En condiciones ideales, esperamos que ambos conjuntos de datos tengan una complejidad similar, es decir, valores WPE. En la tabla, podemos ver que el conjunto de datos sintéticos es más complejo que los datos reales, ya que el WPE para el conjunto de datos sintéticos es mayor. Sin embargo, la relación relativa entre los diferentes tipos de usuarios es consistente desde conjuntos de datos reales a sintéticos, donde el conjunto de datos sintético siempre es más complejo a pesar del tipo de usuario. Para demostrar la solidez de esta función, dividimos el conjunto de datos en 50 series temporales con datos de un año para conjuntos de datos reales y sintéticos. Luego, calculamos el WPE para cada serie temporal, que se muestra en la Fig. 10. Como era de esperar, el conjunto de datos sintético siempre muestra una mayor complejidad en diferentes tipos de usuarios, aunque los valores promedio de WPE están cerca entre los conjuntos de datos reales y sintéticos. Esto muestra que CTGAN generalmente sobreestima la complejidad del conjunto de datos real. Sin embargo, los tipos de usuario con mayor complejidad en el conjunto de datos sintetizados corresponden al mismo tipo en el conjunto de datos real, lo que significa que los modelos pueden capturar con éxito las características y la complejidad relativa de cada tipo de usuario.

El cuarto y último estudio comparativo utiliza modelos de clasificación ML para evaluar la similitud de características entre los dos conjuntos de datos. Más específicamente, usamos entrenar en sintético, probar en real (TSTR) y entrenar en real, probar en real (TRTR)59. TSTR evalúa el rendimiento de los datos sintéticos entrenando un modelo (clasificador) con datos sintéticos y probándolo con datos reales. De esta manera, un conjunto de datos sintéticos tiene alta calidad solo si el clasificador entrenado con datos sintéticos se desempeña cerca del clasificador entrenado con datos reales (TRTR). Aplicamos una red neuronal convolucional (CNN) 1D para clasificar cinco tipos de prosumidores, es decir, con los hiperparámetros informados en la Tabla 2.

Aplicando el mismo clasificador, intentamos determinar los tipos de prosumidores en los conjuntos de datos de la jornada laboral y de otros días. Los resultados de las cuatro combinaciones se presentan como matrices de confusión en la Fig. 9. Para la mayoría de los tipos de usuarios, el clasificador muestra resultados similares en TRTR y TSTR, lo que demuestra la existencia de características similares tanto en conjuntos de datos reales como sintéticos. Al comparar TSTR con TRTR en la Fig. 9, encontramos que la relación numérica general para los resultados predichos y la realidad básica son muy similares entre los datos reales y los datos sintéticos. La precisión, la precisión, la sensibilidad (recuperación) y la especificidad generales también se proporcionan en las Tablas 4 y 5. Encontramos una brecha del 10 % en la precisión entre los conjuntos de datos sintéticos y reales, lo que es aceptable para un conjunto de datos sintético, por ejemplo, consulte la Tabla 6 en60. Para la clasificación de días laborables en la Fig. 9, los usuarios de PV podrían identificarse erróneamente como EV, PV y ESS en comparación con TSTR. Una razón potencial podría ser los valores de complejidad similares de los dos tipos de usuarios en el conjunto de datos sintético en comparación con el conjunto de datos real, como se informa en la Tabla 3, lo que indica que sus frecuencias y amplitudes en las fluctuaciones son similares.

Matrices de confusión para los usuarios.

WPE para diferentes tipos de usuarios (50) de forma anual (azul: datos sintéticos, naranja: datos reales).

La primera limitación de nuestro conjunto de datos sintéticos es la resolución horaria, que es insuficiente para algunas aplicaciones, como la desagregación de energía y el análisis de la calidad de la energía. Además, la investigación muestra que el uso de datos horarios para la estimación del autoconsumo de los usuarios fotovoltaicos puede producir una sobreestimación de hasta un 9 % debido a la pérdida de información61. Sin embargo, el conjunto de datos sintéticos presentado se puede utilizar para muchos estudios, por ejemplo, respuesta a la demanda, flujo de poder inverso de los prosumidores, examen del impacto de diferentes tasas de adopción y gestión del lado de la demanda. Otra limitación es que la complejidad de los datos sintéticos tiende a sobreestimarse debido a la estructura de CTGAN, como discutimos en la sección Validación de datos. Por último, pero no menos importante, el conjunto de datos no tiene completamente en cuenta los hábitos de comportamiento de los prosumidores y los cambios a nivel de dispositivo a lo largo del tiempo, ya que el conjunto de datos inicial no tiene etiquetas para los dispositivos de cada usuario final. Una mejora potencial para incluir estocasticidad de comportamiento adicional asociada con la demanda de electricidad de los electrodomésticos es usar un modelo basado en la física de abajo hacia arriba, por ejemplo, la biblioteca StROBe, cuando los usuarios desean agregar ciertos electrodomésticos con conocimiento sobre las distribuciones de parámetros físicos detallados12. Sin embargo, esto producirá un conjunto de datos sintéticos con mayor complejidad más allá de los resultados informados en la sección "Métricas de la teoría de la información", lo cual no es deseable.

Los datos reales utilizados como entrada de CTGAN no están disponibles debido a las regulaciones sobre la privacidad de los consumidores18. Otros que deseen repetir el trabajo o realizar estudios con los datos sin procesar deben acercarse a Watts A/S13. El código para la validación y el análisis de datos está disponible en el repositorio público de Figshare51.

bp Revisión estadística de la energía mundial, https://www.bp.com/en/global/corporate/energy-economics/statistical-review-of-world-energy.html (2022).

Nalley, S. & Larose, A. Perspectivas energéticas internacionales 2021. Tecnología. Representante https://www.eia.gov/outlooks/ieo/pdf/IEO2021_ReleasePresentation.pdf (2021).

Wood Mackensiz. Los vehículos eléctricos a batería dominarán las ventas de vehículos para 2050, https://www.woodmac.com/press-releases/battery-electric-vehicles-to-dominate-vehicle-sales-by-2050/ (2021).

Yuan, R., Pourmousavi, SA, Soong, WL, Nguyen, G. & Liisberg, JA Irmac: motivos refinados interpretables en clasificación binaria para aplicaciones de redes inteligentes. Aplicaciones de ingeniería de inteligencia artificial 117, 11, https://doi.org/10.1016/j.engappai.2022.105588 (2023).

Artículo Google Académico

Shaw, M. et al. La prueba de almacenamiento de energía nextgen en el acto, australia. En Proceedings of the Tenth ACM International Conference on Future Energy Systems, e-Energy' 19, 439–442, https://doi.org/10.1145/3307772.3331017 (Association for Computing Machinery, Nueva York, NY, EE. UU., 2019).

Jim, M. & Russo, S. Informe anual de la calle Pecan FY 2020–2021. tecnología Representante, Pecan Street Inc. https://www.pecanstreet.org/wp-content/uploads/2022/06/Pecan-Street-Annual-Report-20-21.pdf (2021).

Kapoor, S., Sturmberg, B. & Shaw, M. Una revisión de conjuntos de datos de energía disponibles públicamente. tecnología Rep. 00120, Universidad Nacional de Australia, Canberra ACT 2601 Australia. https://arena.gov.au/projects/wattwatchers- (2021).

Li, H., Wang, Z. y Hong, T. Un conjunto de datos sintéticos de operaciones de construcción. Datos científicos 8, 1–13, https://doi.org/10.1038/s41597-021-00989-6 (2021).

Artículo ANUNCIOS Google Académico

Modelado de la demanda energética de los edificios: desde edificios individuales hasta escala urbana. En Eicker, U. (ed.) Urban Energy Systems for Low-Carbon Cities, 79–136, https://doi.org/10.1016/B978-0-12-811553-4.00003-2 (Academic Press, 2019).

Pereira, L., Costa, D. & Ribeiro, M. Un conjunto de datos residencial etiquetado para el análisis de datos de medidores inteligentes. Datos científicos 9, 1–11, https://doi.org/10.1038/s41597-022-01252-2 (2022).

Artículo Google Académico

Andersen, FM, Gunkel, PA, Jacobsen, HK y Kitzing, L. Consumo de electricidad residencial y características del hogar: un análisis econométrico de los datos de los medidores inteligentes daneses. Economía energética 100, 105341, https://doi.org/10.1016/j.eneco.2021.105341 (2021).

Artículo Google Académico

Baetens, R. & Saelens, D. Modelado de la incertidumbre en las simulaciones de energía del distrito mediante el comportamiento estocástico de los ocupantes residenciales. Journal of Building Performance Simulation 9, 431–447, https://doi.org/10.1080/19401493.2015.1070203 (2016).

Artículo Google Académico

Anders, SH, Jon, L. & Julian, LV Watts A/S, ¿marcaremos la diferencia juntos?, https://watts.dk/ (2021).

Li, H. et al. Indicadores clave de desempeño basados en datos y conjuntos de datos para construir flexibilidad energética: una revisión y perspectivas https://doi.org/10.48550/ARXIV.2211.12252 (2022).

Artículo Google Académico

Qiu, Y. & Kahn, ME Mejor evaluación de la sostenibilidad de los edificios ecológicos con datos de alta frecuencia. Naturaleza Sustentabilidad 1, 642–649, https://doi.org/10.1038/s41893-018-0169-y (2018).

Artículo Google Académico

Consulting, NE Valoración de la flexibilidad de carga en el NEM preparado para la agencia australiana de energías renovables. tecnología Rep. febrero, Agencia Australiana de Energía Renovable. https://arena.gov.au/assets/2022/02/valuing-load-flexibility-in-the-nem.pdf (2022).

La red de energía. ¿Qué es DATAHUB?, https://en.energinet.dk/energy-data/datahub/ (2019).

vatios. Política de datos personales de Watts, https://watts.dk/en/persondata/ (2022).

Parlamento Europeo y el Consejo de la Unión Europea. Reglamento europeo de protección de datos, https://gdpr-info.eu/ (2018).

El parlamento danés. Ley que complementa la regulación sobre la protección de las personas con respecto al procesamiento de datos personales y sobre la libre circulación de dichos datos (ley de protección de datos), https://www.retsinformation.dk/eli/lta/2018/502 (2018 ).

Tiempo Abierto. OpenWeather: Previsiones meteorológicas, nowcasts e historial de forma rápida y elegante, https://openweathermap.org/ (2019).

TCP, H. Adopción de vehículos eléctricos en Dinamarca por año, https://ieahev.org/countries/Denmark/ (2019).

Gaete-Morales, C., Kramer, H., Schill, WP & Zerrahn, A. Una herramienta abierta para crear series temporales de vehículos eléctricos a batería a partir de datos empíricos, emobpy. Datos científicos 8, 1–18, https://doi.org/10.1038/s41597-021-00932-9 (2021).

Artículo Google Académico

Estadísticas de Dinamarca. Trabajo e ingresos, https://www.dst.dk/en/Statistik/emner/arbejde-og-indkomst.

Hall, D., Wappelhorst, S., Mock, P. & Lutsey, N. Libro de datos europeo sobre vehículos eléctricos 2019/2020. El Consejo Internacional sobre Transporte Limpio 19, https://theicct.org/sites/default/files/publications/EV-EU-Factbook-2020.pdf (2020).

Jaganmohan, M. Proporción de hogares con fuentes de energía verde en Dinamarca 2019, https://www.statista.com/statistics/1088463/share-of-households-with-green-energy-sources-in-denmark (2019).

Lemos-Vinasco, J., Schledorn, A., Pourmousavi, SA & Guericke, D. Evaluación económica de los sistemas estocásticos de gestión de la energía doméstica en un entorno de horizonte móvil realista https://doi.org/10.48550/ARXIV.2203.08639 (2022) .

Artículo Google Académico

Pfenninger, S. & Staffell, I. Patrones a largo plazo de la producción fotovoltaica europea utilizando 30 años de reanálisis por hora validado y datos satelitales. Energía 114, 1251–1265, https://doi.org/10.1016/j.energy.2016.08.060 (2016).

Artículo Google Académico

Grams, CM, Beerli, R., Pfenninger, S., Staffell, I. y Wernli, H. Equilibrar la producción de energía eólica de Europa a través del despliegue espacial informado por los regímenes meteorológicos. Nature climate change 7, 557–562, https://doi.org/10.1038/nclimate3338 (2017).

Artículo PubMed PubMed Central Google Académico

Zeyringer, M., Price, J., Fais, B., Li, P.-H. & Sharp, E. Diseño de sistemas de energía con bajas emisiones de carbono para Gran Bretaña en 2050 que sean resistentes a la variabilidad espaciotemporal e interanual del clima. Nature Energy 3, 395–403, https://doi.org/10.1038/s41560-018-0128-x (2018).

Artículo ADS CAS Google Académico

Brown, T., Schlachtberger, D., Kies, A., Schramm, S. y Greiner, M. Sinergias del acoplamiento sectorial y refuerzo de la transmisión en un sistema energético europeo altamente renovable y de costo optimizado. Energía 160, 720–739, https://doi.org/10.1016/j.energy.2018.06.222 (2018).

Artículo Google Académico

PVOutput: un servicio gratuito para compartir y comparar datos de salida de PV, https://pvoutput.org/about.html (2022).

La Agencia Danesa de Energía y Energinet. Datos tecnológicos - Generación de electricidad y calefacción urbana. tecnología Rep. https://ens.dk/en/our-services/projections-and-models/technology-data/technology-data-generation-electricity-and (2016).

Sorknæs, P., Mæng, H., Weiss, T. & Andersen, AN Descripción general del estado actual y escenarios de desarrollo futuro del sistema eléctrico en Dinamarca: permitir la integración de grandes cantidades de energía eólica. https://www.store-project.eu/documents/target-country-results/en_GB/energy-storage-needs-in-denmark (2013).

Pedersen, AS et al. Estado y recomendaciones para RD & D sobre tecnologías de almacenamiento de energía en un contexto danés. tecnología Rep. Febrero, Energinet. http://energinet.dk/SiteCollectionDocuments/Danskedokumenter/Forskning-PSO-projekter/RDD Energy storage_ex app.pdf (2014).

Análisis de energía de EA. El valor del almacenamiento de electricidad: una perspectiva sobre los servicios y las oportunidades de mercado en los mercados de electricidad daneses e internacionales. tecnología Rep., Energinet. https://en.energinet.dk/Analysis-and-Research/Analyses/The-value-of-electricity-storage/ (2020).

Dinh, NT et al. Dimensionamiento y programación óptimos del almacenamiento comunitario de baterías dentro de un mercado local. En Proceedings of the Thirteenth ACM International Conference on Future Energy Systems, e-Energy' 22, 34–46, https://doi.org/10.1145/3538637.3538837 (Association for Computing Machinery, Nueva York, NY, EE. UU., 2022).

Langby, C. Almacenamiento de baterías en el hogar, https://mozo.com.au/energy/guides/home-battery-storage (2021).

Energy, V. Manual de instalación y diseño de ESS. tecnología Rep., energía de Victron. https://www.solar-electric.com/lib/wind-sun/VE-ESS_design_and_installation_manual.pdf (2018).

Abraj, M., Wang, YG & Thompson, MH OPEN Un nuevo modelo de cópula de mezcla para múltiples variables espacialmente correlacionadas con una aplicación ambiental. Informes científicos 1–10, https://doi.org/10.1038/s41598-022-18007-z (2022).

Lemos-Vinasco, J., Bacher, P. & Møller, JK Pronóstico probabilístico de carga considerando la correlación temporal: Modelos en línea para la predicción de la carga eléctrica de los hogares. Energía Aplicada 303, 117594, https://doi.org/10.1016/j.apenergy.2021.117594 (2021).

Artículo Google Académico

Rezende, DJ & Mohamed, S. Inferencia variacional con flujos de normalización. 32.ª Conferencia internacional sobre aprendizaje automático, ICML 2015 2, 1530–1538 (2015).

Google Académico

Tashiro, Y., Song, J., Song, Y. & Ermon, S. Csdi: Modelos de difusión basados en puntuaciones condicionales para la imputación de series temporales probabilísticas. Avances en sistemas de procesamiento de información neuronal 34, 24804–24816, https://arxiv.org/abs/2107.03502 (2021).

Dhariwal, P. y Nichol, A. Los modelos de difusión superan a las GAN en la síntesis de imágenes. Avances en sistemas de procesamiento de información neuronal 34, 8780–8794, https://doi.org/10.48550/arXiv.2105.05233 (2021).

Artículo Google Académico

Alzantot, M., Chakraborty, S. & Srivastava, M. SenseGen: Una arquitectura de aprendizaje profundo para la generación de datos de sensores sintéticos. Conferencia internacional IEEE de 2017 sobre talleres de comunicación y computación generalizada, Talleres PerCom 2017 188–193, https://doi.org/10.1109/PERCOMW.2017.7917555 (2017).

Patki, N., Wedge, R. & Veeramachaneni, K. GaussianCopula - La bóveda de datos sintéticos SDV. Actas: 3ra Conferencia internacional IEEE sobre ciencia de datos y análisis avanzado, DSAA 2016 399–410 (2016).

Asre, S. & Anwar, A. Generación de datos de energía sintética utilizando una red antagónica generativa variante en el tiempo. Electrónica (Suiza) 11, https://doi.org/10.3390/electronics11030355 (2022).

Yoon, J. & Jarrett, D. Redes antagónicas generativas de series temporales. 33.ª Conferencia sobre sistemas de procesamiento de información neuronal (NeurIPS 2019) 1–11 (2019).

Yu, L., Zhang, W., Wang, J. & Yu, Y. SeqGAN: Secuencia de redes antagónicas generativas con gradiente de políticas. 31.ª Conferencia AAAI sobre Inteligencia Artificial, AAAI 2017 2852–2858 (2017).

Ping, H., Stoyanovich, J. & Howe, B. DataSynthesizer: conjuntos de datos sintéticos que preservan la privacidad. ACM International Conference Proceeding Series Part F1286, https://doi.org/10.1145/3085504.3091117 (2017).

Yuan, R. et al. Un conjunto de datos sintéticos de prosumidores de electricidad residencial daneses, figshare, https://doi.org/10.6084/m9.figshare.c.6383862.v1 (2023).

Bandt, C. & Pompe, B. Entropía de permutación: una medida de complejidad natural para series temporales. Physical Review Letters 88, 4, https://doi.org/10.1103/PhysRevLett.88.174102 (2002).

Artículo CAS Google Académico

Andersen, FM, Baldini, M., Hansen, LG y Jensen, CL Consumo de electricidad por hora y demanda pico de los hogares en Dinamarca. Energía aplicada 208, 607–619, https://doi.org/10.1016/j.apenergy.2017.09.094 (2017).

Artículo Google Académico

Panaretos, VM & Zemel, Y. Aspectos estadísticos de las distancias de wasserstein. Revisión anual de estadísticas y su aplicación 6, 405–431 (2019).

Artículo ADS MathSciNet Google Scholar

Fadlallah, B., Chen, B., Keil, A. y Príncipe, J. Entropía de permutación ponderada: una medida de complejidad para series temporales que incorporan información de amplitud. Revisión física E - Física estadística, no lineal y de materia blanda 87, 1–7, https://doi.org/10.1103/PhysRevE.87.022911 (2013).

Artículo CAS Google Académico

Vuong, PL, Malik, AS & Bornot, J. Entropía de permutación ponderada como medida de complejidad para series de tiempo electroencefalográficas de diferentes estados fisiológicos. IECBES 2014, Actas de la conferencia - Conferencia IEEE de 2014 sobre ingeniería y ciencias biomédicas: "Miri, donde se encuentran la ingeniería en medicina, la biología y la humanidad" 979–984, https://doi.org/10.1109/IECBES.2014.7047658 (2014).

Yin, Y. & Shang, P. Entropía de permutación ponderada basada en diferentes enfoques simbólicos para series temporales financieras. Physica A: Mecánica estadística y sus aplicaciones 443, 137–148, https://doi.org/10.1016/j.physa.2015.09.067 (2016).

Artículo ANUNCIOS Google Académico

Niu, H., Wang, J. y Liu, C. Análisis de los mercados de petróleo crudo con entropía de permutación ponderada multiescala mejorada. Physica A: Mecánica estadística y sus aplicaciones 494, 389–402, https://doi.org/10.1016/j.physa.2017.12.049 (2018).

Artículo ANUNCIOS Google Académico

Hartmann, KG, Schirrmeister, RT & Ball, T. Eeg-gan: Redes antagónicas generativas para señales cerebrales electroencefalográficas (eeg). Preimpresión de arXiv https://doi.org/10.48550/arXiv.1806.01875 (2018).

Artículo Google Académico

Cheon, MJ et al. ¿CTGAN VS TGAN? Cuál es más adecuado para generar datos EEG sintéticos. Revista de tecnología de la información teórica y aplicada 99, 2359–2372 (2021).

Google Académico

Ayala-Gilardón, A., Sidrach-de Cardona, M. & Mora-López, L. Influencia de la resolución temporal en la estimación del autoconsumo y autoabastecimiento de instalaciones fotovoltaicas. Energía aplicada 229, 990–997, https://doi.org/10.1016/j.apenergy.2018.08.072 (2018).

Artículo Google Académico

Descargar referencias

Este proyecto está financiado conjuntamente por el esquema de becas de doctorado de la industria de la Universidad de Adelaida y Watts A/S, Dinamarca, que proporciona datos de consumidores convencionales como fuente de datos de entrada.

Escuela de Ingeniería Eléctrica y Mecánica, Universidad de Adelaide, Adelaide, Australia

Rui Yuan, S. Ali Pourmousavi y Wen L. Soong

Facultad de Informática y Ciencias Matemáticas, Universidad de Adelaide, Adelaide, Australia

Andrés J. Negro

Watts A/S, Køge, Dinamarca

Jon AR Liisberg y Julián Lemos-Vinasco

También puede buscar este autor en PubMed Google Scholar

AP y RY concibieron los experimentos, RY realizó los experimentos, JR y JL proporcionaron y validaron los datos, RY, AP, WS y AB analizaron los resultados. Todos los autores revisaron el manuscrito.

Correspondencia a Rui Yuan.

Los autores declaran no tener conflictos de intereses.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Yuan, R., Pourmousavi, SA, Soong, WL et al. Un conjunto de datos sintéticos de prosumidores de electricidad residencial daneses. Datos científicos 10, 371 (2023). https://doi.org/10.1038/s41597-023-02271-3

Descargar cita

Recibido: 13 enero 2023

Aceptado: 26 de mayo de 2023

Publicado: 08 junio 2023

DOI: https://doi.org/10.1038/s41597-023-02271-3

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt