Thursday, 2 November 2017

Agregación Media Móvil


Hace un tiempo escribí sobre el cálculo del promedio móvil de datos en vivo mediante el método Buffer () en Reactive Extensions. El método crea un búfer de actualizaciones cuyo límite, como el desarrollador especifica, le proporciona este búfer de ejecución con cada actualización posterior. La actualización 8216current8217 sería la última en el búfer, lo que le permite calcular el promedio móvil inclusivo, uno donde el último factor se incluye en los resultados. Recientemente, tuve que hacer algo similar con datos estáticos en una aplicación que no estaba usando RX, bud tenía un proveedor de datos LINQ bien definido. Para mi sorpresa, encontré que LINQ no proporciona un método de buffering de la caja. Para mi mayor sorpresa, encontré que era fácil implementar uno. El código está abajo. No quería asumir que sólo realizaríamos agregaciones promedio, por lo tanto, mantuve mi solución bastante genérica. Correspondería al usuario de mi función codificar la lógica de agregación. En este post, me gustaría demostrar agregaciones promedio, pero el usuario de esta función sería capaz de hacer cualquier cosa con un conjunto dado de elementos. En primer lugar, let8217s define una estructura de datos, denominada Agregación que se utilizaría para ajustar el original y añadir una nueva propiedad AggregatedValue (línea 16) que se rellenaría durante el proceso de agregación. Luego defino una muestra TimedDataPoint que se utilizaría para mantener los precios de las acciones en mi ejemplo. Finalmente, let8217s define una función LINQ que almacenaría un conjunto de elementos en el conjunto original y devolvería un conjunto modificado con menos elementos, donde cada elemento contendría un valor de agregación para el conjunto de búferes. Para reclamar el éxito, necesito probar la función. Para jugar con los números reales, let8217s obtener la historia de la semana MSFT stock devuelve de yahoo. Let8217s exportar estos datos para sobresalir y crear un conjunto de promedios móviles de Close price para probar nuestros datos. Here8217s lo que debería ser la hoja de cálculo: Podemos crear un dataset de muestra para representar los precios de cierre originales. Podemos entonces probar nuestra función mi crear un cálculo del promedio móvil en el conjunto de datos. El código está abajo. En primer lugar, crear el dataaset, luego iterar a través del conjunto de datos, canalización de los datos en mi función de agregador, que a su vez me llama de nuevo y me pide que tome dos decisiones importantes: 1. ¿Debe continuar el almacenamiento en búfer (líneas 60 y 71) (La línea 61 en el primer ejemplo y las líneas 74-82 en la segunda) La salida de la muestra debe coincidir con la columna de 6 días promedio en la hoja de cálculo adjunta. He encontrado esta función de agregador muy útil. Espero que también lo sea. Una agregación para calcular el promedio móvil en una agregación de histograma 10002 Esta agregación calculará el promedio móvil de métricas de hermanos en datos de histograma-estilo (histograma, datehistogram). Los promedios móviles son útiles cuando los datos de series de tiempo son estacionarios y tienen una media que cambia lentamente con el tiempo. Los datos estacionales pueden necesitar un análisis diferente, así como datos bimodales, ráfagas o que contengan valores extremos frecuentes (que no son necesariamente valores atípicos). La agregación de movavg admite varias opciones configurables: Tamaño de ventana El usuario especifica el tamaño de ventana que desea calcular un promedio móvil. P. ej. Un usuario puede querer una ventana deslizante de 30 días sobre un histograma de 90 días en total. Actualmente, si no hay suficientes datos para llenar la ventana, el promedio móvil se calculará con lo que esté disponible. Por ejemplo, si un usuario selecciona una ventana de 30 días, los días del 1 al 29 calcularán el promedio móvil con entre 1 y 29 días de datos. Podríamos investigar la adición de más políticas de borde, que determinan cómo manejar las lagunas en el borde de la media móvil Tipo de ponderación Actualmente, el agg soporta cuatro tipos de ponderación: simple. Un promedio simple (aritmético). Defecto. lineal. Un promedio linealmente ponderado, tal que los datos se vuelven linealmente menos importantes a medida que envejece en la ventana singleexp. Un solo promedio exponencialmente ponderado (también conocido como EWMA o Browns Simple Exp Smoothing), de forma que los datos se vuelven exponencialmente menos importantes a medida que envejece. Dobleexp. Doble promedio exponencialmente ponderado (también conocido como Holt-Winters). Utiliza dos términos exponenciales: los primeros datos lisos exponencialmente como singleexp. Pero luego aplicar un segundo suavizado correctivo para tener en cuenta una tendencia. Todo: Expose alfa y beta Alfa y beta son parámetros que controlan el comportamiento de singleexp y doubleexp. Alfa: controla hasta qué punto el término de suavizado exponencial individual está a la zaga de los puntos de inflexión en la media por períodos de 1 / alfa. Alfa 1 significa que el término de suavizado no tiene memoria (período de 1) y emula un paseo al azar. Alfa 0 significa que el término de suavizado tiene memoria infinita e informa la media de los datos Beta: Sólo se utiliza en doubleexp. Análogo a alfa, pero aplicado al alisamiento de tendencia en lugar del alisado de datos. Todo: Investigar la ponderación métrica Es a veces útil para ponderar un período de tiempo no por su distancia de la hora actual, sino más bien por alguna métrica que sucedió en ese intervalo de tiempo. P. ej. Peso por el volumen de transacciones que ocurrieron ese día. Debe ser posible ponderar basado en métricas dentro del cubo, aunque podría ser complicado si falta el valor. Muestra de Solicitud Esto calculará una media móvil (ventana deslizante de tres días) sobre la suma de los precios en cada día: Ejemplo de respuestaEntender los conceptos de previsión de series de tiempo Comprender los conceptos clave en la predicción de series de tiempo y familiarizarse con algunos de los detalles subyacentes le dará Una ventaja en el uso de las capacidades de previsión en SQL Server Analysis Services (SSAS). En este artículo, Tyler Chessman explica los conceptos clave necesarios para comprender cómo funcionan las tecnologías de minería de datos. Además, introduce algunos detalles subyacentes para que no parezcan tan extraños y formidables la primera vez que los encuentres. De vez en cuando, los profesionales de SQL Server deben proporcionar estimaciones de valores futuros, como proyecciones de ingresos o previsiones de ventas. Las organizaciones a veces confían en la tecnología de minería de datos para construir modelos de predicción para proporcionar tales estimaciones. Explicaré los conceptos clave necesarios para comprender cómo funcionan estas tecnologías de minería de datos. También te presentaré algunos de los detalles subyacentes para que no parezcan tan extraños y formidables la primera vez que los encuentres. Con una comprensión de los conceptos clave y la exposición a algunos de los detalles, estará en una mejor posición para empezar a utilizar las capacidades de previsión en SQL Server Analysis Services (SSAS). Por qué la minería de datos no es más popular En la última década, una vez que las tecnologías de inteligencia empresarial (BI) de nicho, como OLAP, se han adoptado ampliamente. Durante ese tiempo, Microsoft también ha impulsado otra tecnología de BI, la minería de datos, en herramientas populares como Microsoft SQL Server y Microsoft Excel, pero la minería de datos aún no se ha convertido en una tecnología convencional. ¿Por qué? Aunque la mayoría de las personas pueden captar conceptos básicos de minería de datos incluso sin capacitación formal, los detalles subyacentes de los algoritmos están llenos de conceptos matemáticos y fórmulas. Hay una considerable cantidad de puntos entre la comprensión conceptual de alto nivel y los detalles de implementación. Como resultado, la minería de datos se ve como una caja negra por los profesionales de TI y los usuarios empresariales por igual, lo que reduce la confianza en el uso y la adopción de la tecnología. Entender los conceptos de predicción de series de tiempo es mi intento de hacer que el quotdrop fuera de la predicción de series de tiempo menos pronunciada. Métodos de pronóstico Existen diferentes enfoques para la predicción. Por ejemplo, el sitio web de Métodos de Pronóstico clasifica los métodos de pronóstico en varias categorías, incluyendo casual (aka econométrica), juicios, series de tiempo, inteligencia artificial, mercado de predicción, pronóstico probabilístico, simulaciones de predicción y predicción de clases de referencia. El sitio web de los Principios de Pronóstico tiene un árbol de metodología que clasifica los métodos, comenzando con una división entre los métodos críticos (es decir, los métodos utilizados cuando los datos disponibles son inadecuados para el análisis cuantitativo) y métodos estadísticos (es decir, métodos utilizados cuando se dispone de datos numéricos relevantes). En este artículo, me centraré en la predicción de series de tiempo, un tipo de enfoque estadístico en el que se dispone de datos históricos para los valores que se prevean. La previsión de series temporales asume que los datos pasados ​​pueden ayudar a explicar los valores futuros. Es importante saber que en algunas situaciones, puede haber circunstancias que no se reflejan en los datos históricos. Por ejemplo, podría haber un nuevo competidor que pudiera afectar negativamente los ingresos futuros o un cambio rápido en la composición de la fuerza laboral (por ejemplo, un aumento en las estructuras familiares de doble ingreso que surgieron en la década de 1960) que podrían afectar las tasas de desempleo futuras. En este tipo de situaciones, un pronóstico de series de tiempo podría no ser el mejor enfoque o no debería ser el único enfoque considerado. A menudo, los diferentes enfoques de predicción se combinan para proporcionar las predicciones más precisas. Descripción de los fundamentos de la predicción de series de tiempo Una serie de tiempo es un conjunto de valores observados durante un período de tiempo, normalmente a intervalos regulares. Ejemplos comunes incluyen cantidades semanales de ventas, gastos trimestrales y tasas de desempleo mensuales. Los datos de series de tiempo se presentan a menudo en un formato gráfico, con el intervalo de tiempo a lo largo del eje x de un gráfico y los valores a lo largo del eje y, como muestra la figura 1. En cuanto a la comprensión de cómo un valor cambia de un período a otro y cómo pronosticar valores futuros, los datos de series temporales tienen varias características principales: Nivel de base. El nivel de base se define típicamente como el valor promedio de la serie. En algunos modelos de predicción, el nivel base se define como el valor inicial de los datos de la serie. Tendencia. Una tendencia se define típicamente como cómo la serie está cambiando de un período al siguiente. Por ejemplo, en la Figura 1, el número de desempleados tiende a mostrar una tendencia al alza desde principios de 2008 hasta enero de 2010, después de lo cual parece mostrar una tendencia a la baja. (Para obtener información sobre el conjunto de datos de muestra utilizado para crear los gráficos de este artículo, consulte la barra lateral quotCalculating Unemployment. quot) Cálculo del desempleo En quotUnderstanding Time Series Forecasting Concepts, el conjunto de datos de los gráficos proviene de datos de empleo publicados por la Oficina de EE. UU. De Estadísticas Laborales. El BLS publica la tasa de desempleo basada en una encuesta mensual de la Oficina del Censo de los Estados Unidos que extrapola el número total de personas empleadas y desempleadas. Específicamente, el BLS utiliza la fórmula: tasa de desempleo desempleados / (desempleados empleados) Curiosamente, la tasa de desempleo citada típicamente en las noticias es una tasa ajustada estacionalmente. El ajuste estacional se logra con la implementación de media móvil integrada (ARIMA) autorregresiva disponible al público. Este es esencialmente el mismo algoritmo utilizado por muchos paquetes de minería de datos para la previsión de series de tiempo, incluyendo SQL Server Analysis Services (SSAS). Para más información sobre la implementación de ARIMA utilizada por la Oficina del Censo, vea la página web del Programa de Ajuste Estacional X-12-ARIMA. Tenga en cuenta que en el proyecto de ejemplo de este artículo, incluí los valores ajustados por temporada y los no ajustados por temporada. Estacionalidad. Ciertos valores tienden a subir y bajar en función de ciertos períodos de tiempo, como el día de la semana o el mes del año. Los ejemplos incluyen ventas al por menor, que a menudo pico durante la temporada de Navidad. En el caso del desempleo, hay una tendencia estacional, con un mayor número de desempleados en enero y julio y menores en mayo y octubre, como muestra la figura 2. Ruido. Algunos modelos de pronóstico incluyen una cuarta característica, el ruido, que se refiere a variaciones aleatorias y movimientos irregulares en los datos. El ruido no se cubrirá aquí. Por lo tanto, si puede identificar una tendencia, aplique esa tendencia al nivel base y tenga en cuenta cualquier estacionalidad que pudiera existir en los datos, tiene un modelo de pronóstico que puede usarse para predecir valores futuros: Valor previsto Nivel base Tendencia Estacionalidad Identificación Un valor base y una tendencia Una manera de identificar un valor base y la tendencia es aplicar una técnica de regresión. El término regresión significa estudiar la relación entre variables. En este caso, la relación es entre la variable independiente de tiempo y la variable dependiente del número de desempleados. Obsérvese que la variable independiente a veces se denomina predictor. Puede utilizar una herramienta como Microsoft Excel para aplicar la técnica de regresión. Por ejemplo, puede hacer que Excel calcule automáticamente y añada una línea de tendencia a un gráfico de series de tiempo utilizando el menú Línea de tendencias de la ficha Diseño de herramientas de gráfico o PivotChart Herramientas de diseño de la cinta Excel 2010 o Excel 2007. En la Figura 1, agregué una línea de tendencia en línea recta seleccionando la opción Linear trendline en el menú Trendline. Posteriormente, elegí más opciones de línea de tendencia en el menú Tendencia y seleccioné la ecuación de visualización en el gráfico y el valor R cuadrado en las opciones de gráfico, que se muestran en la figura 3. Este proceso de ajustar una línea de tendencia a los datos históricos se denomina regresión lineal. Como se puede ver en la Figura 1, la línea de tendencia se calcula con una ecuación que identifica el nivel de base (8248.8) y la tendencia (104.67x): y 104.67x 8248.8 Puede pensar en la línea de tendencia como una serie de coordenadas xy conectadas en las que Puede conectar un período de tiempo (es decir, el eje x) para llegar a un valor (el eje y). Excel determina la línea de tendencia quotbestquot usando algo llamado el método menos cuadrado (identificado como Rsup2 en la Figura 1). La línea menos cuadrada es la línea que minimiza la distancia vertical cuadrada de cada punto de línea de tendencia a su punto de línea correspondiente. Los valores cuadrados se utilizan para que las desviaciones por encima y por debajo de la línea real no se cancelen mutuamente. En la Figura 1, Rsup2 0,5039, que indica la relación lineal explica 50,39 por ciento de los cambios en las estadísticas de desempleados en el tiempo. Identificar una línea de tendencia precisa en Excel a menudo implica pruebas y errores, junto con la inspección visual. En la Figura 1, la línea de tendencia lineal no es un gran ajuste. Excel proporciona otras opciones de línea de tendencia, que se pueden ver en la Figura 3. Por ejemplo, en la Figura 4, agregué una línea de tendencia de media móvil de cuatro periodos, que traza puntos basados ​​en un promedio de los períodos actuales y últimos especificados en la serie temporal. También agregué una línea de tendencia polinómica, que usa una ecuación algebraica para construir una línea. Obsérvese que la línea de tendencia polinomial tiene un valor Rsup2 de 0,9318, indicando un mejor ajuste para explicar la relación entre la variable independiente y la variable dependiente. Sin embargo, un Rsup2 más alto no indica necesariamente si la línea de tendencia proporcionará pronósticos exactos. Existen otros métodos para calcular la exactitud de los pronósticos, que discutiremos en breve. Algunas de las opciones de línea de tendencia de Excel (por ejemplo, lineal, polinómico) le permiten pronosticar hacia adelante y hacia atrás por un número de períodos, con los valores de pronóstico resultantes trazados en el gráfico. Diciendo que usted puede quotforecast backwardquot puede parecer extraño. La mejor manera de explicarlo es con un ejemplo. Supongamos que un nuevo crecimiento rápido de los empleos gubernamentales (por ejemplo, empleos de Defensa de la Patria a principios de los años 2000, trabajadores temporales de la Oficina del Censo de los Estados Unidos) provoca una rápida caída del desempleo. Usted desea pronosticar la tasa de crecimiento de este nuevo sector de trabajo hacia atrás durante varios meses, luego recalcular el desempleo para llegar a una tasa de cambio suavizada. También puede utilizar manualmente la ecuación de línea de tendencia para calcular los valores pronosticados. En la Figura 5, agregué una línea de tendencia polinómica con un pronóstico de seis meses, habiendo eliminado primero los últimos seis meses de datos (es decir, los datos de abril a septiembre de 2012) de la serie temporal original. Si se compara la Figura 5 con la Figura 1, puede ver que los pronósticos polinomiales están tendiendo hacia arriba, lo que no coincide con la tendencia a la baja de la serie de tiempo real. Es importante señalar dos puntos adicionales sobre la regresión: Como he mencionado anteriormente, la regresión lineal implica una variable independiente y una dependiente. Si desea entender cómo las variables independientes adicionales pueden explicar el cambio en una variable dependiente, puede crear un modelo de regresión múltiple. En el contexto de la previsión del número de desempleados en los Estados Unidos, es posible que usted pueda aumentar el Rsup2 (y la precisión de pronóstico), también teniendo en cuenta el crecimiento de la economía, la población de EE. UU., y el crecimiento en el número de desempleados Empleados. SSAS puede acomodar múltiples variables (es decir, regresores) en un modelo de predicción de series temporales. Los algoritmos de predicción de series temporales, incluidos los de SSAS, pueden calcular la autocorrelación, que es la correlación entre valores vecinos en una serie temporal. Los modelos de predicción que incorporan directamente la autocorrelación se denominan modelos autorregresivos (AR). En un modelo de AR, los predictores son los valores pasados ​​de la serie en lugar de algún factor de la (s) variable (s) independiente (es). Por ejemplo, un modelo de regresión lineal proporciona una ecuación de tendencia basada en el período (por ejemplo, 104.67 x), mientras que la tendencia de un modelo de AR se basa en valores pasados ​​(por ejemplo, -0.417 Desempleados (-1) 0.549 empleados (-1)). Los modelos AR tienen el potencial de mejorar la precisión de las previsiones al incluir información adicional más allá de la tendencia y la estacionalidad. Contabilidad de la estacionalidad Es común que la estacionalidad aparezca en una serie de tiempo, ya sea por día de la semana, día del mes o mes del año. Como se mencionó anteriormente, el número de desempleados en los Estados Unidos suele aumentar y disminuir en un año calendario determinado. (Esto es cierto incluso cuando la economía está funcionando muy bien, como se ilustra en la Figura 2). En términos de pronóstico, es necesario tener en cuenta esta estacionalidad para hacer predicciones precisas. Un enfoque común es suavizar la estacionalidad. Galit Shmueli recomienda utilizar uno de los tres métodos siguientes: Calcular un promedio móvil Agregue la serie temporal a un nivel menos granular (por ejemplo, consulte la tabla de resultados) Desempleados por trimestre en lugar de por mes) Generar series temporales separadas (y pronósticos) por temporada A continuación se obtiene un nivel base y una tendencia para generar pronósticos en función de las series temporales suavizadas. Opcionalmente, la estacionalidad o los ajustes granulares pueden reaplicarse a los valores pronosticados por factorización de nuevo en la estacionalidad original usando el método de Holt-Winters. Si desea ver cómo podría factor en la estacionalidad utilizando Excel, realizar una búsqueda en Internet utilizando la frase Winters método en Excel. También puede encontrar una explicación completa del método Holt-Winters en Wayne L. Winston, Microsoft Office Excel 2007: Análisis de Datos y Modelación de Negocios, Segunda Edición (Microsoft Press, 2007). En muchos de los paquetes de minería de datos como SSAS, los algoritmos de predicción de series temporales toman en cuenta automáticamente la estacionalidad al cuantificar las relaciones estacionales e incluirlas en el modelo de predicción. Sin embargo, a menudo desea proporcionar sugerencias sobre el patrón estacional real. Medición de la exactitud del modelo de pronóstico Como mencioné anteriormente, el ajuste inicial de un modelo (medido por el método menos cuadrado) no necesariamente equivale a predicciones precisas. La mejor manera de probar la precisión predictiva es dividir las series de tiempo en dos conjuntos de datos: uno para construir (es decir, para entrenar) el modelo y el otro para validarlo. El conjunto de datos de validación será la parte más reciente del conjunto de datos original y, idealmente, abarcará un período de tiempo igual al calendario de predicción futuro. Para validar el modelo, los valores pronosticados se comparan con los valores reales. Tenga en cuenta que después de la validación ha ocurrido, el modelo debe ser reconstruido utilizando toda la serie de tiempo para que los pronósticos futuros puedan beneficiarse de los valores reales más recientes. Al medir la exactitud de un modelo de pronóstico, hay dos preguntas frecuentes. ¿Cómo debo definir la precisión predictiva En algunos escenarios, los valores predichos que son más altos que el valor real podrían ser perjudiciales (por ejemplo, las predicciones sobre el rendimiento de la inversión). En otras situaciones, los valores predichos que son inferiores al valor real podrían ser perjudiciales (por ejemplo, predecir la oferta ganadora más baja en un artículo de subasta). Pero en los casos en que se desea calcular algún tipo de puntaje ponderado para todas las predicciones (sin importar si las predicciones son más altas o más bajas que el valor real), puede comenzar por cuantificar el error en una sola previsión usando la definición: error predicho Valor ndash valor real Con esta definición de error, dos de los métodos más populares para medir la precisión son el error absoluto medio (MAE) y el error de porcentaje absoluto medio (MAPE). Con el método MAE, los valores absolutos de los errores de pronóstico se suman y luego se dividen por el número total de pronósticos. Con el método MAPE, las desviaciones medias de los pronósticos se calculan como un porcentaje. Si desea ver un ejemplo de estos y varios otros métodos para medir la precisión, una plantilla de Excel (con datos de pronóstico de muestra y puntajes de exactitud) está disponible en la página web Plantilla de diagnósticos de mediciones de demanda. Cuánto datos históricos debo utilizar para entrenar mi modelo Cuando se trabaja con una serie temporal que se remonta al pasado, es posible que se incline a incluir todos los datos históricos en el modelo. En algún momento, sin embargo, la historia adicional podría no mejorar la precisión de pronóstico. Los datos más antiguos pueden incluso distorsionar el pronóstico si las condiciones pasadas son muy diferentes de las condiciones actuales (por ejemplo, ahora hay una composición de mano de obra diferente que en el pasado). No he visto ninguna fórmula específica o regla de oro que diga cuánto datos históricos incluir, así que mi sugerencia es comenzar con una serie de tiempo que es varias veces más grande que el marco de tiempo de pronóstico, luego prueba de precisión. A continuación, intente ajustar la cantidad de historial hacia arriba o hacia abajo y vuelva a probar. Trabajar con previsiones de series de tiempo en SSAS La predicción de series de tiempo apareció por primera vez en SSAS 2005. Su algoritmo de series de tiempo de Microsoft utilizó un solo algoritmo denominado árbol autorregresivo con predicción cruzada (ARTXP) para generar pronósticos. ARTXP combina técnicas AR con un árbol de quotdecisión de minería de datos de modo que la ecuación de pronóstico puede cambiar (es decir, dividida) en base a ciertos criterios. Por ejemplo, un modelo de pronóstico podría producir un ajuste más ajustado (y una mejor precisión de pronóstico) si primero se divide por la fecha y luego se divide por el valor de una variable independiente, como se muestra en la Figura 6. En SSAS 2008, Comenzó a utilizar un segundo algoritmo denominado media móvil integrada autoregresiva (ARIMA) además de ARTXP para mejorar las previsiones a largo plazo. ARIMA es considerado un estándar de la industria y puede ser pensado como una combinación de la AR y técnicas de media móvil. También evalúa los errores de pronóstico históricos para mejorar el modelo. El comportamiento predeterminado del algoritmo de serie temporal de Microsoft es combinar los resultados de los algoritmos ARIMA y ARTXP para lograr pronósticos óptimos. (Puede anular este comportamiento predeterminado si lo desea). De acuerdo con los Libros en pantalla de SQL Server (BOL): quotEl algoritmo entrena dos modelos independientes en los mismos datos: un modelo utiliza el algoritmo ARTXP y un modelo utiliza el algoritmo ARIMA. El algoritmo luego combina los resultados de los dos modelos para obtener la mejor predicción sobre un número variable de intervalos de tiempo. Debido a que ARTXP es el mejor para las predicciones a corto plazo, se pesa más fuertemente al comienzo de una serie de predicciones. Sin embargo, a medida que los intervalos de tiempo que está prediciendo se mueven más hacia el futuro, ARIMA se pesa más pesadamente. Cuando se trabaja con previsiones de series de tiempo en SSAS, debe tener en cuenta lo siguiente: Aunque hay una pestaña SSAS, esta pestaña no funciona con modelos de minería de datos de series temporales. Como resultado, tendrá que medir manualmente la precisión con uno de los métodos mencionados (por ejemplo, MAE, MAPE) utilizando una herramienta como Excel para ayudar con los cálculos. La Edición Enterprise de SSAS le permite segmentar un modelo de serie temporal en múltiples modelos quotóricos, para que no tenga que dividir manualmente los datos en conjuntos de datos de entrenamiento y validación al probar la precisión predictiva. Desde el punto de vista del usuario final, todavía hay un solo modelo de series temporales, pero puede comparar los resultados reales con los resultados previstos dentro del modelo, como se muestra en la Figura 7. Si no está utilizando Enterprise Edition o si no desea aprovechar Esta característica, deberá primero dividir manualmente los datos. El siguiente paso En este artículo, le presenté los conceptos necesarios para comprender los conceptos básicos de la predicción de series de tiempo. También le introduje algunos de los detalles de los algoritmos subyacentes para que no se conviertan en una barrera para la implementación de series de tiempo. Como paso siguiente, le invito a recorrer una implementación de previsiones de series de tiempo con SSAS. Incluí un proyecto de ejemplo que utiliza los datos de desempleo a los que se hace referencia en este artículo. (Para obtener este proyecto, haga clic en el icono Descargar el código en la parte superior de la página.) Posteriormente, puede consultar el tutorial de TechNet quotTutorial de minería de datos intermedios (Analysis Services ndash Data Mining).quot

No comments:

Post a Comment