Universidad Nacional San Luis Gonzaga de Ica
​
​
​
​
​
Elías Tello Junior Paul
​
IVEE - 2
Fac. Ingeniería Mecánica y Eléctrica (Electrónica)
Regresión
​
​
En estadística, el análisis de la regresión es un proceso estadístico para estimar las relaciones entre variables. Incluye muchas técnicas para el modelado y análisis de diversas variables, cuando la atención se centra en la relación entre una variable dependiente y una o más variables independientes
La regresión es una técnica estadística utilizada para simular la relación existente entre dos o más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.
La regresión es muy utilizada para interpretar situaciones reales, pero comúnmente se hace de mala forma, por lo cual es necesario realizar una selección adecuada de las variables que van a construir las ecuaciones de la regresión, ya que tomar variables que no tengan relación en la práctica, nos arrojará un modelo carente de sentido, es decir ilógico.
Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras. Las ecuaciones de cada relación se presentan en la siguiente tabla.
Tabla 1. Ecuaciones de regresión
REGRESIÓN
ECUACIÓN
Lineal
y = A + Bx
Logarítmica
y = A + BLn(x)
Exponencial
y = Ae(Bx)
Cuadrática
y = A + Bx +Cx2
Sin embargo obtener el modelo de regresión no es suficiente para establecer la regresión, ya que es necesario evaluar que tan adecuado es el modelo de regresión obtenido. Para esto se hace uso del coeficiente de correlación R, el cual mide el grado de relación existente entre las variables. El valor de R varia entre -1 y 1, pero en la práctica se trabaja con el valor absoluto de R, entonces, a medida que R se aproxime a 1, más grande es el grado de correlación entre los datos, de acuerdo con esto el coeficiente de correlación se puede clasificar de varias formas, como se observa en la Tabla 2.
Tabla 2. Clasificación del grado de correlación.
CORRELACIÓN
VALOR O RANGO
Perfecta
|R| = 1
Excelente
0.9 <= |R| < 1
Buena
0.8 <= |R| < 0.9
Regular
0.5 <= |R| <0.8
Mala
|R|< 0.5
Por lo tanto el análisis de regresión es una herramienta estadística que permite analizar y predecir o estimar observaciones futuras de dos o más variables relacionadas entre sí, es decir una herramienta útil para la planeación.
Después de éste tratamiento superficial acerca de regresiones, se continua con un caso práctico relacionado con la empresa ESTIMAR LTDA.
A continuación se presentan los ingresos y costos en millones obtenidos mensualmente durante todo el año 2002 y los seis primeros meses del 2003.
Optamos por presentar éste caso ya que resulta muy práctico a la hora de aplicar la técnica de regresión. Además porque permite analizar como se han comportado los ingresos y costos de la empresa a partir del año 2002 y a su vez pronosticar según la tendencia arrojada, como será el comportamiento de los ingresos y costos para el resto del año 2003 y con base en ellos inferir o tomar decisiones a corto plazo.
Distribuciones Bivalentes
Es cuando sobre una población estudiamos simultáneamente los valores de dos variables estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribución bivalentes.
Ejemplo 1:
Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente tabla:
MATEMÁTICAS
2
4
5
5
6
6
7
7
8
9
LENGUA
2
2
5
6
5
7
5
8
7
10
Los pares de valores {(2,2),(4,2),(5,5),...;(8,7),(9,10)}, forman la distribución bivariante.
Regresion
La regresión es una técnica estadística utilizada para simular la relación existente entre dos o más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.
-
Correlación
Es frecuente que estudiemos sobre una misma población los valores de dos variables estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas.
Medida De La Correlación
La apreciación visual de la existencia de correlación no es suficiente. Usaremos un parámetro, llamado coeficiente de correlación que denotaremos con la letra r, que nos permite valorar si ésta es fuerte o débil, positiva o negativa.
El cálculo es una tarea mecánica, que podemos realizar con una calculadora o un programa informático. Nuestro interés está en saber interpretarlo
destacaremos una de sus propiedades
-1 < r < 1
Correlación Lineal Y Recta De Regresión
Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión.
Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y será cada vez más débil (o menos fuerte) cuando la nube vaya desparramándose con respecto a la recta.
En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya que la recta que hemos dibujado está próxima a los puntos de la nube.
Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir.
Ejemplo 2:
Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos realizados.
Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y negativa (la recta es decreciente).
Diagrama De Dispersión
La primera forma de describir una distribución bivariante es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.
Un diagrama de dispersión es una representación gráfica de la relación entre dos variables, muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos. Tres conceptos especialmente destacables son que el descubrimiento de las verdaderas relaciones de causa-efecto es la clave de la resolución eficaz de un problema, que las relaciones de causa-efecto casi siempre muestran variaciones, y que es más fácil ver la relación en un diagrama de dispersión que en una simple tabla de números
Linea De Tendencia
La línea de tendencia es la herramienta básica más importante con la que cuenta el analista técnico.
Es una línea o conjunto de líneas que se trazan en el gráfico uniendo con una misma pendiente series sucesivas de puntos mínimos (línea de tendencia alcista) o de puntos máximos (línea de tendencia bajista).
Sirve para determinar en primer lugar la dirección del mercado y establecer sus objetivos de proyección.
Marca los niveles de soporte o de resistencia que están proyectando los precios.
Permite analizar en cada momento el nivel de Beneficio/Riesgo que se puede tomar al iniciar o cerrar una posición, tomando como referencia el precioactual respecto a línea de tendencia y su proyección.
La ruptura de una línea de tendencia al alza o la baja es una de las señales que confirma un cambio en la dirección de los precios.
Son la base para trazar los canales que encuadran el posible movimiento de los precios.
Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras.
Modelo Matematico
Llamado tambien ajuste de curvas es una ecuacion dada en un grafico, dependiendo del grado de correlacion que mas se ajuste al conjunto de datos.
-
AJUSTE LINEAL: Y=BX+A
-
AJUSTE LOGARITMICO: Y=B Ln X+A
-
AJUSTE EXPONENCIAL: Y=AC BX
-
AJUSTE PARABOLICO, CUADRATICO O POLINOMIAL: Y= AX2 + BX + A
Estimativos
Es una valoracion aproximada basado en datos de periodos anteriores (datos historicos o estadisticos) a traves de muestreos.
Pronósticos
Es estimar un valor de y dado o supesto un valor de x. Tambien se puede decir que es preveer el futuro.
Enuncie Los Pasos Para Ajustar Un Conjunto De Datos Y Crear Un Conjunto Su Modelo Matematico
Tener tabulado un conjunto de datos Xi, Yi cuyas variables tengan relación
-
Utilidades Vs Costos
-
Costos Vs Cantidad Producida
-
Utilidades Vs Mes
-
Costos Vs Semanas
-
Ingresos Vs Año
Graficar los datos Xi, Yi (Diagrama de dispersion o nube de puntos). Esto permite visualizar la linea de tendencia.
Contruya el modelo matematico que mas se ajuste teniendo en cuenta el grado de correlacion.
-
Perfecta [r]=1
-
Excelente 0.9 <=[r]<=1
-
Regular 0.5<=[r]<0.8
-
Mala [r]<0.5
Series Cronológicas
Una SERIE cronológica es un conjunto de observaciones (ordenado en términos de tiempo). Algunos ejemplos de series cronológicas serian aspectos tales registros de precipitación pluvial diaria, las ventas semanales, el producto nacional bruto trimestral, mediciones de la temperatura.
El objeto de analizar tales datos es determinar si se presentan ciertos patrones o pautas no aleatorias.
Algunas veces se trata de descubrir patrones no aleatorios que se puedan utilizar para predecir el futuro.
En otras coacciones, el objetivo es asegurarse de que no haya patrones no aleatorios. En estos casos, dichos patrones son considerados como una señal de que un sistema o proceso esta " fuera de control".
La siguiente explicación tiene relacion con el análisis intrínseco, el cual se concentra en los datos históricos de la variable de estudio. Cabria destacar que el análisis intrínseco es ampliamente empleado en los negocios y en l a industria. El objetivo reconocido del análisis intrínseco es describir mas que explicar los patrones históricos de los datos (es decir, identificar diversos patrones). Además el supuesto en el que se basa el análisis intrínseco, estable que existe un constante sistema causal relacionado con el tiempo, el cual influye en los datos. En otras palabras, los datos históricos supuestamente reflejan l a influencia de todos los factores de manera uniforme atravez del tiempo. Por ejemplo, un estudio de ventas realizadas en un periodo de 14 años puede revelar que las ventas han aumentado de manera uniforme a razón de casi 10% anual. Con base en esto se lleva a cabo una proyección de las ventas futuras, suponiendo que cualesquiera que fuesen las fuerzas que hayan dado lugar a este patrón, continuaran en le futuro.
Números Índices
Un número índice mide qué tanto una variable ha cambiado con el tiempo.
Mide la variación relativa entre las variables económicas: Variaciones en los precios, en los salarios, en los ingresos, etc.
Se calculan para 2 períodos de una serie de tiempo o para todos los períodos de una serie de tiempo con respecto a un período fijo llamado período base.
Que importancia tienen estas tematicas para cualquier ciencia.
La Estadistica es de gran importancia en las diferentes empresas, enfocadas desde cualquier area profesional ya que ayudan a lograr una adecuada planeacion y control apoyados en los estudios de pronosticos, presupuestos etc.
-
Motivan a la alta gerencia para que definan los objetivos basicos de la empresa.
-
Propician que se defina una estructura adecuada, determinando la responsabilidad y autoridad de cada una de las partes que integran laorganización.
-
Incrementan la participación de los diferentes niveles de la organización, cuando existe motivacion adecuada.
-
Obligan a mantener un archivo de datos historicos controlables.
-
Facilitan a la administracion la utilizacion optima de los diferentes insumos.
-
Facilitan la coparticipación e integracion de las diferentes areas de la compañía.
-
Obligan a realizar un autoanalisis periodico.
-
Facilitan el control administrativo.
-
Son un reto que constantementese presenta a los ejecutivos de una organización para ejercitar su creatividad y criterio profesional a fin del mejoramiento de la empresa.
-
Ayudan a lograr una mayor efectividad y eficiencia en las operaciones.
Que importancia tiene para usted como contador (a) la realización de pronósticos.
-
Para prevenir los cambios del entorno, de manera que anticipandose a ellos sea mas fácil la adaptacion de las organizaciones.
-
Para integrar los objetivos y decisiones de la organización.
-
A traves de los pronosticos, se pueden prever las perdidas en los resultados de los estados financieros futuros, y de esta manera se pueden tomar decisiones bien sea la reduccion de costos y gastos, planear estrategias que ayuden al mejoramiento de la empresa, y que se cumpla con el objetivo de toda empresa que es obtener utilidades.
-
Con base en analisis de rotacion de inventarios se puede tomar la decision de aumentar o sacar del mercado un producto.
En cuales areas de su competencia profesional es útil aplicar este conocimiento.
-
Economia
-
Administración
-
Psicología y las demas áreas afines (Ciencias exactas y ciencias Sociales)
-
Medicina etc. Nosotras pensamos que estos temas de estadística son indispensables en cualquier área ya que a diario se presentan situaciones donde intervienen dos variables y es importante este conocimiento para la toma de decisiones.
3. Análisis De Resultados
Realizando un breve análisis de la EMPRESA ESTIMAR LTDA. Podemos observar la poca o nula estabilidad comercial , la cual tuvo mucha variabilidad en cada uno de los meses, donde podemos concluir que la empresa tuvo acogida por los clientes, si observamos los ingresos mensuales que fueron aumentando, sin embargo las utilidades fueron cada vez más decrecientes debido a la mala administración dada por los jefes de producción donde invirtieron más de lo que realmente vendían. Esto a su vez, demuestra que en una situación como la que se presentó en el periodo del año 2002 y los seis primeros meses del año 2003, es más difícil lograr un punto de equilibrio; es decir, el esfuerzo en la inversión es mayor para compensar lo que se deja de ganar en el margen.
Como podemos observar en la tabla de números índices base fija (# pagina) en el mes de junio de 2003 se hace demasiado notable la mala administración por parte de la empresa debido a que tenemos una variación en el costo del 250%, una variación en los ingresos del 125% y una variación de las utilidades de un déficit del 125%; lo cual no tiene sentido alguno en el desarrollo de las actividades de una empresa, donde el objetivo general de una empresa es obtener rentabilidad.
En la tabla de números índice en base móvil, observamos que el porcentaje de variación de costos y el de los ingresos respecto a la tabla en base fija van disminuyendo a medida que avanza el periodo, mientras que el porcentaje de variación en las utilidades en las dos tablas fueron muy diferentes, el la base móvil las utilidades estuvieron muy variables entre utilidad y perdida, en cambio en la base fija siempre se presento déficit en forma creciente a medida en que avanzaba el periodo.
4. Conclusiones
Es de suma importancia que la empresa ESTIMAR LTDA. Realice una planeación de presupuesto con el fin de investigar sobre el comportamiento de los diferentes mercados, los cuales tienen incidencia directa sobre el producto, como también realizar el plan de necesidades de insumos el cual consiste en detectar los requerimientos de los diferentes recursos que intervienen en el proceso productivo de tal modo que se pueda hacer frente al plan de mercados.
Realizar el plan financiero que tiene como finalidad decidir como se resolvera el problema de liquidez y de financiamiento de la empresa, una vez que se haya pronosticado los ingresos y los desembolsos provenientes del plan de requerimientos de insumos.
Mediante un buen grado de correlación, podemos fácilmente hacer estimativos acerca de cómo se va a comportar una variable de interés (en nuestro caso los ingresos, costos y utilidades mensuales de la empresa ESTIMAR LTDA.) a través del tiempo.
Los ingresos de ESTIMAR LTDA. desde Enero de 2002, presentan una tendencia creciente y se ajustó aun modelo matemático polinomial con un grado de correlación excelente, R = 0.9627, mostrando una buena relación entre los datos manejados.
Se observa que ESTIMAR LTDA. es una empresa con una muy mala gestión administrativa, porque fueron mas altos los costos que los ingresos a pesar que estos estuvieron mas o menos por el mismo nivel afectando notablemente las utilidades en forma negativa; por tal motivo es necesario mantener en la empresa costos estándar actualizados, con el propósito de que facilite la elaboración del presupuesto de requisiciones de materia prima, mano de obra y de gastos de fabricación indirectos, ya que de otra forma, se determinarían en forma muy imprecisa
La mejor estrategia para que no suceda lo anterior estriba en tomar medidas practicas para la reducción de costos, lo cual generara mayor margen y permitirá a la empresa mejorar su posición competitiva.
Correlación: La correlación es la forma numérica en la que la estadística ha podido evaluar la relación de dos o más variables, es decir, mide la dependencia de una variable con respecto de otra variable independiente.
Relación Entre las Variables
La correlación puede decir algo acerca de la relación entre las variables. Se utiliza para entender:
si la relación es positiva o negativa
la fuerza de la relación.
La correlación es una herramienta poderosa que brinda piezas vitales de información.
En el caso del ingreso familiar y el gasto familiar, es fácil ver que ambos suben o bajan juntos en la misma dirección. Esto se denomina correlación positiva.
En caso del precio y la demanda, el cambio se produce en la dirección opuesta, de modo que el aumento de uno está acompañado de un descenso en el otro. Esto se conoce como correlación negativa.
Coeficiente de Correlación
La correlación estadística es medida por lo que se denomina coeficiente de correlación (r). Su valor numérico varía de 1,0 a -1,0. Nos indica la fuerza de la relación.
En general, r> 0 indica una relación positiva y r <0 indica una relación negativa, mientras que r = 0 indica que no hay relación (o que las variables son independientes y no están relacionadas). Aquí, r = 1,0 describe una correlación positiva perfecta y r = -1,0 describe una correlación negativa perfecta.
Cuanto más cerca estén los coeficientes de +1,0 y -1,0, mayor será la fuerza de la relación entre las variables.
Como norma general, las siguientes directrices sobre la fuerza de la relación son útiles (aunque muchos expertos podrían disentir con la elección de los límites).
Valor de r Fuerza de relación
-1,0 A -0,5 o 1,0 a 0,5 Fuerte
-0,5 A -0,3 o 0,3 a 0,5 Moderada
-0,3 A -0,1 o 0,1 a 0,3 Débil
-0,1 A 0,1 Ninguna o muy débil
La correlación es solamente apropiada para examinar la relación entre datos cuantificables significativos (por ejemplo, la presión atmosférica o la temperatura) en vez de datos categóricos, tales como el sexo, el color favorito, etc.
Desventajas
Si bien 'r' (coeficiente de correlación) es una herramienta poderosa, debe ser utilizada con cuidado.
Los coeficientes de correlación más utilizados sólo miden una relación lineal. Por lo tanto, es perfectamente posible que, si bien existe una fuerte relación no lineal entre las variables, r está cerca de 0 o igual a 0. En tal caso, un diagrama de dispersión puede indicar aproximadamente la existencia o no de una relación no lineal.
Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se podría calcular 'r' entre el número de calzado y la inteligencia de las personas, la altura y los ingresos. Cualquiera sea el valor de 'r', no tiene sentido y por lo tanto es llamado correlación de oportunidad o sin sentido.
'R' no debe ser utilizado para decir algo sobre la relación entre causa y efecto. Dicho de otra manera, al examinar el valor de 'r' podríamos concluir que las variables X e Y están relacionadas. Sin embargo, el mismo valor de 'r no nos dice si X influencia a Y o al revés. La correlación estadística no debe ser la herramienta principal para estudiar la causalidad, por el problema con las terceras variables.