Skip to main content

Home/ foe_2013/ Group items tagged series

Rss Feed Group items tagged

Alpha Teleco

Time Series Analysis and Mining with R | (R news & tutorials) - 0 views

    • Alpha Teleco
       
      Cómo clasificar y agrupar series de tiempo en R y explicación mediante una serie de ejemplos.
  • classification and clustering of time series data are not readily supported by existing R functions or packages.
    • Alpha Teleco
       
      Ejemplo de descomposición de una serie temporal, con el ejemplo de pasajeros de avión.
  • ...18 more annotations...
  • Time series data are widely seen in analytics. Some examples are stock indexes/prices, currency exchange rates and electrocardiogram (ECG)
  • Time Series Decomposition
  • Time series decomposition is to decompose a time series into trend, seasonal, cyclical and irregular components.
    • Alpha Teleco
       
      Serie de tiempo original.
    • Alpha Teleco
       
      Tendencia.
    • Alpha Teleco
       
      Factores estacionales.
    • Alpha Teleco
       
      Componente aleatoria.
    • Alpha Teleco
       
      Previsión de hechos futuros basados en conocidos.
  • Time Series Forecasting
  • Time series forecasting is to forecast future events based on known past data.
    • Alpha Teleco
       
      Agrupar series temporales basandose en su similitud o distancia.
  • Time Series Clustering
    • Alpha Teleco
       
      Ejemplo de agrupacion con 600 graficos, agrupados en 6 grupos. (Normales, ciclicos, tendencia alcista, tendencia bajista...)
  • Time series clustering is to partition time series data into groups based on similarity or distance, so that time series in the same cluster are similar.
    • Alpha Teleco
       
      Clasificacion de series de tiempo. Construir un modelo de clasificacion basado en las series de tiempo marcadas y usando el modelo construido, predecir la continuación de la series.
  • o build a classification model based on labelled time series and then use the model to predict the label of unlabelled time series.
  • Time series classification is t
  • Time Series Classification
Alpha Teleco

R Tutorial Series: Basic Polynomial Regression | (R news & tutorials) - 0 views

    • Alpha Teleco
       
      Tutorial regresión no lineal basica en R.
  • Polynomial regression can be used to explore a predictor at different levels of curvilinearity.
  • This tutorial will demonstrate how polynomial regression can be used in a hierarchical fashion to best represent a dataset in R.
  • ...24 more annotations...
  • Scatterplot
    • Alpha Teleco
       
      El grafico de dispersion demuestra que estos datos pueden no ser lineales.
  • The preceding scatterplot demonstrates that these data may not be linear.
    • Alpha Teleco
       
      Como crear variables de orden lineal, cuadratico y cubico.
  • Creating The Higher Order Variables
  • In this tutorial, we will explore the a linear, quadratic, and cubic model.
    • Alpha Teleco
       
      Paso 1: centrar la variable, restando la media de cada punto y guardando el resultado en una nueva variable de R.
  • Step 1: Centering
  • To center a variable, simply subtract its mean from each data point and save the result into a new R variable, as demonstrated below.
    • Alpha Teleco
       
      Paso 2: Crear los terminos de orden superior multiplicando la variable creada por si misma y guardando el resultado en una nueva variable.
    • Alpha Teleco
       
      Crear los modelos lineales y no lineales.
  • Once the input variable has been centered, the higher order terms can be created.
  • we can simply multiply our centered term from step one and save the result into a new R variable, as demonstrated below.
  • Step 2: Multiplication
  • Creating The Models
  • Now we have all of the pieces necessary to assemble our linear and curvilinear models.
    • Alpha Teleco
       
      Evaluar los modelos y compararlos, en el ejemplo se observa que no ha una diferencia significativa entre los tres modelos.
  • Evaluating The Models
  • In this case, the quadratic and cubic terms are not statistically significant themselves nor are their models statistically significant beyond the linear model.
    • Alpha Teleco
       
      A traves de los modelos que hay en este tutorial se pueden crear modelos muy complejos, utilizando las mismas sencillas tecnicas de este tutorial.
  • it can be helpful to summarize and compare our potential models using the summary(MODEL) and anova(MODEL1, MODEL2,… MODELi) functions.
  • More On Interactions, Polynomials, and HLR
  • The regression topics covered in these tutorials can be mixed and matched to create exceedingly complex models.
  • The good news is that more complex models can be created using the same techniques covered here. The basic principles remain the same.
  •  
    Tutorial
LaRuPu upv

Data Mining Applications with R - RDataMining.com: R and Data Mining - 0 views

shared by LaRuPu upv on 01 May 13 - No Cached
  • Data ExplorationDecision Treesk-means ClusteringHierarchical ClusteringOutlier DetectionTime Series AnalysisTime Series Clustering and ClassificationAssociation RulesText MiningSocial Network AnalysisParallel ComputingOther Examples
  •  
    Uso aplicado de aplicaciones Data mining en R para el análisis de datos.
diigo lemon

Ecología austral - ¿Por qué comprar un programa estadístico si existe R? - 0 views

  • implementan distintos algoritmos para llevar a cabo los mismos tipos de análisis, los usuarios se benefician de una comparación entre los programas más usados
  • son bastante específicos y se circunscriben a aspectos puntuales.
  • Amigabilidad con el usuario.
  • ...59 more annotations...
  • comparación general sobre la base de una serie de aspectos
  • SAS (SAS Institute Inc. 2007) ha sido por largos años el software más utilizado en la comunidad estadística
    • empresa 2013
       
      En cada color se remarcan sus caracteristicas: -SPSS en amarillo -SAS en rosa -R en azul
    • empresa 2013
       
      En verde caracteristicas conjuntas.
  • SPSS es bastante amigable para el usuario, ya que permite acceder a todas las opciones mediante un menú de funciones
  • SAS y R requieren conocer la sintaxis y/o los comandos antes de ejecutar un procedimiento, lo cual los hace poco amigables para aquellos usuarios no familiarizados con la programación computacional
  • R no es necesario utilizar el menú de funciones
  • para ejecutar SAS, además de requerir sintaxis es necesario utilizar los botones de la interfaz gráfica
  • b. Manipulación de datos.
  • Tanto SPPS como SAS permiten abrir el archivo de datos en una ventana aparte, lo cual puede ser importante para algunos usuarios.
  • R muestra los datos, o una porción de ellos, según se requiera, aunque empleando la función "fix" también es posible mostrar y editar los datos en una ventana.
  • c. Calidad de gráficos.
  • d. Control de procesos.
  • e. Costo
  • f. Variedad de análisis estadísticos
  • g. Documentación y soporte de ayuda.
  • h. Sistemas operativos
  • SPSS ofrece una serie de gráficos tipo que si bien pueden modificarse en su formato
  • son difíciles de personalizar
  • SAS como R permiten el diseño personalizado de gráficos
  • SAS requiere del uso de diferentes rutinas (o paquetes)
  • R son más sencillas (o "planas") y no requieren de una gran cantidad de paquetes.
  • Tanto SPSS y SAS ofrecen generalmente una gran cantidad de salidas completas ("outputs") para un procedimiento estadístico cualquiera
  • R ofrece como salidas sólo aspectos básicos y, en el caso de que el usuario necesite más detalles, debe solicitarlos especialmente.
  • R es totalmente gratuito y está disponible en Internet,
  • SAS es el software estadístico más caro del mercado.
  • SPPS cuesta U$S 1599 (SPPS Inc. 2007), un valor promedio a levemente alto entre los programas estadísticos de similar categoría, y corresponde a una licencia perpetua
  • A pesar de que el sistema operativo (S.O.) Microsoft Windows® está ampliamente difundido, existe una gran cantidad de usuarios que usan otros sistemas operativos. Los tres programas analizados están implementados para Windows®. Si bien tanto SPSS como SAS pueden funcionar en el S.O. Linux, su configuración es compleja. SPPS también puede ejecutarse en Macintosh®. R es el único que funciona de manera estable e íntegra en los tres sistemas operativos de mayor uso. La versatilidad de plataformas donde R puede ser instalado ofrece una ventaja para los diferentes usuarios en distintas disciplinas.
  • Una ventaja de SPSS y de SAS es el soporte (e.g., servicio al cliente), a través del cual es posible indicar problemas de ejecución en ciertos procedimientos y, por lo tanto, obtener el respaldo técnico de las respectivas empresas.
  • para R no existe un respaldo formal de una empresa con respecto a todos sus paquetes, rutinas y funcionamiento general. Es decir, R no tiene ninguna garantía legal y el usuario asume cualquier potencial problema causado por su uso
  • SPPS ofrece un amplio rango de procedimientos estadísticos, que probablemente cubren gran parte de los que se utilizan en ecología e ingeniería. Sin embargo, cuando se requiere de mayores especificaciones en los procedimientos (e.g., el ajuste de un modelo no lineal no converge y es necesario definir el rango posible de valores para los parámetros del modelo), SPPS no ofrece mucha versatilidad.
  • SAS es un software de sólido desarrollo y en donde la empresa invierte cerca del 20% de sus utilidades en investigación (SAS 2007). Por lo tanto, la variedad de procedimientos implementados es bastante amplia.
  • R ha sido desarrollado por estadísticos que trabajan en diferentes instituciones a nivel mundial y, por lo tanto, implementa algoritmos modernos y robustos. Además, un número importante de paquetes están continuamente siendo desarrollados y puestos a disposición en Internet para su instalación.
  • nueva alternativa, el programa R
  • Existen varios programas estadísticos genéricos.
  • uso de los botones de la interfaz gráfica
  • SPSS (SPSS Inc. 2007) es un software lanzado al mercado en 1968.
  • programa estadístico y un lenguaje de programación de uso libre, de distribución gratuita y de código abierto
  • ciencias sociales
  • SAS (SAS Institute Inc. 2007) ha sido por largos años el software más utilizado en la comunidad estadística
  • uso sencillo de las opciones, acceso rápido a datos y procedimientos, generación de salidas y gráficos
  • SAS (SAS Institute Inc. 2007)
  • requiere el ingreso de comandos
  • SAS (SAS Institute Inc. 2007)
  • necesita del conocimiento de la sintaxis antes de su uso
  • R (Ihaka & Gentleman 1996; R Development Core Team 2007)
  • programa estándar empleado en ensayos clínicos y por la industria farmacéutica en los Estados Unidos.
  • basado sobre comandos, en el que se puede acceder a todos los procedimientos y opciones a través de sintaxis computacional.
  • similar al programa estadístico S-plus
  • derivados de un lenguaje estadístico llamado S y
  • orientación y administración diferentes a las de R, y además se enfocan en aquellos mercados y usuarios que les proporcionan los mayores beneficios.
  • SPSS como SAS son programas comerciales
    • Joan Bono
       
      Aunque visualmente, no tan avanzado o bonito como puede ser SPSS o SAS, en relación calidad precio, muchísimo mejor (no olvidemos que es de licencia gratuita), y nada tiene que envidiar a los otros dos programas conocidos en cuanto a funcionalidad, que al fin y al cabo, es lo que cuenta. Algo que destacar de R es que para el poco tiempo de "vida" que tiene, cuenta ya con gran cantidad de librerias y algoritmos robustos que son implementados por científicos de todo el mundo.
  • se comparan con el software estadístico R. Sobre la base de este análisis, se propone el uso de R en ciencias ecológicas e ingeniería en Latinoamérica y en países del tercer mundo en general, porque ofrece el uso gratuito de un software de primer nivel, así como también un mayor control de los análisis conducidos, extensa documentación, y un ambiente de programación desarrollado para aplicaciones estadísticas y con capacidad para ser empleado en otras áreas cuantitativas de diversas disciplinas.
  • ¿Por qué comprar un programa estadístico si existe R?
  • R muestra los datos, o una porción de ellos, según se requiera, aunque empleando la función "fix" también es posible mostrar y editar los datos en una ventana. Debido a que tanto SAS como R emplean sintaxis y procedimientos que afectan a los datos en una memoria virtual, cualquier modificación en los datos (e.g., crear una variable que no existe en el archivo) no es guardada físicamente en el archivo (a menos que se requiera al finalizar una sesión). Es decir, uno puede incorporar transformaciones a un archivo de datos, dejando intacto el archivo original. Esta es una gran ventaja ya que por muchos análisis que se realicen, siempre es posible partir de un único archivo de datos, evitando la duplicación de versiones.
  • R es totalmente gratuito y está disponible en Internet, al igual que cada versión nueva. No es necesario pagar ni por obtener el software ni por actualizarlo. La instalación típica de R consiste de una serie de paquetes, y cada paquete nuevo que ha sido desarrollado es publicado en Internet, desde donde se puede obtener y agregar a R. A diferencia de SPSS y de SAS, la distribución de R es actualizable, pudiéndosele agregar paquetes adicionales por separado.
  • La renovación e implementación de nuevos procedimientos en R es relativamente rápida. Frecuentemente aparecen nuevos procedimientos y/o paquetes en desarrollo y en revisión, los cuales después pueden ser obtenidos a través de Internet e instalados directamente.
  • la capacidad de producir gráficos de calidad y la amplia documentación gratuita, entre otros aspectos, hacen de R un excelente programa estadístico para ser usado en docencia e investigación. La gratuidad de R además, permite no solo trasmitir el uso de un software legal, sino también acceder libremente a un programa de alta calidad. Por otra parte, la transparencia en la construcción de R permite un mayor control del proceso de generación de conocimiento por parte de los usuarios.
    • diigo lemon
       
      En este artículo se dan a conocer las diversas herramientas de análisis estadístico que están en el mercado y hace una comparación entre ellas. Centrándonos en R, podemos destacar: su poca amabilidad con el usuario, ya que se trata de un lenguaje difícil; su buena disposición al manejo de datos; su sencillez y gran calidad en el diseño de gráficos; su flexibilidad en el control de procesos, gracias a ser de código abierto; su disposición gratis a través de internet ya que se trata de software libre de código abierto; su gran variedad de análisis estadísticos ya que al ser de código abierto, acepta contribuciones de todos los usuarios; su gran cantidad de documentación y el buen soporte de ayuda al que contribuye toda la comunidad de usuarios realizando manuales gratuitos; su versatilidad al poder usarse perfectamente en Windows, Macintosh y Linux. El artículo finaliza con las conclusiones, las cuales se basan principalmente en que es un software libre de código abierto que ofrece una gran variedad de análisis estadísticos, la alta calidad de sus gráficos y la amplia documentación gratuita.
pajoje lololo

R (programming language) - Wikipedia, the free encyclopedia - 1 views

    • David Moya
       
      Anualmente se celebra un encuentro para los usuarios que utilizan el lenguaje R. Entre los últimos destinos en los que se han celebrado las reuniones, podemos destacar Rennes, Tennessee o Albacete.
  • R is an interpreted language; users typically access it through a command-line interpreter.
  • R supports matrix arithmetic
  • ...7 more annotations...
  • R's data structures include scalars, vectors, matrices, data frames (similar to tables in a relational database) and lists.
  • R's extensible object-system includes objects for (among others): regression models, time-series and geo-spatial coordinates.
  • Although mostly used by statisticians and other practitioners requiring an environment for statistical computation and software development, R can also operate as a general matrix calculation toolbox - with performance benchmarks comparable to GNU Octave or MATLAB.
  • "useR!" is the name given to the official annual gathering of R users.
  • Here is the list of useR! conference: useR! 2004, Vienna, Austria useR! 2006, Vienna, Austria useR! 2007, Ames, Iowa, USA useR! 2008, Dortmund, Germany useR! 2009, Rennes, France useR! 2010, Gaithersburg, Maryland, USA useR! 2011, Coventry, United Kingdom useR! 2012, Nashville, Tennessee, USA useR! 2013, Albacete, Spain
    • David Moya
       
      R es un lenguaje basado en el uso de línea de comandos. Soporta matrices, escalares y vectores además de operar estadísticamente. Su cálculo en el ámbito de matrices es comparable a otros softwares como pueden ser Matlab o GNU Octave.
    • pajoje lololo
       
      Hemos elegido consultar la información general sobre R en la versión en inglés de Wikipedia, ya que nos parecía más completa y elaborada. En primer lugar se enumeran las capacidades principales de este lenguaje y algunos de sus principales usos. También se destaca el hecho de que es 'GNU project' y que está disponible bajo licencia GPL. A pesar de ser un lenguaje que utiliza la linea de comandos, se descaca que existen diversas interfaces gráficas para facilitar su uso. En un apartado posterior se enumeran algunas de las principales versiones de estas interfaces. http://en.wikipedia.org/wiki/R_(programming_language)#Graphical_user_interfaces Se destaca en varios de los apartados del artículo la enorme versatilidad y capacidad de adaptación a distintos campos que posee este lenguaje debido a la gran cantidad de paquetes y extensiones que soporta. También se indica que debido a su herencia del lenguaje S, está más dirigido a la programación orientada a objetos que la mayoria de lenguajes estadísticos. Finalmente se destaca el uso comercial que se le ha dado a este lenguaje, y encontramos ejemplos como el de Oracle y el de Revolution Analytics.
Antonio Legaz

Data Mining Algorithms In R - Wikibooks, open books for an open world - 0 views

    • Antonio Legaz
       
      El Data Mining consiste en una serie de algoritmos que mediante el procesamiento de gran cantidad de datos o datasets descubre una serie de patrones en estos.
    • Antonio Legaz
       
      El lenguaje R nos sirve para aplicar la técnica del Data Mining a estos datasets facilitando la tarea y permitiendo obtener patrones que serían imposibles de observar sin la ayuda de ordenadores.  Existen además otros lenguajes, no obstante la característica que destaca de R sobre el resto es que se trata de un lenguaje con licencia libre y es accesible a cualquier empresa, sea cual sea su tamaño. 
  • The choice of the R project as the computational platform associated with this Wikibook stems from its popularity (and thus critical mass), ease of programming, good performance, and an increasing use in several fields, such as bioinformatics and finances, among others.
Enrique Diaz Romero

¿Qué es R? | Omnia sunt Communia! - 0 views

  • Una de sus grandes fortalezas es que puede ser ampliado mediante paquetes que extienden sus funcionalidades.
  • Actualmente hay más de 2860 paquetes publicados con licencias libres y disponibles en un repositorio general (CRAN), y unos 400 paquetes destinados al análisis de genomas (Bioconductor).
  • Los paquetes publicados en CRAN están organizados en lo que denominan “Task Views“, abarcando aplicaciones tales como  Empirical Finance, Computational Econometrics, Social Sciences, Analysis of Ecological and Environmental Data, Official Statistics & Survey Methodology, Chemometrics and Computational Physics, Natural Language Processing, Time Series Analysis
  • ...2 more annotations...
  • En el campo de la visualización de datos destacan especialmente tres paquetes: lattice, latticeExtra y ggplot2.
  • Destacan los paquetes gWidgets (para interfaces de escritorio: ejemplo) y gWidgetsWWW (para interfaces vía web y aplicaciones en un servidor: ejemplo). También hay interfaces ya construidas orientadas hacia el análisis de datos (por ejemplo, latticist, playwith y rattle).
  •  
    Aquí se pueden observar la gran variedad de paquetes, orientados a diferentes tipos de aplicaciones. "Task Views", visualización de datos, interfaces gráficas simplificadas y personalizadas para interfaces web, para aplicaciones en servidores o orientadas hacia análisis de datos.
Javier Soriano

Conclusión - 0 views

R es un tipo de lenguaje de programación el cual fue diseñádo expresamente para el análisis de datos. Gracias a R, es más facil extraer conclusiones a partir de datos multidimensionales con tablas ...

started by Javier Soriano on 27 Apr 13 no follow-up yet
Alpha Teleco

R - 2 views

De los documentos que hemos podido leer, podemos concluir que R, es un lenguaje de programación que es muy útil dentro del ámbito de la empresa, ya que se puede utilizar en diferentes áreas dentro ...

R empresa estadistica algoritmo software libre lenguaje programacion

started by Alpha Teleco on 01 May 13 no follow-up yet
Bora Jasan

R Statistics, R Statistical Consulting Home - 0 views

    • Bora Jasan
       
      Este es un ejemplo de una empresa que se dedica a proveer datos estadísticos, análisis de distintos tipos, data mining... Además, también atienden a diferentes negocios como servicios financieros, productos médicos, etc. Es, en definitiva, lo que nos puede aportar el lenguaje de programación R a nivel empresarial.
  • R Statistical Consulting provides statistical software development and consulting services. We design statistical based algorithms in the R language that provide advanced statistical / graphical data analysis, R Project time series analysis, econometrics, data mining, machine learning, statistical computing and optimization.
  • We currently serve a broad range of businesses, specifically including the financial services, medical product, and hotel industries. We provide end-to-end solutions that provide our clients the tools needed to make critical business decisions that impact the company's bottom line.
  • ...1 more annotation...
  • R Statistical Consulting draws on over 20 years of experience in computational algorithmic infrastructure and database development. We also have depth of experience in the migration of functionality to newer, advanced platforms.
Enrique Diaz Romero

An Introduction to R - 1 views

    • nerub val
       
      las carateristicas generales de R
    • nerub val
       
      El desarrollo de R
  • R is an integrated suite of software facilities for data manipulation, calculation and graphical display. Among other things it has an effective data handling and storage facility, a suite of operators for calculations on arrays, in particular matrices, a large, coherent, integrated collection of intermediate tools for data analysis, graphical facilities for data analysis and display either directly at the computer or on hardcopy, and a well developed, simple and effective programming language (called ‘S’) which includes conditionals, loops, user defined recursive functions and input and output facilities. (Indeed most of the system supplied functions are themselves written in the S language.)
    • Enrique Diaz Romero
       
      El entorno de R entre otras cosas nos permite el uso y almacenamiento eficaz de datos, así como su análisis en forma de matrices, un gran numero de herramientas graficas y un lenguaje claro y sencillo de programación en el que podemos encontrar un gran numero de funciones.
  • ...4 more annotations...
  • his section presumes the reader has some familiarity with statistical methodology, in particular with regression analysis and the analysis of variance. Later we make some rather more ambitious presumptions, namely that something is known about generalized linear models and nonlinear regression. The requirements for fitting statistical models are sufficiently well defined to make it possible to construct general tools that apply in a broad spectrum of problems. R provides an interlocking suite of facilities that make fitting statistical models very simple. As we mention in the introduction, the basic output is minimal, and one needs to ask for the details by calling extractor functions.
  • When you use the R program it issues a prompt when it expects input commands. The default prompt is ‘>’, which on UNIX might be the same as the shell prompt, and so it may appear that nothing is happening. However, as we shall see, it is easy to change to a different R prompt if you wish. We will assume that the UNIX shell prompt is ‘$’.
  • R can be regarded as an implementation of the S language which was developed at Bell Laboratories by Rick Becker, John Chambers and Allan Wilks, and also forms the basis of the S-Plus systems. The evolution of the S language is characterized by four books by John Chambers and coauthors. For R, the basic reference is The New S Language: A Programming Environment for Data Analysis and Graphics by Richard A. Becker, John M. Chambers and Allan R. Wilks. The new features of the 1991 release of S are covered in Statistical Models in S edited by John M. Chambers and Trevor J. Hastie. The formal methods and classes of the methods package are based on those described in Programming with Data by John M. Chambers. See References, for precise references. There are now a number of books which describe how to use R for data analysis and statistics, and documentation for S/S-Plus can typically be used with R, keeping the differences between the S implementations in mind. See What documentation exists for R?.
  • R (“GNU S”), a language and environment for statistical computing and graphics. R is similar to the award-winning1 S system, which was developed at Bell Laboratories by John Chambers et al. It provides a wide variety of statistical and graphical techniques
    • Enrique Diaz Romero
       
      ¿Que es R y de donde viene? R nos lo presentan como un lenguaje y entorno que desciende del reconocido sistema S desarrollado por los laboratorios Bell, y que nos ofrece una serie de técnicas u herramientas para el análisis estadístico y gráfico
  •  
    Introducción completa al lenguaje R de programación para análisis de datos estadísticos.
1 - 11 of 11
Showing 20 items per page