Skip to main content

Home/ foe_2013/ Group items tagged Analisis de datos

Rss Feed Group items tagged

Alexis Agustín

Data mining. ¿Cómo extraer la máxima información de Twitter? | Rizomática - 0 views

  • posibilidad de poder extraer la información no trivial que subyace en ese flujo continuo que está generando más de 170 de millones de tuits cada día.
  • Hoy, Twitter es una red de microblogging que permite conocer lo que se habla y lo que interesa a la gente.
  • para realizar esta minería de datos (Data mining), he empezado a utilizar el lenguaje de programación R, un software libre para análisis estadístico y gráfico muy popular en las tareas de investigación de la comunidad científica en campos tan punteros como la biomedicina y la bioinformática
  • ...15 more annotations...
  • Para extraer la información de Twitter, el entorno de programación del lenguaje R suministra extensiones o paquetes, como twitteR que permite, entre otras opciones, extraer tuits públicos
  • Una vez que hemos obtenido los datos en bruto, es decir, la colección de tuits que cumplen unas determinadas condiciones, con el lenguaje R y las funciones especializadas podemos trasladar las informaciones de los tuits en tablas normalizadas que nos permitirán realizar una exploración analítica de los datos y su representación gráfica
  • el lenguaje R también nos aporta potentes herramientas para empezar a pulir los 140 caracteres con el objetivo de localizar información que nos permita conocer sobre que temas se está hablando,
  • Asimismo, tenemos la posibilidad de realizar análisis, en el texto del tuit, de actitudes positivas o negativas hacia un determinado acontecimiento, producto o servicio.
  • Esto último, denominado análisis de los sentimientos o minería de opinión,
  • es un área de investigación que persigue poder identificar y extraer información subjetiva de textos y documentos, algo nada fácil considerando la ambigüedad que puede conllevar el lenguaje natural y el contexto cultural particular de cada persona.
    • Alexis Agustín
       
      Este articulo que al parecer todos hemos encontrado, hace un analisis de como usa R para extraer la mineria de datos de twitter con un programa expecifico programado en dicho lenguaje y representa datos claves sobre los usuarios que serian utiles para aplicarlos en el departamento de marketing.
    • Joca Vijo
       
      Es decir, 'R' no sólo recopila información de diversas fuentes (como Twitter), sino que además puede analizar esa información y recopilarla en conjuntos de datos.
  • al margen de los datos estructurados que podemos extraer: usuario, conexiones con otros usuarios, fecha y hora de publicación
  • con el lenguaje R y las funciones especializadas podemos trasladar las informaciones
  • Una vez que hemos obtenido los datos en bruto
  • en tablas normalizadas que nos permitirán realizar una exploración analítica de los datos y su representación gráfica
  • , de actitudes positivas o negativas hacia un determinado acontecimiento, producto o servicio
  • Asimismo, tenemos la posibilidad de realizar análisis, en el texto
  • el aspecto más interesante es poder extraer información significativa del propio texto
  • Una vez que hemos obtenido los datos en bruto, es decir, la colección de tuits que cumplen unas determinadas condiciones, con el lenguaje R y las funciones especializadas podemos trasladar las informaciones de los tuits en tablas normalizadas que nos permitirán realizar una exploración analítica de los datos y su representación gráfica
  •  
    R en data mining
  •  
    R en data mining
Enrique Diaz Romero

Introducción a R: historia de un lenguaje de computación para el análisis de ... - 2 views

    • Borja Herrero
       
      El artículo nos presenta la evolución del lenguaje R desde su nacimiento. El lenguaje R es un dialecto del S. Para más información leer el artículo subrayado.
    • juan carlos carlos
       
      El lenguaje R permite mover gran cantidad de informacion y representarla como graficos, estadisticas, cuestionarios y analisis. Esto lo hace un lenguaje muy practico en los campos nombrados en el párrafo.
    • juan carlos carlos
       
      El avance de este lenguaje es inminente y ya podemos verlo en aplicaciones avanzadas de sony como la famosa PS3.
  • ...29 more annotations...
    • Rafa Vaño
       
      En esta página se repasa la creación del lenguaje de programación R a partir del lenguaje S. Se cuenta cómo evolucionó el lenguaje S para que finalmente apareciera el actual lenguaje de programación R.
  • para tratar esas cantidades ingentes de datos atómicos y convertirlos en información
  • Nuevo S y S4
  • de esa necesidad de tratar con datos surgieron los lenguajes de tratamiento estadístico, como R
  • Nuevo S y S4
  • de la que se pueda inferir un conocimiento
  • ‘S’, el antepasado de R
  • ‘S’, el antepasado de R
  • la mayor parte del análisis y computación estadísticos se realizaba por medio de subrutinas en Fortran
  • desarrollaron ‘S’ como un conjunto de bibliotecas de macros Fortran, que se convirtieron en su entorno de análisis estadístico interno
  • Nuevo S y S4
  • en código C
  • En 1988, se reescribió completamente S
  • se sustituyeron las macros por funciones y se modificó la sintaxis para hacerla más consistente, aunque también más estricta
  • se añadieron las funciones de modelado estadístico
  • en 1998 se liberó la cuarta versión, que actualmente es vigente, también denominada S4
  • S-Plus y los cambios de manos
  • En 1993, Bell Labs vendió a StatSci la licencia para la explotación comercial de S
  • sacaron su versión comercial bajo el nombre S-Plus, haciendo referencia a las múltiples características que habían añadido a S (principalmente interfaz gráfica).
  • En 2004 adquirió la totalidad del lenguaje S y en 2008 fue comprada por Tibco, que es el propietario actual.
  • tras todos estos cambios de compañía, los fundamentos de S apenas han variado desde 1998
  • R, el dialecto libre de S
  • Ross Ihaka y Robert Gentleman
  • Era 1991 cuando estos dos neozelandeses crearon R
  • gran similitud sintáctica con S-Plus
  • puede ejecutarse sobre cualquier sistema operativo convencional, e incluso en plataformas tan inverosímiles como puede ser una PlayStation 3.
  • muy poco soporte para gráficos dinámicos o en 3D
  • obligación de que todos los objetos se guarden en memoria física
  • R no es un lenguaje ideal para todas las situaciones, pero sin duda es uno de los más útiles a la hora de estructurar y manipular datos, especialmente grandes colecciones de ellos.
  •  
    Probablemente, cuando intentamos pensar en el avance de la informática y de la electrónica asociada a ella, nos vienen a la mente portátiles, tabletas, teléfonos inteligentes... y ejecutándose en ellos webs, videojuegos, aplicaciones de realidad aumentada... Pero a lo mejor unos pocos recuerdan que también tenemos cada vez mayor cantidad y más variada de sensores, capaces de realizar mediciones, almacenarlas y transmitirlas. En este enlace nos muestra como tambien se utiliza para aplicaciones electronicas de gestion de datos a gran velocidad como seria la Playstation
  •  
    Pequeña introducción al lenguaje de programación R e historia de este, con su evolucion
Enrique Diaz Romero

Analisis de supervivencia basico utilizando el lenguaje R | Rafael Borges - Academia.edu - 0 views

  • Análisis de supervivencia utilizando el lenguaje R
  • El paquete survival permite llevar a cabo análisis de supervivencia para datos que presentandiversos mecanismos de censura
  • La función Surv permite crear objetos tipo survival, la estructura para datos que presentancensura por la derecha es
  • ...10 more annotations...
  • La función survfit
  • La función survdiff
  • Estructura del archivo de datos dpa.txt
  • Lectura de los datos en R.
    • Enrique Diaz Romero
       
      Ejemplo de el uso del lenguaje R para el análisis de supervivencia. Podemos ver en acción el uso del lenguaje. 
    • Enrique Diaz Romero
       
      Descripción del paquete survival que nos permite analizar los datos mediante funciones con mecanismos de censura y finalización. Funciones:  *Surv  *Survfit  *survdiff
    • Enrique Diaz Romero
       
      Ejemplo de un archivo de datos en los que incluimos los datos que queremos analizar, los cuales en este caso hace referencia al registro de un hospital. 
  • Estimación de la función de supervivencia a través del estimador de Kaplan yMeier.
  • plot(km1,xlab="Meses",ylab="Supervivencia", main="Gráfico No. 1.Estimador de Kaplan y Meier"
    • Enrique Diaz Romero
       
      Ejemplo de calculo de tabla de supervivencias y posterior muestra gráfica de los datos calculados.
  •  
    Análisis de supervivencia básico utilizando el lenguaje R Ejemplo de un tipo de analisis utilizando el lenguaje R
Alexis Agustín

Actuarial Analytics in R - 0 views

    • Alexis Agustín
       
      En este artículo se expone la increible versatilidad del lenguaje R con un monton de ejemplos en los que se ha usado (Analisis de estadisticas en Baseball, juzgar la calidad de un vino, analisis de datos de un scanner de supermercado) y luego introduce una presentacion donde se analizan 4 casos entre los que se encuentra uno interesante sobre el tiempo ademas de otro donde se valora los datos de un grupo de trabajadores
  • With data analysis showing up in domains as varied as baseball, evidence-based medicine, predicting recidivism and child support lapses, judging wine quality, credit scoring, supermarket scanner data analysis, and “genius” recommendation engines, “business analytics” is part of the zeitgeist. This is a good moment for actuaries to remember that their discipline is arguably the first – and a quarter of a millennium old – example of business analytics at work.
  • This session will include an overview of the R statistical computing environment as well as a sequence of brief case studies of actuarial analyses in R. Case studies will include examples from loss distribution analysis, ratemaking, loss reserving, and predictive modeling.
    • Alexis Agustín
       
      En este artículo se expone la increible versatilidad del lenguaje R con un monton de ejemplos en los que se ha usado (Analisis de estadisticas en Baseball, juzgar la calidad de un vino, analisis de datos de un scanner de supermercado) y luego introduce una presentacion donde se analizan 4 casos entre los que se encuentra uno interesante sobre el tiempo ademas de otro donde se valora los datos de un grupo de trabajadores
Alexis Agustín

R, análisis de datos profesional y abierto | Thp - 0 views

  • Es un software de uso común en departamentos de business intelligence dentro de las empresas, pero también es utilizado en investigación.
  • Esta pensado para poder trabajar con muchos datos, es ideal para el trabajo en bigdata. Asimismo, no solo es capaz de tratar los datos sino que también es capaz de tomar esos datos, de tal forma que podemos automatizar el proceso de toma de datos (útil si esos datos se encuentran en internet y son elaborados por terceros).
  • Al tratarse de un software pensado en clave estadística, dispone de una mayor varidedad de gráficos de los que puedan tener otros sistemas más sencillos y fáciles de usar como el Excel
  • ...1 more annotation...
  • Un par de buenas noticias para finalizar este breve análisis. La primera es que disponemos de una suite llamada RStudio que hace algo más sencillo el trabajo con R. La segunda es que podemos aprender a usar R de forma bastante sencilla y gamificada a través de Try R, un curso online elaborado por la editorial O'Reilly usando la plataforma Code School de forma totalmente gratuita.
Alpha Teleco

Comparison of data analysis packages: R, Matlab, SciPy, Excel, SAS, SPSS, Stata | AI an... - 2 views

  • R Library support; visualization Steep learning curve Yes Finance; Statistics
  • Matlab Elegant matrix support; visualization Expensive; incomplete statistics support No Engineering
  •  
    En esta página web podemos observar una tabla comparativa entre las herramientas de analisis de datos más importantes
Alexis Agustín

See how Deloitte uses R for actuarial analysis - 0 views

    • Alexis Agustín
       
      Aqui un consultor de Deloitte nos muestra como usa R para explorar datos y ajustarlos en distribuciones, calculando proyecciones usando la regresion de Poisson. Ademas lo contrapone a Excel, concluyendo que no hay una hoja de calculo en la que confundir columnas, si no que en lineas de codigo simple que se puede copiar se puede trabajar mas facilmente con grandes cantidades de datos
  • Jim Guszcza (Predictive Analytics lead at Deloitte Consulting and Assistant Professor at UW-Madison) who gave a great webinar presentation yesterday
  • R is used for exploratory data analysis and modeling, with a live examples of fitting a mixute distribution to bimodal claims data, and calculating loss reserves using Poisson regression.
  • ...2 more annotations...
  • Just one simple line of [R] code that would work just as well for a 100-by-100 loss triangle as it would for a 10-by-10 triangle. No hidden cells in the spreadsheet, no risk of spreadsheet error. It's a little bit of code you could look at in one screen, it's replicable ... and this does all the work that a spreadsheet would do. 
  • He uses the Allstate Claim Prediction Challenge data (from a recent Kaggle competition) to fit a Tweedie model to 13 million records of claim data. (The Tweedie distribution is often used to model insurance claims, where many claims are exactly zero, and non-zero claims follow a continuous Gamma-like distribution.) Using the forthcoming rxGLM function, he fit the model to this large data set in just over two minutes (140.22 seconds) using a single quad-core PC.
David Moya

Carlos Riff Moya - 0 views

    • David Moya
       
      R es al mismo tiempo un programa y un lenguaje de programación, funciona por comandos, dispone de una biblioteca de estadísticas muy amplia y se le pueden añadir más por el sistema de "packages".
    • David Moya
       
      Es un lenguaje objeto, su estructura de base es el vector. Lo que se pretende con este lenguaje es programar técnicas, estadísticas, analisis de datos y "data mining"
  • Il dispose d'une bibliothèque très large de fonctions statistiques
  • ...5 more annotations...
  • Il fonctionne sous la forme d'un interpréteur de commandes.
  • R est à la fois un logiciel de statistique et un langage de programmation.
  • 'il est possible d'en intégrer de nouvelles par le système des "packages"
  • c'est un langage objet, la structure de base est le vecteur, une bibliothèque très riche de fonctions permettant de manipuler ces structures sont disponibles.
  • la plupart des illustrations consisteront à programmer des techniques statistiques, d'analyse de données et de data mining.
LaRuPu upv

R Spatial Projects | GeoDa Center - 0 views

  • This collection of web pages is intended to be a guide to some of the resources for the analysis of spatial data using R, and other associated software. Corrections and contributions are very welcome, and may be made through the mailing list R-sig-Geo, or directly to the site maintainer. Another useful resource is the CRAN Spatial Task View. Please note that all software and documentation here provided or described is done so "as is" without warranty of any kind.
  •  
    Proyectos en los que se ysa del lenguage R para el analisis de datos provenientes del espacio.
Sébastien Sanchez

R Is Hot: The New Global Statistics Language R - Revolution Analytics - 1 views

    • Borja Herrero
       
      R es lenguaje de programación utilizado para procesar grandes bases de datos, por ejemplo; predicción de analisis, sistemas de decisión.
    • Borja Herrero
       
      El lenguaje R se va convirtiendo en algo indispensable para una empresa y poco a poco se va extendiendo en el mercado, ya que innova y se desarrolla de forma continua, convrtiendose en una herramienta muy util.
    • Sébastien Sanchez
       
      Explicación del porqué la programación R se ha hecho tan popular y revolucionaria. Resumen de las propiedades más destacadas de R y de quien se aprovecha de sus beneficios únicos.
  • ...7 more annotations...
  • R is a full-fledged programming language with a radically different approach to processing large and complex datasets
  • R community develops and releases new software continuously
  • R also offers benefits to companies trying to reduce their software expenditures with enterprise software vendors such as SAS and SPSS.
  • R is especially useful for quickly and easily generating charts and graphics
  • R allows
  • to create high-quality charts and graphs
  • R allowed them to effectively communicate their analytic results in ways that were easily understood by non-technical audiences
Carlos Espinosa

"Introducción a R: historia de un lenguaje de computación para el análisis de... - 0 views

    • Carlos Espinosa
       
      En esta página se nos muestra el porqué del desarrollo de los lenguajes estadísticos como el lenguaje R y también se nos muestra los pros y los contras del lenguaje R respecto al S y a los demás. Se afirma que el lenguaje R no es bueno para todas las situaciones pero sin duda es uno de los lenguajes más útiles.
nerub val

R Programming/Introduction - Wikibooks, open books for an open world - 1 views

  • R is statistical software which is used for data analysis.
  • It includes a huge number of statistical procedures such as t-test, chi-square tests, standard linear models, instrumental variables estimation, local polynomial regressions, etc. It also provides high-level graphics
  • capabilities
  • ...14 more annotations...
  • R is an object oriented programming language. This means that virtually everything can be stored as an R object. Each object has a class. This class describes what the object contains and what each function does with it. For instance, plot(x) produces different outputs depending on whether x is a regression object or a vecto
  • The assignment symbol is "<-". Alternatively, the classical "=" symbol can be used.
  • Arguments are passed to functions inside round brackets (parentheses). One can easily combine functions. For instance you can directly type
  • The symbol "#" comments to the end of the line:
  • Commands are normally separated by a newline. If you want to put more than one statement on a line, you can use the ";" delimiter.
  • You can also have one statement on multiple lines. R is case sensitive: a and A are two different objects. Traditionally underscores "_" are not used in names. It is often better to use dots ".". One should avoid using an underscore as the first character of an object name.
  • Here are some things editors do to keep this book internally consistent. If you have something to contribute, go ahead and make your contribution. Other editors can touch up your edits afterwards so that they conform to the guidelines.
  • The local manual of style WB:LMOS for the R programming book, including a brief explanation of why we do it that way, is: Examples use "source" tags : <source lang="rsplus"> a <- 1:10 ; mean(a) </source>. That makes them look pretty to our readers. The name of packages are in bold  : '''Hmisc'''. Name of functions are in "code" tags: <code>lm()</code>. Page titles -- the part after "R Programming/" -- are in sentence case, like "R Programming/Working with data frames". We couldn't decide between sentence case and title case, so I flipped a coin. Every page has <noinclude>{{R Programming/Navigation}}</noinclude> at the top and {{R Programming/Navbar|Mathematics|Probability Distributions}} at the bottom. That makes it easier to navigate from one page to another online.
    • nerub val
       
      La lenguaje R es un software de estatisticas que hace analisis de los datos.
    • nerub val
       
      Las ventajas de la lenguaje R
    • nerub val
       
      las caracteristicas de la lenguaje R
    • nerub val
       
      Cómo podemos empezar a hacer un programa con esa lenguaje?
    • nerub val
       
      Aqui se exponen otras alternativas al lenguaje R. Y aconseja en la ultima parte cuales son los recomendados para cada nivel de dominio del lenguaje R
  • Beginners can have a look at GNU PSPP or Gretl. Intermediate users can check out Stata. Advanced users who like matrix programming may prefer MATLAB or Octave. Very advanced users may use C or Fortran.
1 - 12 of 12
Showing 20 items per page