Skip to main content

Home/ foe_2013/ Contents contributed and discussions participated by Alexis Agustín

Contents contributed and discussions participated by Alexis Agustín

Alexis Agustín

R, análisis de datos profesional y abierto | Thp - 0 views

  • Es un software de uso común en departamentos de business intelligence dentro de las empresas, pero también es utilizado en investigación.
  • Esta pensado para poder trabajar con muchos datos, es ideal para el trabajo en bigdata. Asimismo, no solo es capaz de tratar los datos sino que también es capaz de tomar esos datos, de tal forma que podemos automatizar el proceso de toma de datos (útil si esos datos se encuentran en internet y son elaborados por terceros).
  • Al tratarse de un software pensado en clave estadística, dispone de una mayor varidedad de gráficos de los que puedan tener otros sistemas más sencillos y fáciles de usar como el Excel
  • ...1 more annotation...
  • Un par de buenas noticias para finalizar este breve análisis. La primera es que disponemos de una suite llamada RStudio que hace algo más sencillo el trabajo con R. La segunda es que podemos aprender a usar R de forma bastante sencilla y gamificada a través de Try R, un curso online elaborado por la editorial O'Reilly usando la plataforma Code School de forma totalmente gratuita.
Alexis Agustín

R, un lenguaje de programación que seduce - 2 views

  • El New York Times publicó una nota recientemente sobre sobre el lenguaje de programación R, destacando el hecho de que se trata de software libre, siendo los analistas de datos los más cautivados
  • La operación de procesar datos es utilizada tanto para fijar precios, perfeccionar modelos financieros o encontrar nuevas medicinas, es así que R se utiliza en Pfizer, Merck, Google, el InterContinental Hotels Group, Bank of America o Shell, empresas muy diversas.
  • ¿Y por qué R es tan utilizado? Porque científicos, ingenieros, estadísticos que no son expertos en programación pueden emplearlo rápidamente.
    • Alexis Agustín
       
      Ademas al ser software libre, se reducen costes de licencias en las empresas y en uso propio.
Alexis Agustín

Ecología austral - ¿Por qué comprar un programa estadístico si existe R? - 0 views

  • se comparan con el software estadístico R. Sobre la base de este análisis, se propone el uso de R en ciencias ecológicas e ingeniería en Latinoamérica y en países del tercer mundo en general, porque ofrece el uso gratuito de un software de primer nivel, así como también un mayor control de los análisis conducidos, extensa documentación, y un ambiente de programación desarrollado para aplicaciones estadísticas y con capacidad para ser empleado en otras áreas cuantitativas de diversas disciplinas.
  • ¿Por qué comprar un programa estadístico si existe R?
  • R muestra los datos, o una porción de ellos, según se requiera, aunque empleando la función "fix" también es posible mostrar y editar los datos en una ventana. Debido a que tanto SAS como R emplean sintaxis y procedimientos que afectan a los datos en una memoria virtual, cualquier modificación en los datos (e.g., crear una variable que no existe en el archivo) no es guardada físicamente en el archivo (a menos que se requiera al finalizar una sesión). Es decir, uno puede incorporar transformaciones a un archivo de datos, dejando intacto el archivo original. Esta es una gran ventaja ya que por muchos análisis que se realicen, siempre es posible partir de un único archivo de datos, evitando la duplicación de versiones.
  • ...3 more annotations...
  • R es totalmente gratuito y está disponible en Internet, al igual que cada versión nueva. No es necesario pagar ni por obtener el software ni por actualizarlo. La instalación típica de R consiste de una serie de paquetes, y cada paquete nuevo que ha sido desarrollado es publicado en Internet, desde donde se puede obtener y agregar a R. A diferencia de SPSS y de SAS, la distribución de R es actualizable, pudiéndosele agregar paquetes adicionales por separado.
  • La renovación e implementación de nuevos procedimientos en R es relativamente rápida. Frecuentemente aparecen nuevos procedimientos y/o paquetes en desarrollo y en revisión, los cuales después pueden ser obtenidos a través de Internet e instalados directamente.
  • la capacidad de producir gráficos de calidad y la amplia documentación gratuita, entre otros aspectos, hacen de R un excelente programa estadístico para ser usado en docencia e investigación. La gratuidad de R además, permite no solo trasmitir el uso de un software legal, sino también acceder libremente a un programa de alta calidad. Por otra parte, la transparencia en la construcción de R permite un mayor control del proceso de generación de conocimiento por parte de los usuarios.
Alexis Agustín

R, análisis de datos profesional y abierto | Thp - 0 views

  • Es el nombre de un proyecto de código abierto consistente en un lenguaje de programación y un software de código abierto. Este software nos permite poder analizar datos de múltiples formas.
  • Es un software de uso común en departamentos de business intelligence dentro de las empresas, pero también es utilizado en investigación. 
  • Al tratarse de un software de código abierto, podemos decir que está vivo. La comunidad de R trabaja constantemente en desarrollar nuevas versiones mejoradas y en elaborar paquetes específicos para diferentes tipos de análisis. Así podemos encontrar paquetes de todo tipo (4293 a fecha de hoy), desde específicos para biólogos o genetistas, hasta modelos de hábitos de compra para marketing, pasando evidentemente por paquetes estadísticos de todo tipo y calidad.
  • ...3 more annotations...
  • Esta pensado para poder trabajar con muchos datos, es ideal para el trabajo en bigdata. Asimismo, no solo es capaz de tratar los datos sino que también es capaz de tomar esos datos, de tal forma que podemos automatizar el proceso de toma de datos (útil si esos datos se encuentran en internet y son elaborados por terceros).
  • Al tratarse de un software pensado en clave estadística, dispone de una mayor varidedad de gráficos
  • Hemos dicho que una de las peculiaridades de este software es que no dispone de una interfaz visual, que se utilizar a través de un lenguage de programación propio. Esta misma desventaja es en realidad una ventaja, ya que ese mismo hecho hace que tengamos más libertad para hacer lo que queramos
Alexis Agustín

See how Deloitte uses R for actuarial analysis - 0 views

    • Alexis Agustín
       
      Aqui un consultor de Deloitte nos muestra como usa R para explorar datos y ajustarlos en distribuciones, calculando proyecciones usando la regresion de Poisson. Ademas lo contrapone a Excel, concluyendo que no hay una hoja de calculo en la que confundir columnas, si no que en lineas de codigo simple que se puede copiar se puede trabajar mas facilmente con grandes cantidades de datos
  • Jim Guszcza (Predictive Analytics lead at Deloitte Consulting and Assistant Professor at UW-Madison) who gave a great webinar presentation yesterday
  • R is used for exploratory data analysis and modeling, with a live examples of fitting a mixute distribution to bimodal claims data, and calculating loss reserves using Poisson regression.
  • ...2 more annotations...
  • Just one simple line of [R] code that would work just as well for a 100-by-100 loss triangle as it would for a 10-by-10 triangle. No hidden cells in the spreadsheet, no risk of spreadsheet error. It's a little bit of code you could look at in one screen, it's replicable ... and this does all the work that a spreadsheet would do. 
  • He uses the Allstate Claim Prediction Challenge data (from a recent Kaggle competition) to fit a Tweedie model to 13 million records of claim data. (The Tweedie distribution is often used to model insurance claims, where many claims are exactly zero, and non-zero claims follow a continuous Gamma-like distribution.) Using the forthcoming rxGLM function, he fit the model to this large data set in just over two minutes (140.22 seconds) using a single quad-core PC.
Alexis Agustín

Actuarial Analytics in R - 0 views

    • Alexis Agustín
       
      En este artículo se expone la increible versatilidad del lenguaje R con un monton de ejemplos en los que se ha usado (Analisis de estadisticas en Baseball, juzgar la calidad de un vino, analisis de datos de un scanner de supermercado) y luego introduce una presentacion donde se analizan 4 casos entre los que se encuentra uno interesante sobre el tiempo ademas de otro donde se valora los datos de un grupo de trabajadores
  • With data analysis showing up in domains as varied as baseball, evidence-based medicine, predicting recidivism and child support lapses, judging wine quality, credit scoring, supermarket scanner data analysis, and “genius” recommendation engines, “business analytics” is part of the zeitgeist. This is a good moment for actuaries to remember that their discipline is arguably the first – and a quarter of a millennium old – example of business analytics at work.
  • This session will include an overview of the R statistical computing environment as well as a sequence of brief case studies of actuarial analyses in R. Case studies will include examples from loss distribution analysis, ratemaking, loss reserving, and predictive modeling.
    • Alexis Agustín
       
      En este artículo se expone la increible versatilidad del lenguaje R con un monton de ejemplos en los que se ha usado (Analisis de estadisticas en Baseball, juzgar la calidad de un vino, analisis de datos de un scanner de supermercado) y luego introduce una presentacion donde se analizan 4 casos entre los que se encuentra uno interesante sobre el tiempo ademas de otro donde se valora los datos de un grupo de trabajadores
Alexis Agustín

Trabajos que necesitan R - 1 views

  •  
    Distintos trabajos que necesitan de R, y distintas empresas que (incluso hoy en dia) reclaman programadores, programadores estadisticos... Un ejemplo de las distintas salidas que se pueden conseguir con R.
Alexis Agustín

III Jornadas de Usuarios de R - 1 views

shared by Alexis Agustín on 16 Apr 13 - No Cached
  • Las jornadas son el reflejo de la importancia creciente de R en diversas áreas y disciplinas, tanto en la universidad como fuera de ella.
    • Alexis Agustín
       
      El lenguaje de programacion R, esta en auge, debido a sus caracteristicas inigualables (entre ellas su precio), lo que se demuestra con cursos como estos, a los que acuden los empleados de distintas instituciones.
Alexis Agustín

Data mining. ¿Cómo extraer la máxima información de Twitter? | Rizomática - 0 views

  • es un área de investigación que persigue poder identificar y extraer información subjetiva de textos y documentos, algo nada fácil considerando la ambigüedad que puede conllevar el lenguaje natural y el contexto cultural particular de cada persona.
    • Alexis Agustín
       
      Este articulo que al parecer todos hemos encontrado, hace un analisis de como usa R para extraer la mineria de datos de twitter con un programa expecifico programado en dicho lenguaje y representa datos claves sobre los usuarios que serian utiles para aplicarlos en el departamento de marketing.
  • Una vez que hemos obtenido los datos en bruto, es decir, la colección de tuits que cumplen unas determinadas condiciones, con el lenguaje R y las funciones especializadas podemos trasladar las informaciones de los tuits en tablas normalizadas que nos permitirán realizar una exploración analítica de los datos y su representación gráfica
  •  
    R en data mining
1 - 9 of 9
Showing 20 items per page