Skip to main content

Home/ foe_2013/ Group items tagged data mining

Rss Feed Group items tagged

Enrique Diaz Romero

R Package for Data Mining - RDataMining.com: R and Data Mining - 0 views

  • The package will provide various functionalities for data mining, with contributions from many R users. 
  • To forester the development of data mining capability in R and facilitate sharing of data mining codes/functions/algorithms among R users
  • Function authors will be acknowledged as authors of corresponding functions in help documentation and manual of the package
  • ...8 more annotations...
  • Function authors will be responsible for the development, maintenance and documentation of their contributed functions
  • It is far beyond the capability of a single team, even several teams
  • Data Exploration
  • Decision Trees
  • Association Rules
  • Text Mining
  • R and Data Mining: Examples and Case Studies
    • Enrique Diaz Romero
       
      Ejemplo de paquete para la minería de Datos: rdatamining.com, se encarga de la recolección de algoritmos y funciones de DataMining en R para la confección de un gran paquete que incluya todos estos, ya que muchas veces se realizan numerosos algoritmos, pero no se comparten al  no crear paquetes para solo un algoritmo. Ademas, mantiene la propiedad del creador del algoritmo permitiendo eliminar este del paquete cuando quiera y abandonar el proyecto. Como ejemplos podemos ver, la exploración de datos, los arboles de decisiones, agrupaciones jerarquicas, text mining, ect Ademas cuenta con un gran numero de libros.
  •  
    Paquete de R para Data Mining, información y objetivo
LaRuPu upv

Data Mining Applications with R - RDataMining.com: R and Data Mining - 0 views

shared by LaRuPu upv on 01 May 13 - No Cached
  • Data ExplorationDecision Treesk-means ClusteringHierarchical ClusteringOutlier DetectionTime Series AnalysisTime Series Clustering and ClassificationAssociation RulesText MiningSocial Network AnalysisParallel ComputingOther Examples
  •  
    Uso aplicado de aplicaciones Data mining en R para el análisis de datos.
Alexis Agustín

Data mining. ¿Cómo extraer la máxima información de Twitter? | Rizomática - 0 views

  • posibilidad de poder extraer la información no trivial que subyace en ese flujo continuo que está generando más de 170 de millones de tuits cada día.
  • Hoy, Twitter es una red de microblogging que permite conocer lo que se habla y lo que interesa a la gente.
  • para realizar esta minería de datos (Data mining), he empezado a utilizar el lenguaje de programación R, un software libre para análisis estadístico y gráfico muy popular en las tareas de investigación de la comunidad científica en campos tan punteros como la biomedicina y la bioinformática
  • ...15 more annotations...
  • Para extraer la información de Twitter, el entorno de programación del lenguaje R suministra extensiones o paquetes, como twitteR que permite, entre otras opciones, extraer tuits públicos
  • Una vez que hemos obtenido los datos en bruto, es decir, la colección de tuits que cumplen unas determinadas condiciones, con el lenguaje R y las funciones especializadas podemos trasladar las informaciones de los tuits en tablas normalizadas que nos permitirán realizar una exploración analítica de los datos y su representación gráfica
  • el lenguaje R también nos aporta potentes herramientas para empezar a pulir los 140 caracteres con el objetivo de localizar información que nos permita conocer sobre que temas se está hablando,
  • Asimismo, tenemos la posibilidad de realizar análisis, en el texto del tuit, de actitudes positivas o negativas hacia un determinado acontecimiento, producto o servicio.
  • Esto último, denominado análisis de los sentimientos o minería de opinión,
  • es un área de investigación que persigue poder identificar y extraer información subjetiva de textos y documentos, algo nada fácil considerando la ambigüedad que puede conllevar el lenguaje natural y el contexto cultural particular de cada persona.
    • Alexis Agustín
       
      Este articulo que al parecer todos hemos encontrado, hace un analisis de como usa R para extraer la mineria de datos de twitter con un programa expecifico programado en dicho lenguaje y representa datos claves sobre los usuarios que serian utiles para aplicarlos en el departamento de marketing.
    • Joca Vijo
       
      Es decir, 'R' no sólo recopila información de diversas fuentes (como Twitter), sino que además puede analizar esa información y recopilarla en conjuntos de datos.
  • al margen de los datos estructurados que podemos extraer: usuario, conexiones con otros usuarios, fecha y hora de publicación
  • con el lenguaje R y las funciones especializadas podemos trasladar las informaciones
  • Una vez que hemos obtenido los datos en bruto
  • en tablas normalizadas que nos permitirán realizar una exploración analítica de los datos y su representación gráfica
  • , de actitudes positivas o negativas hacia un determinado acontecimiento, producto o servicio
  • Asimismo, tenemos la posibilidad de realizar análisis, en el texto
  • el aspecto más interesante es poder extraer información significativa del propio texto
  • Una vez que hemos obtenido los datos en bruto, es decir, la colección de tuits que cumplen unas determinadas condiciones, con el lenguaje R y las funciones especializadas podemos trasladar las informaciones de los tuits en tablas normalizadas que nos permitirán realizar una exploración analítica de los datos y su representación gráfica
  •  
    R en data mining
  •  
    R en data mining
Antonio Legaz

Adding power to data mining with R - 0 views

    • Antonio Legaz
       
      El lenguaje R supone una alternativa para las empresas que no tienen los medios o el capital suficiente para contratar expertos en minería de datos. Es un lenguaje relativamente sencillo además de ser software libre,en otras palabras, gratis.
  •  
    Pequeña descripción del lenguaje R y su enfoque hacia el "data mining" en los negocios.
Sébastien Sanchez

R, the Software, Finds Fans in Data Analysts - NYTimes.com - 0 views

  • While it is difficult to calculate exactly how many people use R, those most familiar with the software estimate that close to 250,000 people work with it regularly.
    • corozo56
       
      Actualmente el número de usuarios esta creciendo exponencialmente.
  • “R is a real demonstration of the power of collaboration, and I don’t think you could construct something like this any other way,” Mr. Ihaka said. “We could have chosen to be commercial, and we would have sold five copies of the software.”
  • Data Analysts Captivated by R’s Power
    • corozo56
       
      Este artículo del NYTimes explica el origen y la utilidad del lenguaje de programacion en R.
  • ...12 more annotations...
    • Sébastien Sanchez
       
      Artículo en NYTimes que habla de la creciente implantación del lenguaje de programación R en el ámbito empresarial. Explica como cada vez más, grandes empresas como Google empiezan a emplear este lenguaje de programación para todo tipo de propósitos (investigación comercial, data mining…).
  • Open-source software is free for anyone to use and modify
  • an improve
  • R is similar to other programming languages
  • R is also the name of a popular programming language used by a growing number of data analysts inside corporations and academia
  • For statisticians
  • R is particularly useful because it contains a number of built-in mechanisms for organizing data, running calculations on the information and creating graphical representations of data sets.
  • statisticians, engineers and scientists can improve the software’s code or write variations for specific tasks
  • software’s
  • Packages written for R add advanced algorithms, colored and textured graphs and mining techniques to dig deeper into databases
  • While it is difficult to calculate exactly how many people use R, those most familiar with the software estimate that close to 250,000 people work with it regularly
  • “R is a real demonstration of the power of collaboration, and I don’t think you could construct something like this any other way,” Mr. Ihaka said. “We could have chosen to be commercial, and we would have sold five copies of the software.”
julianc1c

GMK: Data Mining - Entornos visuales de programacion para R. - 0 views

  •  
    programas para data mining
Enrique Diaz Romero

Decision Trees - RDataMining.com: R and Data Mining - 0 views

  •  
    Ejemplo de Data Mining con R, en este en concreto el uso de R para la creación de arboles de Decisión.
juan trinidad jimenez armesto

R, the Software, Finds Fans in Data Analysts - NYTimes.com - 0 views

    • juan trinidad jimenez armesto
       
      Debido al aumento estos últimos años de la necesidad del data mining por el gran número de datos que manejas las empresas y la posibilidad de buscar patrones comunes, las grandes empresas empezaron a utilizar R como herramienta para ello.
    • juan trinidad jimenez armesto
       
      Además R es de código libre, como también lo son Apache o la bases de datos MySQL, haciendo que el proyecto se desarolle en comunidades de usuarios.
    • juan trinidad jimenez armesto
       
      Existen numerosos paquetes con funciones predefinidas por otros usuarios para facilitar la programación
  • ...11 more annotations...
  • Many people view the end results of all this technology via the Firefox Web browser, also open-source software.
  • R is also the name of a popular programming language used by a growing number of data analysts inside corporations and academia. It is becoming their lingua franca partly because data mining has entered a golden age
  • Companies as diverse as Google, Pfizer, Merck, Bank of America, the InterContinental Hotels Group and Shell use it.
  • R has also quickly found a following because statisticians, engineers and scientists without computer programming skills find it easy to use.
  • Many people view the end results of all this technology via the Firefox Web browser, also open-source software.
  • Most Web sites are displayed using an open-source application called Apache, and companies increasingly rely on the open-source MySQL database to store their critical information. Many people view the end results of all this technology via the Firefox Web browser, also open-source software.
  • For statisticians
  • R is particularly useful because it contains a number of built-in mechanisms for organizing data, running calculations on the information and creating graphical representations of data sets.
  • What makes R so useful
  • is that statisticians, engineers and scientists can improve the software’s code or write variations for specific tasks. Packages written for R add advanced algorithms, colored and textured graphs and mining techniques to dig deeper into databases.
  • The financial services community has demonstrated a particular affinity for R; dozens of packages exist for derivatives analysis alone.
Bora Jasan

R Statistics, R Statistical Consulting Home - 0 views

    • Bora Jasan
       
      Este es un ejemplo de una empresa que se dedica a proveer datos estadísticos, análisis de distintos tipos, data mining... Además, también atienden a diferentes negocios como servicios financieros, productos médicos, etc. Es, en definitiva, lo que nos puede aportar el lenguaje de programación R a nivel empresarial.
  • R Statistical Consulting provides statistical software development and consulting services. We design statistical based algorithms in the R language that provide advanced statistical / graphical data analysis, R Project time series analysis, econometrics, data mining, machine learning, statistical computing and optimization.
  • We currently serve a broad range of businesses, specifically including the financial services, medical product, and hotel industries. We provide end-to-end solutions that provide our clients the tools needed to make critical business decisions that impact the company's bottom line.
  • ...1 more annotation...
  • R Statistical Consulting draws on over 20 years of experience in computational algorithmic infrastructure and database development. We also have depth of experience in the migration of functionality to newer, advanced platforms.
Sébastien Sanchez

http://cran.r-project.org/doc/contrib/Zhao_R_and_data_mining.pdf - 0 views

    • Sébastien Sanchez
       
      Extenso pdf dirigido a programadores con ejemplos y explicaciones sobre cómo aplicar data mining empleando el lenguaje de programación R.
Antonio Legaz

Data Mining Algorithms In R - Wikibooks, open books for an open world - 0 views

    • Antonio Legaz
       
      El Data Mining consiste en una serie de algoritmos que mediante el procesamiento de gran cantidad de datos o datasets descubre una serie de patrones en estos.
    • Antonio Legaz
       
      El lenguaje R nos sirve para aplicar la técnica del Data Mining a estos datasets facilitando la tarea y permitiendo obtener patrones que serían imposibles de observar sin la ayuda de ordenadores.  Existen además otros lenguajes, no obstante la característica que destaca de R sobre el resto es que se trata de un lenguaje con licencia libre y es accesible a cualquier empresa, sea cual sea su tamaño. 
  • The choice of the R project as the computational platform associated with this Wikibook stems from its popularity (and thus critical mass), ease of programming, good performance, and an increasing use in several fields, such as bioinformatics and finances, among others.
Juanjo Cristian

R, the Software, Finds Fans in Data Analysts - NYTimes.com - 0 views

  • R describe it  as a supercharged version of  Microsoft’s Excel
  • R describe it  as a supercharged version of Microsoft’s Excel
  • R describe it  as a supercharged version of Microsoft’s Excel
  • ...26 more annotations...
  • R describe it  as a supercharged version of  Microsoft’s Excel
  • R describe it  as a supercharged version of
  • R describe it  as a supercharged version of  Microsoft’s Excel
  • R describe it  as a supercharged version of  Microsoft’s Excel
  • R describe it  as a supercharged version of  Microsoft’s Excel
  • is particularly useful because it contains a number of built-in mechanisms for organizing data, running calculations on the information and creating graphical representations of data sets.
  • familiar
  • familiar
  • It allows statisticians to do very intricate and complicated analyses without knowing the blood and guts of computing systems.”
  • It is also free.
  • R is an open-source program, and its popularity reflects a shift in the type of software used inside corporations
  • R describe it  as a supercharged version of Microsoft’s Excel
  • R is similar to other programming languages, like C, Java and Perl, in that it helps people perform a wide variety of computing tasks by giving them access to various commands.
  • Excel
  • Microsoft’s
  • version
  • supercharged
  • Some people familiar with R describe it
  • familiar
  • Mr. Gentleman is applying R-based software, called Bioconductor, in work he is doing on computational biology at the Fred Hutchinson Cancer Research Center in Seattle.
  • The popularity of R at universities could threaten SAS Institute, the privately held business software company that specializes in data analysis software. SAS, with more than $2 billion in annual revenue, has been the preferred tool of scholars and corporate managers.
  • Google, for example, taps R for help understanding trends in ad pricing and for illuminating patterns in the search data it collects.
  • Pfizer has created customized packages for R to let its scientists manipulate their own data during nonclinical drug studies rather than send the information off to a statistician.
  • R first appeared in 1996, when the statistics professors Ross Ihaka and Robert Gentleman of the University of Auckland in New Zealand released the code as a free software package.
    • Sébastien Sanchez
       
      Artículo en NYTimes que habla de la creciente implantación del lenguaje de programación R en el ámbito empresarial. Explica como cada vez más, grandes empresas como Google empiezan a emplear este lenguaje de programación para todo tipo de propósitos (investigación comercial, data mining…).
    • Juanjo Cristian
       
      El lenguaje de programación R ha cautivado a gran parte de los analistas de datos debido a su potencial en el ámbito de la estadística especialmente. También es usado por grandes empresas como Google o Bank of America y por estadistas y científicos.
  •  
    Se trata de un artículo del New York Times en el que describe la historia del lenguaje y diferentes empresas que lo utilizan y los usos que le dan, como Google y Pfizer.
Alpha Teleco

Time Series Analysis and Mining with R | (R news & tutorials) - 0 views

    • Alpha Teleco
       
      Cómo clasificar y agrupar series de tiempo en R y explicación mediante una serie de ejemplos.
  • classification and clustering of time series data are not readily supported by existing R functions or packages.
    • Alpha Teleco
       
      Ejemplo de descomposición de una serie temporal, con el ejemplo de pasajeros de avión.
  • ...18 more annotations...
  • Time series data are widely seen in analytics. Some examples are stock indexes/prices, currency exchange rates and electrocardiogram (ECG)
  • Time Series Decomposition
  • Time series decomposition is to decompose a time series into trend, seasonal, cyclical and irregular components.
    • Alpha Teleco
       
      Serie de tiempo original.
    • Alpha Teleco
       
      Tendencia.
    • Alpha Teleco
       
      Factores estacionales.
    • Alpha Teleco
       
      Componente aleatoria.
    • Alpha Teleco
       
      Previsión de hechos futuros basados en conocidos.
  • Time Series Forecasting
  • Time series forecasting is to forecast future events based on known past data.
    • Alpha Teleco
       
      Agrupar series temporales basandose en su similitud o distancia.
  • Time Series Clustering
    • Alpha Teleco
       
      Ejemplo de agrupacion con 600 graficos, agrupados en 6 grupos. (Normales, ciclicos, tendencia alcista, tendencia bajista...)
  • Time series clustering is to partition time series data into groups based on similarity or distance, so that time series in the same cluster are similar.
    • Alpha Teleco
       
      Clasificacion de series de tiempo. Construir un modelo de clasificacion basado en las series de tiempo marcadas y usando el modelo construido, predecir la continuación de la series.
  • o build a classification model based on labelled time series and then use the model to predict the label of unlabelled time series.
  • Time series classification is t
  • Time Series Classification
David Moya

Carlos Riff Moya - 0 views

    • David Moya
       
      R es al mismo tiempo un programa y un lenguaje de programación, funciona por comandos, dispone de una biblioteca de estadísticas muy amplia y se le pueden añadir más por el sistema de "packages".
    • David Moya
       
      Es un lenguaje objeto, su estructura de base es el vector. Lo que se pretende con este lenguaje es programar técnicas, estadísticas, analisis de datos y "data mining"
  • Il dispose d'une bibliothèque très large de fonctions statistiques
  • ...5 more annotations...
  • Il fonctionne sous la forme d'un interpréteur de commandes.
  • R est à la fois un logiciel de statistique et un langage de programmation.
  • 'il est possible d'en intégrer de nouvelles par le système des "packages"
  • c'est un langage objet, la structure de base est le vecteur, une bibliothèque très riche de fonctions permettant de manipuler ces structures sont disponibles.
  • la plupart des illustrations consisteront à programmer des techniques statistiques, d'analyse de données et de data mining.
Rafa Llopis

R You Ready for R? (1/2) - 0 views

  • Data Analysts Captivated by R’s Power
    • Rafa Llopis
       
      Artículo del New York Times que explica desde el principio las bases del lenguaje R y en qué se emplea.
  • used to set ad prices, find new drugs more quickly or fine-tune financial models
  • Google, Pfizer, Merck, Bank of America, the InterContinental Hotels Group and Shell use it.
  • ...17 more annotations...
  • R is also the name of a popular programming language used by a growing number of data analysts inside corporations and academia.
  • R is really important to the point that it’s hard to overvalue it,” said Daryl Pregibon
  • “It allows statisticians to do very intricate and complicated analyses without knowing the blood and guts of computing systems.”
  • R is similar to other programming languages, like C, Java and Perl
  • . I.B.M., Hewlett-Packard and Dell make billions of dollars a year selling servers that run the open-source Linux operating system
  • Web sites are displayed using an open-source application called Apache,
  • the end results of all this technology via the Firefox Web
  • can help illuminate data trends more clearly than is possible by entering information into rows and columns
  • What makes R so useful
  • is that statisticians, engineers and scientists can improve the software’s code or write variations for specific tasks
  • advanced algorithms, colored and textured graphs and mining techniques to dig deeper into databases.
  • Packages written for R add
  • the professors considered their coding efforts more of an academic game than anything else.
  • the notion of devising something like R sprang up during a hallway conversation.
  • They both wanted technology better suited for their statistics students
  • R immediately gained a following with people who saw the possibilities in customizing the free software.
  • “The diversity and excitement around what all of these people are doing is great,” Mr. Chambers said.
juan trinidad jimenez armesto

Conclusiones lenguaje R - 0 views

'R' es un proyecto de software libre (gratuito), resultado de la implementación GNU del lenguaje S, cuyas ventajas principales son la calidad y cantidad de opciones gráficas y estadísticas que prop...

started by juan trinidad jimenez armesto on 08 May 13 no follow-up yet
juan trinidad jimenez armesto

Conclusiones lenguaje R - 1 views

'R' es un proyecto de software libre (gratuito), resultado de la implementación GNU del lenguaje S, cuyas ventajas principales son la calidad y cantidad de opciones gráficas y estadísticas que prop...

started by juan trinidad jimenez armesto on 08 May 13 no follow-up yet
Sébastien Sanchez

Sébastien Teva Sanch - 0 views

started by Sébastien Sanchez on 25 Apr 13 no follow-up yet
Antonio Legaz

Reflexión sobre el lenguaje R - 0 views

El lenguaje R es una herramienta en alza en el campo de las finanzas y los negocios. Esto se debe a su relativa facilidad de uso con respecto a otros lenguajes de programación y a que es software l...

started by Antonio Legaz on 30 Apr 13 no follow-up yet
Paco Hormigo

Lenguaje R | Rizomática - 0 views

  •  
    En una entrada anterior, Data mining. Análisis de las actividades de los usuarios en Twitter, hemos podido ver como la minería de datos nos permite analizar la actividad de los usuarios, en términos de frecuencia de su actividad en Twitter. Lo que ha sido una sorpresa para el grupo
1 - 20 of 22 Next ›
Showing 20 items per page