Skip to main content

Home/ foe_2013/ Group items tagged algoritmo

Rss Feed Group items tagged

Enrique Diaz Romero

R Package for Data Mining - RDataMining.com: R and Data Mining - 0 views

  • The package will provide various functionalities for data mining, with contributions from many R users. 
  • To forester the development of data mining capability in R and facilitate sharing of data mining codes/functions/algorithms among R users
  • Function authors will be acknowledged as authors of corresponding functions in help documentation and manual of the package
  • ...8 more annotations...
  • Function authors will be responsible for the development, maintenance and documentation of their contributed functions
  • It is far beyond the capability of a single team, even several teams
  • Data Exploration
  • Decision Trees
  • Association Rules
  • Text Mining
  • R and Data Mining: Examples and Case Studies
    • Enrique Diaz Romero
       
      Ejemplo de paquete para la minería de Datos: rdatamining.com, se encarga de la recolección de algoritmos y funciones de DataMining en R para la confección de un gran paquete que incluya todos estos, ya que muchas veces se realizan numerosos algoritmos, pero no se comparten al  no crear paquetes para solo un algoritmo. Ademas, mantiene la propiedad del creador del algoritmo permitiendo eliminar este del paquete cuando quiera y abandonar el proyecto. Como ejemplos podemos ver, la exploración de datos, los arboles de decisiones, agrupaciones jerarquicas, text mining, ect Ademas cuenta con un gran numero de libros.
  •  
    Paquete de R para Data Mining, información y objetivo
diigo lemon

Ecología austral - ¿Por qué comprar un programa estadístico si existe R? - 0 views

  • implementan distintos algoritmos para llevar a cabo los mismos tipos de análisis, los usuarios se benefician de una comparación entre los programas más usados
  • son bastante específicos y se circunscriben a aspectos puntuales.
  • Amigabilidad con el usuario.
  • ...59 more annotations...
  • comparación general sobre la base de una serie de aspectos
  • SAS (SAS Institute Inc. 2007) ha sido por largos años el software más utilizado en la comunidad estadística
    • empresa 2013
       
      En cada color se remarcan sus caracteristicas: -SPSS en amarillo -SAS en rosa -R en azul
    • empresa 2013
       
      En verde caracteristicas conjuntas.
  • SPSS es bastante amigable para el usuario, ya que permite acceder a todas las opciones mediante un menú de funciones
  • SAS y R requieren conocer la sintaxis y/o los comandos antes de ejecutar un procedimiento, lo cual los hace poco amigables para aquellos usuarios no familiarizados con la programación computacional
  • R no es necesario utilizar el menú de funciones
  • para ejecutar SAS, además de requerir sintaxis es necesario utilizar los botones de la interfaz gráfica
  • b. Manipulación de datos.
  • Tanto SPPS como SAS permiten abrir el archivo de datos en una ventana aparte, lo cual puede ser importante para algunos usuarios.
  • R muestra los datos, o una porción de ellos, según se requiera, aunque empleando la función "fix" también es posible mostrar y editar los datos en una ventana.
  • c. Calidad de gráficos.
  • d. Control de procesos.
  • e. Costo
  • f. Variedad de análisis estadísticos
  • g. Documentación y soporte de ayuda.
  • h. Sistemas operativos
  • SPSS ofrece una serie de gráficos tipo que si bien pueden modificarse en su formato
  • son difíciles de personalizar
  • SAS como R permiten el diseño personalizado de gráficos
  • SAS requiere del uso de diferentes rutinas (o paquetes)
  • R son más sencillas (o "planas") y no requieren de una gran cantidad de paquetes.
  • Tanto SPSS y SAS ofrecen generalmente una gran cantidad de salidas completas ("outputs") para un procedimiento estadístico cualquiera
  • R ofrece como salidas sólo aspectos básicos y, en el caso de que el usuario necesite más detalles, debe solicitarlos especialmente.
  • R es totalmente gratuito y está disponible en Internet,
  • SAS es el software estadístico más caro del mercado.
  • SPPS cuesta U$S 1599 (SPPS Inc. 2007), un valor promedio a levemente alto entre los programas estadísticos de similar categoría, y corresponde a una licencia perpetua
  • A pesar de que el sistema operativo (S.O.) Microsoft Windows® está ampliamente difundido, existe una gran cantidad de usuarios que usan otros sistemas operativos. Los tres programas analizados están implementados para Windows®. Si bien tanto SPSS como SAS pueden funcionar en el S.O. Linux, su configuración es compleja. SPPS también puede ejecutarse en Macintosh®. R es el único que funciona de manera estable e íntegra en los tres sistemas operativos de mayor uso. La versatilidad de plataformas donde R puede ser instalado ofrece una ventaja para los diferentes usuarios en distintas disciplinas.
  • Una ventaja de SPSS y de SAS es el soporte (e.g., servicio al cliente), a través del cual es posible indicar problemas de ejecución en ciertos procedimientos y, por lo tanto, obtener el respaldo técnico de las respectivas empresas.
  • para R no existe un respaldo formal de una empresa con respecto a todos sus paquetes, rutinas y funcionamiento general. Es decir, R no tiene ninguna garantía legal y el usuario asume cualquier potencial problema causado por su uso
  • SPPS ofrece un amplio rango de procedimientos estadísticos, que probablemente cubren gran parte de los que se utilizan en ecología e ingeniería. Sin embargo, cuando se requiere de mayores especificaciones en los procedimientos (e.g., el ajuste de un modelo no lineal no converge y es necesario definir el rango posible de valores para los parámetros del modelo), SPPS no ofrece mucha versatilidad.
  • SAS es un software de sólido desarrollo y en donde la empresa invierte cerca del 20% de sus utilidades en investigación (SAS 2007). Por lo tanto, la variedad de procedimientos implementados es bastante amplia.
  • R ha sido desarrollado por estadísticos que trabajan en diferentes instituciones a nivel mundial y, por lo tanto, implementa algoritmos modernos y robustos. Además, un número importante de paquetes están continuamente siendo desarrollados y puestos a disposición en Internet para su instalación.
  • nueva alternativa, el programa R
  • Existen varios programas estadísticos genéricos.
  • uso de los botones de la interfaz gráfica
  • SPSS (SPSS Inc. 2007) es un software lanzado al mercado en 1968.
  • programa estadístico y un lenguaje de programación de uso libre, de distribución gratuita y de código abierto
  • ciencias sociales
  • SAS (SAS Institute Inc. 2007) ha sido por largos años el software más utilizado en la comunidad estadística
  • uso sencillo de las opciones, acceso rápido a datos y procedimientos, generación de salidas y gráficos
  • SAS (SAS Institute Inc. 2007)
  • requiere el ingreso de comandos
  • SAS (SAS Institute Inc. 2007)
  • necesita del conocimiento de la sintaxis antes de su uso
  • R (Ihaka & Gentleman 1996; R Development Core Team 2007)
  • programa estándar empleado en ensayos clínicos y por la industria farmacéutica en los Estados Unidos.
  • basado sobre comandos, en el que se puede acceder a todos los procedimientos y opciones a través de sintaxis computacional.
  • similar al programa estadístico S-plus
  • derivados de un lenguaje estadístico llamado S y
  • orientación y administración diferentes a las de R, y además se enfocan en aquellos mercados y usuarios que les proporcionan los mayores beneficios.
  • SPSS como SAS son programas comerciales
    • Joan Bono
       
      Aunque visualmente, no tan avanzado o bonito como puede ser SPSS o SAS, en relación calidad precio, muchísimo mejor (no olvidemos que es de licencia gratuita), y nada tiene que envidiar a los otros dos programas conocidos en cuanto a funcionalidad, que al fin y al cabo, es lo que cuenta. Algo que destacar de R es que para el poco tiempo de "vida" que tiene, cuenta ya con gran cantidad de librerias y algoritmos robustos que son implementados por científicos de todo el mundo.
  • se comparan con el software estadístico R. Sobre la base de este análisis, se propone el uso de R en ciencias ecológicas e ingeniería en Latinoamérica y en países del tercer mundo en general, porque ofrece el uso gratuito de un software de primer nivel, así como también un mayor control de los análisis conducidos, extensa documentación, y un ambiente de programación desarrollado para aplicaciones estadísticas y con capacidad para ser empleado en otras áreas cuantitativas de diversas disciplinas.
  • ¿Por qué comprar un programa estadístico si existe R?
  • R muestra los datos, o una porción de ellos, según se requiera, aunque empleando la función "fix" también es posible mostrar y editar los datos en una ventana. Debido a que tanto SAS como R emplean sintaxis y procedimientos que afectan a los datos en una memoria virtual, cualquier modificación en los datos (e.g., crear una variable que no existe en el archivo) no es guardada físicamente en el archivo (a menos que se requiera al finalizar una sesión). Es decir, uno puede incorporar transformaciones a un archivo de datos, dejando intacto el archivo original. Esta es una gran ventaja ya que por muchos análisis que se realicen, siempre es posible partir de un único archivo de datos, evitando la duplicación de versiones.
  • R es totalmente gratuito y está disponible en Internet, al igual que cada versión nueva. No es necesario pagar ni por obtener el software ni por actualizarlo. La instalación típica de R consiste de una serie de paquetes, y cada paquete nuevo que ha sido desarrollado es publicado en Internet, desde donde se puede obtener y agregar a R. A diferencia de SPSS y de SAS, la distribución de R es actualizable, pudiéndosele agregar paquetes adicionales por separado.
  • La renovación e implementación de nuevos procedimientos en R es relativamente rápida. Frecuentemente aparecen nuevos procedimientos y/o paquetes en desarrollo y en revisión, los cuales después pueden ser obtenidos a través de Internet e instalados directamente.
  • la capacidad de producir gráficos de calidad y la amplia documentación gratuita, entre otros aspectos, hacen de R un excelente programa estadístico para ser usado en docencia e investigación. La gratuidad de R además, permite no solo trasmitir el uso de un software legal, sino también acceder libremente a un programa de alta calidad. Por otra parte, la transparencia en la construcción de R permite un mayor control del proceso de generación de conocimiento por parte de los usuarios.
    • diigo lemon
       
      En este artículo se dan a conocer las diversas herramientas de análisis estadístico que están en el mercado y hace una comparación entre ellas. Centrándonos en R, podemos destacar: su poca amabilidad con el usuario, ya que se trata de un lenguaje difícil; su buena disposición al manejo de datos; su sencillez y gran calidad en el diseño de gráficos; su flexibilidad en el control de procesos, gracias a ser de código abierto; su disposición gratis a través de internet ya que se trata de software libre de código abierto; su gran variedad de análisis estadísticos ya que al ser de código abierto, acepta contribuciones de todos los usuarios; su gran cantidad de documentación y el buen soporte de ayuda al que contribuye toda la comunidad de usuarios realizando manuales gratuitos; su versatilidad al poder usarse perfectamente en Windows, Macintosh y Linux. El artículo finaliza con las conclusiones, las cuales se basan principalmente en que es un software libre de código abierto que ofrece una gran variedad de análisis estadísticos, la alta calidad de sus gráficos y la amplia documentación gratuita.
Alpha Teleco

R - 2 views

De los documentos que hemos podido leer, podemos concluir que R, es un lenguaje de programación que es muy útil dentro del ámbito de la empresa, ya que se puede utilizar en diferentes áreas dentro ...

R empresa estadistica algoritmo software libre lenguaje programacion

started by Alpha Teleco on 01 May 13 no follow-up yet
pajoje lololo

How R Can Help Your Business - ReadWrite - 0 views

    • pajoje lololo
       
      En este curioso artículo se habla de una especie de competición de programación en R, en el cual se exponen algunos ejemplos en los que este lenguaje puede serle útil a la industria. Concretamente se habla del ejercicio ganador, que consistió en un algoritmo capaz de evaluar los Tweets para estimar la satisfacción de los clientes y extraer conclusión sobre la calidad del servicio que ofrece la empresa, en este caso, la industria de las aerolineas.
grupo empresa

R programming - R language - R commander | R statistics - 0 views

    • grupo empresa
       
      el lenguaje de programación R, es un lenguaje con el los elementos gráficos y los algoritmos se relacionan perfectamente, esto hace que sea un lenguaje bastante intuitivo y muy útil a nivel práctico.
  • The R programming language is a populair and easy to use programming langauge used on combination with R commander. R provides a lot of statistical and graphical functions and it is highly extensible. The best thing about R is that it is easy to plot high quality graphics.
Antonio Legaz

datanalytics » Experiencia y Recursos de Estadística - 0 views

    • Antonio Legaz
       
      El lenguaje R simplifica trabajo respecto al C a la hora de programar y trabajar con algoritmos estadísticos por ser un lenguaje interpretado, una de sus desventajas es que no es un código eficiente, es decir resolver problemas puede resultar muy costoso a la hora de computar los datos introducidos. Para resolver este problema se incorporan rutinas escritas en otros lenguajes
    • Antonio Legaz
       
      Esta puede ser la visión que tiene un programador que trabaje directamente implementando programas en R ya que nos da información de sus características y también de sus desventajas
Antonio Legaz

Data Mining Algorithms In R - Wikibooks, open books for an open world - 0 views

    • Antonio Legaz
       
      El Data Mining consiste en una serie de algoritmos que mediante el procesamiento de gran cantidad de datos o datasets descubre una serie de patrones en estos.
    • Antonio Legaz
       
      El lenguaje R nos sirve para aplicar la técnica del Data Mining a estos datasets facilitando la tarea y permitiendo obtener patrones que serían imposibles de observar sin la ayuda de ordenadores.  Existen además otros lenguajes, no obstante la característica que destaca de R sobre el resto es que se trata de un lenguaje con licencia libre y es accesible a cualquier empresa, sea cual sea su tamaño. 
  • The choice of the R project as the computational platform associated with this Wikibook stems from its popularity (and thus critical mass), ease of programming, good performance, and an increasing use in several fields, such as bioinformatics and finances, among others.
nelvia del cisne gonza ajila

Paquetes de Software estadísticos - Ficha técnica de Victor De Ponte en Prezi - 0 views

  • MATLAB es un entorno de programación para el desarrollo de algoritmos, el análisis y la visualización de datos y el cálculo numéric
  • R es un lenguaje y un ambiente de desarrollo para computacion estadistica y grafica
  • y tecnicas
  • ...14 more annotations...
  • . R provee una gran variedad estadistica
  • graficas,
  • R está disponible
  • como software libre, bajo los términos de Free Software Foundation’s GNU General Public License, y su código fuente está disponible.
  • ompilable y ejecutable
  • reeBSD y Linux, Windows, y MacOS
  • plataformas UNIX
  • Ventajas Ventajas de MatLAB 1.
  • Es costoso 2.
  • suele ser mas lento
  • esventajas Ventajas de R
  • completamente gratuito y código abierto
  • propia documentacion en formato parecido a LaTeX
  • Desventajas de R No acepta programas o scripts escritos en MatLab,
  •  
    En esta página se presentan algunas de las diferencias entre el lenguaje R y el matlab, que es un programa que estamos aprendiendo a usar.
Enrique Diaz Romero

Conclusion FOE - 0 views

En conclusión al material buscado e indexado, R es un lenguaje de programación orientado a la estadística y manipulación de datos, así como si se trabaja en la creación de gráficos gracias a los da...

opinion personal empresas diigo

started by Enrique Diaz Romero on 25 Jun 13 no follow-up yet
Enrique Diaz Romero

En conclusión al mat - 0 views

En conclusión al material buscado e indexado, R es un lenguaje de programación orientado a la estadística y manipulación de datos, así como si se trabaja en la creación de gráficos gracias a los da...

opinion personal empresas diigo

started by Enrique Diaz Romero on 25 Jun 13 no follow-up yet
1 - 10 of 10
Showing 20 items per page