Skip to main content

Home/ InternetActu/ Group items tagged data mining

Rss Feed Group items tagged

hubert guillaud

L'invasion des profanateurs de données - NYTimes.com - 0 views

  •  
    Quelle est la frontière entre un service public et une atteinte à la vie privée ? La publication de la cartographie des propriétaires d'armes par un journal américain après la tuerie de Newton - http://www.lohud.com/article/20121224/NEWS04/312240045/The-gun-owner-next-door-What-you-don-t-know-about-weapons-your-neighborhood?gcheck=1 - nous rappelle que quand il s'agit de vie privée, nous sommes tous hypocrites. Le centre américain de contre-terrorisme a été autorisé par un procureur à stocker des informations sur les Américains ordinaires, sans qu'ils soient suspects de quoique ce soit, lui permettant d'enquêter sur toute base de donnée. Le Congrès a renouvelé la loi qui permet l'écoute des appels téléphoniques et des e-mails. "La position de l'administration Obama sur la vie privée consiste à dire "Faites-nous confiance, nous sommes bons"", souligne Daniel Solove. "Mais c'est ce que dit tout despote." La publication de la liste par ce journal ne nous dit rien de qui dispose d'armes illégales. Elle a au final favorisé la NRA et risque de provoquer une disparition de ce type de base de données. Pas sûr que cela nous ait fait avancer.
hubert guillaud

Etude : seulement 1% des données sont analysées - Guardian DataBlog - 0 views

  •  
    Selon une étude publiée par Digital Universe - http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-2020.pdf - seulement 0,5 % des données publiées sont utilisées pour l'analyse et 3 % sont étiquetées. Seulement 20 % des données sont protégées quand 35 % mériteraient de l'être.
hubert guillaud

The comScore Data Mine | Colorful, bite-sized graphical representations of the best dis... - 0 views

  •  
    Le recueil de statistiques de ComScore sur le numérique.
hubert guillaud

Un algorithme permettant de remonter à la source d'une information circulant ... - 0 views

  •  
    Le chercheur de l'EPFL Pedro Pinto a développé un algorithme capable de remonter à la source de tout type d'information circulant dans un réseau complexe. Etude : http://prl.aps.org/abstract/PRL/v109/i6/e068702
hubert guillaud

Comment fouiller les données des téléphones mobiles sans envahir la vie privé... - 0 views

  •  
    Des chercheurs de AT&T, la Rutgers University, Princeton et l'université Loyola ont mis au point un moyen d'extraire des données de téléphonie cellulaire pour faire des études sur la mobilité sans révéler l'identité des utilisateurs, en obfuscant les données permettant la réidentification. L'idée est de faire une représentation synthétique, proche de la représentation des données agrégées, mais sans induire les réels parcours des gens. La solution, utiliser un algorithme différentiel qui calcul le risque d'identification pour le réduire en altérant les données. L'idée est d'introduire du bruit dans le modèle pour réduire la ré-identification, explique Margaret Martonosi de Princeton. Leur méthode a été publié publiquement afin que d'autres chercheurs puissent l'utiliser. 
hubert guillaud

Fouiller les dossiers de santé électronique pour révéler des données sur la s... - 0 views

  •  
    Les dossiers de santé électronique aux Etats-Unis ne sont pas une réussite, révélait il y a peu une étude de la Rand Corporation - http://www.nytimes.com/2013/01/11/business/electronic-records-systems-have-not-reduced-health-costs-report-says.html . Mais le rapport a négligé l'économie à la recherche que pourrait apporter ces bases de données électroniques. La fouille de données dans les dossiers de santé pourrait s'avérer riche en découvertes. Les professeur Altman et Tatonetti ont publié en 2011 une étude (et un algorithme) permettant de rechercher dans ces dossiers des pairs de médicaments qui pris ensemble provoquaient un effet indésirable, permettant notamment de mettre à jour un rapport indésirable entre un antidépresseur et un médicament anti-cholestérol. L'accès aux dossiers des patients permet d'étudier une population réelle. Mais les données saisies dans ces dossiers sont loin d'être complètes ou fiables. Comment anonymiser les dossiers et les rendre accessibles aux chercheurs ?
hubert guillaud

Qu'est-ce que les candidats savent de vous ? - Mashable - 0 views

  •  
    A l'approche des élections américaines, Mashable s'est intéressé aux données dont les candidats disposent sur leurs électeurs. Si le ciblage des équipes d'Obama est plus avancé, Romney a plus de succès auprès des grands électeurs. Mais tous savent surtout convaincre les plus convaincus. Le problème reste d'aller au-delà. Le Saint-Graal, celui qui permettrait de faire correspondre les messages des gens aux affirmations des candidats, n'est pas encore là.
hubert guillaud

Détecter les effets indésirables des médicaments grâce au data mining : Quest... - 0 views

  •  
    Le projet européen EU-ADR - http://www.alert-project.org - utilise les données de santé personnelles de 30 millions de patients pour détecter les mauvaises combinaisons médicamenteuses. 
hubert guillaud

La fouille de données révèle les surprenants comportements des utilisateurs d... - 0 views

  •  
    Sur les sites de rencontres, les hommes ont tendance à cherche des jeunes femmes, alors que les femmes mettent davantage l'accent sur le statut socio-économique de leurs partenaires potentiels. L'analyse qui a porté sur 200 000 utilisateurs du site de rencontre chinois baihe montre que les hommes envoient en moyenne 15 à 20 messages dès leur inscription et continuent au même rythme, alors que les femmes envoient deux fois plus de messages la première semaine avant de poursuivre à un taux beaucoup plus faible. Les hommes envoient plus de messages mais obtiennent bien moins de réponses. Autre enseignement, les femmes ont tendance à s'écarter beaucoup plus de leurs préférences déclarées que les hommes (notamment sur les attributs d'âge, de taille, de localisation...) mais sont moins souples que les hommes que l'état civil ou le nombre d'enfants. Certains choix semblent parfaitement aléatoires (taille, niveau d'éducation), alors que d'autres demeurent très forts comme la différence d'âge ou la distance géographique. Reste que la probabilité de répondre est plus grande lorsque l'attribut de l'expéditeur correspond à la préférence exprimée du récepteur.
hubert guillaud

La fouille de données montre les embarrassants problèmes des Mooc - Technolog... - 0 views

  •  
    Non seulement les chiffres d'audience des Moocs ne sont pas bons, mais la participation aux forums est elle-même assez faible. La raison ? Bah, ce ne sont que des forums, où l'essentiel est perdu au milieu de l'inutile. Comment aider les élèves à repérer les messages qui leur seront utiles ? Il va être temps d'améliorer les Moocs si l'on veut que les étudiants les rejoignent.
hubert guillaud

La fouille de données pour comprendre l'émergence des théories conspirationni... - 0 views

  •  
    Après étude d'un million de personnes ayant échangé de l'information politique sur Facebook à propos des élections italiennes de 2013, des chercheurs se sont intéressés à comment les gens réagissaient à de fausses informations.... Les gens ont tendance à échanger des idées sur les pages d'information grand public, sur des pages d'informations alternatives et sur celles de commentateurs politique exactement sur la même durée, suggérant que l'engagement demeure, quel que soit le contenu. Mais ils ont constaté que certaines personnes sont plus sensibles aux faux contenus que d'autres, notamment ceux qui préfèrent les pages alternatives. Les gens qui tentent d'éviter la manipulation des médias de masse sont en fait plus sensibles aux fausses informations que les autres.
hubert guillaud

La fouille de données expose des problèmes embarassant pour les Moocs - Techn... - 1 views

  •  
    Non seulement la participation des élèves est en baisse sur les Moocs, mais l'implication des enseignants dans les discussions en ligne est pire, estime une récente étude qui s'est intéressée aux forums associés aux cours. Pire, la participation des professeurs dans les forums augmente le taux d'abandon (même si elle augmente le taux de commentaires) !
1 - 12 of 12
Showing 20 items per page