Posts Tagged ‘statistique’

h1

15 livres achetés par les lecteurs du blog

juillet 7, 2012

En achetant un livre sur Amazon en cliquant sur un lien du blog, une commission m’est versée.

Voici quelques livres, pas toujours référencés sur le blog, achetés par les lecteurs. Ils traitent de SAS, du logiciel R, de statistique ou de compétences plus générales (anglais).

Deux sorties sont prévues d’ici peu :

1. Notez qu’à la rentrée sortira la quatrième édition du livre « Data mining et statistique décisionnelle » de Stéphane Tufféry. Pour le moment voici le lien vers la 3ème Edition.

2. De même, la second édition de l’ouvrage Le modèle linéaire par l’exemple – 2e éd. – Régression, analyse de la variance et plans d’expérience: Régression, analyse de la variance et plans d’expérience illustrés avec R et SAS, de Jean-Marc Azaïs et Jean-Marc Bardet sortira en août 2012.

Parmi les autres livres consacrés à SAS, on trouve :

3. SAS for Mixed Models, de Ramon C. Littell, George A., PH.D. Milliken, Walter W. et PH.D. Stroup, mars 2006

4. SAS Certified Base Programmer for SAS 9 Certification Exam Preparation Course in a Book for Passing the SAS Certified Base Programmer for SAS 9 Exam: … on Your First Try Certification Study Guide, de William Manning, juin 2009

5. Reporting avec SAS : Mettre en forme et diffuser vos résultats avec SAS 9 et SAS 9 BI, d’Olivier Decourt, Novembre 2008

6. SAS l’essentiel – SAS v8 et SAS v9, SAS Enterprise Guide, langages SAS, SQL et macro, d’Olivier Decourt, juin 2011

7. SAS 2 édition – « introduction pratique : du data management au reporting », de Sébastien Ringuedé, avril 2011

8. Méthodes statistiques de l’économie et de la gestion : Tome 3, Econométrie théorie et application sous SAS, de Virginie Delsart, Arnaud Rys et Nicolas Vaneecloo, octobre 2009

Le logiciel R a aussi son livre

9. Initiation à la statistique avec R – Cours, exemples, exercices et problèmes corrigés, de  Myriam Maumy-Bertrand et Frédéric Bertrand, septembre 2010

Quelques notions de probabilité ensuite avec :

10. L’essentiel en théorie des probabilités, de Jean Jacod et Philip Protter, octobre 2002

La thématique des sondages est adressée avec ce livre :

11. Mon plan de sondage en 9 questions, de Sidi Tiral, mars 2010 (table_des_matieres.pdf)

D’autres applications de la statistuqes sont traitées par :

12. Statistiques pour l’économie et la gestion, de Anderson, Sweeney, Williams et traduit par Claire Borsenberger, août 2010

13. Econométrie: Méthode et Applications, de Nicolas Jacquemet et Bruno Crépon, juillet 2010

14. Modélisation statistique appliquée aux sciences sociales, de Pascal Bressoux, octobre 2010

Enfin une version audio d’une méthode d’apprentissage a été achetée.

15. Perfectionnement Anglais : Enregistrement MP3, d’Assimil, juin 2008

Publicités
h1

Vidéo : Formation STID de Pau

janvier 10, 2012

L’Institut Universtaire Technologique STID (STatistique et Informatique Décisionnelle) de Pau en France, http://iutpa.univ-pau.fr se présente en vidéo (4min45). Comme tous les IUT STID, cette formation inclus SAS dans son cursus.

N’hésitez pas à consulter le site de l’IUT, http://iutpa.univ-pau.fr, et y télécharger les brochures détaillées de la formation pour l’étudiant.

h1

Calendrier : Café de la statistique à Paris (mensuel)

janvier 9, 2011

La société française de la statistique organise des soirées-débats mensuelles sur Paris intitulées : Les Cafés de la Statistique. La thématique globale est : Comment la statistique peut éclairer les grandes questions qui traversent nos sociétés ?

1. Le message de la Sfds

Je citerais simplement le site www.sfds.asso.fr.

« Ces rencontres sont ouvertes à tous : elles visent à un dialogue entre des statisticiens soucieux d’inscrire leur discipline dans la société et le public le plus large : simples citoyens, non-spécialistes, représentants de professions diverses ou participants au débat politique, économique ou social. En conséquence, les débats évitent la technicité. »

« Le thème du jour est introduit par un invité ou deux, puis débattu entre les participants, qui ne viennent pas simplement pour écouter, mais pour partager leurs interrogations et témoigner de leur point de vue. Un animateur veille à ce que l’introduction et le débat restent compréhensibles par tous, en particulier s’il est nécessaire d’évoquer des points techniques. »

2. Quand ?

Les Cafés de la Statistique ont lieu une fois par mois (en principe, le deuxième mardi du mois) de 19h à 21h30.

2.1 Prochaine date: mardi 11 janvier 2011 : Le partage de la valeur ajoutée.

Invités : Didier Blanchet, chef du département des études économiques d’ensemble de l’INSEE et Jean-Philippe Cotis, directeur général de l’INSEE.

La richesse produite est répartie entre les acteurs économiques : rémunération du travail, du capital, prélèvements des administrations publiques. A quel niveau et comment ce partage a-t-il évolué en France depuis 60 ans ? Que nous apprend-il sur les transformations de la société ? Cet indicateur est-il consensuel ou contesté ? Comment peut-il évoluer ? Faudrait-il l’enrichir par d’autres indicateurs ?

2.2 Séance suivante, le mardi 8 février 2011 : L’opinion publique se mesure-t-elle ?

Invités : Nonna Mayer, Directeur de recherches au CNRS, et Vincent Tiberj, chercheur au Centre d’études européennes- Fondation nationale des sciences politiques

3. Où ?

Café du Pont Neuf, 14 Quai du Louvre, 75001 PARIS

4. Tarif

Aucun droit d’entrée n’est perçu, les consommations étant à la charge des participants (6 € la première).

5. Inscription

Envoyer un message à : statcafe@sfds.asso.fr.

6.  Compte-rendu des éditions précédentes

Sur le site vous pouvez également retrouver le compte-rendu des précédentes rencontres : http://www.sfds.asso.fr

Vous avez une rencontre à annoncer, n’hésitez pas à contacter evenementiel@sasreference.com

h1

4 ouvrages en français sur le logiciel R

septembre 7, 2010

Le logiciel R, version gratuite du logiciel de statistique S-Plus, est souvent utilisé dans le monde académique pour effectuer des analyses statistiques. Voici quelques ouvrages en français sur le sujet.

1. Comprendre et réaliser les tests statistiques à l’aide de R

Comprendre et réaliser les tests statistiques à l’aide de R, de Gaël Millot, Editions De Boeck, Mai 2009

Le mot de l’éditeur : Ce livre s’adresse aux étudiants en médecine, en biologie, aux médecins et aux chercheurs désirant réaliser des tests alors qu’ils débutent en statistique ou en biostatistique. Son originalité est de proposer non seulement une explication très détaillée sur l’utilisation des tests les plus classiques, mais aussi la possibilité de réaliser ces tests à l’aide de R, logiciel de référence en statistique, gratuit, disponible sur internet et compatible avec Windows, Mac OS et Linux.

Illustré par de nombreuses figures et accompagné d’exercices avec correction, l’ouvrage aborde la statistique de la manière la plus simple qui soit, sans démonstration mathématique, mais en insistant sur les détails, afin de bien maîtriser toutes les subtilités des tests. Il traite en profondeur de notions essentielles comme la check-list à effectuer avant de réaliser un test, la gestion des individus extrêmes, l’origine de la p value, la puissance ou la conclusion d’un test. Il explique comment choisir un test à partir de ses propres données. Il décrit 35 tests statistiques sous forme de fiches, dont 24 non paramétriques, ce qui couvre la plupart des tests à une ou deux variables observées. Il traite de toutes les subtilités des tests, comme les corrections de continuité, les corrections de Welch pour le test t et l’anova, ou les corrections de p value lors des comparaisons multiples. Il propose un exemple d’application de chaque test à l’aide de R, en incluant toutes les étapes du test, et notamment l’analyse graphique des données.

Ce livre parlera également à ceux qui ne souhaitent pas utiliser R, car tous les exemples d’application des tests sont réalisés à partir d’un même fichier de données, qui peut facilement être adapté à un autre logiciel de statistique.

Ne nécessitant pas de connaissances particulières en mathématiques, ni de pré-requis en informatique, cet ouvrage devrait contenter à la fois ceux qui recherchent un manuel de statistique/biostatistique expliquant le fonctionnement des tests et ceux qui recherchent un manuel d’utilisation de R.

Télécharger : Vous pouvez télécharger le sommaire sur le site de l’éditeur : sommaire.pdf

Chapitre 1 : Présentation de R
Chapitre 2 : Notions de base de la statistique
Chapitre 3 : Démarche scientifique et erreurs associées
Chapitre 4 : Les étapes d’un tests en statistique
Chapitre 5 : Les tests statistiques

  • Comparaison d’effectifs et de proportions
  • Comparaison de moyennes
  • Comparaison de médianes
  • Comparaison de variances
  • Corrélations entre variables
  • Comparaison de distributions
  • Autres tests

Feuilleter le livre : Enfin, vous pouvez aussi découvrir le livre sur Google Book.

2. Analyse de données avec R

Analyse de données avec R, François Husson, Sébastien Lê et Jérôme Pagès, Editions Presses Universitaires de Rennes, Sept. 2009.

Mot de l’éditeur : Avec ce manuel, le lecteur dispose d’un équipement complet (bases théoriques, exemples, logiciels) pour analyser des données multidimensionnelles. Pour chaque méthode, un exemple détaillé concrétise les éléments théoriques et chaque résultat est accompagné de la commande R qui permet de l’obtenir (logiciel FactoMineR).

3. Statistique avec R, deuxième édition

Statistique avec R, Pierre-André Cornillon, Editions Presses Universitaires de Rennes,  Juin 2010

Le mot de l’éditeur : Ce manuel explique le fonctionnement du logiciel R et il montre la mise en œuvre d’une vingtaine de méthodes statistiques au travers de fiches. Ces fiches sont basées sur des exemples concrets et balayent un large spectre de techniques classiques en traitement de données. Ce guide s’adresse aux débutants comme aux utilisateurs réguliers de R. Il leur permettra de réaliser rapidement des graphiques et des traitements statistiques simples ou élaborés.

Ce livre est une rédaction exhaustive de mon cours de biostatistique. Il s’adresse aux étudiants, médecins et chercheurs désirant réaliser des tests alors qu’ils débutent en statistique. Son originalité est de proposer à la fois une explication très détaillée des tests les plus classiques ainsi que la possibilité de réaliser ces tests à l’aide du logiciel gratuit R. Simple et complet, il devrait contenter ceux qui recherchent un manuel de statistique expliquant le fonctionnement des tests et ceux qui recherchent un manuel d’utilisation de R. Il est disponible dans la plupart des librairies spécialisées. Il peut aussi être commandé chez De Boeck Université, qui offre généralement les frais de port.

4. Analyser les séries chronologiques avec S-Plus

Analyser les séries chronologiques avec S-Plus. Une approche paramétrique, Laurent Ferrara et Dominique Guégan, Editions Presses Universitaires Rennes, Sept. 2002

Le mot de l’éditeur : Ce manuel est destiné aux étudiants et professionnels ayant à étudier des séries de données dépendant du temps, qu’ils soient paramétriques linéaires ou non linéaires. Pour chaque type, les auteurs proposent des simulations et des applications.

Proposez un ouvrage sur R ou S-Plus : Vous connaissez des ouvrages français sur R ou son équivalent commercial S-Plus, ajoutez un commentaire à cet article pour qu’il soit référencé.

h1

Combien de nouveaux cas par an ? Une mesure d’incidence

juillet 25, 2010

L’incidence est une mesure statistique utilisée couramment dans les études cliniques, en cancérologie notamment. Vous trouverez sur Wikipédia une explication en termes simples de ce concept. Voici quelques extraits: définition et exemple de base.

1. Le principe de base

Wikipedia, définition : « En général, l’incidence (ou le taux d’incidence) est le nombre de nouveaux cas d’une pathologie observés pendant une période et pour une population déterminée. »

Taux d’incidence=nombre de nouveaux cas/durée totale du suivi

Wikipedia, exemple : « Par exemple, si 100 personnes à risque ont été étudiées pendant 2 ans, la durée totale de suivi est de 200 personnes-années.Dans ce même exemple, s’il a eu 5 nouveaux cas de la maladie à l’étude, le taux d’incidence sera de 5 cas par 200 personnes-années, ou plus simplement de 2,5 cas par 100 personnes-années (ou encore 0,025 cas par personne-année). »

Taux d’incidence=5/200

2. Le vrai taux d’incidence

Wikipedia, définition : « En général, on s’intéresse à la première occurrence d’une maladie donnée chez une personne (au premier cancer et pas à ses récidives chez un même patient par exemple). »

Wikipedia, l’exemple: « Dans l’exemple précédent, les cinq cas diagnostiqués pendant l’étude ne sont plus à risque à partir du moment où ils sont diagnostiqués. S’ils ont contracté la maladie après six mois d’observation, ils n’ont été à risque que pendant six mois. La durée totale de suivi pour cette étude est donc

  • de 190 personnes-années pour les personnes qui n’ont pas la maladie (95 personnes fois 2 ans) et
  • de 2,5 personnes-années pour les cas (6 mois fois 5 cas).

Le vrai taux d’incidence est donc de 5 cas sur 192,5 personnes-années (ou 2,6 cas par 100 personnes-années). »

Taux d’incidence=5/192.5

L’éventail d’application de cette mesure s’étant au delà de la pharmaceutique. Nombre de personnes ayant retrouvé un emploi, nombre de clients ayant effectué un nouvel achat dans l’année après être passé au statuts de client perdu, etc.

Complétez cet article

N’hésitez pas à ajouter des précisions tant sur le calcul avec SAS, que sur la gestion des valeurs manquantes, identifier une différence significative entre deux taux d’incidence ou la représentation graphique de ce type de données.

h1

Emploi/Formation : Pourquoi j’ai choisi l’IUT STID Vannes ?

janvier 30, 2010

1998, Bac Economique et Social (ES) en poche, je décide de poursuivre une formation en statistique. Pourquoi ai-je STID Vannes ? Voici quelques informations qu’il peut-être bon de  collecter avant de prendre une décision sur les formations.

1. De riches informations jointes au dossier d’inscription

J’ai trouvé, joins au dossier d’inscription, une petite revue qui m’explique concrètement ce qui allait m’attendre les deux prochaines années et après. 12 ans plus tard, je peux encore me rappeler qu’il y avait :

Un tableau récapitulatif des matières enseignées avec

  • le nombre d’heure d’enseignement
  • la répartition des heures par semestre
  • le mode d’évaluation de chaque matière

A ce tableau était joint un paragraphe par matière, expliquant plus en détail le contenu du programme.

En fin de revue, une page de statistiques m’indique les débouchés de ses anciens étudiants.

  • la répartition géographique (80% était alors sur Paris)
  • les secteurs d’activités (avec 4/5 secteurs majeurs)
  • le temps avant de trouver un premier job
  • la part des personnes ayant choisi des poursuites d’études

2. Un site des anciens étudiants très utile dans une cadre de recherche d’emploi

Je ne connaissais pas encore le site des anciens étudiants (www.aesv.net) au moment de l’inscription. Mais je ne connaissais pas Internet non plus. C’était en 1998. Aujourd’hui je dirais que c’est un des atouts majeurs de l’IUT. Voici quelques fonctionnalités avec lesquelles j’ai eu une très bonne expérience.

STID Vannes, AESV.net

Un annuaire avec plus de 1000 anciens étudiants

Alors que je recherchais un stage hors France et Angleterre, j’ai pu trouvé un ancien en Allemagne. Celui-ci a pu me dire si la société pour laquelle il travaillait prenait des stagiaires et quelle était la personne à contacter.

Avant de postuler pour un job, je regardais s’il y avait déjà des anciens dans l’entreprise pour mieux cerner les valeurs de la société, voir les attentes du service qui recrutait. Certains anciens ont même proposé de relire CV et lettre de motivation.

Arrivée dans une nouvelle ville, cela m’a permis de prendre contact avec d’autres personnes de la même région.

Réciproquement, des étudiants m’ont contacté pour avoir mon opinion sur la poursuite d’études à l’étranger. Parmi les informations que j’ai saisies, on a : coordonnées personnelles, coordonnées professionnelles, baccalauréat, parcours universitaire et parcours professionnel, photo.

Des statistiques sur les salaires

Lors d’un entretien pour premier emploi, l’observatoire des salaires aide à estimer un intervalle de salaire auquel on peut prétendre.

Dépôt de CVs et accès aux offres d’emploi

Pour une somme modique de 8 euros par année civile, il es possible de déposer son CV et recevoir les offres d’emploi actuelles et consulter l’historique. C’est le seul service payant, service qui permet de financer l’association. L’IUT ayant un large réseau dans les entreprises, les deux services s’avèrent très fructueux:

Accès aux offres d’emploi : l’historique des offres avec une cartographie avancée permet de repérer les entreprises qui ont déjà recruter, voir le type de postes pouvant être proposé et ensuite faire une candidature spontanée ciblée.

Dépôt de CV : une entreprise pharmaceutique m’avait contacté suite au dépôt de CV sur le site.

Favoriser les échanges entre anciens avec un forum et des rencontres festives

En prime, on trouve d’autres services comme un forum, des moments festifs pour les anciens (journée pétanque sur Paris, soirées anniversaires de l’IUT).

Tout cela pour dire qu’il m’apparaît judicieux d’étendre le choix de sa formation au delà d’un simple programme de formation.

h1

Communiqué : Sortie du livre « Étude de cas en statistique décisionnelle »

juin 22, 2009

Vous trouverez ci-dessous le communiqué de Stéphane Tufféry qui vient de sortir le livre :

Etude de cas en statistique décisionnelle

1. Communiqué du mercredi 17 juin 2009

Bonjour à toutes et tous,

J’ai le plaisir de vous annoncer la parution cette semaine aux éditions Technip d’un nouvel ouvrage de statistique et data mining : Etude de cas en statistique décisionnelle.

Il met en pratique les principes de la statistique dans une étude de cas répondant à deux problématiques classiques :

  • la construction d’une segmentation de clientèle ;
  • l’élaboration d’un score d’appétence à l’achat d’un produit.

Les données utilisées proviennent du secteur de l’assurance, mais l’étude réalisée peut se transposer à d’autres domaines. Les données sont disponibles sur Internet, notamment sur le site des Éditions Technip où elles sont accompagnées des programmes présentés dans l’ouvrage. Le lecteur pourra ainsi compléter sa lecture par des exercices personnels ou appliquer ces programmes à ses propres données.

L’étude de cas est menée avec le logiciel SAS, qui est le plus complet et le plus répandu des logiciels commerciaux, et qui permet de traiter de façon optimale tous les sujets abordés dans l’ouvrage. Les principales procédures de SAS/STAT sont passées en revue, et nous montrons que les outils de programmation SAS (macros, ODS, etc.) permettent de conjuguer rigueur et productivité. Bien entendu, les principes de modélisation exposés dans l’ouvrage ne sont pas propres à SAS, et la démarche suivie pourra intéresser le lecteur qui dispose d’un autre logiciel.

Pour des rappels sur la statistique, le lecteur pourra se référer à notre précédent ouvrage chez le même éditeur : Data Mining et statistique décisionnelle.

Bien cordialement,

Stéphane Tufféry

2. Vos liens

Pour télécharger les compléments du livre : www.editionstechnip.com

Pour commander l’ouvrage : www.amazon.fr