Posts Tagged ‘statistique’

h1

Vidéo : Formation STID de Pau

janvier 10, 2012

L’Institut Universtaire Technologique STID (STatistique et Informatique Décisionnelle) de Pau en France, http://iutpa.univ-pau.fr se présente en vidéo (4min45). Comme tous les IUT STID, cette formation inclus SAS dans son cursus.

N’hésitez pas à consulter le site de l’IUT, http://iutpa.univ-pau.fr, et y télécharger les brochures détaillées de la formation pour l’étudiant.

Publicités
h1

Combien de nouveaux cas par an ? Une mesure d’incidence

juillet 25, 2010

L’incidence est une mesure statistique utilisée couramment dans les études cliniques, en cancérologie notamment. Vous trouverez sur Wikipédia une explication en termes simples de ce concept. Voici quelques extraits: définition et exemple de base.

1. Le principe de base

Wikipedia, définition : « En général, l’incidence (ou le taux d’incidence) est le nombre de nouveaux cas d’une pathologie observés pendant une période et pour une population déterminée. »

Taux d’incidence=nombre de nouveaux cas/durée totale du suivi

Wikipedia, exemple : « Par exemple, si 100 personnes à risque ont été étudiées pendant 2 ans, la durée totale de suivi est de 200 personnes-années.Dans ce même exemple, s’il a eu 5 nouveaux cas de la maladie à l’étude, le taux d’incidence sera de 5 cas par 200 personnes-années, ou plus simplement de 2,5 cas par 100 personnes-années (ou encore 0,025 cas par personne-année). »

Taux d’incidence=5/200

2. Le vrai taux d’incidence

Wikipedia, définition : « En général, on s’intéresse à la première occurrence d’une maladie donnée chez une personne (au premier cancer et pas à ses récidives chez un même patient par exemple). »

Wikipedia, l’exemple: « Dans l’exemple précédent, les cinq cas diagnostiqués pendant l’étude ne sont plus à risque à partir du moment où ils sont diagnostiqués. S’ils ont contracté la maladie après six mois d’observation, ils n’ont été à risque que pendant six mois. La durée totale de suivi pour cette étude est donc

  • de 190 personnes-années pour les personnes qui n’ont pas la maladie (95 personnes fois 2 ans) et
  • de 2,5 personnes-années pour les cas (6 mois fois 5 cas).

Le vrai taux d’incidence est donc de 5 cas sur 192,5 personnes-années (ou 2,6 cas par 100 personnes-années). »

Taux d’incidence=5/192.5

L’éventail d’application de cette mesure s’étant au delà de la pharmaceutique. Nombre de personnes ayant retrouvé un emploi, nombre de clients ayant effectué un nouvel achat dans l’année après être passé au statuts de client perdu, etc.

Complétez cet article

N’hésitez pas à ajouter des précisions tant sur le calcul avec SAS, que sur la gestion des valeurs manquantes, identifier une différence significative entre deux taux d’incidence ou la représentation graphique de ce type de données.

h1

Emploi/Formation : Pourquoi j’ai choisi l’IUT STID Vannes ?

janvier 30, 2010

1998, Bac Economique et Social (ES) en poche, je décide de poursuivre une formation en statistique. Pourquoi ai-je STID Vannes ? Voici quelques informations qu’il peut-être bon de  collecter avant de prendre une décision sur les formations.

1. De riches informations jointes au dossier d’inscription

J’ai trouvé, joins au dossier d’inscription, une petite revue qui m’explique concrètement ce qui allait m’attendre les deux prochaines années et après. 12 ans plus tard, je peux encore me rappeler qu’il y avait :

Un tableau récapitulatif des matières enseignées avec

  • le nombre d’heure d’enseignement
  • la répartition des heures par semestre
  • le mode d’évaluation de chaque matière

A ce tableau était joint un paragraphe par matière, expliquant plus en détail le contenu du programme.

En fin de revue, une page de statistiques m’indique les débouchés de ses anciens étudiants.

  • la répartition géographique (80% était alors sur Paris)
  • les secteurs d’activités (avec 4/5 secteurs majeurs)
  • le temps avant de trouver un premier job
  • la part des personnes ayant choisi des poursuites d’études

2. Un site des anciens étudiants très utile dans une cadre de recherche d’emploi

Je ne connaissais pas encore le site des anciens étudiants (www.aesv.net) au moment de l’inscription. Mais je ne connaissais pas Internet non plus. C’était en 1998. Aujourd’hui je dirais que c’est un des atouts majeurs de l’IUT. Voici quelques fonctionnalités avec lesquelles j’ai eu une très bonne expérience.

STID Vannes, AESV.net

Un annuaire avec plus de 1000 anciens étudiants

Alors que je recherchais un stage hors France et Angleterre, j’ai pu trouvé un ancien en Allemagne. Celui-ci a pu me dire si la société pour laquelle il travaillait prenait des stagiaires et quelle était la personne à contacter.

Avant de postuler pour un job, je regardais s’il y avait déjà des anciens dans l’entreprise pour mieux cerner les valeurs de la société, voir les attentes du service qui recrutait. Certains anciens ont même proposé de relire CV et lettre de motivation.

Arrivée dans une nouvelle ville, cela m’a permis de prendre contact avec d’autres personnes de la même région.

Réciproquement, des étudiants m’ont contacté pour avoir mon opinion sur la poursuite d’études à l’étranger. Parmi les informations que j’ai saisies, on a : coordonnées personnelles, coordonnées professionnelles, baccalauréat, parcours universitaire et parcours professionnel, photo.

Des statistiques sur les salaires

Lors d’un entretien pour premier emploi, l’observatoire des salaires aide à estimer un intervalle de salaire auquel on peut prétendre.

Dépôt de CVs et accès aux offres d’emploi

Pour une somme modique de 8 euros par année civile, il es possible de déposer son CV et recevoir les offres d’emploi actuelles et consulter l’historique. C’est le seul service payant, service qui permet de financer l’association. L’IUT ayant un large réseau dans les entreprises, les deux services s’avèrent très fructueux:

Accès aux offres d’emploi : l’historique des offres avec une cartographie avancée permet de repérer les entreprises qui ont déjà recruter, voir le type de postes pouvant être proposé et ensuite faire une candidature spontanée ciblée.

Dépôt de CV : une entreprise pharmaceutique m’avait contacté suite au dépôt de CV sur le site.

Favoriser les échanges entre anciens avec un forum et des rencontres festives

En prime, on trouve d’autres services comme un forum, des moments festifs pour les anciens (journée pétanque sur Paris, soirées anniversaires de l’IUT).

Tout cela pour dire qu’il m’apparaît judicieux d’étendre le choix de sa formation au delà d’un simple programme de formation.

h1

Communiqué : Sortie du livre « Étude de cas en statistique décisionnelle »

juin 22, 2009

Vous trouverez ci-dessous le communiqué de Stéphane Tufféry qui vient de sortir le livre :

Etude de cas en statistique décisionnelle

1. Communiqué du mercredi 17 juin 2009

Bonjour à toutes et tous,

J’ai le plaisir de vous annoncer la parution cette semaine aux éditions Technip d’un nouvel ouvrage de statistique et data mining : Etude de cas en statistique décisionnelle.

Il met en pratique les principes de la statistique dans une étude de cas répondant à deux problématiques classiques :

  • la construction d’une segmentation de clientèle ;
  • l’élaboration d’un score d’appétence à l’achat d’un produit.

Les données utilisées proviennent du secteur de l’assurance, mais l’étude réalisée peut se transposer à d’autres domaines. Les données sont disponibles sur Internet, notamment sur le site des Éditions Technip où elles sont accompagnées des programmes présentés dans l’ouvrage. Le lecteur pourra ainsi compléter sa lecture par des exercices personnels ou appliquer ces programmes à ses propres données.

L’étude de cas est menée avec le logiciel SAS, qui est le plus complet et le plus répandu des logiciels commerciaux, et qui permet de traiter de façon optimale tous les sujets abordés dans l’ouvrage. Les principales procédures de SAS/STAT sont passées en revue, et nous montrons que les outils de programmation SAS (macros, ODS, etc.) permettent de conjuguer rigueur et productivité. Bien entendu, les principes de modélisation exposés dans l’ouvrage ne sont pas propres à SAS, et la démarche suivie pourra intéresser le lecteur qui dispose d’un autre logiciel.

Pour des rappels sur la statistique, le lecteur pourra se référer à notre précédent ouvrage chez le même éditeur : Data Mining et statistique décisionnelle.

Bien cordialement,

Stéphane Tufféry

2. Vos liens

Pour télécharger les compléments du livre : www.editionstechnip.com

Pour commander l’ouvrage : www.amazon.fr

h1

Structure un programme, un exemple en 5 étapes

janvier 22, 2008

Tel un menu, les commentaires donnent une vue d’ensemble de votre programme SAS. Par la suite, vous devez expliquer les étapes de votre développement. Mais comment agencer votre code ? Voici un exemple extrait de la pharmaceutique. Il s’agit de créer un tableau statistique extrait de données sur les essais cliniques.

1. Des valeurs rapidement accessibles pour la maintenance du programme : dans cette première section figurent les informations utilisables à tout moment dans le programme. Voici quelques exemples de mises à jour :

  • changement de répertoire de vos données ou programmes ;
  • changement des labels apposés sur vos données codifiées ;
  • pour connaître les valeurs prises par vos variables macros.

Suivre cette convention aidera les autres programmeurs à se familiariser avec votre travail.

2. Regrouper les informations : l’information à publier est, le plus souvent, à recueillir parmi plusieurs jeux de données. Il vous faudra donc les combiner. Par exemple, les données démographiques sur les patients seront à ajouter aux résultats de laboratoire. Si seule une sous population vous intéresse, il faudra supprimer les champs inutiles.

3. Extraire les statistiques : cette section peut inclure le calcul de simples fréquences et pourcentages. Elle peut aussi faire l’objet du calcul de tests statistiques.

4. Mettre en forme les résultats : chaque tableau devra suivre une mise en page précise. Les titres devront être adaptés à chaque tableau et ces dérivés. Les données codées se verront remplacées par du texte via des formats. L’ensemble pourra être lu par des éditeurs de texte ou sur des fichiers Internet.

5. Nettoyage : enfin vous pouvez faire du nettoyage en supprimant toutes les données temporaires, qu’il s’agisse de jeux de données, de catalogues, de fichiers .log ou de noms reconnus comme chemin d’accès à une bibliothèque de données. Ce travail vous sera d’autant plus bénéfique que vous exécuterez plusieurs programmes à la suite des uns des autres. Cela vous évitera de mauvaises surprises dues à l’utilisation involontaire de données en mémoire.

Tout au long de ces cinq étapes, vous ponctuerez votre code de commentaires. Un programme s’allonge très rapidement même s’il est bien écrit. Pour un simple tableau statistique en essai clinique il n’est pas rare de voir l’équivalent d’une dizaine d’écrans. Pour naviguer rapidement d’une section à l’autre, rien de tel que de numéroter vos commentaires. Un programme SAS est composé principalement de deux groupes de texte (data step et procedure). Commentez chacun bloque de texte. Par exemple, “extraire pour chaque effet secondaire, le nombre de patient l’ayant vécu”. Si une étape est inhabituelle, fournissez les raisons.