Archive for the ‘Par thématique’ Category

h1

La fonction CATQ pour concaténer tout en ajoutant des guillemets avec SAS 9.3 et plus

février 23, 2019

La fonction catq est disponible depuis SAS 9.3. La particularité de cette fonction est de pouvoir ajouter des guillemets simples (single quotes) ou des guillemets doubles (double quotes) autour des différentes valeurs à concaténer.

Un des avantages de la fonction catq est de pouvoir travailler autant avec les valeurs numériques qu’avec les valeurs caractères. On fera néanmoins attention aux valeurs infinies comme 1/3.

Exemple 1

data catq;
    x=catq('1' ,'ABC ',2," EFG",' ');
    put x=;

    x=catq('2' ,'ABC ',2," EFG",' ');
    put x=;
run;

Dans ce premier exemple, on voit que le 1 permet d’ajouter des guillemets simples alors que le deux permet d’ajouter des guillemets doubles. Dans le cas présent, seules les valeurs caractères ont des guillemets.

x='ABC ' 2 ' EFG' ' '
 x="ABC " 2 " EFG" " "

Exemple 2

data catq;
   x=catq('1'     ,'ABC ',2," EFG",' '); 
   put x=;

   x=catq('1a'    ,'ABC ',2," EFG",' '); 
   put x=;
 
   x=catq('1c'    ,'ABC ',2," EFG",' '); 
   put x=;
   
   x=catq('1ac'    ,'ABC ',2," EFG",' '); 
   put x=;
run;

Dans ce second exemple, on voit que la lettre a pour que toutes les valeurs soient entre guillemets, y compris les valeurs numériques.

Si on souhaite ajouter la virgule (comma) entre les différentes valeurs à concaténer avec la lettre c, il faudra impérativement garder la lettre a.

 x='ABC ' 2 ' EFG' ' '
 x='ABC ' '2' ' EFG' ' '
 x=ABC ,2, EFG,
 x='ABC ','2',' EFG',' '

Exemple 3

Une autre manière d’ajouter la virgule comme séparateur entre les valeurs est d’utiliser la lettre d (delimiter) et de préciser le séparateur dans le second argument de la fonction ; cet argument est optionnel et ne servira qu’avec la lettre d.

data catq;
   x=catq('c','ABC ',2," EFG",' '); 
   put x=;

   x=catq('d',',','ABC ',2," EFG",' '); 
   put x= /;
  
   x=catq('1ac','ABC ',2," EFG",' '); 
   put x=;

   x=catq('1ad',',','ABC ',2," EFG",' '); 
   put x=;
run;

Nous obtenons le même résultat qu’on utilise c ou d avec l’argument optionnel. La lettre d offre juste plus de possibilités.

 x=ABC ,2, EFG,
 x=ABC ,2, EFG,
 x='ABC ','2',' EFG',' '
 x='ABC ','2',' EFG',' '

Exemple 4

Lorsqu’on n’a pas besoin des guillemets autour des différentes valeurs à concaténer, la fonction catq se rapproche de la fonction catx.

data catq;  
   x=catq('d',',','ABC ',2," EFG",' '); 
   put x=/;
   
   x=catq('ds',',','ABC ',2," EFG",' '); 
   put x=;
   
   x=catx(',','ABC ',2," EFG",' ');
   put x=/;
   
   x=catq('dt',',','ABC ',2," EFG",' '); 
   put x=;
run;

Pour enlever les leading et trailing blanks avec la fonction catq, on ajoutera la lettre s (strip).
Pour uniquement enlever les trailing blanks avec la fonction catq, on ajoutera la lettre t (trim).

 x=ABC ,2, EFG,
 x=ABC,2,EFG
 x=ABC,2,EFG
 x=ABC,2, EFG

Aller plus loin

La fonction dispose d’autres arguments pour travailler avec les literals (lettre n), pour afficher les valeurs en hexadecimal (lettre x), pour utiliser une tabulation horizontale comme séparateur (lettre h), etc.
Toutes les informations sont disponibles dans la documentation en ligne : http://support.sas.com/documentation/cdl/en/lefunctionsref/63354/HTML/default/viewer.htm

À lire aussi

h1

SAS : obtenez des couleurs sympas dans vos rapports en 5 minutes

août 20, 2018

h1

Lister fichiers et répertoires sous UNIX

novembre 2, 2013

La fonction call system permet dans le cas présent de stocker du code Unix pour rechercher des fichiers dans des répertoires données. Le résultat de la recherche est stocké dans un fichier .txt qui est lu dans une étape data.

1. Créer une macro variable pour stocker le chemin d’accès de la bibliothèque WORK

Le chemin d’accès à la bibliothèque WORK est extrait avec la fonction système PATHNA?E et est stocké dans la macro variable WORKDIR. Ce chemin d’accès sera celui où sera sauvegardé le fichier .txt de la recherche.

%let workdir=%sysfunc(pathname(work));

2. Utiliser call symput pour appeler la commande find d’UNIX 

La commande find est suivie de trois composants :

  • le chemin d’accès au(x) fichier(x) d’entrée. L’astérisk indique que tous les sous répertoire du répertoire PROJET sont consultés
  • le chemin d’accès au fichier final (ici resultat.txt) où sera stocké le résultat de la recherche. Dans l’exemple, le fichier est stocké de manière temporaire dans le répertoire utilisé par la bibliothèque WORK de SAS.
  • La page anglaise de Wikipedia http://en.wikipedia.org/wiki/Find explique que le code 2>/dev/null supprime des messages d'erreurs liés à des droits d'accès.

« If you’re doing this as a user other than root, you might want to ignore permission denied (and any other) errors. Since errors are printed to stderr, they can be suppressed by redirecting the output to /dev/null. »

Dans le second appel le double >> permet d’ajouter au fichier existant le résultat de la recherche au lieu de remplacer l’ancien.

data _null_;
   call system ("find c:/projet/*/demographie.sas7bdat > &workdir./resultat.txt 2>/dev/null
                      c:/project/*/laboratoire.sas7bdat >> &workdir./resultat.txt 2>/dev/null");
run;

L’étape data  sert à lire le fichier .txt et de la trocker dans un dataset (ici REF) via infile/input. Des options à l’instruction infile peuvent être ajoutées pour lire le fichier correctement.

data ref (keep=);

   infile "&workdir./resultat.txt" ;*lrecl=2000 truncover firstobs=1;

   input pathdsn $1-100;

run;
h1

Passer de CLASS CLAS à « CLASS » « CLAS » dans une macro variable

février 1, 2013

Mettre toutes les mots contenus dans une macro variable entre guillemets (quote en anglais) est un tâche plus fréquente qu’elle n’y paraît.
Une vois le code écrit, il est souvent plus rapide de faire du copier/coller et ensuite de modifier. Voici un exemple où DSN=CLASS CLAS sert à créer DSN_QUOTE= »CLASS » « CLAS ».

1. Exemple dans une macro

Dans l’exemple, la macro est PRINTDSN. Elle a pour tâche d’imprimer dans la log tous les datasets présents dans la bibliothèque SASHELP qui sont cités dans le paramètre de macro DSN, s’ils existent.

%macro printdsn (dsn=);

%let dsn      =%upcase(&dsn.);
%let dsn_quote=%sysfunc(tranwrd(%nrstr(%")&dsn.%nrstr(%"),%str( ),%str(" ")));

proc sql;
 create table ref as
 select memname
 from dictionary.tables
 where upcase(libname)='SASHELP' and
       upcase(memname) in (&dsn_quote.);
quit;

data _null_;
 set ref;
 call execute ('proc print data=sashelp.' || memname || ';');
 call execute ('run;');
run;
%mend printdsn;
%printdsn(dsn=class clas);

Pour ma part j’ai pris l’habitude de mettre le contenu des macros paramètres en majuscule, et ce dès le début du programme, sauf besoin spécifique contraire. Ceci explique la ligne %let dsn=upcase(&dsn.);

De plus j’ai pris l’habitude de rajouter le suffixe _quote au nom de la macro variable. Dans notre exemple il y a la macro variable DSN mise en majuscule. Cette variable est ensuite mise entre guillemets.

La macro fonction %sysfunc() permet d’utiliser la fonction tranwrd dans une expression macro. La fonction tranwrd est composée de trois paramètres :

  1. le texte d’origine entre guillemets
  2. le partie de texte à remplacer dans cette chaîne de caractères
  3. le texte de remplacement

2. Le même exemple sans macro

L’exemple est présenté dans une macro. Pour tester le code, un simple %let et %put feront l’affaire. Le résultat s’affiche alors dans la log.

%let dsn=CLASS CLAS;
%let dsn_quote=%sysfunc(tranwrd(%nrstr(%")&dsn.%nrstr(%"),%str( ),%str(" ");
%put &dsn_quote.;
h1

SAS 9.2. : WARNING avec PROC SQL et l’option UNDO_POLICY=NONE

janvier 6, 2013

Depuis SAS 9.2, un nouveau WARNING apparaît dans la log quand le nom de la table SAS d’entrée est le même que le nom de la table SAS de sortie. Pour éviter ce message, l’option undo_policy=none est à ajouter dans l’instruction proc sql;. SAS support prévient néanmoins que l’usage du même nom en entrée et en sortie présente un risque et que l’option enlève l’avertissement mais pas le risque.

1. Le message dans la log

WARNING: CREATE TABLE statement recursively references the target table

 

2. Exemple

Ce code générerait le warning avec SAS 9.2 si l’option undo_policy=none n’était pas utilisée.

proc copy in=sashelp out=work;
   select class;
run;

proc sql undo_policy=none;
   create table class as 
   select name, age
   from class;
quit;

 

En savoir plus

h1

5 points pour rendre la maintenance d’un programme la plus inaperçu possible pour l’utilisateur

mars 4, 2012

La maintenance des programmes est toujours mieux acceptée si les utilisateurs sont informés au préalable et si la durée de l’intervention est limitée dans le temps. Voici cinq points qui rendront l’intervention plus douce.

  1. S’il est préférable de faire une maintenance de programme dans un environnement de développement, il est parfois plus rapide de faire certains changements directement en production après avoir fait une copie des fichiers d’origine, surtout les changements rapides. L’utilisateur est dans l’indisponibilité d’utiliser le programme durant cet intervalle de temps.
  2. Idéalement la maintenance sera planifiée. Les utilisateurs seront informés une semaine à l’avance par email de la date et durée d’indisponibilité. Ils pourront ainsi adapter leur travail en fonction.
  3. Le créneau horaire sera choisi de préférence en dehors des heures d’utilisation les plus fréquentes (le week-end, le matin, le soir).
  4. Un email informera du début de la maintenance.
  5. Un autre email confirmera la fin de la maintenance et donc la remise à disposition du service.
h1

SAS 9.2 Souligner ou barrer un texte dans une table en sortie ODS

juillet 14, 2011

Avec SAS 9.2 il est maintenant possible de souligner/barrer des valeurs d’une table dans une sortie ODS et plus seulement dans le titre.

L’exemple est basé sur une sortie .pdf. TEXTDECORATION=UNDERLINE souligne les valeurs. TEXTDECORATION=LINE-THROUGH barre les valeurs et TEXTDECORATION=OVERLINE (usage très rare a priori) ajoute une ligne au dessus du texte.

ods listing close;
ods pdf file=‘c:/sasref’;
proc print data=sashelp.class;
var name / display style(column)=[textdecoration=underline];
var sex / display style(column)=[textdecoration=line-through];
var age / display style(column)=[textdecoration=overline];
run;
ods pdf close;
ods listing;

Lecture complémentaire

SUGI, pour visualiser le résultat : http://www2.sas.com/proceedings/sugi31/227-31.pdf

h1

Deux exemples d’usage de la syntaxe de l’ODS : PROC PRINT et PROC REPORT

juin 26, 2011

Jusqu’à présent, j’ai présenté la syntaxe de l’ODS (Output Delivery System) de SAS avec la procédure PROC REPORT pour générer vos tableaux dans des fichiers .rtf (ODS RTF), .pdf (ODS PDF) ou en XML avec extension .xls (ODS TAGSETS.EXCELXP).

PROC PRINT se révèle dans les cas les plus simples aussi avantageux. Voici deux fichiers .pdf contenant la même table, une fois générée avec PROC REPORT et une fois avec PROC PRINT.

ods listing close;

*1. Exemple de l’ODS avec PROC REPORT;

ods pdf file=‘O:/sasref/exemple_report.pdf’;
proc report data=sashelp.class nowd;
columns sex age;
define sex / display style(column)=[cellwidth=2cm];
define age / display style(column)=[cellwidth=3cm];
run;
ods pdf close;

*2. Exemple de l’ODS avec PROC PRINT;

ods pdf file=‘O:/sasref/exemple_print.pdf’;
proc print data=sashelp.class nobs;
var sex / style(column)=[cellwidth=2cm];
var age / style(column)=[cellwidth=3cm];
run;
ods pdf close;

ods listing;

h1

SAS 9.2 et PROC SORT : Quel est l’effet de l’option – sortseq=ascii (numeric_collation=on) ?

avril 10, 2011

Recherchez l’effet de l’option SAS 9.2 de la procédure PROC SORT : sortseq=ascii (numeric_collation=on),  une option qui manquait vraiment pour le tri de variables alphanumérique.

Pour cela, il vous suffit d’exécuter l’exemple suivant.

data one;
length x $10;
input x $;
datalines;
1
10
A
a
b
B
20
2
;
run;

proc sort data=one
out=nooption;
by x;
run;

proc sort data=one
out=withoption
sortseq=ascii (numeric_collation=on);
by x;
run;

title ‘No option’;
proc print data=nooption;
run;

title ‘With option’;
proc print data=withoption;
run;

Lecture Complémentaire

  • Trier les données par ordre croissant et décroissant
  • Tout sur l’instruction BY
  • SAS Online Doc 9.2: The PROC SORT Procedure
  • h1

    Plusieurs formats pour une variable numérique – passer à une variable caractère avec la fonction PUTN

    octobre 14, 2010

    Découvrez le cours de novembre 2022 : Les fonctions put et input – un sujet épineux

    Dans cet article que vous propose une illustration de la fonction PUTN. En effet une variable numérique peut contenir des groupes de valeurs. Chaque groupe de valeurs se réfère à un format donnée. Le nom de ces formats est disponible dans une autre variable. La question est alors comment puis-je créer une variable caractère équivalent simplement, sans boucle, sans if-then, etc. La solution : la fonction PUTN. Voici un exemple pour illustrer le propos.

    1. Le problème en exemple

    Dans cet exemple, deux formats numériques AGE et SEX exitent.

    proc format;
    value age 11-13=’11-13′
    14-16=’14-16′;
    value sex 1=‘Male’
    2=‘Female’;
    run;

    Dans un data set, ONE, trois variables existent :

    • CRITERIA : les critères sont AGE et SEX dans l’exemple.
    • CODLST : le nom des formats qui expliquent les valeurs numériques sont enregistrés dans la variable CODLST.
    • VALN: les valeurs numériques associées aux critères sont disponibles dans la variable VALN.

    data one;
    length criteria $8 codlst $8;
    input criteria $ codlst $ valn;
    age age 12
    sex sex 1
    ;
    run;

    L’objectif est de créer une variable VALC qui contienne l’équivalent alphanumérique de VALN (la valeur donnée dans le label du format).

    2. La solution proposée : PUTN

    data two;
    set one;
    length valc $20;
    VALC=putn(valn,codlst);
    run;

    3. Le résultat attendu

    criteria codlst valn valc

    age      age    12   11-13
    sex      sex    1    Male

    Ici les formats sont tous numériques. La fonction PUTN est utilisée.
    Pour des formats alphanumériques, il faudra se servir de la fonction PUTC.

    Allez plus loin

    Découvrez le cours de novembre 2022 : Les fonctions put et input – un sujet épineux

    h1

    Répéter la valeur d’une variable sur chaque page avec ODS RTF

    septembre 26, 2010

    Il y a un peu plus d’un mois, je vous parlais de l’option SPANROWS de PROC REPORT pour pouvoir répéter une valeur groupée sur chaque page du listing.

    Mais si vous devez créer un fichier .RTF et non un fichier .PDF ou si vous n’avez pas SAS 9.2, vous pouvez vous rabattre sur cette solution.

    Elle présente le seul inconvénient de séparer la table en table distincte à chaque nouvelle valeur du la variable groupée.

    Voici donc un exemple à tester par vous même.

    1. Le setting

    Par simple soucis de présentation, quelques instructions de paramétrage sont données.

    • Enlever le titre par défaut avec l’instruction TITLE.
    • Enlever la date et le numéro de page par défaut et alignez le résultat à gauche.
    • Créer un format caractère SEX où M réfère à Garçon et F à Fille.


    *——————————————–;
    * Setting;
    *——————————————–;

    title;
    options nodate nonumber nocenter;

    proc format;
    value $ sex ‘M’=‘Garçon’
    ‘F’=‘Fille’;
    run;

    2. Préparation des données

    Afin d’avoir assez de données le fichier CLASS est multiplié par 5. Les noms sauvegardés dans la variable NAME sont incrémentés d’un nombre.

    *——————————————–;
    * 2. Data Preparation;
    *——————————————–;

    data class;
    set sashelp.class;
    output;
    name=cats(name,’1′);
    output;
    name=cats(name,’2′);
    output;
    name=cats(name,’3′);
    output;
    name=cats(name,’4′);
    output;
    name=cats(name,’5′);
    output;
    run;

    3. Reporting;

    Vos données doivent être triées afin d’utiliser l’instruction BY dans PROC REPORT.

    L’option d’ODS RTF STARTPAGE=NEVER empêchera le passage à une nouvelle feuille à chaque nouvelle valeur de la variable SEX.

    Au moyen des options COMPUTE/ENDCOMP, il est possible de personnaliser le texte en début de chaque page. Un texte aligné à gauche est ajouté. Une ligne avant et une ligne après sont ajoutées pour faciliter la lisibilité du rapport. Ce texte est composé de « SEXE :  » suivi de la valeur formatée de la variable SEX.

    *——————————————–;
    * 3. Reporting;
    *——————————————–;

    proc sort data=class;
    by sex;
    run;

    *options nobyline;

    ods rtf file=’C:/…/test1.rtf’ startpage=never;
    proc report data=class;
    by sex;
    column sex name;
    define sex  / /*id*/ group noprint ;
    define name / display  ‘Nom’;

    compute before _page_ /style=[just=left] ;
    line ‘ ‘;
    line @1 ‘Sexe:’ @6 sex $sex. ;
    line ‘ ‘;
    endcomp;

    run;

    ods rtf close;

    h1

    Avec ODS, comment ajouter des caractères spéciaux ≤ et ≥

    septembre 19, 2010

    Comment inclure dans un rapport généré par ODS les symboles ≤ et ≥ ? En effet, ils ne font pas parti des caractères spéciaux ASCII classiques, il s’agit de caractères dépendants d’une police de caractères en particulier : la police « symbol ».

    SAS propose un article sur le sujet. Je vous propose de détailler l’exemple utilisé qui a été utilisé avec SAS 8.2 sous environnement DBCS.

    1. Setting

    Dans cette instruction ODS ESCAPECHAR, est précisé que l’accent circonflexe sera utilisé, non pas comme simple caractère, mais comme caractère introduisant une notation particulière pour le style.

    ods escapechar= »^ »;

    Un format appelé TEMP est créé. La valeur 11 aura un label composé du symbole « inférieur ou égal ».

    • Le symbole « inférieur ou égal » en lui même est introduit par le code hexadécimal A3.
    • Pour que ce que code corresponde à « inférieur ou égal », il faut utiliser la police de caractère, d’où le code font_face=symbol.
    • Avant A3, on change le style et en particulier la police de caractère. Notez ici l’accent circonflexe introduit précédemment pour entrer la police.
    • Après A3, on arrête d’utiliser cette police.

    proc format;
    value temp 11=‘The value is ^S={font_face=symbol}’ « A3″x ‘^S={} the value’;
    run;

    2. Reporting

    A présent SAS va écrire tout ce qui suite dans un fichier temp.rtf. Vous avez ici seulement besoin de préciser le chemin d’accès au fichier dans les guillemets.

    Le résultat s’affichera correctement dans votre fichier .RTF mais pas dans votre sortie listing classique. Autant fermer cette destination avec ODS LISTING CLOSE.

    ods listing close;

    ods rtf file=‘temp.rtf’;

    Les deux tableaux imprimé se basent sur la table CLASS dans la bibliothèque SASHELP.

    Dans le premier cas, le format créé précédemment est appliqué à la variable AGE. On aura dont le label de format défini précédemment quand AGE=11.

    title ‘This uses the special characters in the value’;
    proc print data=sashelp.class;
    format age temp.;
    run;

    Dans ce second exemple, le symbole « supérieur ou égal » est introduit avec le code hexadécimal B3 d’où « B3″x.

    Comme précédemment, il est entouré de ^S={font_face=symbol} avant et ^S={} après.

    Cette fois ci pas contre le symbole est ajouté dans le label d’une variable. Chacun des groupes de mot est donc mis entre guillemets.

    title ‘This uses the special characters in the label’;
    proc print data=sashelp.class label;
    label age=« Age » « ^S={font_face=symbol} » « B3″x « ^S={} » « 10 »;
    run;

    Enfin, on précise de former le fichier .rtf et donc de ne plus ajouter d’info dedans à partir de maintenant.

    ods rtf close;

    ods listing;

    Source : Usage Note 24054: In ODS, how can I add special characters such as GE or LE to my output?

    Lecture complémentaire

    h1

    Avez-vous pensé à lire votre log de manière automatique

    septembre 12, 2010

    Vous savez comment lire un fichier .txt avec SAS mais avez-vous déjà envisager lire votre programme ou encore votre log et d’en faire un data set pour pouvoir fouiner un peu dedans ? Voici donc un exemple très basique côté programmation mais qui peut se révéler très utilise si vous faites preuve d’un peu d’imagination.

    1. Commentaires sur l’exemple

    Dans l’exemple qui suite la log sauvegardée de manière permanente sur le disque dur est importée dans SAS. Une ligne est égale à une observation. Le délimiteur est le caractère hexadécimal 09. Le nombre maximum de caractères par observation est ici de 1000. A vous de trouver la valeur qui vous semble la mieux appropriée pour éviter que le texte soit coupé sans pour autant sur-consommer votre capacité de stockage.

    2. L’exemple

    data mylog;
    infile ‘c:/sasref/test.log’ dlm=’09’x;
    length x $1000;
    input x $;
    run;

    3. Aller plus loin

    Ensuite pour vous entraîner, sortez les lignes où il y a le mot NOTE, les lignes avec le mot REAL TIME ou encore les lignes contenant un mot-clé qui vous est propre à l’aide de fonctions caractères.

    Dans ce dernier cas, vous pouvez inclure dans votre programme les titres des grandes rubriques de votre programme et ensuite les extraire avec cette méthode. Pratique pour retrouver rapidement la structure d’ensemble de son programme, mettre à jour son en-tête, etc.

    Lectures complémentaires

    h1

    Des options pour se débarrasser de WARNING de SAS 9.2

    août 18, 2010

    Avec SAS 9.1.3 et SAS9.2 de nouveaux warning apparaissent. En voici deux que vous pouvez faire disparaître dans le cas où ils ne reflètent pas un problème dans votre programme.

    1. Avec PROC SQL, je crée une nouvelle table du même nom que la table source.
    2. Dans un data set je réduis la longueur d’une variable

    1. Utiliser le même nom de data set en entré et en sortie avec PROC SQL

    Pour illustrer le sujet, je vais d’abord créer un data set appelé ONE avec deux variables X et Y.

    data one;
    x=‘A’;
    y=‘B’;
    run;

    Ensuite je vais créer avec PROC SQL un nouveau data set du même nom ONE qui ne contiendra que la variable X.

    proc sql;
    create table one as
    select x
    from one;
    quit;

    Le message dans la log ressemble à ceci:
    WARNING: This CREATE TABLE statement recursively reference the target table. A consequence of this is a possible data integrity problem.

    Pour ne plus avoir ce message dans la log, ajouter l’option UNDO_POLICY=NONE

    proc sql undo_policy=none;
    create table one as
    select x
    from one;
    quit;

    Ce cas existe depuis SAS 9.1.3.

    2. Réduire la longueur d’une variable dans une étape data

    Une solution pour changer la longueur d’une variable est de définir sa longueur dans une instruction LENGTH avant de lire les données avec un SET par exemple.

    Depuis SAS 9.2, si la nouvelle longueur est plus petite que l’ancienne un WARNING apparaît dans la log. Ceci est une bonne chose car cela vous permet de repérer d’éventuelles coupures (truncations) de vos données.

    Dans certains cas cependant, vous savez pertinemment que le nombre de caractères dans données est au plus X et que dès lors elles ne seront pas coupées en réduisant la longueur.

    Vous pouvez vous épargner le warning en encadrant votre étape data des options globales VARLENCHK=nowarn et VALENCHK=warm.

    Je vous conseille d’appliquer cette option localement afin de pouvoir continuer à repérer d’autres coupures potentielles non prévues.

    data two;
    length x $32;
    x=‘A’;
    run;

    data two_a;
    length x $1;
    set two;
    run;

    WARNING : Multiple lengths were specified for the variable x by input data set(s). This may cause truncation of data.

    options varlenchk=nowarn;
    data two_b
    length x $1;
    set two;
    run;
    options varlenchk=warn;

    Notez cependant, qu’avec SAS 9.1.3 ou SAS 9.2, un warning apparaît dès lors que la variable est donnée dans une instruction BY. L’option VARLENCHK de SAS 9.2 ne vous enlèvera pas le warning. Je vous conseille donc de changer votre longueur au préalable si vous ne voulez pas ce WARNING.

    data two_b;
    length x $1;
    set two;
    by x;
    run;

    WARNING: Multiple lengths were specified for the BY variable x by input data sets and LENGTH, FORMAT, INFORMAT statements. This may cause unexpected results.

    Lectures complémentaires :

    h1

    Une option SAS 9.2 pour ODS PDF : répéter une valeur groupée sur plusieurs pages

    août 3, 2010

    Lorsque vous construisez un listing avec ODS PDF et PROC REPORT l’option GROUP de l’instruction DEFINE sert à n’afficher chaque valeur de la variable concernée qu’une seule fois.

    Hors, si cette valeur s’applique aux observations de plusieurs pages, elle ne sera pas répétée à moins d’ajouter l’option SPANROWS nouvelle avec SAS 9.2.

    Cette options ne fonctionne pas actuellement avec ODS RTF.

    Voici un exemple pour tester par vous même.

    1. Le setting

    Par simple soucis de présentation, quelques instructions de paramétrage sont données.

    • Enlever le titre par défaut avec l’instruction TITLE.
    • Enlever la date et le numéro de page par défaut et alignez le résultat à gauche.
    • Créer un format caractère SEX où M réfère à Garçon et F à Fille.


    *——————————————–;
    * Setting;
    *——————————————–;

    title;
    options nodate nonumber nocenter;

    proc format;
    value $ sex ‘M’=‘Garçon’
    ‘F’=‘Fille’;
    run;

    2. Préparation des données

    Afin d’avoir assez de données le fichier CLASS est multiplié par 5. Les noms sauvegardés dans la variable NAME sont incrémentés d’un nombre.

    *——————————————–;
    * 2. Data Preparation;
    *——————————————–;

    data class;
    set sashelp.class;
    output;
    name=cats(name,’1′);
    output;
    name=cats(name,’2′);
    output;
    name=cats(name,’3′);
    output;
    name=cats(name,’4′);
    output;
    name=cats(name,’5′);
    output;
    run;

    3. Reporting

    Enfin la section qui nous intéresse vraiment : générer un fichier .RTF et un fichier .PDF avec l’option SPANROWS et voir que que seul ODS RTF tient compte de cette option pour répéter l’observation en début de chaque nouvelle page.


    *——————————————–;
    * 3. Reporting;
    *——————————————–;

    ods listing close;
    ods rtf file=‘C:\sasref\test1.rtf’;
    ods pdf file=‘C:\sasref\test1.pdf’;


    proc report data=class spanrows nowd;
    column sex name;
    define sex / group ‘Sexe’;
    define name / display ‘Nom’ ;
    run;


    ods pdf close;
    ods rtf close;
    ods listing;

    h1

    Combien de nouveaux cas par an ? Une mesure d’incidence

    juillet 25, 2010

    L’incidence est une mesure statistique utilisée couramment dans les études cliniques, en cancérologie notamment. Vous trouverez sur Wikipédia une explication en termes simples de ce concept. Voici quelques extraits: définition et exemple de base.

    1. Le principe de base

    Wikipedia, définition : « En général, l’incidence (ou le taux d’incidence) est le nombre de nouveaux cas d’une pathologie observés pendant une période et pour une population déterminée. »

    Taux d’incidence=nombre de nouveaux cas/durée totale du suivi

    Wikipedia, exemple : « Par exemple, si 100 personnes à risque ont été étudiées pendant 2 ans, la durée totale de suivi est de 200 personnes-années.Dans ce même exemple, s’il a eu 5 nouveaux cas de la maladie à l’étude, le taux d’incidence sera de 5 cas par 200 personnes-années, ou plus simplement de 2,5 cas par 100 personnes-années (ou encore 0,025 cas par personne-année). »

    Taux d’incidence=5/200

    2. Le vrai taux d’incidence

    Wikipedia, définition : « En général, on s’intéresse à la première occurrence d’une maladie donnée chez une personne (au premier cancer et pas à ses récidives chez un même patient par exemple). »

    Wikipedia, l’exemple: « Dans l’exemple précédent, les cinq cas diagnostiqués pendant l’étude ne sont plus à risque à partir du moment où ils sont diagnostiqués. S’ils ont contracté la maladie après six mois d’observation, ils n’ont été à risque que pendant six mois. La durée totale de suivi pour cette étude est donc

    • de 190 personnes-années pour les personnes qui n’ont pas la maladie (95 personnes fois 2 ans) et
    • de 2,5 personnes-années pour les cas (6 mois fois 5 cas).

    Le vrai taux d’incidence est donc de 5 cas sur 192,5 personnes-années (ou 2,6 cas par 100 personnes-années). »

    Taux d’incidence=5/192.5

    L’éventail d’application de cette mesure s’étant au delà de la pharmaceutique. Nombre de personnes ayant retrouvé un emploi, nombre de clients ayant effectué un nouvel achat dans l’année après être passé au statuts de client perdu, etc.

    Complétez cet article

    N’hésitez pas à ajouter des précisions tant sur le calcul avec SAS, que sur la gestion des valeurs manquantes, identifier une différence significative entre deux taux d’incidence ou la représentation graphique de ce type de données.

    h1

    Macro : mini-programmes/routines pour tester la validité d’un nom de variable

    juin 27, 2010

    Après avoir appris les bases de la programmation, vous allez vous rendre compte que certaines tâches se répètent de programme à programme. Une partie d’entre eux peut se résumer à quelques lignes. Il est alors tentant d’écrire un programme de manière « officielle » et de le valider au lieux d’avoir à écrire le code à chaque fois.

    Voici un petit exemple. Il s’agit du descriptif d’une macro qui va indiquer si le nom de variable donné est conforme aux règles requises par SAS. Ici vous avez la spécification et les tests de validation.

    1. Spécification : Quelles sont les règles ?

    Le nom d’une variable ne peut pas avoir plus de 32 caractères.

    Le premier caractère est une des 26 lettres de l’alphabet ou un chiffre.

    Les autres caractères  peuvent être des lettres de l’alphabet, un chiffre ou un tiret bas (underscore).

    2. Spécification : Quelques contraintes ?

    Vous développez une macro disons VARNAME_VALID ayant un paramètre VARNAME où vous pourrez entrer le nom d’une variable à tester. Si ce nom entre dans les critères de définition de SAS, alors une macro variable varname_ok=1 sinon la macro variable varname_ok=o.

    3. Test Cases : Quand tout va bien: un nom de variable avec une seule lettre, deux lettre, commençant par un tiret bas, écrit en majuscule, avec un chiffre au milieu, avec un chiffre à la fin

    Qu’est ce qui est testé : un nom de variable suivant les règles requises par SAS.

    Quel est le code à soumettre :

    %varname_valid(varname=a);
    %varname_valid(varname=ab);
    %varname_valid(varname=_ab);
    %varname_valid(varname=AB);
    %varname_valid(varname=ab1a);
    %varname_valid(varname=ab1);

    Quel est le résultat attendu :

    La macro variable garde la valeur un

    &varname_ok.=1

    Un message dans la log est affiché :

    NOTE: (VARNAME_VALID) Nom de variable correct.
    NOTE: (VARNAME_VALID) Valeur actuelle :  ab

    D’autres programmes peuvent être appelés après.

    4. Test Cases : Violation des pré-requis de la macro

    4.1 Violation pré-requis : le paramètre est manquant

    Qu’est ce qui est testé : Un nom de variable doit être donné dans le paramètre de la macro

    Quel est le code à soumettre : %varname_valid(varname=);

    Quel est le résultat attendu :

    La macro variable VARNAME_OK prend la valeur zéro

    &varname_ok.=0

    Un message dans la log est affiché :

    WARNING: (VARNAME_VALID) Nom de variable incorrect.
    WARNING: (VARNAME_VALID) Valeur actuelle:
    EARNING: (VARNAME_VALID) Valeur attendue: un nom de variable.

    D’autres programmes peuvent être appelés après.

    4.2 Violation pré-requis : plus d’un nom de variable est entré

    Qu’est ce qui est testé : Plus d’une variable est entrée dans le paramètre de macro

    Quel est le code à soumettre : %varname_valid(varname= ab cd );

    Quel est le résultat attendu :

    La macro variable prend la valeur zéro

    &varname_ok.=0

    Un message dans la log est affiché :

    WARNING: (VARNAME_VALID) Nom de variable incorrect.
    WARNING: (VARNAME_VALID) Valeur actuelle : ab cd
    WARNING: (VARNAME_VALID) Valeur attendue : un seul nom de variable.

    D’autres programmes peuvent être appelés après.

    5. Test Cases : Les règles définies par SAS pour nommer une variable

    5.1  Un nom de variable : Au maximum 32 caractères

    Qu’est ce qui est testé : un variable avec plus de 32 caractères

    Quel est le code à soumettre : %varname_valid(varname=abcdefghijklmnopqrstuvwxyz1234567890);

    Quel est le résultat attendu :

    La macro variable prend la valeur z éro

    &varname_ok.=0

    Un message dans la log est affiché :

    WARNING: (VARNAME_VALID) Nom de variable incorrect.
    WARNING: (VARNAME_VALID) Valeur actuelle : abcdefghijklmnopqrstuvwxyz1234567890
    WARNING: (VARNAME_VALID) Valeur attendue : 32 caractères au maximum.

    D’autres programmes peuvent être appelés après.

    5.2 Un nom de variable : commence par une lettre de l’alphabet (a-z) ou un tiret bas

    Qu’est ce qui est testés : Un premier caractère différent d’une lettre de l’alphabet ou d’un tiret bas

    Quel est le code à soumettre : %varname_valid(varname=é);

    Quel est le résultat attendu :

    La macro variable prend la valeur zéro

    &varname_ok.=0

    Un message dans la log est affiché :

    WARNING: (VARNAME_VALID) Nom de variable incorrect.
    WARNING: (VARNAME_VALID) Valeur actuelle : é
    WARNING: (VARNAME_VALID) Valeur attendue : La première lettre est une des 26 lettres ou un tiret bas.

    D’autres programmes peuvent être appelés après.

    5.3 Un nom de variable : Après le premier caractère on peut avoir des lettres (a-z), des chiffres (0-9) et des tirets bas.

    Qu’est ce qui est testé : un caractère différent d’une lettre de l’alphabet, d’un chiffre ou d’un tiret bas parmi les autres caractères de l’alphabet

    Quel est le code à soumettre : %varname_valid(varname=1é);

    Quel est le résultat attendu :

    La macro variable prend la valeur zéro

    &varname_ok.=0

    Un message dans la log est affiché :

    WARNING: (VARNAME_VALID) Nom de variable incorrect.
    WARNING: (VARNAME_VALID) Valeur actuelle : 1é
    WARNING: (VARNAME_VALID) Valeur attendue : La première lettre est une des 26 lettres ou un tiret bas.

    WARNING: (VARNAME_VALID) Nom de variable incorrect.
    WARNING: (VARNAME_VALID) Valeur actuelle : 1é
    WARNING: (VARNAME_VALID) Valeur attendue : A partir du deuxième caractères, seuls des lettres,
    WARNING: (VARNAME_VALID) des chiffres et un tiret bas sont autorisés.

    Lecture complémentaire

    h1

    Entrer une date avec l’informat ANYDTDTE

    juin 6, 2010

    Découvrez le cours de novembre 2022 : Les fonctions put et input – un sujet épineux

    Aujourd’hui j’aimerais vous présenter un informat destiné aux dates qui est apparu avec la version 9 de SAS : ANYDTDTE.

    La manière dont est écrite une date est très variable et le nombre d’informat pour pourvoir entrer ces dates dans une table SAS est aussi large que le nombre de manière d’écrire une date. Du coup, difficile de se souvenir du nom de chacun des informats lorsqu’on rencontre une structure différente de son habitude de manière occasionnelle. Le passage par la documentation de SAS est quasiment obligé.

    L’informat ANYDTDTE regroupe plusieurs informats sous sa coupole pour vous faciliter ce travail de mémorisation. Illustration.

    1. Présentation de trois informats : DATE9., DDMMYY10. et ANYDTDTE.

    De manière classique un informat reconnait une structure particulière.

    • L’informat DATE9 reconnait une date écrite sous la forme DDMMMYYYY (15APR2007).
    • L’informat DDMMYY10. reconnait les dates de la forme DD/MM/YYYY (15/04/2007).

    L’informat ANYDTDTE vous permettra de retrouver les deux structures et plus encore.

    2. Un exemple

    Dans cet exemple la date est écrite de deux manières différentes. Deux choix s’offrent à vous :

    • informat date1 ddmmyy10. date2 date9.;
    • informat date1 date2 anydtdte.;

    Dans le premier cas, vous identifiez de manière précise la structure de chacune des dates et appliquez l’informat de votre choix.

    Dans le second cas, vous laissez SAS identifiez la structure des deux dates parmi une liste de 8 informats : DATE, DATETIME, DDMMYY, JULIAN, MMDDYY, MONYY, TIME, YYMMDD ou YYQ.

    data event;
    informat date1 date2 anydtdte.;
    *informat date1 ddmmyy10. date2 date9.;
    format date1 date2 date9.;
    input event date1 date2;
    datalines;
    1 15/04/2007 15APR2007
    1 20/10/2007 20OCT2007
    3 11/02/2007 11FEB2007
    4 14/11/2007 14NOV2007
    8 15/02/2007 15FEB2007
    9 28/01/2007 28JAN2007
    17 15/01/2007 15JAN2007
    17 30/04/2007 30APR2007
    19 12/08/2007 12AUG2007
    19 25/08/2007 25AUG2007
    20 21/02/2007 21FEB2007
    ;
    run;

    proc print data=event;
    run;

    Lecture complémentaire

    Lecture complémentaire sur la documentation en ligne de SAS

    SAS Online Doc >Base SAS > SAS Language Reference : Dictionary > Dictionary of Language Elements > Informats

    • ANYDTDTEw. Informat
    • DDMMYYw. Informat
    • DATEw. Informat

    Aller plus loin

    Découvrez le cours de novembre 2022 : Les fonctions put et input – un sujet épineux

    h1

    Mettre des données côte-à-côte pour votre reporting

    Mai 24, 2010

    Lorsque vous devez présenter vos données (faire du reporting), vous pouvez vous trouver dans la situation suivante : mettre côte-à-côte des données qui n’ont rien à voir entre elles. La situation peut se résoudre très rapidement avec un merge sans instruction BY. Mais que faire dans le cas où vous devez quand même grouper vos données par une clé (exemple l’identifiant du client) mais dans chaque source plus d’une observation par clé ? C’est ce que je vous propose de découvrir dans cet article.

    1. Les données pour l’exemple

    Deborah a deux lignes d’observation et Patrick aussi.

    data demography;
    length cl_name $10 criteria $10 ;
    input cl_name $ criteria $ crit_value ;
    datalines;
    deborah age 15
    deborah height 1.66
    patrick age 14
    patrick height 1.75
    ;
    run;

    Deborah a acheté 4 articles (DVD, téléphone portable, une radio et des écouteurs (4 lignes d’observations pour Deborah) tandis que Patrick a acheté deux articles.

    data sell;
    length cl_name $10 achat $10;
    input cl_name $ achat $;
    datalines;
    deborah dvd
    deborah mobile
    deborah radio
    deborah headset
    patrick mobile
    patrick tv
    ;
    run;

    2. Le résultat sans instruction BY

    data mix_demo_sell;
    merge demography
    sell;
    by cl_name;
    run;

    Vous vous retrouvez avec un merge MANY-to-MANY qui ne résous par votre problème. Pensez toujours à vérifer votre log après un MERGE. Ce type de note est souvent signe d’une erreur de raisonnement dans votre programme.

    proc print data=mix_demo_sell;
    run;

    On observe ici un RETAIN implicite propre au merge.

    3. Ajouter un compteur pour chaque client

    Pour contourner le problème, on ajouter un identifiant supplémentaire dans les deux tables.

    Dans la table DEMOGRAPHY, le client DEBORAH a deux observations. On aura donc CNT=1 et CNT=2.

    data demography;
    set demography;
    by cl_name;
    if first.cl_name then cnt=1;
    else cnt+1;
    run;

    Dans la table SELL, le client DEBORAH a quatre observations. On aura donc CNT=1, CNT=2, CNT=3 et CNT=4.

    data sell;
    set sell;
    by cl_name;
    if first.cl_name then cnt=1;
    else cnt+1;
    run;

    Il ne reste plus qu’à combiner les deux tables à partir de la variable client (CL_NAME) et de la variable CNT.

    data mix_demo_sell;
    merge demography
    sell;
    by cl_name cnt;
    run;

    proc print data=mix_demo_sell;
    run;

    Le résultat désiré se présente ainsi :

    Lecture complémentaire

    h1

    Une petite histoire de macro : compter le nombre de mots dans un paramètre de macro

    avril 11, 2010

    Il est courant de devoir compter le nombre de mots dans un paramètre de macro. Il est par exemple possible de vouloir créer une boucle pour travailler chacun des termes contenu dans cette macro de manière séparée.

    Voici donc l’histoire d’une mini macro qu’on nommera CNT_WRD qui crée une macro variable TOT_WRD renvoyant le nombre de mots contenu dans le paramètre TXT.

    Ceci est pour vous l’occasion de voir ou revoir un raisonnement possible dans la construction d’une macro sous SAS.

    1. Préciser ses besoins, une rapide « spécification »

    La macro CNT_WRD composée d’un seul paramètre retournera dans une macro variable TOT_WRD le nombre de mots contenus dans le texte donné dans le paramètre de macro.

    Ici on considérera comme mot, tout terme séparé par au moins un blanc.

    Si le paramètre de macro est vide, la macro ne devra pas afficher de message d’erreur et la macro variable TOT_WRD sera égale à 1. Par défaut, aucune valeur ne sera entrée dans le paramètre TXT.

    La macro variable doit pouvoir être utilisable à l’extérieur de la macro (macro variable globale).

    2. Tester la fonction COUNT dans une étape data

    La fonction COUNT permet de comptabiliser certains caractères et donc de répondre à ce type de besoin. En fait, cette fonction ne compte pas le nombre de mots mais compte le nombre de caractères définis par le second élément dans la fonction; dans notre cas, elle comptera le nombre de blancs. Il faut donc ajouter 1 au total.

    Voici un exemple dans une étape data.

    data _null_;
    tot_wrd=1+count(‘mot1 mot2’,‘ ‘);
    put tot_wrd=;
    run;

    Dans la log, vous pouvez voir que cnt_wrd=2.

    Mais cela ne suffit pas pour gérer les blancs multiples et les blancs aux extrémités. Car si vous avez plus d’un blanc entre chaque mot, chacun sera compté. Il faut donc les enlever au préalable (avec la fonction COMPBL ici). Les blancs de début et fin peuvent s’enlever au moyen de la fonction STRIP.

    data _null_;
    tot_wrd=1+count(strip(compbl(‘ mot1 mot2 ‘)),‘ ‘);
    put tot_wrd=;
    run;

    Mais que ce passe t-il si notre texte à compter est vide ? TOT_WRD sera égal à 1. Il faut donc ajouter le 1 au total que si le texte à analyser n’est pas vide.

    data _null_;
    length txt $200;
    txt=;
    if txt ne ‘ ‘ then tot_wrd=1+count(strip(compbl(txt)),‘ ‘);
    put tot_wrd=;
    run;

    3. Créer la macro

    Comme indiqué dans le dernier point, on travaille ici de manière conditionnelle. Si le paramètre de macro TXT est vide, la macro variable CNT_WRD nouvellement créée prend la valeur zéro. Sinon, On passe par la fonction COUNT.

    Comme il n’existe pas d’équivalent aux fonctions COUNT et COMPBL en langage macro, il faut encadrer chacune d’elle dans une fonction macro SYSFUNC.

    Ici on notera que la fonction STRIP n’apparaît pas. Les blancs de début et de fin en langage macro n’ont aucun impact.

    %macro cnt_wrd(txt=);

    %global tot_word;

    %if &txt.= %then %let tot_wrd=0;
    %else %let tot_wrd=%eval(1+%sysfunc(count(%sysfunc(compbl(&txt.)),%str( ))));

    %mend cnt_wrd;

    Pour représenter un blanc dans une étape data, il suffit d’utiliser des guillemets. En langage macro, on fait appel à la fonction %STR(). Il faudra ne pas oublier d’ajouter un blanc entre les parenthèses.

    Afin d’ajouter 1 au résultat de la fonction COUNT, il faut utiliser la macro fonction %EVAL. Le contenu des macro variables sont sinon tous interprétés comme du texte, qu’il s’agisse de nombres ou pas.

    Enfin, pour que cette macro variable TOT_WRD soit utilisable en dehors de la macro, il faut qu’elle soit globale. Hors par défaut, une macro variable créée dans une macro est locale, c’est-à-dire n’existe que le temps de la macro. L’instruction %GLOBAL TOT_WRD; résouds le problème.

    4. Tester la macro dans le cadre de sa validation

    Que se passe t-il quand on ne change pas la valeur par défaut du paramètre de macro ?

    %cnt_wrd;
    %put Valeur de TOT_WRD: &tot_wrd;

    Que se passe t-il quand le paramètre de macro TXT est vide de texte ?
    %put Valeur de TOT_WRD: &tot_wrd;

    %cnt_wrd(txt=);
    %put Valeur de TOT_WRD: &tot_wrd;

    Que se passe t-il lorsqu’il n’y a qu’un mot?

    %cnt_wrd(txt=mot1);
    %put Valeur de TOT_WRD: &tot_wrd;

    Que se passe t-il quand il y a plusieurs mots ?

    %cnt_wrd(txt=mot1 mot2 mot3);
    %put Valeur de TOT_WRD: &tot_wrd;

    Que se passe t-il quand il y a des blancs multiples entre les mots, en début et à la fin ?

    %cnt_wrd(txt= mot1 mot2 mot3 );
    %put Valeur de TOT_WRD: &tot_wrd;

    Que se passe t-il quand il y a des blancs multiples entre les mots, en début et à la fin ?

    %cnt_wrd(txt=mot1 mot2);
    %put Valeur de TOT_WRD: &tot_wrd;

    Que se passe t-il quand la macro est appelée plusieurs fois ?

    %cnt_wrd(txt=mot1 mot2);
    %put Valeur de TOT_WRD: &tot_wrd;
    %cnt_wrd(txt=mot1);
    %put Valeur de TOT_WRD: &tot_wrd;

    Lecture complémentaire