SASテクニック SQL 要約統計量を列に追加


SASというよりかはSQLのtips

meansプロシジャなどで要約統計量を求めることができるが、
元データの横にそのまま持たせたいときがある
(合計値を横に持たせて割合出したりなど)

SQLプロシジャを用いて横に持たせる例

proc Sql;
  create table work.CLASS as
    select
    * ,
    ( select max( AGE ) from sashelp.CLASS ) as MAX_AGE ,
    ( select mean( HEIGHT ) from sashelp.CLASS where SEX = "男子" ) as MEAN_HEIGHT_M ,
    ( select mean( HEIGHT ) from sashelp.CLASS where SEX = "女子" ) as MEAN_HEIGHT_F ,
    ( select count( * ) from sashelp.CLASS ) as OBS ,
    ( select mean( WEIGHT ) from sashelp.CLASSFIT ) as MEAN_PREDWEIGHT ,
    1 + 1 as TEST
    from sashelp.CLASS;
quit;

↑のように列に計算結果をどんどん追加できる

再マージされる機能を利用して以下のような書き方もできる
年齢ごとの要約統計量を列に追加

proc Sql;
  create table work.CLASS2 as
    select
      *,
      count( * ) as N ,
      sum( HEIGHT ) as SUM ,
      avg( HEIGHT ) as MEAN ,
      mean( HEIGHT ) as MEAN2
    from sashelp.class
    group by AGE;
quit;

meansプロシジャとdataステップでも一応可能

meansで要約統計量を求め

data xxx;
  set yyy;
  if _N_ = 1 then meansの出力データ;
...
run;

など