<<< PAC-Assist2の使用に関する補足情報(概要) >>>

このページは、PAC-assist利用者のための補足情報として提供していたものに基づいています。この度PAC分析学会ホームページ開設に合わせ、PAC分析を実施する方のための補助となるべく公開することにいたしました。

2016/01/062021/11/08

土田 義郎

 

 目次

  1 全体的補足

  2 Rによるクラスター分析について

  3 SPSSによるクラスター分析について

  4 HALBAUによるクラスター分析について

  5 HADによるクラスター分析について

 

■1 全体的補足

 

スケール表示について

ファイル名に(s7)とついているのは10段階でなく、7段階スケールを表示したものです。内容的には変わりません。ご都合のよろしいほうをお使いください(旧バージョンのみ。PAC-Assist2ではすべて10段階の目盛りになっています)。

 

マクロの設定について

EXCELのセキュリティレベルによっては、ファイルを開いてもボタン類がまったく機能しない場合があります。その場合はメニューから「ツール」→「マクロ」→「セキュリティ」を開き、レベルを「中」か「低」にしてください。再度ファイルを開くと使えるようになります。マクロを有効にするかどうかのウインドウが開いたら「マクロを有効にする」設定にしてください。

EXCEL2007以降はセキュリティの設定方法が変わっています。officeボタンから「EXCELのオプション」を押して「セキュリティ・センター」→「セキュリティ・センターの設定」を選んで「信頼できる場所」や「マクロの設定」を調整してください。

 

連想項目数について

連想項目数は旧バージョンでは25個までとしていました。PAC-Assist2では50個までにしてますが、連想項目が多くなるほど準備時間が長くなります。また、比較回数は連想項目数の2乗に比例する形で増加するので、被験者の負担を考えるとこの程度の数が限界かと思われます。またVBAの内部計算(準備時間)も長くなります。この点をご了解の上ご使用ください。

 

デンドログラムが使用するソフトによって異なる点について

PAC分析(の中のデータのクラスター分析)の問題点について、以下のサイトに貴重な討論が掲載されています。(質問者も当方のソフト利用者です)

http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc035/08392.html

ご使用の際はこういったことも踏まえてお使いください。本ソフトはこのような問題の解決にも多少は役立つかと思います。

 

データの保存

得られたデータは、エクセル形式で被験者固有の名前を付けて保存するのを忘れずに。最初にまず名前を付けてしまうのがよいでしょう。

想起順や重要度はそのファイルを参照して適宜活用してください。その後、従来法による場合は統計ソフトによってクラスター分析を行います。

 

クラスター分析のソフトウェア

クラスター分析のためのソフトは別途インストールが必要です。重複グループ化法による場合はPAC-Assist2を使用される場合は一連の手続きとして継続してください。

以降の2~5は、従来法によってクラスター分析を行う際のガイドとなります。得られたデンドログラムは適宜ワープロなどに貼り付けて(場合によっては印刷して)面接に使用します。


■2 Rによるクラスター分析について

 

Rはフリーの統計パッケージであり、S言語と互換性のある言語でもあります。GUIではありませんが、スクリプトは強力でかなりのことができ、信頼性も高いため、様々な学術分野で広く使われています。

参照 https://www.r-project.org/

 

(1)データファイルの作成

最終的な非類似度データのワークシートから必要部分だけをコピーして、新しいファイルに貼り付けます。それをcsv形式(データをカンマで区切ったテキストファイル)で適当な名前をつけて保存します。サンプルデータ(表1)を以下に示します。

 

 

1 サンプルデータ

-----------------------------------------------------------------------------

家族,   生活,   玄関,   成長,   転勤,   建物,   改築,   同居, 集合体,   材料

0.00,   1.95,   3.97,   4.70,   3.55,   2.78,          3.95,   1.85,   4.80,   7.48

1.95,   0.00,   1.25,   3.45,   2.80,   5.85,          4.40,   3.15,   4.40,   6.65

3.97,   1.25,   0.00,   5.30,   6.49,   2.90,          1.95,   5.85,   5.60,   5.15

4.70,   3.45,   5.30,   0.00,   3.00,   2.90,          3.10,   3.00,   5.45,   5.00

3.55,   2.80,   6.49,   3.00,   0.00,   4.55,          2.20,   4.65,   5.70,   7.25

2.78,   5.85,   2.90,   2.90,   4.55,   0.00,          0.65,   4.80,   5.10,   1.65

3.95,   4.40,   1.95,   3.10,   2.20,   0.65,          0.00,   3.10,   4.60,   1.15

1.85,   3.15,   5.85,   3.00,   4.65,   4.80,          3.10,   0.00,   5.80,   6.85

4.80,   4.40,   5.60,   5.45,   5.70,   5.10,          4.60,   5.80,   0.00,   7.15

7.48,   6.65,   5.15,   5.00,   7.25,   1.65,          1.15,   6.85,   7.15,   0.00

-----------------------------------------------------------------------------

 

(2)R の起動

以下のようなスクリプトを打ち込むことで、簡単にクラスター分析が実行できます。

 

data <- read.table(file.choose(), header=TRUE, sep=",")

d <- as.dist(data)

ans <- hclust(d,method="ward.D2")

plot(ans,hang=-1)

 

※注

このテキストは以下の書籍およびwebサイトを参照して作成しました。

使用したRのバージョンは2.2.0です。特に群馬大の青木先生には謝意を表します。

http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc035/08392.html

http://www.okada.jp.org/RWiki/index.php?RjpWiki

垂水共之、飯塚誠也:R/S-PLUSによる統計解析入門、共立出版(2006)


■3 SPSSによるクラスター分析について

 

SPSSは老舗の統計パッケージです。有償の市販ソフトですが、心理分野では広く用いられてきました。これを用いてもデンドログラムを求めることができます。

参照 https://www.ibm.com/jp-ja/analytics/spss-statistics-software

 

データ作成はRのときと同じようにcsv形式で作成しておきます。下記のページに類似度(非類似度ではない)の行列からクラスター分析を行う方法が書かれています。

http://www-01.ibm.com/support/docview.wss?rs=608&q1=%27PROX%27+%27DISSIMILARITY%27.&uid=swg21479630&loc=ja_JP&cs=utf-8&cc=jp&lang=all

 

(1)変数の数を連想語の数に合わせます。

'MATRIX DATA VARIABLES'は連想語に対応した変数の数としてください。

 

(2)行列のタイプの指定

行列は非類似度なので'SIMILARITY'でなく'DISSIMILARITY'とします。

 

(3)クラスタ生成手法の指定

PAC分析の場合はウォード法が推奨の手法なので、'METHOD''BAVERAGE'ではなく、'WARD'とします。

 

以下の事例を参照してください。データを書き換えることでこちらも簡単にクラスター分析を行なうことができます。

変数名をラベルに変える方法は不明です。

 

MATRIX DATA VARIABLES = x1 to x10

/FORMAT = LIST FULL DIAGONAL

/CONTENTS = PROX.

BEGIN DATA.

0.00,   1.95,   3.97,   4.70,   3.55,   2.78,          3.95,   1.85,   4.80,   7.48

1.95,   0.00,   1.25,   3.45,   2.80,   5.85,          4.40,   3.15,   4.40,   6.65

3.97,   1.25,   0.00,   5.30,   6.49,   2.90,          1.95,   5.85,   5.60,   5.15

4.70,   3.45,   5.30,   0.00,   3.00,   2.90,          3.10,   3.00,   5.45,   5.00

3.55,   2.80,   6.49,   3.00,   0.00,   4.55,          2.20,   4.65,   5.70,   7.25

2.78,   5.85,   2.90,   2.90,   4.55,   0.00,          0.65,   4.80,   5.10,   1.65

3.95,   4.40,   1.95,   3.10,   2.20,   0.65,          0.00,   3.10,   4.60,   1.15

1.85,   3.15,   5.85,   3.00,   4.65,   4.80,          3.10,   0.00,   5.80,   6.85

4.80,   4.40,   5.60,   5.45,   5.70,   5.10,          4.60,   5.80,   0.00,   7.15

7.48,   6.65,   5.15,   5.00,   7.25,   1.65,          1.15,   6.85,   7.15,   0.00

END DATA.

VALUE LABELS rowtype_ 'PROX' 'DISSIMILARITY'.

CLUSTER x1 to x10

/MATRIX = IN (*)

/METHOD WARD

/PRINT SCHEDULE DISTANCE

/PLOT DENDROGRAM.

 


■4 HALBAUによるクラスター分析について

 

内藤先生がその著書で紹介されている統計解析ソフトHALBAU(*1)でも、もちろん分析可能です。この場合はエクセル形式のファイルを読み込みます。

 

(1)データファイルの作成

R(■2)と同様に、結果として保存したエクセルファイルから必要なデータ部分だけ(表1)をコピーして、新しいファイルにします。保存はcsv形式ではなく、エクセル形式のままにします。

 

(2)データの取り込み

HALBAUの設定画面から[ファイル(F)] を選択し、[EXCELからデータ作成(E)]を選びます。開いたウインドウから対象ファイルを選択します。取り込み画面で、シート名や範囲、変数名などを確認した後、[OK]ボタンを押します。

 

(3)分析の実施

自動的に[分析方法の指定メニュー]が開きます。右側の[分析方法グループ][その他の方法]ラジオボタンを選択します(*2)。すると左側に[11.クラスター分析]というメニューが現れます。これを選択し、[設定]ボタンを押します。

[クラスター分析(キー入力)]というウインドウが開きます。この画面はマニュアルでの入力を行うものですが、距離行列を対象とする場合は、ここから分析していく必要があります。ちょっとメニューの構造としてはスマートではありませんが。

[ファイル(F)]から[読み込み(L)]を選択します。開いたウインドウから、保存したエクセルファイルを選択して読み込むと、空欄だった表が埋まります。[行列の大きさ]は自動的に変わります。ここで[行列の種類][距離]にして、[分析の開始]ボタンを押します。

新たに変わった画面で[ウォード法]を選択して、[結果の出力]のチェックはすべて入れたうえで[分析実行]ボタンを押します。

 

※注

*1 確認したソフトはHALBAU 7[()ハルボウ研究所]によっています。

*2 [多変量解析]を選びたくなりますが、PAC分析のように距離行列から分析する場合、これを選んではいけません。距離行列が「変数×ケース」と扱われてしまうからです。


■5 HADによるクラスター分析について

 

HADExcelで動くフリーの統計分析用プログラム(清水裕士氏作成)です。日本語で動き書籍も発行されていますので、日本人にとってとっつきやすいでしょう。Excel上で動くということでPAC-Assistとも相性が良いです。

参照 https://norimune.net/had

 

(1)HADへのデータのセット

データシートにPAC-Assistで得られた距離行列をコピー&ペーストする。

B列は空けておき、ID変数を記入。

【データ読み込み】ボタンを押す。

 

(2)モデリングシート

分析方法の選択と実行はこちらのシートから行います。

「因子分析」を選択します。なぜか因子分析です。

[オプション]から「ウォード法」を選びます。

[使用変数]

 ID以外すべてを選択し、追加します。

[変数を分類]

 もし[回答者を分類]にすると、ID変数で表示されてしまいます。

ボタン押しても何も変化しないので注意が必要です。

クラスタ数

 「指定せずに分析」

分類方法

 「階層的」

分析対象

 「距離行列」←これを選択するのが重要なポイントです。

得点

 不要

出力

 デンドログラムにチェックを入れます。

[分析実行]

 デンドログラムが別シート(HCulster)に出力されます。