大量 の データ の 中 から 傾向 や 規則 性 を 見いだす 方法。 なぜクラスター分析などの統計学や手法について叫ばれるようになったのか━その時代背景は何なのか

テキストマイニングを活用事例から手法まで丁寧に解説|Udemy メディア

大量 の データ の 中 から 傾向 や 規則 性 を 見いだす 方法

信頼性とは• 1-1. 信頼性の起こり• 1-2. 信頼性技術と品質管理• 1-3. 信頼性とは 1-1. 信頼性の起こり 人類が信頼性を目覚めるきっかけは、1本の真空管でした。 真空管が信頼性という概念を誕生させる動機の1つであったことは事実のようです。 第二次世界大戦中、アメリカは大量の軍用機を極東に配置していました。 使用目的が日本に対する攻撃であったのは遺憾ですが、幸か不幸かそれらの軍用機が半分以上使いものになりませんでした。 調べてみると、飛行機の航法や通信などに使われている電気機器が半分以上も故障しているし、予備品でさえ半分は故障しているという始末でした。 そしてそのほとんどは真空管の故障でした。 これはアメリカ軍にとってはもちろん、アメリカ政府にとってもゆゆしい問題です。 さらに、艦船用の電気機器も正常に作動するほうが少ないことも判明しました。 そして、軍と産業界が一体となって対策が検討されはじめたのです。 まず、真空管が図面どうりに正しく作られるようにと製造過程に対する管理を厳しく、徹底的な検査が行われました。 一方、苛烈な戦争のさなかに故障が続出するアメリカ軍からは、絶対に故障しない機器を作れ、と厳しい要求が出されました。 メーカーとしても設計に何を盛り込めば故障しない製品に近づくことができるかと懸命の研究を開始しました。 この「なに」が信頼性という概念の起こりです。 第二次大戦が終わった後、軍が中心になって戦争中の技術活動が生んだ膨大な資料の整理にかかりました。 中でも将兵を悩ませた電子兵器の故障に関するデータは、改めて信頼性に関する問題意識を駆り立てずには起きませんでした。 こうして1950年に電気機器の信頼性を調査する委員会が軍や民間の専門家を集めて発足し、全面的な調査研究が開始されました。 折しも朝鮮戦争(1950〜1953年)が勃発し、ジェット戦闘機がはじめて本格的に使用されはじめたのですが、電子機器の故障に起因すると思われる事故が多発し、せっかくの戦闘機が数多く失われました。 これが議会で取り上げられ政治問題化したため、信頼性についての調査研究がいっそう加速されました。 そして、前記の委員会は電子機器信頼性諮問委員会(通称AGREE)に昇格して、1957年には有名なAGREEレポートが提出されました。 このAGREEレポートは、日本でも初期の信頼性活動に参加した人たちにとってはバイブルのようなものでした。 内容は、信頼性に対する定量的な要求の仕方と、信頼性を確認するための試験法であり、アメリカ軍が電子機器を調達する際の方針に画期的な転換をもたらすとともに、日本などに対しても大きな影響を与えました。 そのころは、米ソのミサイルや宇宙開発の競争時代が目前に迫っていました。 ミサイルや宇宙機器の生命は信頼性であり、費用の大部分は信頼性のために費やされるといっても過言ではありません。 信頼性の研究にいっそう拍車がかかりました。 こうして、1960年前後までに信頼性に関するMIL規格が続々と発行され、現在の整備された信頼性管理体系の基礎ができあがったのでした。 こうしてアメリカの軍事的な要求から出発した信頼性技術ではありますが、内容的には軍用機器にも民生用の製品にも差別なく有効であることに疑念はありません。 信頼性技術は軍用から民生用へと普及し、また、対象も電子機器から他の一般的な製品へと拡大され、さらに、最も信頼性技術を必要とする巨大システムへと応用されて行きました。 1-2. 信頼性技術と品質管理 QC(quality controlの略、品質管理のこと) ことの起こりは互換性にあります。 近代工業が発達し、製品を大量に作るためには部品どうしの互換性が必須です。 つまり、部品の寸法が揃っていなければなりません。 そのためには製作誤差を一定の範囲以内になるように管理する必要があります。 ここに品質管理の芽生えがあったようです。 TQC(total QC) 信頼性を支える3つの柱• 統計確率に基礎をおく信頼性工学• 飛行機における双発と4発• 直列系と並列(冗長)系• 信頼性技術の周辺にある固有技術• ソフトウエアの信頼性技術・パリティビット• むらのない金属材料の作り方• 擦れ合う部分の摩耗の防ぎ方• 荷重や応力の集中を避ける方法 など 信頼性工学の使命 信頼性工学の中にはそれ自体が製品の信頼性向上に直接に寄与する手法も含まれています。 しかしながら、信頼性工学の使命は、製品の信頼性の現状を正確に把握し、改善の方向を示唆し、その結果を予測し、あるいは保証し、投資効率や危険負担についての判断資料を提供することにあると思われます。 マネージメントの重要性 人間が作り出す製品あるいは人間が運転する機械・装置は、すべて人間が絡んでいる。 大きなシステムのほとんどは、システムの構成要素として人間が参加しているマン・マシン・システムです。 したがって、製品・機械・装置の信頼性は人間の心理や挙動を除外して語れない。 船での経験…ブレーカーをロックしたこと、発電機の界磁調整器をさわってブラックアウトしたこと 1-3. 信頼性とは(信頼性の定義) キーワード 信頼性 信頼度 故障 約束どおり、あるいは期待どおりに行動すれば「信頼できる」といいます。 システムや部品についても同じことです。 信頼性(reliability)をJISでは 「 アイテムが与えられた条件で規定の期間中、要求された機能を果たすことができる性質」 と定義しています。 「 アイテム」とは、信頼性の対象となるシステム、サブシステム、機器、装置、構成品、部品、素子、要素の度の総称またはいずれか、のことです。 「 与えられた条件」とは、例えば自動車の場合、サハラ砂漠で使うのと舗装された道路で使うのとが同じ厳しさとは思えないし、また、いつも重量物を積んでいる車と空の車を同列に比較するのは不公平です。 そこで、信頼性を論ずる場合はまず条件を決めておこうというわけです。 「 規定の期間中」とは、アイテムの場合、例えば無故障を要求される期間が1日と1年では全く厳しさが異なります。 そこで、信頼性について語るときには「期間」を決めておく必要があります。 「期間」は、必ずしも時間の経過であるとは限りません。 運行距離、使用回数などが適当な場合もあります。 そして最後に「 要求された機能」とありますが、一般的にここがなかなか問題です。 人間の場合でも、頑固に決められたことを頑固にやり通すことを期待するのか、臨機応変に処理することを期待するのかによって、各個人の信頼性はだいぶ異なります。 信頼性を要求あるいはするとき、評価するとき、何が要求されている機能かを峻別しておく必要があります。 信頼性と並ぶ用語に 信頼度があります。 信頼度のJISの定義は、 「 アイテムが与えられた条件で規定の期間中、要求された機能を果たす確率」 となっています。 最後の文章が• 信頼性:〜果たすことができる性質• 信頼度:〜果たす確率 となっている以外は、信頼性と信頼度の定義は全く同じです。 英語では、信頼性も信頼度も、同じくreliabilityです。 つまり信頼性の方は文字どおりアイテムのもつ性質を意味しており、信頼度の方は、その性質を確率という数値を使って定量的に表現しています。 信頼性の方は、「性質」ですから、その程度を表現するには、低い、高い、非常に高い、などの文学的な表現ですみますが、信頼度の方は「確率」ですから、0. 信頼性工学が工学である以上、数値で表します。 ところで、JISでは故障(failure)を 「 アイテムが規定の機能を失うこと」 としています。 したがって、信頼度を「アイテムが与えられた条件で規定の期間中、故障しない確率」と言い換えてもいいでしょう。 コラム1 確率 ラプラスは確率を次のように定義している。 ある試みをしたとき、起こりうるケースの数がN個であって、そのN個のケースは、全く同じ可能性で起こりうるものと信ずることができるとする。 このN個のケースの内、R個が、われわれの期待することがらを満足するとき、そのことがらの起こる確率を であると、定義する。 このように定義された確率は、次のような性質をもっている。 期待することがらが全く起こる可能性がないときには、確率は0である。 期待する確率が必ず起こるなら、確率は1である。 確率は必ず0〜1までの間の値であって、1より大きい値になったり、マイナスになったりしない。 故障のパターン• 2-1. 人間の死亡率 〜 故障のパターンを知るために• 2-2. バスタブ曲線• 2-3. 故障の起こり方と保全 2-1. 人間の死亡率 〜 故障のパターンを知るために キーワード 生存者数 死亡者数 死亡者累計 死亡率 ヒストグラムの刻み幅 この節のテーマは故障の起こり方(パターン)なのですが、説明の都合上、身近な例として人間の寿命について考えてみましょう。 同じ日に生まれた100人の新生児が、全員亡くなるまでの約100年にわたって追跡したデータがあると思ってください。 0〜9歳の期間では当初100人の生存者がいて、その期間中に5人が死亡し、10〜19歳の期間については当初95人の生存者の内期間中に1人が死亡、そして、90歳のときには4人が生存していたけれど99歳までの間に4人とも天か地に還って追跡調査が終了した、というのがこの表のストーリーです。 死亡者数の欄をみてください。 0〜9歳の期間に5人もの方がなくなっています。 医学の進んだ現在でも出産は母親にとっても赤ちゃんにとっても命を賭けた営みであるほか、何らかの先天的な欠陥をもって生まれた赤ちゃんがこの期間に命を落とすことが多いからでしょう。 その後、10代、20代、30代と死亡の少ない期間が続きます。 40代から徐々に死亡者数が増加し、60代、70代が最も死亡者数が多くなっています。 その後、80代、90代と急激に死亡者数が減っていますが、これはどういうことでしょう。 80代、90代になったら再び元気を取り戻したのでしょうか。 いや、そんなことはないでしょう。 死ぬべき生存者が少なくなったに過ぎません。 このように、「死にやすさ」は死亡者数をみただけではわかりません。 生存者の内どのくらいの割合で死亡したかを調べる必要があります。 それが死亡率です。 0〜9歳を除けば、明らかに高齢化とともに死亡率が上昇しています。 表2-1を棒グラフにしてみましょう。 それが図2-1です。 年齢が10歳刻みの幅になっているため、棒グラフの頂上が凸凹しています。 この追跡調査では対象人数がわずか100人であったために、1本の棒の中に適当な人数を含ませるために10歳刻みにする必要があったからです。 そうすると棒グラフの頂上の凸凹は小さくなり、1本のなめらかな曲線で連ねても不自然でなくなるでしょう。 それで、死亡者数と死亡率の棒グラフの頂をなめらかな曲線でなぞると図2-2のようなグラフになります。 調査対象の人数によって目盛が異なるし、今の場合何人を調査対象にしたかは問題にしていないので、目盛を省略してあります。 一般には、図2-2の上図の縦軸を死亡者の割合(正しくは、死亡の密度関数)とし、曲線と縦軸に挟まれた面積が1になるように縦軸の目盛を刻みます。 問題は、図2-2の下図です。 縦軸は死亡率を表していますが、目盛を刻んでいません。 目盛については後で触れます。 今は上にいくほど死亡率が高い、つまり、死にやすい(故障しやすい)と思ってください。 つまり、人間は生まれた直後に死亡率のやや高い時期があり、それを過ぎると最も死亡率の低い安定した期間を迎え、壮年期くらいから徐々に死亡率が上昇しはじめ、その後は老齢化とともに死亡率は上昇の一途をたどるということになります。 2-2. バスタブ曲線 キーワード 故障率 初期故障 偶発故障 摩耗故障 有効寿命 前節で人間の死亡率の曲線についてみてきましたが、この傾向は人間ばかりではなく他の動物の死亡率についても、また、アイテム(システムや部品の総称)の故障率(failure rate)についても顕著に現れます。 その傾向を露骨に描いたのが図2-3です。 曲線の形が浴槽(bathtub)に似ていることからバスタブ曲線と呼ばれ、信頼性工学の象徴的な用語の一つになっています。 人間の場合には、現代医学のおかげで出産時の危険が大幅に減ったり、多少先天的な欠陥なら治療できるのでこの期間の死亡率はあまり高くありませんが、魚や昆虫などではこの期間の死亡率は非常に高くなります。 動物ばかりではありません。 テレビやパソコンなどの家電製品、自動車、飛行機や船舶などの機械製品も製造直後には故障が多発するのが普通です。 そこで、この期間に生ずる故障を 初期故障(initial failureまたはearly failure)と呼びます。 そして、この初期故障の発生する期間を 初期故障期間と呼んでいます。 たいていの製品には、このような初期故障が起こる期間があります。 そこで、メーカーでは出荷前にならし運転などを行って初期故障を起こさせてしまい、不具合を改善してから製品を市場に出します。 このように、製品に潜んでいる欠陥を早めに摘発してしまうことを デバッギング(debugging)と言います。 bugとは虫のことで、デバッギングは虫とりのことを意味します。 次に、バスタブ曲線の底の部分を仮に第2の期間としましょう。 この期間は死亡率や故障率が低い値でほぼ一定しています。 人間ならば少年期から青年期にかけて、生理的にはつらつとしていて偶発的な事故くらいしか死ぬことがない期間です。 偶発的な死しかないから、死亡率も変化がなく、第2の期間の死亡率は一定です。 こういう故障を 偶発故障(random failure)と言い、この第2の期間は 偶発故障期間と呼ばれます。 ところで、偶発故障などという考え方は、けしからんと思われませんか。 偶然に故障が起こったなどというのは無責任です。 プロペラに鯨が絡むなら、絡まない手を打つべきだし、電磁パルスでICが誤動作するならその対策を工夫すべきです。 ランダムに発生する故障の原因を究明しないまま、偶発故障だから仕方がないと諦めるのおかしい、と。 実は、このような疑問から、故障の起こるメカニズムの本質に迫り、その対策を見いだすための努力が開始され成果を上げつつある。 このための考え方の手法は故障解析(failure analysis)と呼ばれ、信頼性工学の中で占める位置も高まると思われます。 しかしながら、故障解析の研究がいくら進んでも、偶発故障とみなさざるを得ない故障がなくなるとは思えません。 便宜的に、因果関係の筋道があまりにも複雑すぎて、それにこだわっていたのでは話が進まないようなとき、それを偶然として取り扱います。 バスタブ曲線の右側の部分、つまり第3の期間は、第2の期間では低値安定していた死亡率や故障率が徐々に増加し、ついには加速度的に急上昇する期間です。 人間なら生理的にガタがきてぽつりぽつりと死に始め高齢化とともに死亡率が急上昇しとうとう全員が神に召される期間です。 製品の場合なら、摩耗によって文字どおりガタがきたり、材料が疲労で壊れたりして要求された機能が果たせなくなる時期です。 この時期の故障は、原因を摩耗に代表させて 摩耗故障と呼ばれます。 この期間は 摩耗故障期間と名づけられています。 疲労 金属の棒に、弱い力を繰り返し繰り返しかけ続けるとそのうちに棒が折れるがこういう現象を疲労という。 また、熱したり冷やしたりを繰り返しても材料に疲労破壊が起こる。 さて、第1の期間は設計や製造などに潜んでいる欠陥が露呈する時期、第2の期間は人知では偶発故障とかいいようのない故障だけが僅かに発生する期間、第3の期間は長い間酷使の末にガタがきてしまった時期とですから、製品としての働き盛りは第2の期間、すなわち偶発故障期間だけといえます。 そこで、偶発故障期間の長さを 有効寿命(また耐用命数)と呼ぶことがあります。 図2-4は、改めてバスタブ曲線を描き、それにこの節ででてきた新しい用語を書き込んだものです。 図をみながらこのような名称を与えられた理由を復習してみてください。 故障の起こり方と保全 キーワード 保全 整備 故障の起こり方に、初期故障、偶発故障、摩耗故障の3段階があることを知ったので、それに対する保全・整備の作戦が見えてきました。 JISによれば 保全(maintenance)とは、 アイテムを使用及び運用可能状態に維持し、または故障、欠点などを回復するためのすべての処置及び活動であり、整備ともいう となっています。 まず、製品が初期故障期間にある場合 この期間ではバスタブ曲線にみるように、時間の経過とともに故障率が下がります。 不良品が早い時期に淘汰されてしまい、良品だけが残るので故障率が低下します。 したがって、この期間は製品をどんどん使い込んで欠陥を摘出する、すなわちデバッギングするのが保全の上から良策です。 ところで、初期故障期間が終わって偶発故障期間にはいる時期は、どうしたらわかるのでしょうか。 (ワイブル分布と形状パラメータm) つぎは、偶発期間にある製品の場合 この場合はもうすぐ壊れそうな気がするからと新品に交換するのは馬鹿げています。 なしにろ故障は偶発にしか起こらないので、新品と交換しても故障率は変わりません。 むしろデバッギングが完全に終わっていない新品と交換すれば、故障率は増加します。 一般家庭の窓ガラスは、ボールが直撃したりの偶発故障しか起こりませんから、新品に換えたからといって故障率が低下しません。 誰でも実感としてこのことはよく知っています。 ところが、工場や船舶の機械類の保全などでは、たいていの部品は使うほど痛んでくるという先入観があるため、充分に有効寿命の中にあるのに新品と交換してしまうことか少なくありません。 一般的に、日本では整備不足よりも整備過剰(over-maintenance)によって稼動率を下げていると言われています。 さて、ここでも問題は、偶発故障期間から摩耗故障期間に移り変わる時点を、どうして察知するかです。 (ワイブル分布と形状パラメータm) 最後は、摩耗故障にはいった製品の場合 これは簡単です。 さっそく新品と取り替えます。 以上の作戦は、1つの大きなシステムでも、多数の同じ製品でも同じです。 3 偶発故障と信頼性• 3-1. 減衰曲線の性格(故障率と残量の関係)• 3-2. 減衰曲線を式で表す• 3-3. 平均寿命とMTBF• 3-4. 減衰曲線の性格(故障率と残量の関係) 平均寿命(MTBF)や信頼度関数を求めるための準備。 前章で、システムや部品の誕生から死滅までの間に故障率はバスタブ曲線を描き、バスタブ曲線の底の部分、つまり、偶発故障だけが起こる範囲を偶発故障期間といい、その期間が有効寿命であると述べました。 この場合、偶発故障は人智を超えた偶然によってだけ起こるのですから、故障率は一定であると信じるほかありませんし、現実のデータもそれを裏付けています。 しかし、偶然の一つ一つは正体不明でも、偶然を束にして観察するとそこに明瞭に規則性が読み取れます。 その規則性を体系づけたものが確率論であり、統計学です。 そこで、確率や統計の力をかりて偶発期間中のアイテムの有り様を明らかにして行きましょう。 まず、故障率が一定とはどういう現象でしょうか。 ラジウムやウラニウムのような放射性物質は自分の目方に正比例した放射線をだして自然に崩壊して行きますから、このような物質の崩壊を故障による摩耗と見なせます。 立ち上がりに100gだった物質は、1時間後には10%減って90g、その1時間後には90gから10%減の81g、…と計算していくと表3-1のようになります。 最初はやや急激に減少しますが、時間の経過とともに減少の仕方が緩やかになっています。 しかし、残りの量が0になることはありません。 限りなく0に近づいて行きますが、どうしても0にはなりません。 これが一定の割合で減少するときの残量の性格です。 減衰曲線と指数分布の間には密接な関係があります(後述)。 図3-2に、故障率をパラメータにとっていくつか減衰曲線を描いてみました。 いつも100gから始まるとは限らないので、縦軸の1. 0のところから曲線をスタートさせてあります。 横軸は、仮に「時の流れ」としていますが、取り扱う現象によっては走行距離としたり、使用回数としたりすます。 そして、故障率は、「時の流れ」の1単位当たりに発生する故障の割合ですが、「時の流れ」を際限なく細分化していった究極の値を1単位当たりに換算したものであることに注意を要します。 図をみると、故障率の大小にかかわらず、最初はやや急激に減少するけれども時間の経過につれて緩やかになり、零に近づいていくものの決して零にならない、という共通の傾向が読み取れます。 そして、その傾向は故障率が大きくなるほど顕著に現れます。 3-2. 減衰曲線を式で表す 平均寿命、半減期、信頼度を求めるために 故障率と時の流れと残量の関係は図3-2の通りなのですが、このままでは平均寿命を計算したり半減期を求めたりすることができません。 数式に表す必要があります。 当初、つまり時間の経過が零の時の量がAであったとする。 式3-1で表される曲線を図3-3に示します。 おなじみの減衰曲線であることがわかります。 この度は当初の量をAとしましたから、曲線の縦軸のAの位置からスタートします。 また、横軸の目盛は、図3-1や図3-2では横軸は時間の経過そのものでしたが、今度は、それに故障率kを掛け合わせた値で目盛が刻まれています。 例題1 水槽の中の生き残った魚の残量 大きな濁った水槽の中にたくさんの小魚が勝手気ままに泳いでいます。 腕白小僧が、盲滅法に網で魚をすくいとるのですが、偶然にすくい上げられる魚の数は水槽の中に残っている魚の数に正比例し、1分当たり1%の割合で犠牲になります。 10分後には水槽の中の魚は最初の何%に減ってしまうでしょうか。 この場合、kは、0. そこで表3-2を見ます。 exp -0. 例題2 水槽の中の魚が半分になるまでの時間 同じ想定を使います。 水槽の中の魚が約半分に減ってしまうのは何分たったときでしょうか。 つまり 0. 表3-2をみると exp -0. すなわち 0. 例題3 ある製品の故障率と信頼度 デバッギングが終わったある製品1350個を20日間使い続けたら40個が故障しました。 この製品の故障率はいくらでしょうか。 また、この製品が同じ条件下で200日間の使用に耐えられるように規定されているとしたら、この製品の信頼度はいくらと予測されますか。 20日間の使用で40個が故障したのですから、そのときまで故障せずに残っている残数は1310個です。 ここで、1310と1350の単位は個、20の単位は日です。 表3-2からexp -x が0. 970とほぼ同じになるxは0. 03です。 0015 が求まります。 もちろん故障率の単位は1日当たりです(故障率は理論的には瞬間の値です)。 次に、200日間使用に耐えられる信頼度を求めましょう。 実はこの値がそのまま信頼度なのですが、念のために確認します。 すなわち、1350個の内1000個が200日間働き通すだろうと見込んでいいでしょう。 3-3. 平均寿命とMTBF 平均寿命を求めます。 そして、それが平均故障間隔(MTBF)に等しいことを述べます。 平均寿命 偶発故障期間では、故障率が一定で、残量は減衰曲線を示すこと観察しました。 ところで、水槽の中の小魚のことを思い出していただきたい。 5%に減少するし、70分後には半分になるのでした。 小魚の中にはわずか数分で落命する哀れなものもいるし、数百分たっても生き延びているものもいます。 それでは、いったい、平均寿命はどれくらいなのでしょうか。 図3-4をみてください。 これは先にでてきた減衰曲線を90゜だけ回転したものです。 この曲線はうまいぐあいに彼らの寿命の度数を表していることがわかります。 横軸をA個に区切り、A本の棒グラフがあるとみなせば、1本1本の棒の高さが小魚ごとの寿命を表しています。 すなわち、Aに近いほど寿命が短い小魚たちがいること、右の端に行くほど寿命の長い小魚が多くいることを示しています。 高い棒の頭を削って低い棒へ配分し、棒の高さを揃えれば、その高さが平均寿命になるに違いありません。 そして、図を90゜だけ元へ戻します。 5のようになります。 図の中で薄ずみを塗った長方形の面積を、減衰曲線と縦軸及び横軸に囲まれた面積に等しくしてあります。 MTBF ここで、ちょっと視点を変えてみます。 1350個の製品を20日使ったら40個だけ故障して残りが1310個になったことを考えた。 そして、この事実をもとに故障率が0. 故障した製品は取り除き、代わりにデバッギングの終わった新品と取り替えて補充して、常に1350個を機能させとおくと想定してください。 製品の使われ方としてはこの方が普通だからです。 このようにすると機能している1350個の製品には、当初からがんばっているのもあるし、途中から働きだしたのもいる。 しかし、途中から働きだした製品であっても、やはり平均寿命が667日の製品であることには変わりはありません。 そうすると、ある製品が戦列に参加した日から数えて、平均的には667日後に故障が発生することになります。 つまり見方を変えれば、平均寿命は個々の製品についての平均的な故障間隔であるといえるでしょう。 で、信頼性工学では平均寿命を 平均故障間隔(mean time between failures)と名付け、普通これを MTBFと略して呼びます。 MTTFという略語もありますが、これは 平均故障寿命(mean time to failure)の略で、MTBFや平均寿命(mean life)と同じ値です。 製品、一般的にいうとアイテムの信頼性の程度を定量的に表現する物差しの第1は、もちろん信頼度です。 それと並んでMTBFも非常によく使われます。 理由の主なものは次の2つです。 電子機器の部品や計器、モーターなどのような汎用性のある製品は、市場にでた後いろいろなシステムに組み込まれて使用されますが、使用時間はシステムによってまちまちです。 それでも信頼性を信頼度で表示しようとするなら、製品のメーカがあらかじめ勝手に使用時間を想定しなければなりません。 それはあまり適当な方法とは思えません。 そこで、メーカーでは使用時間とは無関係なMTBFを表示しておき、ユーザーがそれぞれの使用時間に応じて信頼度を算出することができるようにしておきます。 これが第1の理由です。 また、多くのアイテムは故障したらそれで終わりではなく、故障したらその都度修理して長く使用される方が普通です。 こういうとき、信頼性を平均故障間隔(MTBF)で表示されている方がなじみやすいのです。 これが第2の理由です。 もちろんMTBFではなく、故障率で信頼性の程度を表すことも少なくありません。 なにしろ、MTBFと故障率は互いに逆数の関係にあるのですから。 3-4. その中の1つが放射性物質の崩壊です。 ラジウムなどの放射性物質は自分の目方に比例した放射線を出して自然に崩壊し、他の物質に変わっていく。 ところで、放射性物質の寿命はどのように表しているのでしょうか。 ある塊がだんだん小さくなっていくのですが、しかし、いつまでも消滅することはありません。 子魚の集団なら、1匹1匹の寿命を平均した平均寿命という値が説得力をもちますが、ラジウムやウラニウムに平均寿命という概念はふさわしくありません。 そこで、残量がもとの半分になるまでの時間、すなわち半減期を寿命の目安にします。 5 ; となります。 例えば、ラジウムの半減期は1622年、ウラニウムの半減期は4. 温かいコーヒーが室温との温度差に比例して熱量を放出するからです。 この場合、コーヒーの温度と室温との差は減衰曲線を描き、時間の経過とともに限りなく0に近づいて行きます。 こういうとき、温度差の現象を表現するのに平均寿命の概念は全くふさわしくないし、また半減期もしっくりきません。 そこで、 時定数(time constant)という表し方をします。 もしこの冷め方が持続されるならば、ある時間を経過した後には温度差は零になってしまうに違いありません。 その経過時間が時定数であり、これをもって冷め方を表現しようというのです。 7をみてください。 23 まで減ります。 24 ですから、MTBFだけ経つと37%に減る、決して半分に減るのではありません。 7となるようなtで表せるのでした。 したがって、平均寿命を表す式 3. 7 3. 25 という関係にあるのは明らかです。 このあたりは信頼性工学の常識です。 8 半減期とMTBFの関係 信頼度曲線 信頼度、信頼度曲線、故障確率、故障確率曲線 私たちは、故障率が一定なら故障せずに働き続けている残数は減衰曲線を描くことを知った。 そのとき、当初の量をAとして、減衰曲線はAからスタートさせた。 26 です。 信頼度は「規定の時間を通して機能を果たす確率」だからです。 したがって、Aからスターとしている減衰曲線の縦軸の目盛をAで割り、1からスタートするように描き直せば、それが信頼度を表す曲線になる。 9に信頼度曲線を示す。 既に何度もでてきた減衰曲線ですが、信頼度Rが時間tの関数なので、Rがtの関数であることを強調するためにR t と書きました。 27 であることに異論はないでしょう。 信頼度曲線は減衰曲線と目盛の刻み方が異なるだけで曲線そのものの性質は同じですから、減衰曲線に性格はそのまま信頼度曲線に当てはまります。 7のときである。 9 これが信頼度曲線 故障確率、故障確率曲線 図3. 10をみてください。 10 信頼度曲線と故障確率曲線 ここで、ものの見方を少し変えてみましょう。 なぜなら、この面積はすべての瞬間に発生した故障の総計を意味しているし、無限の時間が経った後には全数Aが故障し尽くしているからです。 28 であることは明かです。 この分布の形は指数分布と呼ばれ、分布のグラフでは縦軸が確率密度関数を表す。 29 で表される。 さて、信頼度は先に述べたように故障しない確率であり、 でしたから、式 2. 30 という筋書きになります。 さらに、もう一つの筋道をたどってみましょう。 問題は、製品が故障率一定の期間にあるかどうか、バスタブのそこにあるかどうかを見破る方法であります。 初期故障や摩耗故障の期間にありながら、この章の理屈をふりまわしてもピントはずれもいいところだからです。 これについては後にゆずる予定になっている。 7 3. 直列と並列の信頼性 直列システムのきびしさ 直列 AND 図4. 1のように3つの部品が直列に連なったシステムがあると思っていただきます。 これらの部品が水道のバルブなら1つでも詰まってしまうと水が流れません。 また、一つ一つがスイッチであれば一つでも故障すると電流は流れません。 このような部品の連なり方を直列といいます。 人によってはANDになっているという。 1つめの部品and2つめの部品and3つめの部品が健全なときだけシステムとして健全だからです。 1 直列システム このように、システムはたいてい多くのアイテムから成り立っているが、1つのアイテムが故障するとシステムとして機能しなくなる場合、信頼性工学では、アイテムは直列であるという。 さて、図4. 1のように記入してあるように、それぞれの部品の信頼度、すなわち、規定の時間を通じて故障せずに機能する確率をr1,r2,r3としましょう。 1 となります。 [例 直列システムの信頼度の計算] 具体例を一つ計算してみよう。 1つめの部品のMTBFが1000時間、2つめのそれは2000時間、3つめは2500時間であるとき、システムが100時間は正常に機能するように規定されていたとすれば、このシステムの信頼度はいくらでしょうか。 並列システムの冗長性 並列 OR 冗長性(redundancy) 冗長性の効きめ 冗長度 常用冗長 待機冗長 直列・並列などが混ざったシステム 5。 保全とアベイラビリティ 信頼性を補うために フェールセーフ(fail safe) MTTR(mean time to repair) 保全 保全性 保全度 平均修復期間(MTTR) 修復率 アベイラビリティ(availability) 固有アベイラビリティ 修理系 アベイラビリティは広義の信頼性 CMとPM 事後保全(corrective maintenance) 予防保全(preventive maintenance) 保全の分類 時間計画保全と状態監視保全 定期保全と経時保全 緊急保全と通常事後保全 6。 信頼性を評価する デザイン・レビュー(design review) FTA(fault tree analysis) オア・ゲート アンド・ゲート FMEA(failure mode and effects analysis) FMECA(failure mode effects and criticality analysis) メモ 自転車、自動車の故障と保守.

次の

数学的な見方・考え方で不確定事象を大数の法則を応用して推測し保険を設計する | Note&Board

大量 の データ の 中 から 傾向 や 規則 性 を 見いだす 方法

心理学研究における実験的方法の意義と限界(2) 心理学研究における実験的方法の意義と限界(2) 長谷川芳典 岡山大学文学部紀要, 1998, 30, 87-102. 1999年5月25日掲載 1. はじめに 本稿は、前編(長谷川, 1998)の続編として、最近の実験論文を具体的な内容まで立ち入ってとりあげ、この側面から心理学研究における実験的方法の意義と限界について考察することを目的とする。 前編(長谷川, 1998)では、実験操作の段階から結論を導く段階に至るまでのさまざまな点で、心理学の実験が物理や化学や生物などの実験と本質的に異なっていることを、次のような面から指摘した。 本稿では、日本心理学会発行の『心理学研究』の最新巻(第68巻)に掲載された原著実験論文を対象として、これらの問題点の有無を検討する。 念のためおことわりしておくが、本稿は原著論文の評論ではない。 各論文は、あくまで、実験的方法の意義と限界を考察するための「データ」として扱われている。 各論文が、それぞれの分野でどのような貢献をもたらしているかとか、どのようなオリジナリティがあるかといったことは一切考慮していない。 また、それぞれの箇所で引用する論文は、本稿の論点をより明確にするための一例として選択されたものである。 引用されていない論文は同種の問題を含まないものであるとか、引用した論文が最も重大な問題を含むものであるということは決して意味していない点にも御留意いただきたい。 対象論文の概要 さて、今回は、1997年から1998年にかけて日本心理学会より刊行された『心理学研究』誌68巻を対象とする。 全6号からなるこの学術誌には、32編の原著論文があり、このうち実験的方法を用いたものは22編であった。 その一覧を表1に示す。 観察研究、調査研究の原著論文については、著者名のみ記した。 対象論文の著者名、タイトル、被験者(体)、及び用いられた主たる統計解析法一覧. *印の論文は、観察研究・調査研究を示す。 著者名 タイトル 被験者(体) 主な統計解析法 68巻1号 水野りか 漢字表記後の音韻処理. 自動化仮説の検証.. 55歳の失語症患者1名と健常な成人6名. 分散分析 筒井美加 自己関連語における気分一致効果. 大学生および大学院生 因子分析 68巻2号 南学 判断者のとる役割が確率判断に与える影響 文系女子短大生/国立大の文系学生 対数線形モデル分析、飽和モデル 関口理久子 ラットの空間探索行動に及ぼすNMDAアンタゴニスト, MK-801の効果 ラット 分散分析 大野和男 * * * 岩木信喜・ 今塩屋隼男 事象関連電位による認知的葛藤の情報処理過程に関す る研究 健常成人、右利き 分散分析 塚本伸一 子どもの自己感情とその自己統制の認知に関する発達的研究. 被験者(体)及び、用いられた主たる統計解析法 22編の実験論文がどのような被験者(体)を対象としていたのだろうか。 表1からその内訳をさぐると、大学生、大学院生、短大生、高専生など学生を主体としたものが11編、その他が成人が4編、子供を対象としたものが1編、複数の年齢層を対象としたものが2編、ラットやハトなどの動物を被験体としたものが4編となっていた。 被験者選びは、上記1. 主として用いた統計解析方法については、同じく表1を見ると、22編中12編で分散分析が用いられ、過半数を占めている。 但し、統計解析法の内容を云々することは本稿の目的から外れるので差し控えることとしたい。 現実場面との隔たり 前編(長谷川, 1998)で指摘したように、心理学の実験では、実験がきわめて人工的な状況や課題で行われ、扱う要因と反応が極度に単純化されている場合がある。 いっぱんに、そのような実験は「基礎心理学」的な実験と言われる。 物理学であれ生理学であれ、ほんらい「基礎」というものは何らかの形でその成果が現実に還元される可能性を秘めたものであるはずだ。 ところが、あまりにも特殊な実験状況のみで理論を組み立てていると、実験室という閉じた空間の中でしか通用しないモデルの改廃に終始し、その空間内の思考ゲームとしての価値しか見出せないような研究に終わってしまう恐れがある。 本稿では、特に次の2点に注目して、実際の諸論文の具体的な内容に検討を加えていくことにしたい。 ・実験操作があまりにも人工化・単純化されることによる隔たり ・被験者(体)に固有の行動特性が反映することによる隔たり 4. 実験操作があまりにも人工化・単純化されることによる隔たり まず、篠塚氏の「愛他主義は内集団の枠を超えられるか?... 」というタイトルの論文(篠塚, 1997)を引用しながら、この問題を考えていきたい。 この論文は、本文の冒頭に 世界各地における民族紛争の頻発が示すように, 東西冷戦終結後の国際社会では, 民族紛争の解決と予防が最重要課題のひとつである. 紛争の解決には, 対立する集団が自集団(民族)の利害にのみこだわることをやめ, 集団の枠を超えた視点を持って, 共存の可能性を理解することが必要である. なぜ, それが困難なのか. 【以下省略】 と記されていることから分かるように、現実の社会的問題に目的意識をもった研究である。 我々が素朴に考えると、愛他主義的な人が増えれば、自分ばかりでなく国全体のことや世界平和のこともちゃんと考えるので、戦争は起こりにくくなると予想される。 ところが、実際には、世界各地では米ソ冷戦時代以上に民族紛争が頻発している。 では、愛他主義的な教育をすれば、民族紛争の抑止につながるのだろうか。 上記論文は、この素朴な考えには否定的であった。 一口で言えば愛他主義は集団の枠を超えないということ、つまり、自・他の利益を同時に考慮するとか言っても、考慮されるのは集団の内部の他者どまりで、集団の外には向かないというのが上記論文の主張内容の1つとなっている。 しかしながら、実際にはどういう実験的検討が行われたのだろうか。 実はその内容は、大学1年の心理学受講生を対象とし、実験者から与えられた100円を資金として、社会的ジレンマ状況 SD と、ダブル・ジレンマ状況 DD の2条件を被験者内比較するものであった。 そこでは各被験者は、その実験期間だけ4人集団を形成する。 メンバーは、独立して、0〜100円までの10円刻みの額を決定。 ここからグループ全体の提供額合計Gが算出される。 SD条件では、基準額Kと、DD条件では相手グループの提供額G'とが比較され、GがKまたはG'よち大きい場合はボーナス300円が、GがKまたはG'と等しいときは150円、GがKまたはG'より小さい時はボーナス無し、というような設定になっていた。 その一方で、各状況ごとに提供額を決定した直後に、仲間意識、自・他集団区別意識等、計22の項目について質問、さらに、両状況終了後に、集団規範意識や自集団優先意識などに関する質問紙調査を実施。 実験の2日後から1週間以内に再来した被験者に、自己利益尺度、他者利益尺度を含む社会的動機を測定し、その内容から愛他的な行動が集団の外にまで及ぶかどうかを検討したものである。 民族紛争までを念頭に置いた意気込みには敬意を表するものであるが、実際に行われたのは、実験室内で、100円というごくわずかな資金を出資するだけの反応を求めるものであり、「集団」というのも、心理学受講生をランダムに分割してその実験のためだけに殆ど瞬間的に組織したグループにすぎない。 それゆえ、そこでどのように巧妙に実験操作が行われようとも、いかにクリアな結果が得られようとも、果たして、文化・風土を土台に何世代にもわたって形成された民族の問題のシミュレーションになりうるかどうかは疑わしい。 この実験ではまた、「愛他主義」的傾向とか、協力行動というものがきわめて普遍的・固定的なものであることを前提としているが、果たして、複数かつ目的の異なるさまざまな集団に属する一個人が、集団の違いや状況の違い、また協力行動の質的・量的な違いを乗り越えて、常に同じ傾向を示すとはにわかには信じがたい。 次に、久保田氏の「社会的カテゴリー化により導入された少数派, 多数派および第三者の集団差別行動と認知」(久保田, 1997)をとりあげよう。 この論文も冒頭に「集団間の差別や偏見の問題は, 古くから社会心理学が関心を寄せてきた問題領域の1つである. 」と記されていることから分かるように、差別やいじめなどの現実的な諸問題との関連を示唆する書き出しとなっている。 これらの結果から、例えば、「少数派は、内集団をひいきし、外集団を差別するだろう」といった仮説を検討する内容となっている(実験2は、実験1の終了後に同一の被験者に行われたもの)。 この実験の場合にも、果たして集団成員性を告知する程度の情報で、民族間、あるいは同一民族内における階層間の差別や偏見のシミュレーションが可能であるか、現実を類推するだけの資料しか得られないのではないか、といった疑問が出てくる。 もうひとつ、南氏の「判断者のとる役割が確率判断に与える影響」(南, 1997 という論文に言及させていただこう。 この研究は、確率判断の実験としてよく知られている以下の「タクシー問題」から出発したものである。 これは、 ある町では、緑のタクシーが85%、青のタクシーが15%走っている。 ある夜この町でタクシーによる引き逃げ事件が起きた。 ところが、この目撃者の証言がどのくらい正確かを検査したところ、事故当時と同じような状況下では80%の確率で正しく色を見分けるが、20%の確率で間違えてもう一方の色を答えてしまうことが分かった。 さて、この目撃者のいう通り、本当に青のタクシーが犯人になる確率は大体いくらだろうか というかたちで、被験者に確率の大きさを数値で答えさせる問題であるが、この材料自体、かなり人工性の強い内容を含んでいる。 たとえば、この問題中には「事故当時と同じような状況」という表現があるが、目撃者自身のコンディションを含めて全く同じような状況を再現することは殆ど不可能であろう。 また、「色の弁別ができないほど暗い場所が町中であるだろうか」、「色が分からない状態でタクシーであることはどうして分かるのか」、「タクシーが本当にひき逃げをするだろうか」など、不自然な状況設定も目につく。 さらに、「20%の確率で間違える」というのは、数学的には、「青を緑」、「緑を青」と間違える頻度を、タクシー目撃総数で割った比率を示すものと考えられるが、単に、青のタクシーを緑と間違える確率であると受け取られる恐れもある。 加えて、「青を緑」、「緑を青」と間違える確率は、色覚の特性上同じとは思えないが、これらをいっしょくたにして20%と表現することが、実生活に確率を適用するにあたって、どの程度有用であるか不明である。 南論文はまた、責任性を強調した裁判官群と中立性を強調した裁判官群を設けて、回答される確率の大きさの数値を比較検討している。 ここでの実験操作は、単に教示に頼るものであり、責任性強調群(「判決によって被告の人生が左右される」)では「あなたは以下に出てくる事件を担当した裁判官であると想像してください」、中立性強調群(「裁判には影響はなく、勘を鍛える」)では「あなたの意見がこの裁判に影響を与えることは許されませんが、裁判官としての勘を鍛えるには格好の事件です」という内容の文章を判断を求める前に呈示するだけなのであるが、役割教示文を読ませるだけで、回答者は本当にその役割に成りきって回答するのかという疑問が出てくる。 これらの教示が回答内容に影響を及ぼすことが真であったとしても、役割教示文のちょっとした文面の違いで、その程度が有意差が出るほどに顕著になる場合も、他の諸要因の中に埋もれる場合もあるだろう。 もうひとつ、現実の裁判では、確率の大きさ程度のあやふやな推量によって判決が下されることはない。 裁判官の本来の役割は、真実の追求ではなく、疑わしさをもった被告について、無罪であるとの仮説を覆すのに足る確実な証拠があるかどうかを判断することにあるからだ。 裁判官は冤罪は厳しく咎められるが、真実としては犯罪を犯していた被告を証拠不十分で無罪としても咎められることはない。 これらの点でも、現実とかけ離れた実験操作が行われいる点は否定できない。 以上指摘した点は、現実場面から乖離した実験場面の設定をしてはいけないという主張するものでは決してない。 「もし自由に空を飛べたら」とか「もしあなたが神様になったら」という非現実的な仮定のもとで回答を求めることにもそれなりの意義はあるだろう。 但し、言語教示による操作は、常に言外の諸要因をも同時に動かしてしまう危険を伴うものだ。 教示内容が非現実的であればあるほど、言外の諸要因も経験的に予見することは難しくなる恐れがある。 それゆえ、事後的に回答理由を分析して言語的教示が妥当な実験操作を含むことを確認したとしても、実験場面で生じた変化が、実験者が計画した要因操作を原因として生じたものであるのか、それとも想定外の諸要因の1つによって生じた変化であるのか、直ちに判別することはできないことに留意する必要がある(5. を参照されたい)。 被験者(体)に固有の行動特性が反映することによる隔たり このタイプの隔たりは、被験者(体)として、人間一般の行動を問題としながら実験では学生のみを対象とした場合、あるいは動物を被験体として用いた場合に顕著に現れると思われる。 に指摘したように、成人を被験者とした実験は大部分が学生であり、それも一般教育科目の「心理学」の受講生や、心理学教室所属の学生が対象となっている。 感覚などの基礎的な生理機構を研究する場合には被験者の職業や現在の生活環境が影響を及ぼすことは少ないと思われるが、社会的行動(たとえば援助行動)とか、一定の知識によって左右される場合(確率判断など)には、それなりの注意が必要であろう。 ここではまず人間を対象とした実験として、谷上・阿部両氏の研究(谷上・阿部, 1997)に言及させていただこう。 この研究は、失語症患者と健常者の漢字想起の自己評価をテーマにしたものであるが、失語症の被験者は、脳梗塞による失語症発症後1年を経過した55歳の高校卒の男性1名のみであり、この男性の想起可能性の評定値や想起成績の結果を、22〜26歳の短大卒業の健常者男女6名と比較検討したものであった。 そこでは、分散分析が行われ、1名の失語症患者と6名の健常者に対して評定課題などを実施し、その平均値について分散分析を実施、各種の評定値や正答数などについて、被験者間で有意差が見られた云々の議論を行っている。 しかし、刺激材料に対する評定値の独立性もさることながら、もともと失語症者も健常者も無作為抽出された者ではなく、失語症者の特徴はもちろん、健常者間の個体差などは、被験者の選び方によってどのようにも変わりうるものである。 失語症患者の評定と健常者の評定がそれほど大きく異ならないという消極的根拠にはなりうるとしても、このような比較で、失語症患者の一般性のある特徴をどこまで引き出せるのか疑問である。 次に、上に引用した南 1997 の実験をもういちど取り上げよう。 この研究の実験1では、文系短期大学の心理学の受講者集団が対象、実験2では国立大学生に対して個別に実験を実施しているが、同じ役割教示文を使用した場合でも、やる気のない学生が多数含まれている可能性のある心理学の授業中で回答を求めた場合と、自分の教室の大学院生を対象に個別的に実験した場合では、受け止め方は違ってくるはずである。 実験1では..... の説明に基づくならば, 両裁判官は同一の役割表象であるので, 両裁判官群の回答は異ならないと予想される. とあるが、受講生が煩わしさを感じながら役割教示文をいい加減に読んだとしても回答は異ならないはずだ。 回答理由を分析することでその危惧は薄れるとしても、講義時間中に何らかの実験や調査を行う場合には、受講生に教示に従った回答行動態度をさせるための再現可能性な何らかの方策を明示しておく必要があるだろう。 次に、被験体として動物を用いることについて。 動物を被験体とした実験は、パヴロフの条件反射の実験や、スキナーらによる強化スケジュールを用いた実験など、過去において現実に結びつく貴重な業績の蓄積がある。 また、人間の脳機能が進化のプロセスで高度化していったことを考慮するならば、ラットやハトやサルの脳機能の分析で得られる知見が人間の種々の認知機能の解明に大きく貢献することも間違いなかろう。 とはいえ、いくら厳密に統制され筋道のたった論理が展開されていたとしても、人間とは無関係で、実験装置内部の動物の行動だけに通用する思考ゲームに終わってしまうようなことがあってはならない。 ここでは、ランウェイ・テストを用いて、離乳後の未成体期ラットの情動反応性の発達が記録された。 この研究は、ウィスター系ラットを対象としたものであるが、影響を及ぼすと考えられる離乳などの諸要因、あるいはその後の餌を求める行動は、いずれもラットという種の枠内で意味をもつものである。 それゆえ、用語として「情動」という言葉を用いていたとしても、人間の発達過程における情動反応性の変化の研究には結びつきにくい。 同じ情動研究でも、情動に影響を及ぼすと考えられる新薬の薬理作用を検討するならば発展の可能性は期待できるが、離乳期の行動変化についての資料を細かく収集することが人間行動の発達理解に役立つかどうかは不明である。 もうひとつ、谷内氏の「ラットにおける強化系列の習得と消去に及ぼす項目配列の効果」(谷内, 1997)は、ラットを被験体として単一交代系列の習得における遠隔連合の形成とその消去への関与を明らかにすることを目的としている。 そこでは、実験1では遠隔連合の形成と消去への関与を検討し、実験2において、遠隔連合を仮定した記憶弁別理論と法則弁別仮説が比較されている。 この研究については、次節で改めて取り上げさせていただくが、被験体固有の特徴という点に限って言えば、「法則構造の符号化」とか「遠隔連合の形成」の関与の量的な度合いが、ラットと人間で同一であるのかどうか、言いかえれば、ラット固有の系列学習の特徴を分析しているにすぎないという可能性がある。 なお、心理学における動物実験の役割については、佐藤 1993 が次のように指摘している点にも注目したい。 種を越えて普遍的な行動の基本的諸原理の探求の段階はすでに終ったというはっきりとした自覚はかならずしももたなかったにせよ、多くの行動分析家が究極的にはもっとも興味を抱いている種であるヒトを対象とする研究へと歩を進めたように思われる。..... 217] 5. 実験操作上の問題 本稿では実験研究のもう1つの問題として、実験操作の固有性と、変数外の多数の要因の関与の問題をとりあげることにしたい。 1 実験操作固有の特性 実験研究では、いっぱんに、研究対象とする実験変数の効果をみるためにその値をいろいろに変えて影響の大きさの違いを調べることが多い。 しかし、変数を操作する過程では、別の諸要因が同時に関与したり、操作内容の固有性が大きく影響する場合がありうる。 そのような場合は、結果に違いが出たからといって、その原因を操作した変数に帰着することはできない。 柿井氏の「双方向型TVを用いたマルチメディア・カウンセリングの基礎的研究」(柿井, 1997)を例にこの問題を考えてみよう。 この実験では、音声方式、双方向TV方式、対面方式という3条件のカウンセリングを被験者1名あたり4分ずつ合計12分実施し、コミュニケーション評価得点を比較している。 4分間程度の接触で果たしてカウンセリングが実現できるのかといった疑問は別として、そこで生じた評価得点の差が、果たして、一般的な双方向TV方式のカウンセリングの特性を捉えているかどうか、はなはだ疑問が多い。 例えば、このTV条件では14型のTVモニターが用いられているが、筆者自身が記しているように、もっと大きな画面のモニターを使えば結果が変わった可能性がある。 さらに、この実験では経験30年以上の女性のベテランカウンセラー1人が実験に加わったと記されているが、このカウンセラーがどういう流派のカウンセリングを行ったのか、たとえば、話を聞くことを重視する立場なのか、クライエントが望ましい発言をした時に微笑むとか相づちをうつといった動作をするのかどうか、などによって、いくらでも結果に違いを及ぼす恐れがある。 塚本氏の「子どもの自己感情とその自己統制の認知に関する発達的研究」(塚本, 1997)にも同様の問題が含まれている。 ここでは、「... ボール遊びをしているときに石につまづいて転んでしまい、足から血が出て痛い」とか「おじさんからプレゼントをもらい、... 」といった例話が実験操作として重要な意味をもっているが、そこで示された「表出を統制すべき感情とその場面に関する知識」、「自己統制の理由」、「自己統制の可能性の認知」、「自己統制の方略」についての5歳から9歳に至るまでの変化において、例話に含まれる固有の特性がどのような影響を及ぼしたのかは特定できない。 実験変数以外の多数の要因の同時関与 実験研究ではまた、あらかじめ複数の仮説を提起した上で、特定の実験操作の結果がどの仮説の予測によく一致するかという形で検討を行っているものが多い。 この場合、実験結果が、種々の実験状況の違いを越えて一般的に特定仮説の予測を支持しているのか、それともその状況に限って特定仮説を支持しているのかを見極める必要がある。 心理学実験から離れて、ある目的地に到達するためのルートがAとBの2つあり、その選択比率を検討する場合を考えてみよう。 Aは舗装されているが道のりが長い。 Bは近道だが舗装されていない。 この実験は、天候という別の要因によって異なった結果をもたらすので、2つの仮説いずれが正しいのかという検証実験にはなりえない。 正しい結論は、「仮説Aが成り立つ場合もあるし、仮説Bが成り立つ場合もある」、あるいは「仮説は2つとも妥当であるが、その関与の度合いは状況によって異なる」ということになるだろう。 心理学に戻って、谷内氏のラットの実験(谷内, 1997)を例にこの問題を考えてみよう。 にも述べたように谷内氏の実験(谷内, 1997)は、ラットを被験体として単一交代系列の習得における遠隔連合の形成とその消去への関与を明らかにすることを目的としている。 実験1では遠隔連合の形成と消去への関与を検討し、実験2において、遠隔連合を仮定した記憶弁別理論と法則弁別仮説のどちらが系列学習の習得や消去に見られる条件差をよりよく説明するかという問題の立て方をしている。 しかし、この2つの仮説は排他的なものではない。 筆者自身が全体的考察の最後の段落でも認めているように、両仮説とも真であって加算的にはたらく可能性もある。 逆に、いずれも偽であるという可能性もあるだろう。 例えば、いくら系列に規則性があるといっても、あまりにも系列が長すぎたり、計算式を必要とするような複雑な系列であった場合には、法則弁別などできるわけがない。 こういう場面では、記憶弁別仮説が提唱するプロセス、もしくは第3のプロセスが大きく関与する可能性もある。 要するに、「2つの仮説のどちらが正しいか」という現象ではなく、「ある場合には仮説Aが、別の場合には仮説Bが成り立つ」というだけのことかもしれない。 藤井氏の「語彙検索における自己接触行動の役割」(藤井, 1997)の研究では、視線の動きの影響が統制されていなかった。 こうした把握できない干渉要因がある問題については、当該論文の「今後の課題」に反省点として記されているので、ここでは重複は避けたい。 もう1つ、水野氏による「漢字表記語の音韻処理自動化仮説の検証」(水野, 1997)という研究を例に、実験操作に別の要因が絡んでいる可能性を考えてみたい。 この研究は、日本語では漢字表記語の場合だけ音韻処理が介在しない、あるいは優位性が低いとする従来の説の不自然さ不合理さを指摘し、漢字の場合でも音韻処理が介在するが、それは自動化(特定の処理を無意識かつ迅速に行えるようになること)されているとする統一モデルを提唱、その実験的検証をめざしたものである。 しかし、この実験では、「同時構音課題」が音韻処理以外の認知行動を妨害している可能性を否定しきれていない。 例えば単に「他のことに気をとられる」ような効果、つまり異なる作業を同時に遂行することによる競合的な妨害効果があるかもしれない。 音韻処理妨害の効果と同時にそれらが働いていたとしても、仮名表記語を刺激とした実験1の結果は同じような結果になるはずである。 とすると、漢字表記語の穴埋め課題において「同時構音課題」が妨害効果をもたらしたからといって、それが音韻処理を妨害したのか、それとも、音韻処理と無関係でありかつ課題遂行に必要な別の行動要素を妨害したのかは、この実験からは確認することができない。 じっさい、実験2では、統制条件や音韻処理と無関係の妨害操作(タッピング)を加えた条件において、拍数の長さに依存した反応時間の遅れは検出されなかった。 したがって、実験2の結果だけからは、漢字表記語を用いた穴埋め課題において、音韻処理が介在しているとの実証はできないのである。 なお、著者が考察で述べているように、水野 1997 の実験には、ほんらい漢字表記語と仮名表記語の頻度や文字数、形態的複雑さ、形態的具象性、表記の親近性などを一致させて初めて成り立つ前提が含まれている。 しかし、これらを統制することは実質的に不可能であり、 5. 1に述べた「操作固有の特性」の問題がクリアされていない点にも留意する必要がある。 全体的考察 以上、本稿でとりあげた種々の実験論文の具体的内容をみる限りにおいては、研究の成果は必ずしも現実の人間行動の理解に発展する方向に向かっていないように思われる。 また、実験のロジックとして複数の仮説を比較検討する論理の立て方になっていながら、結局は、特定の実験状況に固有の結果しか導けずに終わっている論文のあることも示唆された。 では、それぞれの論文は、以上にかかげたような問題点についてどのような総括をしているのだろうか。 以下に、全実験論文の中から、結論の一般性や、実験操作に含まれない種々の要因の影響について総括していると考えられる記述を抜き書きしてみよう。 これらの結果は、........... 支持的証拠を得ることができた。................ こうした実験的限界を超えるためには、ある程度の実験的証拠に基づいて構成したモデルの妥当性を、まったく別の視点から検討することも必要となる.... 水野, 1997 今後は、テレビ方式と対面方式の比較という視点ではなく、テレビ方式の特質(遠隔地性、マルチメディア性)を積極的に生かした活用方法の研究がより重要になってくると考えられる。 柿井, 1997 本結果が手続き上あるいは刺激材料上の固有性に由来したものであるという可能性を棄却することはできない。 よって、本研究で得られた知見が他の課題に対しても拡張しうるのかどうかについては、今後も検討を続けていく必要があると思われる。 (南, 1997)。 しかし本研究の結果は、3種の感情と2種の例話という極めて限られた条件に関するものであり、また被験者数も十分とはいえないことから、これらを広く一般化できるかは否かに関しては、さらに慎重な検討が必要であろう。 (塚本, 1997) 今後、遠隔連合を含めた項目連合過程と法則符号化過程の性質を明らかにするとともに、各過程間の関係についても検討する必要がある。 (谷内, 1997)。 もちろん本研究では実験的方法を用いたため、この結果が日常の祖母-母親関係を必ずしも反映しているとは限らない。 しかし、本研究は、実験場面というある程度統一された状況を設定して日常の家庭ごとの差異を除くことによって、一般的な傾向を見いだすことを目的とするものであった。 本研究の結果がどのように日常場面に反映されるのかは、観察などによる研究によって明らかにされねばならない。 (興津・浜, 1997)。 実験室研究では、快感情を喚起することが難しいことが挙げられる。 そのため、実験室的研究で生態学的妥当性を考慮した研究では、感情喚起が容易な暴力シーンや事故場面などの不快な刺激が用いられてきた。 しかし、実験操作の便宜以上という理由で不快感情のみに焦点を当てるのは不適当であり、ある程度の実験的制御を行いつつ、快感情から不快感情までの幅広い感情を喚起するような課題を考案し、今後、..... 記憶に与える影響について検討する必要があろう。 (神谷, 1997)。 従来、CA効果研究では、特定のターゲット記述文が繰り返し用いられる傾向にあったが、そこで得られた結果が一般性をもつものかどうかは、今後さまざまな刺激を用いて検討していく必要があるだろう。 (森・坂元, 1997)。 このように、22編中7編は、何らかの形で結論一般化の問題点や、実験的方法以外の研究を進めることの必要性に言及していた。 ただし、一般化への具体的な道筋は示さず、「 一般化のために、今後さらに慎重に検討をすすめる必要がある」程度の記述に終わっているものも多い。 またこれ以外の論文の中には、この種の総括を全く行っていないものもある。 個々の実験研究が直ちに一般性のある結論を導く必要は無いし、応用性を意識する必要はない。 ただ、基礎的研究と応用研究、あるいは実験研究と現実の観察研究という分類は研究する側の都合から分けられたものであって、人間行動自体には、基礎的な行動とか応用的な行動といった区分は一切ないことに目を向けなければならない。 実験室空間という人工的な環境の中だけで成り立つようなモデル、そのモデルの改訂だけをめざした研究、尽きることの無い刺激の組み合わせを変えただけの実験研究は、方法がいかに厳密であったとしても、仮説から結論に至る論理の筋道がいかにしっかりしたものであったとしても、それだけでは心理学の研究としては不十分である。 実験室内での実験をいかにして現実の人間行動の理解につなげる方向で発展させるのか、ということは常に考えなければならない。 なお、今回は、日本心理学会発行の『心理学研究』を検討対象としたが、海外の一流学術誌や、各種概論書などで紹介されることの多い古典的な実験研究についても、同一の検討を加えていく必要がある(長谷川, 1994参照)。 より建設的な方向をめざして 最後に、今回指摘した問題点をもとに、実験研究の今後についてより建設的な方向を提唱することにしたい。 まず、以上に引用した実験研究のうちのいくつかについて具体的な方向を示してみる。 柿井 1997 :音声方式や対面方式との比較研究には限界がある。 筆者自身も考察で述べられているように、テレビ方式の特質(遠隔地性、マルチメディア性)を積極的に生かした活用方法の研究にエネルギーを注ぐべきである。 特定の流派のカウンセラーの利用可能性を探るのではなく、テレビ方式に最も適したカウンセリング技法の確立、その活用範囲の特定をめざすことが重要。 篠塚 1997 :愛他行動は、愛他的傾向の強さを原因として生じるのはなく、該当する場面において、その行動がどれだけ強化されるかによって決まるものと考えられる。 愛他的行動は、あらゆる状況を越えて生じるのではなく、それが強化されるか否かによって、対象や場面に依存して生じたり生じなかったりするはずである。 実験室内で「普遍的な愛他行動」のシミュレーションを行うより、現実の具体的場面で、個々の愛他的行動がどのように強化されているのか、集団を越えた愛他的行動はどのような形で強化可能かといって検討を行うほうが生産的であろう。 南 1997 :紙に記された問題に対して被験者が数字で確率の大きさを答えるという実験は、問題そのものの不自然さ、問題文への理解度、回答するという行動に対する動機づけなど、種々の点で副次的な影響を受ける恐れをかかえている。 もともと、確率判断は、選択行動の1つの手がかりとして身につけられてきたものであるから、紙の上での回答に頼るのではなく、現実の選択行動の場面での偏りとして捉えていったほうが生産性のある研究が期待できる。 「〜になってみてください」という役割教示に実験操作を委ねるのではなく、その役割を演じるほど強化されるような随伴性が設定された場面で確率判断を求めることも必要だろう。 谷上・阿部 1997 :もともと母集団が不確定であることを考慮し、健常者との群(?)間比較ではなく、失語症患者自身についてさまざまな回復訓練を行い、単一被験体法に基づいて、その特性を明らかにすべきであろう。 水野 1997 :筆者自身も「こうした実験的限界を超えるためには、ある程度の実験的証拠に基づいて構成したモデルの妥当性を、全く別の視点から検討することも必要となる」と認めていることから、今後は各種の難読症や失読症の患者に対して、音韻処理をスムーズに行うためにどういう訓練を行ったらよいのか、あるいは音韻処理を介さずに意味処理を可能にするようなステップは無いものか、といった、改善を目的とした個別的検討を積み重ねていくことのほうがより生産的な結論を生み出せるように思われる。 ある種の音韻処理訓練によって漢字表記語に対する難読症が改善されたとすれば、それは結果的に音韻処理の介在を実証したことになるはずであろう。 これらに示したように、今後の実験研究では、人工的な実験状況の中で抽象化・一般化されたモデルの改廃を行う研究よりも、より現実に即した場面で、対象とする行動への働きかけの過程を追っていく研究のほうが、はるかに生産的ではないだろうか。 つまり、ある仮説を「実証」するために特定の行動を手段として利用するのではなく、現実場面で意味のある行動自体をターゲットとして、それに関与する諸要因を実験的に分析するという方向性である。 「援助行動」を例にとるならば、実験室内でサクラの演技に対する援助行動を分析して抽象理論を構築するよりも、神戸の大震災とか高齢者の介護といった現実場面で生じる具体的な援助行動について、それを維持・強化する要因をさぐっていくというものである。 震災時の援助行動と高齢者介護場面での援助行動から一般的な法則性が見出されるかどうかは分からない。 見出されるか見出されないかというのは結果論であって、そのことで研究の価値が失われるわけではない。 次に、実験研究を推進するにあたっては、ただ新しさを求めるばかりでなく、10年前、20年前、.... 50年前というように過去に行われた実験研究の成果がその後どう発展したのか、あるいは発展せずに廃れていったのかということを、分野を超えた方法論の立場から追究する取り組みが必要であろう。 実験研究は、その性質上、常に過渡的な研究成果として公表されるものであり、その多くは、考察「今後さらに慎重に検討をすすめる必要がある」というような形で結んでいる。 その時点での個人の業績の1つとしてはそこまでで評価されてよいとしても、研究全体の流れの中では、「今後の検討」なるものが実際にどのように行われたのか、それとも行き詰まって方向転換していったのか、単なる流行現象で終わってしまったのか、過去の研究を洗いざらい調べ、その総括にたって実験的方法の意義と限界を検討していく必要がある。 最後に、実験研究の結論は特定の閉じた分野に収束することなく、よりグローバルな方向に向かって開かれていくものでなくてはならない。 このことに関連して佐藤 1993 は、行動分析学における動物実験の役割を総括する中で、 強化随伴性という概念的枠組みを用いて人間行動についての実験的および理論的に分析の範囲を従来よりさらに広げ、発達心理学、知能心理学、性格心理学、異常心理学、社会心理学といった心理学の諸分野のみならず、文化人類学、社会学、政治学、法学、経済学、教育学、言語学、歴史学などを広義の行動諸科学の領域すべてを射程に入れて、行動分析学的な人間行動学の体系を確立する という方向性を提唱している。 この主張は、行動分析学だけにあてはまるものではない。 どのような枠組みを用いるにせよ、今後の心理学の研究では、このようなより広範囲の分野を総合的に射程に入れた研究が強く求められる。 近年、博士の学位取得要件や大学院博士課程への進学要件、さらには研究費の獲得や教官採用人事などにおいて、研究業績の量的評価を重んじる傾向が強まっている。 こうした風潮の中では、ともすれば、方法上の厳密さだけを追求し狭い領域のみに目を向けた実験論文が大量生産されてしまう恐れがある。 よりグローバルな視点にたった統合的研究をいかに育てていくのかということにももっと目を向ける必要がある。 本稿作成前にインターネット上で公開した論文別のリビューについて、執筆者のお一人である南学氏と谷上亜紀氏からご意見をいただき、その一部を本稿の修正に反映させた。 深く感謝いたします。 引用文献 藤井美保子 1997. 語彙検索における自己接触行動の役割. 心理学研究, 68, 9-16. 長谷川芳典 1994. スキナー以後の行動分析学: 4 よく知られた心理学実験を再考する(その1). 岡山大学文学部紀要, 22, 21-38. 長谷川芳典 1998. 心理学研究における実験的方法の意義と限界 1. 岡山大学文学部紀要, 29, 61-72. 柿井俊昭 1997. 双方向TVを用いたマルチメディア・カウンセリングの基礎的研究. 心理学研究, 68,9-16. 神谷俊次 1997. エピソード場面刺激による感情喚起が記憶に及ぼす影響. 心理学研究,68, 290-297. 久保田健市 1997. 社会的カテゴリー化により導入された少数派, 多数派および第三者の集団差別行動と認知. 心理学研究,68,120-128. 南学 1997. 判断者のとる役割が確率判断に与える影響. 心理学研究,68, 79-87. 宮本邦雄 1997. 心理学研究, 68,339-345. 森津太子・坂元章 1997. 特性関連語の閾下・閾上呈示が対人知覚に及ぼす効果, 心理学研究,68, 371-378. 興津真理子・浜治世 1997. 母親による子供の賞罰に及ぼす父方祖母・母方祖母の影響. 心理学研究, 68,281-289. 佐藤方哉 1993. 行動分析学における動物実験の役割--<理論>の敗退と反復実験の勝利. 心理学評論, 36, 209-225. 篠塚寛美 1997. 心理学研究, 68, 163-172. 谷上亜紀・阿部純一 1997. , 心理学研究,68,17-24. 谷内通. 1997. ラットにおける強化系列の習得と消去に及ぼす項目配列の効果. 心理学研究, 68, 255-263. 塚本伸一 1997. 子どもの自己感情とその自己統制の認知に関する発達的研究. 心理学研究, 68, 111-119.

次の

統計学

大量 の データ の 中 から 傾向 や 規則 性 を 見いだす 方法

やさしい医学統計手法 はじめに 統計的データが得られたとき,私達はデータの集団としての性質を知るために,一定の手順にしたがって,統計量を計算したり(記述),データの分布の型を調べたり(解析),あるいはそのデータから全体を推定したり,検定したり(推測)します.これを統計的方法と云います. すなわち,統計をとると云うことはデータに関する記述・解析・推測がなされていなければなりません.数値を羅列しただけのものは,単なるデータの集合にすぎません. 統計をとる手順の第一歩は,データがどの様な型ちをしているか(分布型)を知ることから始めます.データがある集団から無作意にとられたものであれば,データの分布はその集団の分布を反映するはずです.したがって,データの分布が正規型(釣鐘状の美しい分布)であれば,その集団の分布も正規型とみなすことができますので,「パラメトリック統計法」を用います. もしデータの分布が非正規型(釣鐘状でない歪んだ分布)で,データ変換(釣鐘状の美しい分布に近づける)などの処理によっても正規型が得られないときは,その集団での正規型の仮定は,極めて困難となるので「ノンパラメトリック統計法」の適用を考えるべきです. またデータの種類によっても,あるいは標本の数とか,標本間の関連などによっても統計的手法が異なるので,それぞれに最適な手法を選択しなければなりません.統計的手法の適切な選択は,統計の結果にもとづく判断と行動を保証するものですので,統計的方法の数学的知識・技術以前の問題として大切です. そこで,本書では統計的手法の選択を正しく行うための基礎的な知識,考え方について述べると共に,収集したデータの性質に適した統計的手法の選択を容易にするために,フローダイヤグラムを巻末に綴じ込み,系統的に統計の手法を学習できるように配慮しました. しかし,医学と医学に関連した知識が皆無であり,データへの探求心がなければ,いかに優れた医学的データであっても,そのデータは情報としての価値を持たないでしょう. すなわち,数々の統計的手法が本書の中に用意されていても,その手法の選択は統計をとる目的に応じて決定すべきであり,唯一これだと云う統計的手法を提示したつもりはありません. 定性的データに1か0の数値を与えたものを数量化データと云う. また,データはその特性によって,連続量と離散量に分けられます.例えば,日本人男性の大多数の血圧は110〜180mmHgの範囲で,どのような値でもとるところから,血圧値は連続量と云えます. この血圧値を図1のように,ある範囲の間隔で区切って,その割合を数えたら,その度数は離散量と見なされます. 同様に,血圧値を図2のように分類し脳卒中発生の頻度を求めると,血圧値を質的な特性によって分類したことになり、分類変量と呼ばれます. 図1 離散量の形式 変量(血圧値) 度数 人数 90-109 mmHg 5 110-129 30 130-149 35 150-169 7 170-189 5 血圧を一定間隔で設定したとき 整数値でトビトビの度数を離散量と言う 図2 分類量の形式 変量(病名 度数 人数 拡張期血圧 28 収縮期血圧 17 境界域血圧 13 正常域血圧 3 血圧値を4群に分けた 整数値でトビトビの度数を分類量と言う これらをまとめると図3のようになります. 図3 データの分類• 血圧の分布は年齢・性別・地域・環境・人種・季節・時代・食習慣など多くの要因によって異なっており,1回限りの血圧測定で,その分布を正規型と結論することは出来ない.ここでは,私達の日常生活において血圧の測定がごく身近なものであることを考え例題としている.したがって,血圧の分布を正規型と結論づけている訳ではないので誤解なきよう留意されたい.• 2項分布とは,ある期間,一定の時間内に病院外来を訪れた患者の性別を調査したとき,男性の割合の度数は2項分布する.そして,その分布は実際に調査した外来患者のうちで男性の占める割合によって決まる.• ポアソン分布とは,ある期間一定の時間内に病院外来を訪れる患者数を調査したとき,単位時間当りの外来患者数の度数はポアソン分布する. 収集したデータは統計をとる目的に応じて,自由に分類しても良いのですが,通常は統計的特性によって分類します.定量的データであれば最初に度数分布を作ってみると良いでしょう.そして,データの分布を確認することが大切です. 1. A2 F21 F22 .. F2m F2. : .. .. .. .. .. An Fn1 Fn2 .. Fnm Fn. total F. 1 F. 2 .. F. ヒストグラムの作り方. 度数分布において,各級に属する個体の度数に比例するように矩形を描きます.離散量であっても,変量自体を級代表と考えヒストグラムとして表現することができます。 333 mmHg を「分散」と云います.また, 分散の平方根を標準偏差(s)と云い, s=SQRT(V)=10. 354〜142. 646 mmHgであること,そしてデータの68. 26%(この例では 6. 00 110-120 7 20. 00 120-130 8 40. 00 130-140 10 67. 50 140-150 5 80. 00 150-160 7 97. 50 160- 1 100. 075 mmHg , 標準偏差 s=14. 455 mmHg であり,119. 62〜148. 53 mmHg の範囲が縦線で囲まれた部分に相当します. そして,全データの 68. 26 %(27.

次の