ytanaka

DBSCANクラスタリングアルゴリズム

2023/6/5    

 DBSCAN(Density-Based Spatial Clustering Applications with Noise)は、高い密度の領域内でのコアのサンプルを見つけます。そしてそれらからク ...

IrisデータセットによるPCA

2023/7/22    

アイリスデータセットに適用した主成分分析 データセットの詳しい情報はここを参照してください。 # Code source: Gaël Varoquaux # License: BSD 3 clause ...

カーネル密度推定

 カーネル密度推定は、カーネル関数K(u)を用いて未知の確率密関数を推定する過程です。ヒストグラムは、幾分恣意的な領域のデータポイントの数を計数しますが、カーネル密度推定は、全てのデータポイントのカー ...

外れ値検知のためのアノマリー検知アルゴリズムの比較

 この例は、2Dデータセットの異なるアノマリー検知アルゴリズムの性質を示します。データセットは多様な様式のデータを処理するためのアルゴリズムの能力を説明するために二つか三つのモード(高密度の領域)を含 ...

ロバスト共分散推定とマハラノビス距離の関連性

2023/6/10    ,

 この例はガウス分布データのマハラノビス距離での共分散の推定を示します。  ガウス分布データでは、分布のモードへの観測値xi の距離はマハラノビス距離を使って計算できます。  ここで、μとΣは、ガウス ...

マルコフ・スイッチング動的回帰モデル

 このノートブックはレジームの変化と動的回帰モデルを推定するために、statsmodelsのマルコフ・スイッチングモデルを使う例を提供します。それは、Stataのマルコフスイッチングの論文の例です。こ ...

マルコフ・スイッチング自己回帰モデル

 このノートブックは、KimとNelson(1999)に発表された結果の検証を、statsmodelのマルコフ・スィッチングモデルを使った例を提供します。Hamiltonフィルター(1989)、Kim ...

失業のトレンドとサイクル

 ここに、経済データのトレンドとサイクルを分離する三つの方法を考えます。私たちがもっている時系列データytを考えます。基本の考えは、それを二つの成分に分解することです。   yt = μt + ηt ...

動的因子と同時性指標

 因子モデルは一般的に小さな数値の観測できない”因子”を発見することを試みることです。それは、たくさんの観測変数の変化の相当な部分に影響します。そして、それらは主成分分析のような次元縮約技術に関係して ...

主成分分析

2023/7/22    

 このノートブックでは、私たちは、世界銀行からデータを入手して、192か国の出生率の時系列データを分析するために、主成分分析を使います。主なゴールは、国と国の間で異なる時間経過の出生率のトレンドがどれ ...