smoothed Latent Dirichlet Allocation implemented with Python and inline C++ using Scipy.weave.
This code is for only learning LDA. Useless, and not for application.
このコードは学習用です。実用には使えません。
You need to download a corpus on UCI Machine Learning Repository. I experimented with the NIPS corpus.
UCI Machine Learning Repositoryから、コーパスのダウンロードが必要です。私は NIPS corpusを使いました。
On the terminal, type the following command after cloning the repository.
リポジトリをcloneした後、ターミナル上で、以下のコマンドを実行して下さい。
./lda.py
lda.py is the main code. It calls three C++ source files, *.embed.cpp, to be embedded.
lda.pyがメインとなるコードです。そこから、埋め込み用の3つの*.embed.cppという名前のC++のソースが呼び出されてます。
- Taro Tezuka, 2010, LDA (Latent Dirichlet Allocation)の更新式の導出
- id:n_shuyo, 2011, Latent Dirichlet Allocations の Python 実装