読者です 読者をやめる 読者になる 読者になる

naoya_t@hatenablog

いわゆるチラシノウラであります

Python

PRML復々習レーン#14(再)

http://connpass.com/event/3529/前回、ワルプルギスの夜が来た為に延期(というか嵐のハッカソン)になった復々習レーン。 今日は9章。k-meansと混合ガウスとEMアルゴリズム。sleepy_yoshiさんがsklearnとか使って10行ぐらいでさくっとコードを書いている…

PRML Hackathon #4 〜嵐のPRMLハッカソン〜

http://connpass.com/event/3479/ @西戸山生涯学習館 視聴覚室ワルプルギスの夜的な物が関東上空を通過したためにPRML復々習レーンは中止となり、空いた会場で代わりに開かれたのが「嵐のPRMLハッカソン」。傘が壊れそうな強風の中を頑張って行ってきました…

ラテン語コーパスからのトピック抽出 - Topic extraction from latin corpus using LDA modelling

折角DSIRNLPに来たので、NLPっぽいことをして遊んでみた話。ネタです。 コードは https://github.com/naoyat/latin にあります。lda_demo.py というやつです。gensim便利です。PythonからLDAとかLSIとか割と高速にやってくれるトピックモデリングライブラリ…

SRM583 (new compilers) DIV 1

Practice Roomsの#893にそんなタイトルのがあったので覗いてみる。 問題はSRM583と同じで、コンパイラが昨日のTest SRMと同様の構成らしい。Pythonが使えるのでPythonで書いてみようか。

Test SRM

unratedなSRMがあったので出てみた。 The solutions are executed at Amazon EC2 m1.medium VMs.Compiler versions:C++ – g++ (GCC) 4.4.6 20110731 (Red Hat 4.4.6-3) Compilation options: --std=c++0x -W -Wall -Wno-sign-compare -O2 -s -pipeJava – jav…

graph-tool(のMacへのインストールに挫折してvagrantと戯れるの巻)

Pythonでグラフの最小カットを計算しようと思ったのだけれど、Wikipediaから拝借してきた最大フローを求めるFord-Fulkersonコードを元に書いたものでイマイチ速度が出なかった*1ので、速いと噂の graph-tool を試してみることにした。brewで入れるとか、easy…

PRML §8.3.3 例:画像のノイズ除去

【次回復々習レーン(2013/7/21開催予定)の発表資料準備】 反復条件付きモード(ICM)での画像復元 左上から順番に走査しながら、反転するとエネルギーを減らせるピクセルを反転 走査前後のエネルギー差分がεを下回ったら(あるいは10回やったら)終了 MacB…

Pythonの辞書内包表記 (2.7〜)

3.1で入ったのは聞いてたけれど、今使ってる2.7でも使えるの知らなかった>< 集合のリテラル文法 ({1,2,3} は mutable set になります) 辞書と集合の内包表記 ({i: i*2 for i in range(3)}). see: http://docs.python.jp/2/whatsnew/2.7.html

Instagram APIで定形業務を自動化してみた

Instagramのフレンド・タイムライン*1に流れてくる写真の中で、like_countの下1桁が "9" のものがあれば like し、like_countを繰り上げる というよくある定形業務をInstagram APIで自動化してみました。最近pythonを使うことが多いので python-instagram …

Coursera始めてみた

(see also: 今週のCoursera)せっかく関東に来てアレだけど勉強会に時間使うより coursera に時間使いたい— smlyさん (@smly) 4月 20, 2012 そんなに楽しいものがあるというのならちょっと見てみようと思ってですねEducation for Everyone - Coursera誰でも…

ナイーブベイズ分類器の実装とか(その2)〜新アルバムの楽曲で畑さん/こだまさん分類器を試してみた〜

1/17のエントリ「ナイーブベイズ分類器の実装とか 〜畑さん/こだまさん問題〜」の続編。とあるアーティスト(仮にMとします)の新アルバムが2/29にリリースされたので、前回作ったナイーブベイズ分類器に過去の3アルバムのデータを訓練データとして与え、新…

Pythonで数値積分 〜フーリエ級数展開を例に、てかscipy.integrate.quad()かわいいよscipy.integrate.quad()

はいはいまたグラフ描きたいだけのエントリですよ。てか数値積分が簡単に出来ちゃうSciPy(・∀・)イイネ!! が from scipy.integrate import quad y, abserr = quad(f, a, b) で計算できちゃうのです。(y が積分値、abserrは推定誤差の絶対値) 基礎編 → を期待…

ナイーブベイズ分類器の実装とか 〜畑さん/こだまさん問題〜

スパム判定などでお馴染みのナイーブベイズ分類器。 構造が比較的単純なのに割といい感じに分類できるので重宝がられています。ナイーブベイズ分類器で用いる文書モデルとして、「言語処理のための機械学習入門」(奥村学 著)では 多変数ベルヌーイモデル (…

三分探索と黄金分割探索

はい、毎度おなじみのグラフ描きたいだけのエントリですw今回のお題は「三分探索(ternary search)」。二分探索(binary search)は割とおなじみかと思うのですが、二分探索が単調増加(減少)関数fについてf(x)=kとなるxを求めるのに対し、三分探索(とか黄…

ポアソン分布 Poisson distribution

タイトルでポアソン分布、とか言いつつ別にポアソン分布の性質とか何かに深入りしようというでもなく、ちょっと確率分布のグラフを書きたいだけのエントリです このブログの想定読者はポアソン分布は当然知ってるのでRSSリーダーでもタイトルだけ見て既読扱…

Oil FlowデータでPCA

では、データを使って PCA を行ってみよう。 oilflow <- read.table("DataTrn.txt"); result <- prcomp(oilflow) # Rなら主成分分析が1行で書ける!!! oilflow.labels <- read.table("DataTrnLbls.txt"); col <- colSums(t(oilflow.labels) * c(4,3,2)); …

PRMLで使われるデータセットの(現在有効な)入手先

PRML 12章の実装試してみたいけど、Oil Flowデータの配布ページが無くなってるんだよなあ、とあきらめてた。でもがんばって探したらwebarchiveから拾えた。tar.gzファイルまでアーカイブしてあるなんて……。すごすぎ。欲しい人いる? 再配布したらまずい? 20…

MacBook Air (Lion) でiPython -pylabを動かすまで

brewとかpythonbrewとか色々試した挙句。結論から言うと Lionに元々入ってるPython (2.7.1) を使う ScipySuperpackを入れる。無料。 インストーラスクリプト内のgitのパスを書き換えてなくてインストールが行われないとか罠 で終了

§1.1「例:多項式曲線フィッティング」

データは にgaussian noise()を加えて人工的に作った10点(※PRMLと同じデータを使用) これを多項式 で近似 二乗和誤差 を最小化するを求める 次元数Mをいろいろ変えてover-fittingしていく様子を楽しむ Pythonで書いたらどんな感じかな?って試してみてるだ…

私訳「暫定的 NumPy チュートリアル」

# 原文:http://www.scipy.org/Tentative_NumPy_Tutorialこのチュートリアルを読む前に、Pythonについてちょっとは知っているべきだ。記憶をリフレッシュしたいと思うなら、Pythonチュートリアルを見てくるがいい。 このチュートリアルに出てくる例を試した…