naoya_t@hatenablog

いわゆるチラシノウラであります

Deep-learningはラテン語の動詞活用を学習できるか? Can deep-learning learn latin conjugation?

ラテン語ネタが続きます

工藤さんがぐぐたすで紹介してた word2vec が面白そうだったので。

https://code.google.com/p/word2vec/

で少し遊んでみた。いわゆる deep learning で 単語のベクトル表現を学習してくれる。

面白いのは、2つのベクトルの差が、2つの単語の関係をよく近似してくれること。

It was recently shown that the word vectors capture many linguistic regularities, for example vector operations vector('Paris') - vector('France') + vector('Italy') results in a vector that is very close to vector('Rome'), and vector('king') - vector('man') + vector('woman') is close to vector('queen')

日本語のコーパスmecab で解析して、何個か試してみた。うまくいった例を抜き出したとはいえ、それっぽい結果が得られた。いいじゃん。


A B C → X (A → Bの関係に対し、 C → X に当てはまるXを探す)

グーグル ヤフー トヨタ → 日産
渋谷 新宿 札幌 → 旭川
警察 泥棒 正義 → くそ
...

工藤さんが「word2vecで少し遊んでみた」Google+のエントリ

だって可能性感じたんだ
そうだ…ススメ!

続きを読む