NL研の発表

今週頭にあったNL研の発表をチェックする。5月のNL & SLPは学生セッションと学生奨励賞があり、同年代で頑張っている人の発表が見れたりするので面白い。一番気になっていたのはこれ。

文脈情報と格構造の類似度を用いた日本語文間述語項構造解析
○林部祐太,小町守,松本裕治(奈良先端大)

今日は実家帰りだったので、帰りにひと通り読んでみた(実家に帰るときは片道1時間半くらい時間がある)。D1の人の発表でおそらく修論をまとめたものだと思うが、とても丁寧に書かれている。考察、やるべきこともしっかり順を追って埋められていて、これは学生奨励賞を取るよなあ、という感じ。自分の研究はとても散漫になりがちなので、見習いたい。

おおよそとしては述語項構造解析の大域的素性として格構造間の類似度を定義し、似た格構造の格要素としては同じものが埋まりやすいという主張をベースに進む。直感的にもそうだろうなと思うようなアイディア。格構造間の類似度の定義にはJSダイバージェンスを使い、項構造解析履歴において類似度がmaxとなる格構造を取って文間照応を行う。

個人的な疑問は2点あって、まずは格構造の類似度を取るときに述語語義が2つ以上ある場合はどうするのかということ。これは現場の質疑でもあったようで、NL201のログを参照すると

Q: エラーの例は類似度計算では捉えられないというより,対応付けの問題ではないか?格構造の類似度という考え方では扱えない例というのはなかったか?
A: 人手で判断しても揺れる事例が多く,根本的に難しい.語義曖昧性解消をしてから類似度を測るなどのやり方があるが,曖昧性解消をするためには項の情報が必要であり,にわとりと卵の関係にある.語義曖昧性解消と項の解消を同時にやる手法を考える必要がある.機能動詞結合に関するものも同様.

と書いてある。以前読んだ東北大のの渡邉陽太郎さんの論文

CiNii 論文 -  述語語義と意味役割の結合学習のための構造予測モデル

は参照しなくていいのかな、と思わなくはない。
あと、語義の曖昧性というのはトピックや分野によっても変わるだろうと思うので、全部の分布類似度で一気に扱うのは少し乱暴な気がした。

もう一点は履歴の中から項構造解析履歴から名詞句を選ぶときに、maxを取らずにこれを確率っぽく扱ったら精度は変わったりしないのかな、ということ。計算量増えるだろうし、ほんとに精度が上がるかわからんけど。

感想は大体そんな感じ。自分の研究にも活かしていけそうだし、同学年が頑張ってると僕も頑張ろうと思える。林部さん、おめでとうございます!

  • -

閑話休題、7月のSLPで発表することになりました。JKJには君も5月のNLで発表して学生奨励賞を狙いに行くべきと発破をかけられましたが、正直NLPで発表して5月のNL研でも発表するのは苦しいと思います…

  • -

最近買った、もらった、読んでいる本など

The Sign of Four (Penguin Sherlock Holmes Collection)

The Sign of Four (Penguin Sherlock Holmes Collection)

AKB48総選挙公式ガイドブック2011 (講談社 MOOK)

AKB48総選挙公式ガイドブック2011 (講談社 MOOK)

梶原あや作品集(上) 殺し屋ジョニー/けんけん猫間軒(1) (fukkan.com)

梶原あや作品集(上) 殺し屋ジョニー/けんけん猫間軒(1) (fukkan.com)


洋書は対訳が頭の中にあるものなら意外と読めると思った。あと、梶原あやはやっぱり死ぬほど面白い。けんけん猫間軒とか単行本が手に入らなくて泣いていたので、とても嬉しいし。

AKBは1〜12位まで12連単当てるとメンバーの手料理食べれるらしいんで、死ぬ気で当てに行きます。このためにランク学習勉強するくらいの勢い。